-
题名农村寄宿制学校心理健康教育模式的构建与实施
- 1
-
-
作者
杜永萍
-
机构
甘肃省兰州市永登县第三中学
-
出处
《教书育人(校长参考)》
2024年第6期22-24,共3页
-
文摘
农村寄宿制学校作为一种特殊的教育形式,在为学生提供教育服务的同时,也面临着学生心理健康教育的挑战。本文旨在探讨农村寄宿制学校心理健康教育模式的构建与实施,通过分析当前农村寄宿制学校心理健康教育的现状,提出相应的策略和建议,以期促进学生的全面发展和健康成长。
-
关键词
农村寄宿制学校
心理健康教育
教育模式
-
分类号
G441
[哲学宗教—发展与教育心理学]
-
-
题名基于视觉语言模型的跨模态多级融合情感分析方法
- 2
-
-
作者
谢润锋
张博超
杜永萍
-
机构
北京工业大学信息学部
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2024年第5期459-468,共10页
-
基金
国家重点研发计划项目(No.2023YFB3308004)
国家自然科学基金项目(No.92267107)资助。
-
文摘
图文多模态情感分析旨在通过融合视觉模态和文本模态预测情感极性,获取高质量的视觉模态表征和文本模态表征并进行高效融合,这是解决图文多模态情感分析任务的关键环节之一.因此,文中提出基于视觉语言模型的跨模态多级融合情感分析方法.首先,基于预训练的视觉语言模型,通过冻结参数,采用低阶自适应方法微调语言模型的方式,生成高质量的模态表征和模态桥梁表征.然后,设计跨模态多头互注意力融合模块,分别对视觉模态表征和文本模态表征进行交互加权融合.最后,设计混合专家网络融合模块,将视觉、文本的模态表征和模态桥梁表征结合后进行深度融合,实现多模态情感分析.实验表明,文中方法在公开评测数据集MVSA-Single和HFM上达到SOTA.
-
关键词
视觉语言模型
多模态融合
多头注意力
混合专家网络
情感分析
-
Keywords
Visual Language Model
Multimodal Fusion
Multi-head Attention
Mixture of Experts Network
Sentiment Analysis
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名融合信任计算的协同过滤推荐方法
被引量:12
- 3
-
-
作者
杜永萍
黄亮
何明
-
机构
北京工业大学计算机学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第5期417-425,共9页
-
基金
国家自然科学基金项目(No.60803086)
国家科技支撑计划子课题(No.2013BAH21B02-01)
+1 种基金
北京市自然科学基金项目(No.4123091)
北京市属高等学校人才强教深化计划"中青年骨干人才培养计划"项目(No.PHR20110815)资助
-
文摘
协同过滤推荐是目前应用最为广泛的推荐策略之一,但存在数据稀疏和难扩展问题.文中在传统基于用户的协同过滤推荐算法的基础上,引入信任关系计算,利用信任关系的条件传递特性,设计并构建一个集用户声望信任和用户局部信任的混和信任网络,并将用户间评分相似度和网络中用户间信任评价度结合,为用户寻找更多基于信任因素和兴趣因素的二维相似近邻.在Epinions数据集上以平均绝对误差(MAE)和均方根误差(RSME)等作为实验评价指标,对该方法进行验证实验.结果表明相比传统协同过滤推荐算法,该方法在MAE上提高约6.8%,最优值达到0.7513,t检验的结果也表明该方法能显著提高推荐系统性能.
-
关键词
协同过滤
信任计算
推荐系统
-
Keywords
Collaborative Filtration
Trust Computation
Recommendation System
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名模式学习在QA系统中的有效实现
被引量:10
- 4
-
-
作者
杜永萍
黄萱菁
吴立德
-
机构
复旦大学计算机科学与工程系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第3期449-455,共7页
-
基金
国家自然科学基金项目(60435020)
上海市科技攻关计划基金项目(035115028)~~
-
文摘
开放领域的问题回答(question answering)是自然语言处理领域中具有挑战性的研究方向.提出了一种基于模式学习实现问题回答的方法,核心思想是利用机器学习方法得到的答案模式获取问题答案.该方法优势在于①模式学习完全自动化实现;②解决了目前普遍存在的模式约束性弱及答案缺乏语义类型限制等缺陷.在TREC测试集上的实验结果表明,它不但解决了简单模式所覆盖的问题集,同时也解决了需要较强约束性模式进行答案抽取的问题集,而后者的问题数目在TREC测试问题集中占约80%.
-
关键词
问题回答
模式学习
答案抽取
-
Keywords
question answering
pattern learning
answer extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题效能的学术文献推荐算法
被引量:5
- 5
-
-
作者
杜永萍
杜晓燕
姚长青
-
机构
北京工业大学计算机学院
中国科学技术信息研究所
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2015年第2期215-222,共8页
-
基金
国家科技支撑计划资助项目(2013BAH21B02-01)
北京市自然科学基金资助项目(4123091)
ISTIC-ELSEVIER期刊评价研究中心开放基金资助项目
-
文摘
针对文献推荐问题,提出了一种基于主题效能的学术文献推荐算法,该算法使用潜在狄利克雷分布(latent Dirichlet allocation,LDA)对候选文献和用户发表的文献进行建模,挖掘出具有高效能的主题集合,并根据候选文献中高效能主题的分布情况来计算它与用户兴趣之间的相似度,最后向用户推荐有价值的文献.实验结果表明:提出的算法比基于频繁项挖掘的算法具有更高的推荐准确率和推荐召回率,可同时满足用户对个性化和文献质量两方面的需求.
-
关键词
推荐系统
效能
主题模型
-
Keywords
recommender system
utility
topic model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于CNN-LSTM模型的短文本情感分类
被引量:33
- 6
-
-
作者
杜永萍
赵晓铮
裴兵兵
-
机构
北京工业大学计算机学院
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2019年第7期662-670,共9页
-
基金
国家科技支撑计划资助项目(2013BAH21B02-01)
北京市自然科学基金资助项目(4153058)
-
文摘
为了有效获取短文本评论隐含的语义信息进行情感倾向性识别,提出一种基于CNN-LSTM模型的短文本情感分类方法.利用卷积神经网络(convolutional neural network,CNN)模型设置不同大小的卷积窗口,提取短文本的语义特征.引入长短时记忆(long short-term memory, LSTM)神经网络模型对短文本的情感倾向进行预测.在3种不同的中英文短文本评论数据集上进行验证取得较好的性能,其中,在NLPCC评测数据集上,正、负向情感识别的F1值分别达到0.768 3和0.772 4(优于NLPCC 评测的最优结果).相较于传统的机器学习分类模型,t-test检验结果表明性能提升显著.
-
关键词
短文本
情感分类
语义特征
深度学习
卷积神经网络
长短时记忆神经网络
-
Keywords
short text
sentiment classification
semantic feature
deep learning
convolutional neural network
long short-term memory neural network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用模式及语言学特征提高阅读理解性能
被引量:1
- 7
-
-
作者
杜永萍
黄萱菁
吴立德
-
机构
北京工业大学计算机学院
复旦大学计算机科学与工程系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第2期293-299,共7页
-
基金
国家自然科学基金重点项目(60435020)
-
文摘
阅读理解(reading comprehension,RC)任务的目的在于理解一篇文档并对提出的问题返回答案句.提出了一种充分利用外部资源来提高RC系统性能的方法,使得RC系统性能在Remedia和ChungHwa两种语料上均得到提高.特别地,在对基于Remedia语料RC系统的性能分析表明,24.1%的性能提高归因于基于Web的答案模式匹配的运用,11.1%的性能提高归因于语言学特征匹配策略运用.同时也进行了t-test,结果表明答案模式匹配、语言学特征匹配和词汇语义关联推理的运用所得到的性能提高是显著的.
-
关键词
模式
阅读理解
问题回答
自然语言处理
-
Keywords
pattern
reading comprehension
question answering
natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于松弛策略的文本层次分类方法
被引量:1
- 8
-
-
作者
杜永萍
杜晓燕
陈守钦
-
机构
北京工业大学计算机学院
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2017年第8期1175-1181,共7页
-
基金
国家科技支撑计划子课题资助项目(2013BAH21B02-01)
北京市自然科学基金资助项目(4153058)
上海市智能信息处理重点实验室开放基金资助项目(IIPL-2014-004)
-
文摘
为了进一步提高文本层次分类的性能,在传统层次分类方法的基础上融入了松弛策略思想,在构造层次结构的过程中,该方法推迟了不确定类别的节点判定,直到可以明确所属类别,大大降低了高层节点分类错误对低层节点分类性能的影响,即"阻滞"问题的有效缓解.实验结果表明:松弛策略思想可以构建更加合理的层次结构,并进一步提高了分类的性能;相对于支持向量机等其他分类方法,在时间性能上更加高效,对于大规模文本分类任务而言具有重要意义.
-
关键词
松弛策略
层次分类
支持向量机
聚类
-
Keywords
relaxed strategy
hierarchial classification
support vector m achine
clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多策略的单文档问答式信息检索技术
被引量:1
- 9
-
-
作者
杜永萍
何明
-
机构
北京工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2009年第7期193-196,共4页
-
基金
国家自然科学基金青年基金(No.60803086)
北京工业大学博士科研启动基金(52007012200701)资助
-
文摘
单文档问答式信息检索,即是阅读理解(Reading Comprehension,简称RC)。该任务的目的在于理解一篇文档并对提出的问题返回答案句。提出了充分利用外部资源采用多策略技术来提高RC系统性能的方法,包括基于Web的答案模式匹配应用、词汇语义关联推理以及上下文辅助等策略。本方法使得RC系统性能在Remedia标准测试集上的性能得到提高。描述了不同策略对提高系统性能的有效性,t-test结果表明,运用答案模式匹配和词汇语义关联推理策略所得到的性能显著提高;同时分析了指代消解策略在系统中的关键作用;最后比较了RC任务和多文档问答式信息检索(Question Answering,简称QA)任务的差异性。
-
关键词
模式
阅读理解
问题回答
自然语言处理
-
Keywords
Pattern, Reading comprehension, Question answering, Natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征扩展与深度学习的短文本情感判定方法
被引量:4
- 10
-
-
作者
杜永萍
陈守钦
赵晓铮
-
机构
北京工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2017年第10期283-288,共6页
-
基金
国家科技支撑计划子课题(2013BAH21B02-01)
北京市自然科学基金资助项目(4153058)
上海市智能信息处理重点实验室开放基金(IIPL-2014-004)资助
-
文摘
针对中文短文本信息量少、特征稀疏等特点,面向微博短文本进行情感分类研究,为了更好地提取短文本情感特征,从评论转发等上下文内容中挖掘具有语义递进关系的语料对原文本进行扩展,并抽取具有潜在感情色彩的特征词,采用Word2vec计算词语相似度以进行候选特征词扩展,最后引入深度信念网络(Deep Belief Network,DBN)对候选特征词进行深度自适应学习。在COAE(Chinese Opinion Analysis Evaluation)2015任务评测数据集上的实验表明,该方法能够有效地缓解短文本特征稀疏问题,并且能够较为准确地挖掘情感特征,提高情感分类的准确率。
-
关键词
情感挖掘
短文本
特征扩展
深度信念网络
-
Keywords
Opinion mining ,Sho r t te x t ,F e a tu re extension,Deep belief netw o rk
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名问答式信息检索中模式优化及性能评价
被引量:1
- 11
-
-
作者
杜永萍
叶乃文
-
机构
北京工业大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第17期186-187,190,共3页
-
基金
北京工业大学博士科研启动基金资助项目(52007012200701)
-
文摘
问答式信息检索是新一代搜索引擎,集成自然语言处理和信息检索科学的研究成果,提高信息检索效率。该文介绍问答式信息检索中的模式优化及其应用,并进行客观评价。模式在问答式信息检索中有两个重要应用——查询扩展和答案抽取。实验结果表明,在TREC标准测试集上,采用模式匹配策略实现答案抽取,能有效地提高问答式信息检索系统的准确率。
-
关键词
信息检索
模式优化
性能评价
-
Keywords
information retrieval
pattern generalization
performance evaluation
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名问答式信息检索查询优化技术研究
被引量:1
- 12
-
-
作者
杜永萍
姚长青
-
机构
北京工业大学计算机学院
中国科学技术信息研究所
-
出处
《情报学报》
CSSCI
北大核心
2009年第5期679-684,共6页
-
文摘
问答式信息检索是新一代搜索引擎,它接收自然语言描述的问题,在文档集合中搜索并返回问题的精确答案。问答式信息检索中,检索模块性能的提高将直接影响问题回答系统的整体性能。本文研究系统中的查询优化技术,包括两种策略:基于模式知识库的查询优化;挖掘Web语义蕴含信息,构建查询扩展资源。本文利用TREC提供的问题集与答案集(TREC8-TREC13)做实验来测试查询优化方法的性能,实验结果表明,相对于传统的查询生成,本文采用的查询优化技术在检索精度上取得了提高,t-test结果证明,系统性能提高统计显著。
-
关键词
信息检索
查询优化
语义蕴含
-
Keywords
information retrieval, query optimization, semantic entailment
-
分类号
G250.73
[文化科学—图书馆学]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名分词及词性标注一致性校对系统的设计与实现
被引量:8
- 13
-
-
作者
杜永萍
郑家恒
-
机构
山西大学
-
出处
《电脑开发与应用》
2001年第10期16-18,共3页
-
基金
山西省自然科学基金资助 (2 0 0 0 10 32 )
-
文摘
针对真实语料中分词、词性标注结果前后不一致的现象提出了基于规则库的校对方法与策略 ,设计了一致性校对系统 ,进一步提高分词、词性标注的正确率。
-
关键词
分词
词性标注
一致性
自动分词
校对系统
中文信息处理
-
Keywords
segment consistence,word property notation consistence,automatic segment,collation system,automatic notation of word
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名语义蕴涵关系识别中的特征提取方法
- 14
-
-
作者
杜永萍
张江涛
刘江利
-
机构
北京工业大学计算机学院
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2013年第7期1046-1052,共7页
-
基金
国家自然科学基金资助项目(60803086)
北京市自然科学基金资助项目(4123091)
北京市属高等学校人才强教深化计划"中青年骨干人才培养计划"资助项目(PHR20110815)
-
文摘
为了捕捉不同文本片段之间的语义推理结果,实现文本片段之间的推导,采用基于分类器的方法进行蕴涵关系的判断.特征的选取是影响分类器性能的关键因素,在采用基本的词汇特征的基础上,引入了句法特征以及语义特征.通过构建语义链的方法挖掘T和H之间的语义关联,并应用于不同的分类器检验语义特征的有效性.在公开评测的数据集RTE-3~RTE-5上评价系统的性能,AdaBoost与SVM分类器取得的准确率分别为61.0%和61.8%.t检验的结果表明:基于语义链的语义特征使得系统性能得到了显著的提高.
-
关键词
文本蕴涵
语义链
自然语言处理
-
Keywords
textual entailment
lexical chain
natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于潜在语义分析的BBS文档Bayes鉴别器
被引量:17
- 15
-
-
作者
刘昌钰
唐常杰
于中华
杜永萍
郭颖
-
机构
四川大学计算机科学系
山西大学计算机科学系
-
出处
《计算机学报》
EI
CSCD
北大核心
2004年第4期566-572,共7页
-
基金
国家自然科学基金 ( 60 0 73 0 46)
高等学校博士学科点专项科研基金( 2 0 0 2 0 610 0 0 7)资助
-
文摘
电子公告栏 (BBS)的滥用是一种以信息污染为特色的社会问题 ,对BBS文档进行鉴别已成为信息安全重要内容之一 .该文融合了数据挖掘技术、数理统计技术和自然语言理解技术 ,提出了基于潜在语义分析与Bayes分类的BBS文档鉴别方法 :利用自然语言处理技术从训练文档中抽取典型短语集 ;通过潜在语义分析进行典型短语同义归约 ,应用关联规则采掘技术提高典型短语间的独立性 ;用Bayes分类器对BBS文档进行鉴别 .该文还对影响系统的关键参数进行了大量的讨论和测试 ,实验表明该方法对于BBS文档的鉴别是可行而有效的 .
-
关键词
数据挖掘
关联规则
BAYES分类
潜在语义分析
BBS
电子公告栏
-
Keywords
data mining
associate rule
Bayes classifier
latent semantic analysis
BBS
-
分类号
TP393.094
[自动化与计算机技术—计算机应用技术]
-
-
题名基于LDA主题模型的文本相似度计算
被引量:97
- 16
-
-
作者
王振振
何明
杜永萍
-
机构
北京工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第12期229-232,共4页
-
基金
国家自然科学基金(60803086)
北京市自然科学基金(4123091)
+1 种基金
北京市教委科研计划(KM20110005013
KM200910005009)资助
-
文摘
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。
-
关键词
主题模型
LDA
文本相似度
GIBBS抽样
-
Keywords
Topic model, Latent Dirichlet Allocation(LDA), Text similarity, Gibbs sampling
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名LDA模型在微博用户推荐中的应用
被引量:29
- 17
-
-
作者
邸亮
杜永萍
-
机构
北京工业大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
2014年第5期1-6,11,共7页
-
基金
国家科技支撑计划基金资助项目(2013BAH21B00)
北京市自然科学基金资助项目(4123091)
北京市属高等学校人才强教深化计划基金资助项目"中青年骨干人才培养计划"(PHR20110815)
-
文摘
潜在狄利克雷分配(LDA)主题模型可用于识别大规模文档集中潜藏的主题信息,但是对于微博短文本的应用效果并不理想。为此,提出一种基于LDA的微博用户模型,将微博基于用户进行划分,合并每个用户发布的微博以代表用户,标准的文档-主题-词的三层LDA模型变为用户-主题-词的用户模型,利用该模型进行用户推荐。在真实微博数据集上的实验结果表明,与传统的向量空间模型方法相比,采用该方法进行用户推荐具有更好的效果,在选择合适的主题数情况下,其准确率提高近10%。
-
关键词
主题模型
潜在狄利克雷分配
微博
用户模型
兴趣分析
用户推荐
-
Keywords
topic model
microblog
user model
interest analysis
user recommendation
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名中文专利信息资源深加工方案设计与实证研究
被引量:5
- 18
-
-
作者
张兆锋
桂婕
李颖
杜永萍
-
机构
南京大学信息管理学院
中国科学技术信息研究所
北京工业大学计算机学院
-
出处
《数字图书馆论坛》
CSSCI
2014年第7期45-51,共7页
-
基金
“十二五”国家科技支撑计划项目“面向科技创新的专利信息加工与服务关键技术研究与应用示范”子课题“专利信息资源挖掘与发现关键技术研究”(编号:2013BAH21B02)资助
-
文摘
基于专利分析的视角,调研了国内外专利信息资源的现状和特点,明确了用于专利分析的资源及其加工深度的不足,设计了预处理和深加工的方案,重点为专利清洗和专利中四类信息的内容标引:发明类型、技术主题、发明改进和应用领域。并以新能源汽车领域为例,对中文专利进行了深加工实证研究。结果显示,利用清洗和深度标引后的专利资源能有效提高分析的准确度和专利资源揭示深度。
-
关键词
专利资源
专利清洗
专利标引
专利抽取
-
Keywords
Patent resources
Patent cleaning
Patent indexing
Patent extracting
-
分类号
G306
[文化科学]
-
-
题名降维技术在专利文本聚类中的应用研究
被引量:12
- 19
-
-
作者
姚长青
杜永萍
-
机构
中国科学技术信息研究所
北京工业大学计算机学院
-
出处
《情报学报》
CSSCI
北大核心
2014年第5期491-497,共7页
-
文摘
面向大规模专利文本数据的处理过程中,特征降维对于有效消除无关和冗余特征,并进一步提高学习任务的效率具有重要的作用。本文在专利数据聚类过程中,采用了基于信息熵进行特征选择,并利用潜在语义索引(LSI)的方法实现了特征降维。在利用降维技术基础上,将K-means算法与基于密度的DBSCAN算法相结合,改进了K-means算法初始聚类中心的选择方式,将其应用于专利文本聚类。t检验的实验结果表明,改进后的K—means算法的聚类结果性能显著提高。
-
关键词
降维
K-MEANS
聚类算法
-
Keywords
dimension reduction, K-means, clustering algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题发现的专利发明人推荐方法
被引量:5
- 20
-
-
作者
黎楠
杜永萍
何明
-
机构
北京工业大学计算机学院
-
出处
《情报工程》
2015年第3期90-97,共8页
-
基金
国家科技支撑计划子课题(2013BAH21B02-01)
北京市自然科学基金资助项目(4153058)
上海市智能信息处理重点实验室开放基金(IIPL-2014-004)
-
文摘
LDA主题模型可用于识别大规模文档集中潜藏的主题信息,本文提出了一种基于LDA建立发明人兴趣主题模型的方法,合并每位发明人的专利数据,专利信息基于发明人进行划分,将标准的文档-主题-词的三层LDA模型变为专利数据中的发明人-主题-词的发明人兴趣模型,实现发明人的主题发现,并利用该模型中主题分布之间的相似性进行发明人的个性化推荐。在采集真实专利数据集上的实验结果表明该方法相比传统的向量空间模型方法和隐马尔科夫模型方法具有更高的准确率,推荐效果更优。
-
关键词
LDA主题模型
专利
主题发现
推荐技术
-
Keywords
LDA Topic Model, Patent Data, Topic Discovery, Recommendation Method
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-