期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
科技情报用户画像标签生成与推荐 被引量:26
1
作者 赵辉 化柏林 何鸿魏 《情报学报》 CSSCI CSCD 北大核心 2020年第11期1214-1222,共9页
科技管理部门是科技情报的重要用户,如何主动地了解科技管理部门的情报需求,成为大数据时代快速地提供精准情报服务的重要内容,而用户画像的方法为这项工作提供了可能。通过多源数据的采集与分析,为情报用户打标签,用标签来刻画用户特... 科技管理部门是科技情报的重要用户,如何主动地了解科技管理部门的情报需求,成为大数据时代快速地提供精准情报服务的重要内容,而用户画像的方法为这项工作提供了可能。通过多源数据的采集与分析,为情报用户打标签,用标签来刻画用户特征与需求,并实施推荐。基于上述目的,本文采用自然语言处理的相关方法生成标签,在文本中抽取出关键词,采用直接抽取、词对匹配、主题词抽取、基于TF-IDF的生成方案、组合词生成方案共五种方法。标签生成后,根据词林表中的词间关系分析标签之间的关联和相似度。然后采用协同过滤、基于常识、标签关联等推荐算法为不同的用户推荐标签,并建立了初步的用户画像。通过研究与实证发现,利用这一套方法能够有效勾勒出科技管理部门的情报需求特征,对于科技情报工作而言,推荐的内容也具备一定的启示性。 展开更多
关键词 科技情报 用户画像 标签生成 推荐算法
下载PDF
基于字符级CNN技术的公共政策网民支持度研究 被引量:8
2
作者 邱尔丽 何鸿魏 +1 位作者 易成岐 李慧颖 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第7期28-37,共10页
【目的】提出更适用公共政策评价的网民情感分类指标,引入深度学习技术研究网民立场的自动化识别和支持度研判问题。【方法】选取三个不同领域不同类型的重要公共政策作为研究对象,对微博数据进行采集、清洗和标注;运用立场分析方法研... 【目的】提出更适用公共政策评价的网民情感分类指标,引入深度学习技术研究网民立场的自动化识别和支持度研判问题。【方法】选取三个不同领域不同类型的重要公共政策作为研究对象,对微博数据进行采集、清洗和标注;运用立场分析方法研判三个政策的网民支持度;构建基于字符级卷积神经网络(CNN)技术的文本分类模型对实验数据集进行训练,并对实验结果进行对比检验解读。【结果】该模型在三组数据测试集的综合评价指标上均取得优秀表现,当模型稳定后有两组数据集F1值在0.8以上,一组数据集F1值在0.6以上;且耗时较循环神经网络(RNN)模型更短,训练时间差距达数十倍。【局限】数据样本量和政策覆盖类型有限,网民支持度计算方法有待进一步深化。【结论】立场分类方法和字符级CNN技术在公共政策评价的效度和效率上有较好表现,尤其在应急突发性政策评价方面能够发挥明显作用。 展开更多
关键词 公共政策 立场分析 卷积神经网络 微博 大数据
原文传递
融合词间关系与CNN的科学实体学术功能分类研究
3
作者 化柏林 何鸿魏 《情报科学》 CSSCI 北大核心 2023年第7期90-99,共10页
【目的/意义】为了明晰科学实体在学术文本中承担的语义角色,进而建立特定领域的术语的知识结构,本文提出一种以科学实体词间关系为特征工程的术语分类方法,从学术研究的语义属性角度,将学术文本中出现的科学实体分为“研究领域”“研... 【目的/意义】为了明晰科学实体在学术文本中承担的语义角色,进而建立特定领域的术语的知识结构,本文提出一种以科学实体词间关系为特征工程的术语分类方法,从学术研究的语义属性角度,将学术文本中出现的科学实体分为“研究领域”“研究问题”“研究方法”“研究工具”“其他”五类。【方法/过程】采用依存句法分析的方法,对于学术文本中存在两个及两个以上科学实体的句子,挖掘它们之间的最短依存路径,将最短依存路径上的谓词成分作为实体之间的关系进行提取,构造2D矩阵作为卷积神经网络的输入,完成实体的分类研究。【结果/结论】该模型在Web of Science上获取的“人工智能”领域的学术文献进行验证,精确率为89.38%,召回率为92.46%,F1值为0.9089。【创新/局限】由科学实体关系构成的矩阵是稀疏矩阵,在计算过程中会对计算速度产生不利影响;在关系抽取的环节比较依赖依存句法分析分析工具的处理效果。 展开更多
关键词 依存句法 科学实体 卷积神经网络 研究问题 研究方法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部