期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于关键词对逆文档频率的主题新颖度度量方法 被引量:45
1
作者 杨建林 钱玲飞 《情报理论与实践》 CSSCI 北大核心 2013年第3期99-102,共4页
文章吸收词频原则、逆文档频率原则以及共词分析的思想,提出解决文档主题新颖度量化问题的4个原则,在此基础上定义带时间戳关键词逆文档频率、带时间戳关键词对逆文档频率、文档新颖度等3个概念,给出文档新颖度的计算公式,并对该公式的... 文章吸收词频原则、逆文档频率原则以及共词分析的思想,提出解决文档主题新颖度量化问题的4个原则,在此基础上定义带时间戳关键词逆文档频率、带时间戳关键词对逆文档频率、文档新颖度等3个概念,给出文档新颖度的计算公式,并对该公式的实用性与合理性进行实证研究。实验结果表明:文中提出的文档主题新颖度量化方法是科学的、合理的、可操作的,但是,不规范的标引词标引、关键词个数过少等现象对主题新颖度计量结果的准确性影响较大。 展开更多
关键词 文档主题新颖度 关键词 量方法
下载PDF
主题词法和自然语言法探测文献主题新颖性对比分析 被引量:5
2
作者 许丹 徐爽 +2 位作者 陈斯斯 杨颖 郭继军 《中华医学图书情报杂志》 CAS 2019年第1期19-26,共8页
目的:对比分析主题词法和自然语言法计算结果的一致性和差异性,探讨两种方法的优缺点以及与F1000推荐文献的关系。方法:定义医学主题词词对法的文档主题新颖度概念,给出计算公式进行计算并进行对比分析。结果:主题词法计算了该文献集40... 目的:对比分析主题词法和自然语言法计算结果的一致性和差异性,探讨两种方法的优缺点以及与F1000推荐文献的关系。方法:定义医学主题词词对法的文档主题新颖度概念,给出计算公式进行计算并进行对比分析。结果:主题词法计算了该文献集401篇文献中已标引的346篇文献的文档主题新颖度,平均新颖度值为0.8423;自然语言法计算了该文献集全部401篇文献的文档主题新颖度,平均新颖度值为0.8713。74.28%的文献经两种方法计算得到的新颖度差值在0.1以下。结论:主题词法和自然语言法可从文本层面计算文档主题新颖度,两者各有优势。自然语言法在计算范围和最新发表的文献方面要略优于主题词法,主题词法在揭示文章主旨含义和准确度方面,优于自然语言法。根据相关性比较,主题词法和自然语言法在计算文档主题新颖度方面一定程度上具有相对等效的价值。新颖度值越高,主题词法和自然语言法计算出的文档新颖度值分区越一致。主题词法文档主题新颖度与F1000得分弱相关,说明主题词法新颖度准确性更接近专家同行评议。 展开更多
关键词 文献主题新颖性探测 文档主题新颖度 主题词法 自然语言法 F1000 对比分析
下载PDF
技术坐标视角下的主题分析——以第三代移动通信技术为例 被引量:15
3
作者 沈君 王续琨 +1 位作者 高继平 滕立 《情报学报》 CSSCI 北大核心 2012年第6期603-611,共9页
以第三代移动通信技术领域为例,本文从17864项专利文献的标题和摘要中抽取了技术术语,之后对其进行了技术坐标视角下的共词分析。在卡龙的技术子簇的构建方法基础上,运用饱和值标准进行聚类和技术主题的划分,从技术术语的频次和年... 以第三代移动通信技术领域为例,本文从17864项专利文献的标题和摘要中抽取了技术术语,之后对其进行了技术坐标视角下的共词分析。在卡龙的技术子簇的构建方法基础上,运用饱和值标准进行聚类和技术主题的划分,从技术术语的频次和年份的角度,本文构建了关注度和新颖度指标,并在实证分析中将共词分析法、聚类分析法与技术坐标分析法相结合,绘制出了技术坐标图,展示了第三代移动通信技术领域的技术研发现状和发展趋势。探寻的结果表明,位于技术坐标1、2象限的技术主题超过一半,表明在技术主题中多数是近些年来的研发主题;位于1、4象限备受关注的中心主题和基础主题较少,位于2、3象限属于次级或边缘的技术主题居多。 展开更多
关键词 技术坐标共词分析技术主题新颖度关注
下载PDF
学术成果主题新颖性测度方法研究——基于Doc2Vec和HMM算法 被引量:40
4
作者 逯万辉 谭宗颖 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第3期22-29,共8页
【目的】进一步研究和构建学术成果主题新颖性测度指标,量化地测度学术成果的主题新颖性。【方法】构建基于Doc2Vec和HMM的文本内容特征因子计算模型,通过该内容特征因子构造文档的主题新颖性测度指标函数。基于《情报学报》、《情报科... 【目的】进一步研究和构建学术成果主题新颖性测度指标,量化地测度学术成果的主题新颖性。【方法】构建基于Doc2Vec和HMM的文本内容特征因子计算模型,通过该内容特征因子构造文档的主题新颖性测度指标函数。基于《情报学报》、《情报科学》和《情报杂志》三本期刊2014年度所刊载的学术论文进行实证研究,测度论文的主题新颖性。【结果】将该方法与已有的新颖性测度方法的计算结果进行对比,其结果表现为0.01水平上的显著相关关系,相关系数为0.494,同时该方法也避免了已有方法的计算结果中存在的区分度不够的问题。【局限】仅使用摘要文本进行挖掘,未对全文信息进行深入挖掘。【结论】基于该方法的学术成果主题新颖性测度方法和计算结果具有可操作性和可解释性,可以为学术评价和学科前沿探测提供有效支撑。 展开更多
关键词 主题新颖度 内容特征因子 学术成果
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部