-
题名专利主题词的FW-LDA组合改进与关键词演化分析
被引量:7
- 1
-
-
作者
刘晋霞
张志宇
王芳
-
机构
太原科技大学经济与管理学院
-
出处
《情报杂志》
CSSCI
北大核心
2022年第7期57-64,共8页
-
基金
山西省哲学社会科学规划课题项目“推动大数据产业与山西装备制造业融合创新路径研究”(编号:2020YY151)
山西省社会科学院(山西省人民政府发展研究中心)规划课题项目“山西省数字政府共建共享共治共用研究”(编号:YWYB202158)
山西省社会科学院(山西省人民政府发展研究中心)2021年度青年课题立项名单“山西数字政府建设路径研究”(编号:YWQN202147)。
-
文摘
[研究目的]从过滤主题词的角度出发,对LDA概率主题抽取的结果进行改进,使主题之间划分更加准确、主题内部关键词更加聚类,并通过演化分析跟踪技术发展动态。[研究方法]利用专利之星检索系统获取我国制氢领域的专利数据,采用LDA概率主题模型抽取主题与关键词;结合定义主题标识词以及引入负采样模型,提出FW-LDA的方法;应用该方法对该领域进行相邻时间切片的主题关键词演化分析。[研究结论]通过逐点互信息和皮尔逊相关系数的指标对比,验证了FW-LDA方法的有效性;并且通过这种方法对我国制氢领域的专利数据进行演化分析,以把握发展规律,为技术研究工作提供参考价值。
-
关键词
FW-LDA方法
专利主题词
LDA概念
专利分类号
主题标识词
负采样模型
组合改进
-
Keywords
FW-LAD method
patent topic words
LDA probabilistic
patent classification number
topic identifiers
negative sampling model
cobination improvement
-
分类号
G306
[文化科学]
-
-
题名一种用于专利主题词抽取的模板自动生成方法
被引量:4
- 2
-
-
作者
王裴岩
张桂平
蔡东风
白宇
叶娜
-
机构
沈阳航空航天大学知识工程研究中心
-
出处
《沈阳航空工业学院学报》
2010年第3期46-49,共4页
-
文摘
专利主题词是用以表述发明或实用新型名称的技术关键词,专利主题词的抽取是专利技术方案信息抽取的第一步,是填充信息抽取结果模板的有效依据和填充子之一。将信息抽取技术应用于中文专利摘要文本,在充分分析了专利摘要文本和专利标题特点的基础上,采用无指导的方法构建信息抽取模板,进而完成专利主题词的抽取。实验表明,该方法获得了较好的抽取效果。
-
关键词
中文专利摘要文本
专利主题词
无指导
模板
-
Keywords
Chinese patent Abstract text
patent topic keyword
unsupervised
pattern
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-