面向农业图书资源语义挖掘的主题模型应用设计研究被引量：2

Research on Application Design of Theme Model for Semantic Mining of Agricultural Book Resources

下载PDF

导出

摘要文章分析了目前图书资源语义挖掘的自然语言处理现状,比较其中较为主流的主题模型和自然语言处理技术,如LSI、pLSI、LDA及NLTK等的衍进状况,尝试应用模块设计选择。初步阐释和设计了小型的面向某科研机构农业图书资源分类挖掘的主题模型,并给出了相应的评价指标。 This article analyzes the current status of natural language processing in the semantic mining of book resources, compares the mainstream topic models and natural language processing technologies such as LSI, pLSI, LDA and NLTK, and tries to apply module design selection. A small topic model for the classification and mining of agricultural book resources in a certain scientific research institution is explained and designed, and the corresponding evaluation indexes are given.

作者龚浩崔运鹏钱平 Gong Hao;Cui Yun-peng;Qian Ping

机构地区中国农业科学院农业信息研究所

出处《图书馆理论与实践》 CSSCI 2018年第3期46-51,共6页 Library Theory and Practice

基金中国农业科学院科技创新工程(项目编号:CAAS-ASTIP-2016-AII)支持

关键词自然语言处理农业图书资源图书分类语义挖掘主题模型 Natural Language Processing Agricultural Book Resources Book Classification Semantic Mining Topic Model

分类号 G253 [文化科学—图书馆学] G254.3 [文化科学—图书馆学]

引文网络
相关文献

参考文献2

1徐戈,王厚峰.自然语言处理中主题模型的发展[J].计算机学报,2011,34(8):1423-1436. 被引量：233
2孙海霞,成颖.潜在语义标引(LSI)研究综述[J].现代图书情报技术,2007(9):49-53. 被引量：6

二级参考文献101

1叶浩,王明文,曾雪强.基于潜在语义的多类文本分类模型研究[J].清华大学学报（自然科学版）,2005,45(S1):1818-1822. 被引量：18
2刘云峰 ,齐欢 ,HU Xiang'en ,CAI Zhiqiang ,代建民 .基于潜在语义空间维度特性的多层文档聚类[J].清华大学学报（自然科学版）,2005(S1):1783-1786. 被引量：11
3曾雪强,王明文,陈素芬.一种基于潜在语义结构的文本分类模型[J].华南理工大学学报（自然科学版）,2004,32(z1):99-102. 被引量：27
4郑亚非.潜在语义分析与篇章理解[J].浙江工业大学学报（社会科学版）,2006,5(1):70-75. 被引量：1
5顾榕,王小平,曹立明.一种基于潜在语义分析的查询扩展算法[J].计算机工程与应用,2004,40(18):23-25. 被引量：8
6何明,冯博琴,傅向华.基于Rough集潜在语义索引的Web文档分类[J].计算机工程,2004,30(13):3-5. 被引量：7
7王怡,盖杰,武港山,王继成.基于潜在语义分析的中文文本层次分类技术[J].计算机应用研究,2004,21(8):151-154. 被引量：15
8王金凤.一种基于特征聚合理论和LSI的文本分类新方法[J].北京理工大学学报（社会科学版）,2004,6(5):92-94. 被引量：2
9刘云峰,齐欢,代建民.潜在语义分析在中文信息处理中的应用[J].计算机工程与应用,2005,41(3):91-93. 被引量：18
10陈涛,宋妍,谢阳群.基于IIG和LSI组合特征提取方法的文本聚类研究[J].情报学报,2005,24(2):203-209. 被引量：14

共引文献237

1刘娜,肖智博,路莹,唐晓君,肖鹏.自适应主题融合的多文档自动摘要算法[J].中南大学学报（自然科学版）,2013,44(S2):205-209.
2武浩,王美姣,冯佳明,裴以建.专家检索研究进展[J].计算机应用研究,2010,27(10):3633-3638. 被引量：5
3汤雁冰.氧化铜铁矿石中伴生金银的回收[J].有色矿山,2000,29(3):28-31. 被引量：2
4阳小兰,钱程.基于主题提取和记忆模型的新闻推荐系统设计[J].计算机与数字工程,2012,40(6):47-50. 被引量：1
5周亦鹏,杜军平.基于时空情境模型的主题跟踪[J].华南理工大学学报（自然科学版）,2012,40(8):82-87. 被引量：1
6陈叶旺,王华珍,李海波,钟必能,陈锻生.基于百度百科与文本分类的网络文本语义主题抽取方法[J].小型微型计算机系统,2012,33(12):2605-2610. 被引量：9
7乐小虬,洪娜.面向社会文本流数据探测爆发主题方法浅析[J].现代图书情报技术,2012(10):21-27.
8朱然,李德华.新闻聚合系统中的数据挖掘技术初探[J].电脑知识与技术,2013(1):148-151. 被引量：2
9许冶冰,刘超.基于主题的文档与代码间关联关系的提取研究[J].计算机工程与应用,2013,49(5):70-76. 被引量：3
10方锴.专家检索研究综述[J].科协论坛（下半月）,2013(2):102-104. 被引量：1

同被引文献9

1马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,25(2):163-171. 被引量：511
2刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012,2(1):50-58. 被引量：609
3周雨丽,邓小昭.2015—2017年我国情报学硕士学位论文研究热点分析[J].情报探索,2019(1):128-134. 被引量：7
4安燕,郭利婷,古丽扎尔.艾克木,鲜国容.近十年学前教育专业实践教学研究定量分析[J].宁波教育学院学报,2019,21(1):23-26. 被引量：3
5熊晓辉.CSSCI数据下国内音乐学研究生学位教育发展研究——基于1998—2018年CSSCI期刊发文内容、特点、数量分析[J].晋中学院学报,2019,36(4):76-82. 被引量：2
6何兴菊.基于Ucinet对网络学习空间研究的社会网络分析[J].信息技术与信息化,2019(7):109-112. 被引量：9
7乌英才其克.布鲁氏菌新型检测技术研究进展[J].家畜生态学报,2019,40(8):81-86. 被引量：7
8周国林,额尔德木图,周悦.内蒙古阿鲁科尔沁旗布氏杆菌病分布及治疗效果观察[J].世界最新医学信息文摘,2017,17(68):15-16. 被引量：1
9陈凤玉,王学理,杨宇昊,王雪奇,翟景波,李向阳.近十年布鲁氏菌研究论文发表情况定量分析[J].西南民族大学学报（自然科学版）,2019,45(5):463-466. 被引量：1

引证文献2

1郭诗琪,贠强,周杰,陈亮.基于Ucinet对布鲁氏菌研究的社会网络分析[J].大连民族大学学报,2020,22(3):234-239.
2陈凤玉,王学理,杨宇昊,王雪奇,翟景波,李向阳.近十年布鲁氏菌研究论文发表情况定量分析[J].西南民族大学学报（自然科学版）,2019,45(5):463-466. 被引量：1

二级引证文献1

1郭诗琪,贠强,周杰,陈亮.基于Ucinet对布鲁氏菌研究的社会网络分析[J].大连民族大学学报,2020,22(3):234-239.

1孟楠,徐晓敏.基于因子聚类的高校学生职业选择分析方法研究[J].才智,2017,0(36):6-8.
2李欣,谢前前,黄鲁成,吴菲菲.基于SAO结构语义挖掘的新兴技术演化轨迹研究[J].科学学与科学技术管理,2018,39(1):17-31. 被引量：31
3褚树青,宋红霞.公共图书馆信用服务的价值解读[J].图书馆研究与工作,2018(4):17-20. 被引量：12
4黄凯.智慧消防背景下应急处置模块的构建和应用[J].消防技术与产品信息,2018,31(3):30-34. 被引量：3
5张雄,陈福才,黄瑞阳.基于双词主题模型的半监督实体消歧方法研究[J].电子学报,2018,46(3):607-613. 被引量：6
6顾霞.美得有“深度”——浅谈初中美术技能课中的深度教学法[J].新课程导学（下旬刊）,2018,0(2):12-13.
7陈开昌.自然语言处理技术中的中文分词研究[J].信息与电脑,2016,28(19):61-63. 被引量：8
8叶国芬.中职数学“现代信息技术应用”模块的教学计划设计与教学途径——以高教版《数学(基础模块)》上册(修订版)新增内容为例[J].教育界（高等教育）,2018,0(1):100-103.
9程书强,罗娟,王念东.基于BP神经网络构建的分类器模型财务分析领域的应用[J].自动化与仪器仪表,2018,0(1):129-131. 被引量：2
10王艳华.以提高分类查询效率为导向优化图书服务手段研究[J].河南图书馆学刊,2018,38(3):121-123.

图书馆理论与实践

2018年第3期

浏览历史

内容加载中请稍等...

面向农业图书资源语义挖掘的主题模型应用设计研究被引量：2

参考文献2

二级参考文献101

共引文献237

同被引文献9

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向农业图书资源语义挖掘的主题模型应用设计研究 被引量：2

参考文献2

二级参考文献101

共引文献237

同被引文献9

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向农业图书资源语义挖掘的主题模型应用设计研究被引量：2