基于分类标注语料库的关键词标引知识自动获取被引量：5

Knowledge Repository Acquire for Keywords Auto-Indexing System Based on Labeled and Classed Corpus

导出

摘要基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。 From a classed large-scale corpus, extracts keywords labeled on web pages by indexing specialist and formed a keywords list; Referring to the two characteristics of keywords： fields non-even and exists range edge, brought up and calculated the words＇ subject degree by statistical model. Subject degree expresses text content＇ s subject concept. Based on subject degree, constructed a key words auto-indexing system.

作者刘华

机构地区暨南大学华文学院

出处《图书情报工作》 CSSCI 北大核心 2007年第7期41-43,共3页 Library and Information Service

关键词关键词标引分类语料库主题度 keywords indexing classed corpus subject degree

分类号 G254.2 [文化科学—图书馆学]

引文网络
相关文献

参考文献8

1刘华.关键词自动标引系统实现[J].现代图书情报技术,2006(2):88-90. 被引量：3
2刘华.网页信息抽取及建库系统C#实现[J].计算机工程,2006,32(16):49-51. 被引量：5
3叶志清,刘瑞红,袁庆,胡修兰.文献信息计算机全文全自动标引方法[J].情报学报,2003,22(2):169-172. 被引量：3
4杨文峰,李星.基于PAT TREE统计语言模型与关键词自动提取[J].计算机工程与应用,2001,37(15):17-19. 被引量：12
5吴春玉.中文全文检索系统中实现主题词标引思路[J].情报杂志,2005,24(1):115-116. 被引量：3
6李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
7陈克利.基于大规模真实文本的平衡语料分析与文本分类方法[C]..Advances in Computation of Oriental Languages[C].北京:清华大学出版社,2003..
8主题词自动标引在线演示地址.[2007—04—25]．http：／／www．1anguagetech．cn／class_demo.aspx．

二级参考文献24

1张普.关于大规模真实文本语料库的几点理论思考[J].语言文字应用,1999(1):35-44. 被引量：48
2吴蔚天,田鹤卿.字典法中的辅助切分规则[J].情报科学,1988,9(3):92-94. 被引量：1
3胡明福.中文情报自动标引中可用的一种词库生成技术[J].情报科学,1987,8(2):1-6. 被引量：3
4高崇谦.我国科技文献计算机标引研究的现状[J].情报学报,1989,8(1):67-72. 被引量：2
5周全明.论机辅抽词标引及其规则[J].图书情报工作,1995,39(3):44-49. 被引量：4
6俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量：34
7陈克利.基于大规模真实文本的平衡语料分析与文本分类方法.Advances in Computation of Oriental Languages[M].北京:清华大学出版社,2003..
8Yuen - Hsien Tseng, Fast Keyword Extraction of Chinese Documents in a Web Environment, to appear in Information Retrieval Workshop for Asia Languages - 1997
9黄昌宁李涓子.语料库语言学[M].北京:商务印书馆,2002..
10朱凯.因特网语料自动下载分析软件的设计[C]..第一届学生计算语言学研讨会论文集[C].北京,2002..

共引文献117

1张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：9
2许爱琴,王梦洁,刘永坚,王卫华.一种新的生成候选关键词集的方法[J].武汉理工大学学报（信息与管理工程版）,2013,35(6):816-819.
3刘华.基于语料库的领域词语聚类C#实现[J].计算机工程与应用,2005,41(36):167-169. 被引量：3
4张剑,李春平.基于WordNet概念向量空间模型的文本分类[J].计算机工程与应用,2006,42(4):174-178. 被引量：16
5刘华.关键词自动标引系统实现[J].现代图书情报技术,2006(2):88-90. 被引量：3
6刘华.词典编撰的领域词语自动获取与选择[J].计算机工程与应用,2006,42(24):176-178. 被引量：2
7张庆国,薛德军,张振海,张君玉.海量数据集上基于特征组合的关键词自动抽取[J].情报学报,2006,25(5):587-593. 被引量：17
8索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
9张敏,耿焕同,王煦法.一种利用BC方法的关键词自动提取算法研究[J].小型微型计算机系统,2007,28(1):189-192. 被引量：19
10马芳,王炳锡,李弼程.英语从句识别中的特征表示[J].计算机应用研究,2007,24(2):89-91. 被引量：2

同被引文献124

1孙迪.科技文献标引问题探析——以国家图书馆为例[J].图书馆建设,2020,0(1):101-108. 被引量：3
2王洪,贾惠波,徐端颐.基于中文学术期刊人工标引的自动分类新算法[J].现代图书情报技术,2002(S1):59-62. 被引量：1
3赵衍,张永娟,陈成材,陈恒.一种提高计算机自动赋词标引准确性的综合方法——基于创新型CBA数据库的实证分析[J].情报杂志,2012,31(5):185-191. 被引量：5
4杨学山.词典在汉语科技文献自动标引中的作用[J].情报科学,1987,8(3):35-38. 被引量：1
5张琪玉.关于主题词型手工检索系统标引工作的几点建议[J].国家图书馆学刊,1985,3(4):23-29. 被引量：1
6侯汉清.中、美、英三国标引方式比较中文图书主题标引宜采用保持上下文索引系统[J].国家图书馆学刊,1985,3(4):30-37. 被引量：1
7李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
8王新宇,郭力.中文文献自动标引技术[J].中文信息,1994,11(1):18-21. 被引量：1
9薛春香,夏祖奇,侯汉清.基于语料和基于标引经验的自动分类模式比较[J].南京农业大学学报（社会科学版）,2005,5(4):85-92. 被引量：10
10何琳,侯汉清.基于标引经验和机器学习相结合的多层自动分类[J].中国索引,2006,4(1):39-43. 被引量：2

引证文献5

1杨春明,韩永国.快速的领域文档关键词自动提取算法[J].计算机工程与设计,2011,32(6):2142-2145. 被引量：12
2余春.自动标引研究进展[J].图书馆学研究,2012(4):18-22. 被引量：12
3李千驹,李思达,刘建毅.一种基于知识组织的关键词自动标引方法[J].情报科学,2016,34(11):107-110. 被引量：8
4苏治中.网络舆情安全数据挖掘系统设计与实现[J].信息系统工程,2020,33(11):51-53.
5蔡迎春,赵心如,朱玉梅,汪秀秀.我国文献标引技术的回顾与展望[J].图书馆杂志,2022,41(3):18-31. 被引量：4

二级引证文献33

1杨春明,韩永国.地方政府网络舆情监测系统研究[J].西南科技大学学报,2012,27(3):92-96. 被引量：1
2冯秀珍,郝鹏.基于词性分析的产品评价信息挖掘[J].计算机工程与设计,2013,34(1):283-288. 被引量：4
3陈开慧.本体与分众分类的融合模型研究[J].图书馆学研究,2013(5):73-77. 被引量：8
4刘素军.网络环境下知识组织方式研究[J].黄河水利职业技术学院学报,2013,25(2):81-84.
5文天才,李平.基于XML的名老中医医案结构化标引系统[J].中国数字医学,2013,8(7):22-24. 被引量：6
6何晓阳,张精理,丁婷.医学新闻关键词自动提取策略[J].中华医学图书情报杂志,2014,23(4):13-17. 被引量：2
7马娟.文本自动标引算法研究[J].黑龙江科技信息,2014(15):126-127. 被引量：1
8陈金梁,李青.基于本体的领域文档主题抽取方法研究[J].电脑开发与应用,2014,27(9):44-47.
9石琢.基于校园网络舆情中极端行为的主题词分级研究[J].甘肃高师学报,2014,19(6):139-142.
10王庆,陈泽亚,郭静,陈晰,王晶华.基于词共现矩阵的项目关键词词库和关键词语义网络[J].计算机应用,2015,35(6):1649-1653. 被引量：11

1刘华.关键词自动标引系统实现[J].现代图书情报技术,2006(2):88-90. 被引量：3
2包小兵.基于朴素贝叶斯的Web文本分类及其应用[J].电脑知识与技术,2016,12(10X):220-221. 被引量：4
3何焱,丁玲.关于领域语料库的研究[J].山东农业大学学报（自然科学版）,2014,45(3):360-365.
4吕岩.改进蚁群算法在文本聚类中的应用研究[J].微电子学与计算机,2012,29(3):31-34. 被引量：2
5李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
6史博文,李国和,吴卫江,洪云峰,周晓明.基于强化正域的属性约简方法[J].计算机应用研究,2017,34(1):107-109. 被引量：7
7李军锋,吕学强,周绍钧.带权复杂图模型的专利关键词标引研究[J].现代图书情报技术,2015(3):26-32. 被引量：6
8张海涛,周爱武.蚁群算法在文本聚类中的应用研究[J].微电子学与计算机,2016,33(1):81-84. 被引量：6
9席耀一,林琛,李弼程,周杰,许旭阳.基于语义相似度的论坛话题追踪方法[J].计算机应用,2011,31(1):93-96. 被引量：22
10索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88

图书情报工作

2007年第7期

浏览历史

内容加载中请稍等...

基于分类标注语料库的关键词标引知识自动获取被引量：5

参考文献8

二级参考文献24

共引文献117

同被引文献124

引证文献5

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于分类标注语料库的关键词标引知识自动获取 被引量：5

参考文献8

二级参考文献24

共引文献117

同被引文献124

引证文献5

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于分类标注语料库的关键词标引知识自动获取被引量：5