语法规则和改进关联规则的中文文本非等级关系提取研究被引量：2

Non-hierarchical Relations Extraction of Chinese Texts Based on Grammar Rules and Improved Association Rules

导出

摘要针对目前适用于中文文本非等级关系提取方法偏少以及关联规则筛选方法忽略了集中出现在部分文本集中的领域词汇关系的问题,通过对中文文本的统计分析,尝试定义一套中文非等级关系提取的规则,同时提出一种加入平均值变量的改进的关联规则。实践证明,基于自定义的语法规则提取方法能够有效地从中文文本中提取出主、谓、宾语,进而提取出非等级关系,改进的关联规则方法能够提取出集中出现在部分文本集中的领域词汇非等级关系。 There is lack of non-hierarchical relations extraction suitable for Chinese texts. Association Rules do not effectively exlracl wcabulary relations concentrated in part of the text. This paper defines a set of non-hierarchical relations extraction rules of Chinese texts and an improved association rules based on average value. The practical results show that nun-hierarchical relations extraction rules of Chinese texts can efficiently extract subject, predicate and object in Chinese texts, and form the non-hierarchical relations. Improved association rules can extract ram-hierarchical relations of the wx＇abulary concentrated in part of the text.

作者余凡程虹楼雯

机构地区武汉大学质量发展战略研究院武汉大学信息管理学院

出处《图书情报工作》 CSSCI 北大核心 2013年第22期126-131,147,共7页 Library and Information Service

基金国家社会科学基金重大项目"基于语义的馆藏资源深度聚合与可视化展示研究"(项目编号:11&ZD152)和国家社会科学基金重大项目"我国质量安全评价与网络预警方法研究"(项目编号:11&ZD158)研究成果之一

关键词非等级关系提取语法规则关联规则中文文本 non-hierarchical relations extraction grammar rule association rule Chinese text

分类号 G350 [文化科学—情报学]

引文网络
相关文献

参考文献13

1韩婕,向阳.本体构建研究综述[J].计算机应用与软件,2007,24(9):21-23. 被引量：50
2刘萍,胡月红.领域本体学习方法和技术研究综述[J].现代图书情报技术,2012(1):19-26. 被引量：14
3Sahay S, Mukherjea S. Discovering semantic biomedical relations utilizing the Web[C]//Pacific Symposium on Biocomputing.New York:ACM Transactions on Knowledge Discovery from Data, 2006.
4Maedche A, Staab S. Discovering conceptual relations from text[C]//Proceedings of the 12th International Conference on Software and Knowledge Engineering.Chicago:Knowledge Systems Institute, 2003: 321-325.
5Kavalec M, Maedche A, Svatek V. Discovery of lexical entries for non-taxonomic relations in ontology learning[C]//Proceedings of SOFSEM 2004: Theory and Practice of Computer Science 2004.Berlin:Springer, 2932:249-256.
6Hastings P, Graesser A, Hastings K. Inferring the meaning of verbs from context[C]//Proceedings of the 20th Annual Conference of the Cognitive Science Society.Mahwah:Lawrence Erlbaum Associates, 1998: 1142-1147.
7谭力,史忠植.基于数据挖掘的本体关系学习算法[J].郑州大学学报（理学版）,2008,40(3):40-43. 被引量：3
8徐桂臣,叶枫.基于语义加权距离的语义相似度改进算法[J].情报杂志,2012,31(2):119-123. 被引量：5
9Jiang Tao, Tan A H, Wang K. Mining generalized associations of semantic relations from textual Web content[J]. IEEE Transactions on Knowledge and Data Engineering, 2007, 19(2): 164-172.
10Villaverde J, Persson A, Godoy D, et al. Supporting the discovery and labeling of non-taxonomic relationships in ontology learning[J]. Expert Systems with Applications, 2009 36(7): 10288-10294.

二级参考文献132

1方卫东,袁华,刘卫红.基于Web挖掘的领域本体自动学习[J].清华大学学报（自然科学版）,2005,45(S1):1729-1733. 被引量：31
2杜文华,董慧.本体建设工具比较研究[J].情报杂志,2005,24(2):5-7. 被引量：15
3郑家恒,卢娇丽.关键词抽取方法的研究[J].计算机工程,2005,31(18):194-196. 被引量：41
4李林,刘贺欢,刘椿年.Ontology自动构建平台OntoAGS[J].计算机工程,2006,32(13):212-214. 被引量：6
5张敏,耿焕同,王煦法.一种利用BC方法的关键词自动提取算法研究[J].小型微型计算机系统,2007,28(1):189-192. 被引量：19
6陈文亮,朱靖波,姚天顺,等.基于Bootstrapping的领域词汇自动获取[C]//语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集,2003:67-72.
7Buitelaar E Ontology Learning from Text: Methods, Evaluation and Applications[M]. [S. l.]: ISO Press, 2005.
8Girju R, Moldovan D. Text Mining for Causal Relations[C]//Proc. of the FLAIRS Conference. Florida, USA: AAAI Press, 2002: 360-364.
9Ciramita M. Unsupervised Learning of Semantic Relations Between Concepts of a Molecular Biology Ontology[C]//Proc. of the 19th International Joint Conference on Artificial Intelligence. Edinburgh, UK: [s. n.], 2005.
10Maedche A, Staab S. Discovering Conceptual Relations from Text[C]//Proc. of the 12th International Conference on Software and Knowledge Engineering. Berlin, Germany: [s. n.], 2000: 321-325.

共引文献309

1杨一,邹昀瑾.以机器学习应对信息“爆炸”时代:公共管理研究的降维可视化探析[J].中国行政管理,2021(1):105-113. 被引量：15
2杨捷,范美位,罗成臣,张思路.面向电力工单文本的服务失误识别[J].云南大学学报（自然科学版）,2020,42(S02):32-37. 被引量：1
3赵增涛,张豪,余益龙.应用于电网资产模型搜索的交叉权积文本相似度计算方法[J].水利水电技术（中英文）,2020,51(S02):209-214.
4孙红,黎铨祺,赵娜.基于双层树状支持向量机的观点挖掘与倾向分析[J].智能计算机与应用,2021,11(3):44-47. 被引量：3
5王鹏,郑贵省,郭强,贾蓓.基于网络爬虫的民用运力数据获取[J].军事交通学院学报,2020,22(1):87-90. 被引量：1
6唐涛.基于文本挖掘的领域本体学习模型研究[J].图书情报工作,2010,54(S2):348-352. 被引量：3
7高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
8疏剑,谢庆生.制造业领域本体构建方法研究[J].机械与电子,2008,26(9):64-66.
9张丽丽.从Web2.0到Web3.0——看互联网泡沫消长[J].图书情报工作,2008,52(12):43-46. 被引量：10
10王长霞,李冠宇,陈布伟.语义网本体构建工具现状及发展趋势研究[J].计算机与现代化,2009(7):26-28. 被引量：8

同被引文献83

1任明,许光,王文祥.家谱文本中实体关系提取方法研究[J].中文信息学报,2020(6):45-54. 被引量：8
2丁君军,郑彦宁,化柏林.基于规则的学术概念属性抽取[J].情报理论与实践,2011,34(12):10-14. 被引量：28
3张玉峰,周磊,王志芳,何超.领域本体构建与可视化展示研究[J].情报理论与实践,2012,35(10):95-98. 被引量：11
4程莉,张敏.基于知识需求聚合的威客共享模式研究[J].情报理论与实践,2012,35(12):106-110. 被引量：3
5潘有能,刘朝霞.基于WordNet的关联数据本体映射研究[J].情报杂志,2013,32(2):99-102. 被引量：7
6王鹏程,胡媛.基于SNS的高校图书馆信息服务平台模型构建[J].情报科学,2013,31(4):16-19. 被引量：18
7夏立新,程秀峰,叶光辉.基于词词关联矩阵改进的模糊检索研究(二)——叙词表控制下词间关联度的改进算法[J].情报学报,2013,32(3):270-280. 被引量：8
8邱均平,王菲菲.基于共现与耦合的馆藏文献资源深度聚合研究探析[J].中国图书馆学报,2013,39(3):25-33. 被引量：67
9王忠义,夏立新,石义金,郑森茂.数字图书馆中层关联数据的创建与发布[J].现代图书情报技术,2013(5):28-33. 被引量：17
10胡昌平,陈果.共词分析中的词语贡献度特征选择研究[J].现代图书情报技术,2013(7):89-93. 被引量：15

引证文献2

1肖璐,孙建军.项目特色视角下的我国图书情报领域知识聚合研究进展[J].现代情报,2019,39(1):29-36. 被引量：4
2翟羽佳,田静文,赵玥.基于BERT-BiLSTM-CRF模型的算法术语抽取与创新演化路径构建研究[J].情报科学,2022,40(4):71-78. 被引量：21

二级引证文献25

1文辉,徐永林,于敬.基于主动学习的领域知识多模式抽取框架[J].新一代信息技术,2022,5(6):137-143.
2张海涛,宋拓,孙彤,魏明珠.知识聚合研究的脉络与展望[J].情报科学,2020,38(4):163-170. 被引量：12
3颜石磊.中外图书情报学研究进展及可视化分析[J].情报探索,2020(12):126-134. 被引量：2
4卢恒,张向先,张旭.网络社区知识聚合研究综述与展望[J].图书馆学研究,2021(4):2-10. 被引量：6
5付靖宜,李姗姗,项欣溢,夏江妍.新四军苏浙军区多模态红色文献资源知识聚合模式研究[J].档案学研究,2022(4):24-31. 被引量：10
6黄颖,叶冬梅,丁凤,徐畅,张琳.技术演化路径识别:内涵释义与研究进展[J].图书情报工作,2022,66(22):142-154. 被引量：9
7化柏林,何鸿魏.融合词间关系与CNN的科学实体学术功能分类研究[J].情报科学,2023,41(7):90-99.
8贾君枝,崔西燕,任明.数据与知识双驱动的知识组织系统构建框架研究[J].情报理论与实践,2023,46(10):157-162. 被引量：3
9郭顺利,苏新宁,房旭辉.融合NER和Apriori算法的游记文本关联知识挖掘及推荐服务研究[J].现代情报,2023,43(11):123-134. 被引量：1
10罗凯威,罗文兵,黄琪,王明文.基于依存结构学习的中学数学术语鲁棒抽取[J].中文信息学报,2023,37(8):75-85.

1凌乙.“可怜无补费精神”[J].咬文嚼字,1995,0(8):21-22.
2楼雯.馆藏资源语义化关键技术及实证研究[J].中国图书馆学报,2013,39(6):27-40. 被引量：19
3李爱玲.数据挖掘为图书管理提供决策支持[J].中国管理信息化,2012,15(9):113-114. 被引量：2
4叶建华.中文社会科学引文索引来源期刊筛选方法的分析与评价[J].情报科学,2002,20(10):1065-1065. 被引量：1
5凤元杰,范全青.我国三种人文社会科学核心期刊表的比较分析[J].情报资料工作,2005,26(4):63-65.
6徐汉燕.给《光明日报》挑刺[J].咬文嚼字,1996,0(12):40-40.
7夏立新,楚林,王忠义,石义金,李京蔚.基于网络文本挖掘的就业知识需求关系构建[J].图书情报知识,2016,33(1):94-100. 被引量：39
8李金庆,杨巧云.高校核心期刊目录刍议[J].图书馆论坛,2006,26(4):246-248. 被引量：5
9李湘东,霍亚勇,张娇.基于LDA主题模型的图书网页书目信息提取研究[J].情报科学,2016,34(1):34-37. 被引量：7
10赵丹,张会平.基于可视化技术的知识提取研究[J].图书情报工作,2009,53(2):100-103. 被引量：5

图书情报工作

2013年第22期

浏览历史

内容加载中请稍等...

语法规则和改进关联规则的中文文本非等级关系提取研究被引量：2

参考文献13

二级参考文献132

共引文献309

同被引文献83

引证文献2

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

语法规则和改进关联规则的中文文本非等级关系提取研究 被引量：2

参考文献13

二级参考文献132

共引文献309

同被引文献83

引证文献2

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

语法规则和改进关联规则的中文文本非等级关系提取研究被引量：2