摘要
针对目前适用于中文文本非等级关系提取方法偏少以及关联规则筛选方法忽略了集中出现在部分文本集中的领域词汇关系的问题,通过对中文文本的统计分析,尝试定义一套中文非等级关系提取的规则,同时提出一种加入平均值变量的改进的关联规则。实践证明,基于自定义的语法规则提取方法能够有效地从中文文本中提取出主、谓、宾语,进而提取出非等级关系,改进的关联规则方法能够提取出集中出现在部分文本集中的领域词汇非等级关系。
There is lack of non-hierarchical relations extraction suitable for Chinese texts. Association Rules do not effectively exlracl wcabulary relations concentrated in part of the text. This paper defines a set of non-hierarchical relations extraction rules of Chinese texts and an improved association rules based on average value. The practical results show that nun-hierarchical relations extraction rules of Chinese texts can efficiently extract subject, predicate and object in Chinese texts, and form the non-hierarchical relations. Improved association rules can extract ram-hierarchical relations of the wx'abulary concentrated in part of the text.
出处
《图书情报工作》
CSSCI
北大核心
2013年第22期126-131,147,共7页
Library and Information Service
基金
国家社会科学基金重大项目"基于语义的馆藏资源深度聚合与可视化展示研究"(项目编号:11&ZD152)和国家社会科学基金重大项目"我国质量安全评价与网络预警方法研究"(项目编号:11&ZD158)研究成果之一
关键词
非等级关系提取
语法规则
关联规则
中文文本
non-hierarchical relations extraction grammar rule association rule Chinese text