期刊文献+

中文文本中时间信息抽取及规范化方法 被引量:9

Temporal Information Extraction and Normalization Method in Chinese Texts
下载PDF
导出
摘要 时间信息抽取和规范化表达在时空泛在信息处理、关联、聚合和内容服务中具有重要作用。设计并实现了一种基于规则的时间信息抽取和规范化表达的方法。首先,结合中文文本中时间信息描述的特点,定义了基本时间单元和派生时间单元,并由时间单元组合形成不同的时间表达式;然后,构建了时间词汇词典和时间表达式抽取的正则表达式模板;最后,设计了时间推理和计算的方法,实现了时间信息的规范化表达。基于中文文本语料进行了时间信息抽取测试。实验结果表明,本文方法具有较好的时间信息抽取效果。 Temporal information extraction and normalization expression play a significant role in information processing, association, aggregation and content service. In this paper, a method of temporal information extraction and normalization expression based on a regulation are designed and realized. First of all, combining the characteristics of temporal information description in Chinese text, the basic time unit and derived time unit are defined. Secondly, a regular expression model of temporal vocabulary glossary and the extraction of time expression is built. Finally, a method of reasoning and calculating time is designed, and the normalized expression of temporal information is realized. Then, a test on the extraction of temporal information based on Chinese text corpus is carried out, the result shows that this method has a good effect on temporal information extraction.
作者 宋国民 张三强 贾奋励 姜松言 SONG Guomin;ZHANG Sanqiang;JIA Fenli;JIANG Songyan(Information Engineering University,Zhengzhou 450001,China;69340 Troops,Yili 835000,China)
机构地区 信息工程大学 [
出处 《测绘科学技术学报》 北大核心 2019年第5期538-544,共7页 Journal of Geomatics Science and Technology
基金 国家重点研发项目(2017YFB0503500) 国家自然科学基金项目(41671407,41701457,41801317)。
关键词 中文文本 时间 信息抽取 规范化 时间表达式 正则表达式 时间推理 Chinese text temporal information extraction normalization temporal expression regular expression temporal reasoning
  • 相关文献

参考文献5

二级参考文献54

共引文献28

同被引文献117

引证文献9

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部