-
题名基于词典特征优化和依存关系的中文时间表达式识别
被引量:4
- 1
-
-
作者
高源
席耀一
李弼程
李苏奕
-
机构
信息工程大学
解放军电视宣传中心
-
出处
《信息工程大学学报》
2016年第4期490-495,共6页
-
基金
国家社会科学基金资助项目(14BXW028)
-
文摘
提出一种基于词典特征优化和依存关系的时间表达式识别方法。首先针对中文文本时间表达式边界定位不准确及长距离依赖的问题,优化了传统时间词典特征,将时间词典分为时间词词典和时间单位词典;其次针对传统基于机器学习的时间表达式识别方法忽视时间表达式本身结构特点的问题,在优化后的词典特征的基础上提取依存特征,挖掘时间表达式的结构信息;最后综合时间表达式的基本特征、词典特征和依存特征,在条件随机场模型上完成时间表达式识别。在中文语料上进行实验,时间表达式识别达到较好效果。
-
关键词
时间表达式
时间表达式识别
时间词典
条件随机场
依存句法分析
-
Keywords
temporal expression
temporal expression recognition
temporal dictionary
conditional random fields
dependency parsing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本中时间信息解析方法
被引量:17
- 2
-
-
作者
张春菊
张雪英
李明
王曙
-
机构
合肥工业大学土木与水利工程学院
南京师范大学虚拟地理环境教育部重点实验室
-
出处
《地理与地理信息科学》
CSCD
北大核心
2014年第6期1-6,F0002,共7页
-
基金
国家863计划项目"泛在空间信息关联更新与面向主题时空信息挖掘"(2012AA12A403-3)
国家自然科学基金青年基金项目(41401451)
+1 种基金
中央高校基本科研业务费专项资金项目(JZ2014HGBZ0064)
国家自然科学基金项目(40971231)
-
文摘
探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等地理信息服务向动态化、多维化方向发展。
-
关键词
时间信息抽取
时间词汇词典
规范化表达
时间推理
中文文本
-
Keywords
extraction of temporal information
time vocabulary dictionary
normalized expression
temporal reasoning
Chinese text
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-