-
题名基于规则的中文文本时间表达式识别和规范化方法
被引量:8
- 1
-
-
作者
马雷雷
李宏伟
魏勇
梁汝鹏
龚竞
-
机构
信息工程大学
四川省应急测绘与防灾减灾工程技术研究中心
[
-
出处
《信息工程大学学报》
2017年第5期560-565,共6页
-
基金
国家自然科学基金资助项目(40871183
41140012
+5 种基金
41271392
41401463
41571394)
四川省应急测绘与防灾减灾工程技术研究中心开放基金资助项目(K2014B016
K2015B014)
四川省测绘地理信息局科技支撑资助项目(J2014ZC11)
-
文摘
时间信息是事件的基本要素之一,时间信息识别在信息处理中处于基础地位。提出了一种基于规则的时间表达式识别和规范化方法。首先对中文文本时间表达式进行分类,基于正则表达式制定规则,利用模式匹配方法识别时间表达式;然后介绍了基准时间的确定方法,基于推理思想详细分析了时间表达式的规范化过程;最后通过实验进行了测试与分析,结果表明文章的方法具有较高的准确率、召回率和F值。
-
关键词
时间表达式
中文文本
规则
正则表达式
识别
规范化
推理
-
Keywords
temporal expression
Chinese text
rule
regular expression
recognition
normalization
reasoning
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-
-
题名基于规则的中文时间表达式识别与规范化
被引量:3
- 2
-
-
作者
左亚尧
龙耀发
李杰骏
-
机构
广东工业大学计算机学院
-
出处
《广东工业大学学报》
CAS
2014年第3期88-94,共7页
-
基金
广东省自然科学基金资助项目(S2011040004281
S2013010014457)
-
文摘
为了解决文本时间表达式的识别与规范化问题,针对时间表达式在形式上的多样性与非结构化,提出了对时态元素进行刻画的思想,划分时间表达式类别及规范形式;在此基础上,采用正则表达式与Trie树结构相结合的方式构建出时间短语识别树,自动进行中文时间表达式的识别与分类;最后,提出规范化算法与修正算法处理识别后的结果,得到规范化形式.以中文语料进行实验,中文表达式识别与规范化工作达到较好的效果.
-
关键词
规则
正则表达式
时间表达式识别
规范化
-
Keywords
rule
regular expressions
recognition of time expressions
normalization
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于动态机制的主题事件中的时间识别和规范化
- 3
-
-
作者
李风环
郑德权
赵铁军
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《智能计算机与应用》
2015年第6期1-3,7,共4页
-
基金
国家自然科学基金(61173073)
国家国际科技合作专项(2014DFA11350)
-
文摘
事件中与主题相关的时间信息体现了事件在时间维度的特征。而当前面向事件的时间识别大多是基于句子或短语的,并采用静态时间值机制。本文提出了一个面向主题事件的时间识别模型。该模型采用参考时间动态选择机制对时间表达式进行规范化,然后利用设置了优先级的关键词,将基于句子或短语的时间识别转化为基于篇章的时间识别,从而识别主题事件中的时间。改善了纯粹基于关键词或静态参考时间机制的主题事件中的时间识别的性能。
-
关键词
主题事件
时间表达式规范化
时间识别
参考时间
动态
-
Keywords
Topic Event
Temporal Expression Normalization
Time Recognition
Reference Time
Dynamic
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于条件随机域模型的英语时间表达式识别研究
被引量:2
- 4
-
-
作者
王凤玲
-
机构
菏泽学院计算机与信息工程系
-
出处
《电子技术(上海)》
2012年第5期8-10,共3页
-
文摘
时间表达式在多个自然语言处理领域都有着重要的作用,为了更好地识别时间表达式,提出使用条件随机域模型结合多种特征的方法对英语时间表达式进行识别,并采用TimeML标记语言对识别结果进行标记。采用Timebank1.1作为评测语料,通过实验结果发现各种特征的选择和应用是系统非常重要的部分,文中所选取的特征对于英语时间表达式的识别来说是非常成功的。
-
关键词
时间表达式
条件随机域
TimeML
时间表达式识别与归范化(tern)
特征
-
Keywords
temporal expression
conditional random fields
TimeML
temporal expression recognition andrormalization(tern)
feature
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-