-
题名基于启发式错误驱动学习的中文时间表达式识别
被引量:3
- 1
-
-
作者
贺瑞芳
秦兵
潘越群
刘挺
李生
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2008年第12期1258-1262,共5页
-
基金
863计划(2006AA01Z145)
国家自然科学基金(60435020
60675034)资助项目
-
文摘
提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注,采用启发式A*算法搜索策略进行错误驱动学习,降低了规则学习的复杂度,并具有区分每条规则的有效性和规则间相容性的优点,使系统性能提高近6%。最终在封闭测试集和开放测试集上,F值分别达到了77.96%和77.92%。
-
关键词
时间表达式识别
时间触发词
依存分析
错误驱动学习
A*算法
-
Keywords
time expression recognition, time trigger, dependency parsing, error-driven learning, A ^* algorithm
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于转换的错误驱动与决策树算法的句子边界自动识别
- 2
-
-
作者
李康熙
李为山
-
机构
合肥工业大学外国语学院
-
出处
《科技通报》
北大核心
2012年第10期134-136,共3页
-
基金
中央高校基本科研业务费专项资金资助(2012HGXJ0109)
中央高校基本科研业务费专项资金资助(2012HGXJ0110)
-
文摘
结合基于转换的错误驱动算法和决策树算法,并综合考虑句点标记在语料库中的复杂使用情况,生成能够自动划分英语句子边界的程序。实验结果表明,该方法具有较高的准确率,能够为后续语料库加工提供良好的前提基础。
-
关键词
句子边界识别
基于转换的错误驱动算法
决策树算法
-
Keywords
Sentence Boundary Detection
Transformation-based Error-driven Learning
Decision Tree
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于表驱动的纯软件签名错误检测算法
被引量:1
- 3
-
-
作者
陈建
沈潇军
姚一杨
邢雅菲
琚小明
-
机构
国家电网浙江省电力公司信息通信分公司
华东师范大学计算机科学与软件工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第4期187-192,共6页
-
基金
上海市自然科学基金(15ZR1410000)
-
文摘
针对临时性、间歇性与永久性错误的存在,处理器获取并执行一条不正确的指令将导致控制流错误的发生。为此,在研究通过软件签名的控制流检错(CFDSS)算法的基础上,基于表驱动形式,提出一种纯软件签名错误检测算法(EDSS)。构建二维表(CFID),用于存储控制流图的信息,通过比较基本块中的签名和存储在CFID表中的签名检测出非法的指令跳转。对于CFDSS算法不能有效检测的共享分支扇入节点的非法指令跳转错误,可成功检测出这类错误。实验结果表明,EDSS算法的平均错误检测覆盖率比CFDSS算法高出1.3%,对具有共享分支扇入节点的检错能力平均高出约1.9%。
-
关键词
表驱动
软件签名
错误检测
通过软件签名的控制流检错算法
控制流图
-
Keywords
table-driven
software signature
error detection
Controlled Flow Detection by Software Signature(CFDSS)algorithm
control flow graph
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于语法树高度的汉语韵律短语预测
被引量:6
- 4
-
-
作者
杨鸿武
王晓丽
陈龙
裴东
郭威彤
蔡莲红
-
机构
西北师范大学物理与电子工程学院
清华大学深圳研究生院
清华大学计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第36期139-143,167,共6页
-
基金
国家自然科学基金面上项目(No.60875015)
教育部科学研究重点项目(No.208146)~~
-
文摘
在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标注了语法层级结构,并利用语法树高度描述语法词之间连接的紧密程度。通过分析韵律短语边界与语法结构的关系,发现韵律短语边界受语法树高度、语法词词性和语法词词长的影响,因此选择了这三个特征,利用TBL算法和400句训练语句训练了预测模型。测试集上的预测结果表明,提出的方法在小规模训练语料下,韵律短语预测的精确率达到了75.2%,召回率达到了77.1%,F-Score达到了76.1%。
-
关键词
韵律结构预测
语法结构
韵律短语
语法树高度
错误驱动的规则学习算法(TBL)
-
Keywords
prosodic structure prediction
syntax structure
prosodic phrase
height of syntax tree
Transformation-based Er-ror-driven Learning(TBL)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义角色的汉语韵律短语预测
- 5
-
-
作者
王柳渝
-
机构
重庆邮电大学自动化学院
-
出处
《广东通信技术》
2017年第1期67-69,79,共4页
-
文摘
韵律结构层级中的韵律短语是体现文本节奏感和语义完整性的关键所在。本文分析了汉语语义角色信息与韵律结构层级的关系,并对语义角色分析结果进行语义角色特征提取,将语义角色特征作为深层韵律预测特征与浅层语法特征相结合,采用TBL算法实现对韵律短语层级的预测。实验结果证明,采用语义角色特征作为韵律预测特征,能够提高韵律短语层级预测的准确度,比浅层语法的精度提高了15.5%。比其他句法特征的精度提高了14%。
-
关键词
语义角色
韵律短语
基于错误驱动的规则学习算法
语音合成
-
分类号
TN912.33
[电子电信—通信与信息系统]
-
-
题名基于层叠条件随机场的哈语树库构建技术研究
- 6
-
-
作者
于智娟
古丽拉.阿东别克
-
机构
新疆大学信息科学与工程学院
-
出处
《计算机应用与软件》
CSCD
2016年第3期71-75,82,共6页
-
基金
国家自然科学基金项目(61063025
61363062)
-
文摘
针对如何提高基于统计的哈萨克语句法分析算法的处理性能问题,提出一种通过人机交互来构建哈萨克语树库的方法。在自动句法标注阶段,采用层叠条件随机场模型实现,并在其低层与高层模型之间加入改进的基于转换的错误驱动学习算法来进行简单句的自动句法标注及自动校正。最后对特殊的整体标记错误进行人工校对,形成基于短语结构的哈萨克语树库。实验结果表明,该方法在很大程度上减少了人力及物力的投入,提高了分析精度及整体处理效率,并为后期基于哈萨克语的句法机器翻译及文本挖掘奠定了一定的基础。
-
关键词
哈萨克语树库
人机交互
层叠条件随机场
错误驱动学习算法
-
Keywords
Kazakh treebank
Human-machine interaction
Cascade conditional random fields
Error-driven learning algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-