-
题名英汉机器翻译中的短语自动识别算法
被引量:1
- 1
-
-
作者
朱丽秋
-
机构
曲靖师范学院外国语学院
-
出处
《现代电子技术》
北大核心
2017年第15期126-128,132,共4页
-
文摘
为了准确识别短语,设计了一种英汉机器翻译短语自动识别新算法。首先构建标记规模约为58万个英汉单词的短语语料库,为短语赋予基本的可搜索功能,保证翻译真实度;然后以短语中心点构造短语结构,改进标准GLR算法,在短语语料库的短语标记上识别短语词性,得到词性识别结果;最后通过解析线性表的句法功能校正词性识别结果中的英汉结构歧义,得到最终的识别结果。实验组织测评小组以打分方式对所设计的算法进行测评,测评结果证明算法的短语识别精度、识别速度和更新能力均很优秀。
-
关键词
英汉机器翻译
短语自动识别
GLR算法
词性识别
-
Keywords
English-Chinese machine translation
phrase automatic recognition
GLR algorithm
speech recognition
-
分类号
TN99-34
[电子电信—信号与信息处理]
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名短语及其自动识别研究评述
被引量:8
- 2
-
-
作者
李德俊
-
机构
南京国际关系学院
-
出处
《外语研究》
CSSCI
北大核心
2014年第6期8-13,共6页
-
文摘
短语是具有统计意义的词语共现,它包括固定词组、准固定词组和半自由词组。短语自动识别是短语学研究的基本问题之一,是连接短语学理论和实践的桥梁。本文阐述了三种基于统计的短语自动识别方法,并指出,英语短语自动识别虽存缺陷,但其总体适应性较好,汉语短语自动识别由于汉语自身的特点而更具复杂性。文章具体分析了汉语短语自动识别存在的主要问题,并提出了解决相关问题的初步方案。
-
关键词
短语
短语自动识别
语料库
搭配(力)度
统计测量
-
分类号
H030
[语言文字—语言学]
-
-
题名搜索日志中“V+N”、“V+V”型短语识别
被引量:1
- 3
-
-
作者
吕学强
舒燕
施水才
-
机构
北京信息科技大学中文信息处理中心
-
出处
《北京信息科技大学学报(自然科学版)》
2012年第2期53-58,共6页
-
基金
国家社会科学基金项目(09CYY021)
-
文摘
从搜狗日志语料出发,分析语料特点,以词语本身、词性信息、位置信息、查询词串频次和音节数为特征,提出了基于SVM_HMM模型的短语自动识别方法,对"V+N"、"V+V"短语进行多重对比实验,实验验证了上下文信息量的增加能提高短语识别效率,证实了音节数、位置特征对实验效果的低影响力,为搜索引擎用短语词典的构建提供技术支持,为进一步的短语类别识别研究提供方向性指导。
-
关键词
搜狗日志
SVM_HMM模型
短语自动识别
“V+N”短语
“V+V”短语
-
Keywords
Sogou log
SVM_HMM model
phrases automatic recognition
the phrase of "V+N"
the phrase of"V+V"
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于神经元网络的汉语短语边界识别
被引量:6
- 4
-
-
作者
奚晨海
孙茂松
-
机构
清华大学智能技术与系统国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2002年第2期20-26,共7页
-
基金
国家重点基础研究发展规划项目的支持 (编号 :G19980 30 5 0 7)
-
文摘
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。
-
关键词
汉语短语边界自动识别
神经元网络
中文信息处理
浅层句法分析
组块分析
文字识别
-
Keywords
automatic prediction of Chinese phrase boundary location
neural network
Chinese information processing
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-