期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
英汉机器翻译中的短语自动识别算法 被引量:1
1
作者 朱丽秋 《现代电子技术》 北大核心 2017年第15期126-128,132,共4页
为了准确识别短语,设计了一种英汉机器翻译短语自动识别新算法。首先构建标记规模约为58万个英汉单词的短语语料库,为短语赋予基本的可搜索功能,保证翻译真实度;然后以短语中心点构造短语结构,改进标准GLR算法,在短语语料库的短语标记... 为了准确识别短语,设计了一种英汉机器翻译短语自动识别新算法。首先构建标记规模约为58万个英汉单词的短语语料库,为短语赋予基本的可搜索功能,保证翻译真实度;然后以短语中心点构造短语结构,改进标准GLR算法,在短语语料库的短语标记上识别短语词性,得到词性识别结果;最后通过解析线性表的句法功能校正词性识别结果中的英汉结构歧义,得到最终的识别结果。实验组织测评小组以打分方式对所设计的算法进行测评,测评结果证明算法的短语识别精度、识别速度和更新能力均很优秀。 展开更多
关键词 英汉机器翻译 短语自动识别 GLR算法 词性识别
下载PDF
短语及其自动识别研究评述 被引量:8
2
作者 李德俊 《外语研究》 CSSCI 北大核心 2014年第6期8-13,共6页
短语是具有统计意义的词语共现,它包括固定词组、准固定词组和半自由词组。短语自动识别是短语学研究的基本问题之一,是连接短语学理论和实践的桥梁。本文阐述了三种基于统计的短语自动识别方法,并指出,英语短语自动识别虽存缺陷,但其... 短语是具有统计意义的词语共现,它包括固定词组、准固定词组和半自由词组。短语自动识别是短语学研究的基本问题之一,是连接短语学理论和实践的桥梁。本文阐述了三种基于统计的短语自动识别方法,并指出,英语短语自动识别虽存缺陷,但其总体适应性较好,汉语短语自动识别由于汉语自身的特点而更具复杂性。文章具体分析了汉语短语自动识别存在的主要问题,并提出了解决相关问题的初步方案。 展开更多
关键词 短语 短语自动识别 语料库 搭配(力)度 统计测量
下载PDF
搜索日志中“V+N”、“V+V”型短语识别 被引量:1
3
作者 吕学强 舒燕 施水才 《北京信息科技大学学报(自然科学版)》 2012年第2期53-58,共6页
从搜狗日志语料出发,分析语料特点,以词语本身、词性信息、位置信息、查询词串频次和音节数为特征,提出了基于SVM_HMM模型的短语自动识别方法,对"V+N"、"V+V"短语进行多重对比实验,实验验证了上下文信息量的增加能... 从搜狗日志语料出发,分析语料特点,以词语本身、词性信息、位置信息、查询词串频次和音节数为特征,提出了基于SVM_HMM模型的短语自动识别方法,对"V+N"、"V+V"短语进行多重对比实验,实验验证了上下文信息量的增加能提高短语识别效率,证实了音节数、位置特征对实验效果的低影响力,为搜索引擎用短语词典的构建提供技术支持,为进一步的短语类别识别研究提供方向性指导。 展开更多
关键词 搜狗日志 SVM_HMM模型 短语自动识别 “V+N”短语 “V+V”短语
下载PDF
基于神经元网络的汉语短语边界识别 被引量:6
4
作者 奚晨海 孙茂松 《中文信息学报》 CSCD 北大核心 2002年第2期20-26,共7页
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2... 短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。 展开更多
关键词 汉语短语边界自动识别 神经元网络 中文信息处理 浅层句法分析 组块分析 文字识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部