期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于词向量的维吾尔语词项归一化方法 被引量:5
1
作者 罗延根 李晓 +3 位作者 蒋同海 杨雅婷 周喜 王磊 《计算机工程》 CAS CSCD 北大核心 2018年第2期220-225,共6页
使用无监督的方法,将口语文本中的非正规维吾尔语词项归一化到正规文本中意思相近的正规词,基于神经网络,利用大规模语料将维吾尔语单词映射到低维向量空间,对向量空间的非正规词进行聚类。引入一个贪心解码器对非正规词做归一化处理,... 使用无监督的方法,将口语文本中的非正规维吾尔语词项归一化到正规文本中意思相近的正规词,基于神经网络,利用大规模语料将维吾尔语单词映射到低维向量空间,对向量空间的非正规词进行聚类。引入一个贪心解码器对非正规词做归一化处理,并进行重采样迭代,从而将之前未能成功归一化的非正规词归一化。实验结果表明,使用该方法对维汉机器翻译的待翻译口语文本进行前编辑后,生成的译文质量有显著提高。该方法给维汉口语文本机器翻译系统提供一个前处理的流程,在缺乏双语口语平行语料的情况下也能有效提高机器翻译系统性能。 展开更多
关键词 维吾尔语口语文本 正规词 归一化 神经网络 重采样
下载PDF
Kauffman代数的Grobner-Shirshov基
2
作者 齐秀文 阿布都卡的·吾甫 《数学进展》 CSCD 北大核心 2019年第2期171-182,共12页
本文给出Kauffman代数的Gr?bner-Shirshov基,并且作为一个应用,还给出Kauffman代数的一组由Jones正规词组成的线性基.
关键词 Grobner-Shirshov基 Kauffman幺半群 Kauffman代数 正规词
原文传递
兼顾汉语语言特色的语言信息化建设研究
3
作者 黄居仁 陈克健 高照明 《中国社会语言学》 2016年第2期13-25,共13页
本文从语言理论与语言信息应用兼顾,人机相辅相成以及知识的累积、创造与突破这三个重要观点出发,深入探讨分析词库小组各项研究成果及其影响力。重点在中研院词库小组在汉字、词知识库、语料库、句法树库等领域建构语言资源时兼顾语言... 本文从语言理论与语言信息应用兼顾,人机相辅相成以及知识的累积、创造与突破这三个重要观点出发,深入探讨分析词库小组各项研究成果及其影响力。重点在中研院词库小组在汉字、词知识库、语料库、句法树库等领域建构语言资源时兼顾语言学理论,语言事实及信息处理要求的研究方法。并讨论这个研究方法在学术与应用上的意义与影响,特别是研究成果对汉语语言资源政策与标准化的可能启发。 展开更多
关键词 语言资源 语言信息化建设 汉字 知识库 语料库 正规
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部