期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于N-Gram模型的蒙古语文本语种识别算法的研究
被引量:
3
1
作者
马志强
张泽广
+3 位作者
闫瑞
刘利民
冯永祥
苏依拉
《中文信息学报》
CSCD
北大核心
2016年第1期133-139,共7页
互联网上蒙古语文本正在不断地增加,如何让网络中的蒙古语内容为搜索引擎和舆情分析等应用提供服务引起了社会的高度关注。首先要解决如何采集网络中蒙古语文本数据,核心是准确识别网络中蒙古语文本的问题。该文提出了基于N-Gram模型的...
互联网上蒙古语文本正在不断地增加,如何让网络中的蒙古语内容为搜索引擎和舆情分析等应用提供服务引起了社会的高度关注。首先要解决如何采集网络中蒙古语文本数据,核心是准确识别网络中蒙古语文本的问题。该文提出了基于N-Gram模型的平均距离识别算法,建立了一个能够对目标语种识别的实验平台。实验结果表明,识别算法能够很好地从中文、英文、蒙古文以及混合语言文本中识别出蒙古语文本,准确率达到99.5%以上。
展开更多
关键词
语种
识别
N-GRAM模型
平均距离识别算法
蒙古语文本
下载PDF
职称材料
题名
基于N-Gram模型的蒙古语文本语种识别算法的研究
被引量:
3
1
作者
马志强
张泽广
闫瑞
刘利民
冯永祥
苏依拉
机构
内蒙古工业大学信息工程学院
出处
《中文信息学报》
CSCD
北大核心
2016年第1期133-139,共7页
基金
国家自然科学基金(61363052)
内蒙古自治区自然科学基金(2014MS0608)
+1 种基金
内蒙古自治区高等学校科学研究项目(NJZY12052)
内蒙古工业大学重点基金(ZD201118)
文摘
互联网上蒙古语文本正在不断地增加,如何让网络中的蒙古语内容为搜索引擎和舆情分析等应用提供服务引起了社会的高度关注。首先要解决如何采集网络中蒙古语文本数据,核心是准确识别网络中蒙古语文本的问题。该文提出了基于N-Gram模型的平均距离识别算法,建立了一个能够对目标语种识别的实验平台。实验结果表明,识别算法能够很好地从中文、英文、蒙古文以及混合语言文本中识别出蒙古语文本,准确率达到99.5%以上。
关键词
语种
识别
N-GRAM模型
平均距离识别算法
蒙古语文本
Keywords
language identification
N-Gram model
average distance recognition algorithm
Mongolian text
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于N-Gram模型的蒙古语文本语种识别算法的研究
马志强
张泽广
闫瑞
刘利民
冯永祥
苏依拉
《中文信息学报》
CSCD
北大核心
2016
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部