-
题名多字体印刷藏文内容监测系统研究
- 1
-
-
作者
江涛
于洪志
李艾林
窦嵘
-
机构
西北民族大学中国民族语言文字信息技术委部共建重点实验室
甘肃同元信息系统技术有限责任公司
-
出处
《信息网络安全》
2012年第8期210-211,共2页
-
基金
国家自然基金重点项目[61032008]
模式识别国家重点实验室开放课题[201001051]
西北民族大学中央高校基本业务费专项资金项目[zyz2011101]
-
文摘
针对藏文舆情分析中藏文印刷品和藏文图片内容无法自动监测的难题,文章在深入分析印刷藏文字符特征和藏文文本特点的基础上,提出支持多字体印刷藏文内容监测系统的实现方法,重点阐述藏文字符的特征提取、分类算法以及藏文文本内容监测方法。
-
关键词
印刷藏文
内容监测
特征选择
分类
-
Keywords
printed tibetan character
content detecting
feature selection
classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名统计与规则相结合的藏文人名自动识别研究
被引量:9
- 2
-
-
作者
窦嵘
加羊吉
黄伟
-
机构
甘肃同元信息系统技术有限责任公司
西北民族大学中国民族语言文字信息技术重点实验室
周口师范学院计算机科学技术系
-
出处
《长春工程学院学报(自然科学版)》
2010年第2期113-115,共3页
-
基金
国家自然科学基金(60970071)
-
文摘
提出了一种基于统计与规则相结合的藏文人名自动识别方法。该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述。根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题。实验结果表明,该方法具有较高的准确率和召回率。
-
关键词
藏文人名识别
互信息
格助词
人名词典
-
Keywords
Tibetan names recognition
mutual information
case-auxiliary word
name lexicon
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名跨Windows和Linux平台的藏文输入法研究
被引量:1
- 3
-
-
作者
于洪志
-
机构
甘肃同元信息系统技术有限责任公司
-
出处
《信息技术与标准化》
2007年第8期60-64,共5页
-
基金
电子信息产业发展基金"藏文软件开发专项"之"跨平台的藏文输入法的研发"(信部运[2005]425号)
-
文摘
介绍了跨Windows和Linux平台的藏文输入法技术及技术特征。论述了在不同操作系统环境藏文输入法的实现方法,从而设计在Windows和Linux两类OS间的输入法接口模块;讨论了使用软件移植、第三方虚拟机工具、操作系统抽象层等三种技术,设计跨多个操作系统平台的藏文输入法。
-
关键词
输入法
藏文
跨平台
接口模块
-
Keywords
The input method
Tibetan
Cross-platform
Interface modulel
-
分类号
TP391.14
[自动化与计算机技术—计算机应用技术]
-