-
题名利用N-元模型构建甲骨卜辞词元库的研究
- 1
-
-
作者
开金宇
栗青生
-
机构
安阳师范学院计算机与信息工程学院
-
出处
《计算机应用与软件》
CSCD
2010年第9期26-27,36,共3页
-
基金
国家自然科学基金研究项目(60973051)
河南省教育厅自然科学研究项目(2008B52000
-
文摘
准确识别甲骨卜辞词元是使用计算机技术正确切分与处理甲骨卜辞信息的关键。当前,在甲骨学研究领域没有专门的甲骨卜辞词元库,自动、高效、科学、动态地构建甲骨卜辞词元库非常重要。依据甲骨卜辞特点及拥有的大量甲骨卜辞资源,提出基于N-元模型的Bi-gram模型构建甲骨卜辞词元库的技术方法。实验表明,将统计计算语言模型用于甲骨卜辞的词元库的构建具有很强的实用性和可操作性。
-
关键词
n-元模型
Bi-gram模型
高频字串
甲骨卜辞词元
-
Keywords
n-gram model Bi-gram model High-frequency string Shang dynasty oracle-bone inscriptions words and phrases
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名规则与统计相结合的兼类词处理机制
被引量:6
- 2
-
-
作者
黄德根
张丽静
张艳丽
杨元生
-
机构
大连理工大学计算机系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2003年第7期1252-1255,共4页
-
基金
国家自然科学基金 ( 60 14 3 0 0 2 )资助
-
文摘
兼类词处理是词性标注的关键所在 ,本文对兼类词排岐进行了研究 ,介绍了规则和统计相结合的排岐策略 .按照上述策略 ,实现了一个兼类词处理系统 .实验测试结果表明 ,利用规则与统计相结合的兼类词处理机制可以有效地提高排岐正确率和词性标注正确率 ,在封闭测试和开放测试中兼类词的排歧正确率分别达到了 93.91%和 91.16 % ,标注正确率分别达到了 97.85 %和 96 .71% .
-
关键词
词性标注
兼类词
规则
n-元模型
-
Keywords
Part of speech tagging
syntactic category
rule
N gram
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-