-
题名基于中文信息处理的古代汉语分词研究
被引量:30
- 1
-
-
作者
邱冰
皇甫娟
-
机构
北京大学中文系
河南工程学院图书馆
-
出处
《微计算机信息》
北大核心
2008年第24期100-102,共3页
-
文摘
本文在计算机语言处理与古代汉语词汇研究的交叉学科领域进行了新的探索,提出了一种基于计算机自动分词的词汇处理及量化统计方法,并给出了具体的实现方式。统计结果显示,古代汉语双音词比重自先秦以来以一种平稳的方式增长,该结论与古代汉语词汇研究成果一致。本文提出的方法具有良好的合理性和高效的处理性能,在一定程度上克服了传统人工分词方法的缺陷和不足,因而计算机自然语言处理在古代汉语研究中也有重要的应用价值。
-
关键词
计算机自然语言处理
中文信息处理
自动分词
-
Keywords
computer language processing
Chinese information processing
Word automatic segmentation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于无指导的词义排歧方法
- 2
-
-
作者
张宝剑
-
机构
河南职技师院计算机科学系
-
出处
《河南职业技术师范学院学报》
2002年第1期53-54,57,共3页
-
文摘
介绍了一种利用《同义词词林》和训练语料生成义类代码同现频率矩阵 ,以此作为资源进行真实语料中多义词的词义排歧。由于该方法采用无指导的学习方法 ,可以免除人工标注的开支 。
-
关键词
词义排歧
义类代码
同义词词林
同现频率矩阵
无指导学习方法
计算机自然语言处理
人工智能
-
Keywords
word sense, disambignation, word sense code, co-ocearrence natrix
-
分类号
TP301.2
[自动化与计算机技术—计算机系统结构]
TP18
[自动化与计算机技术—控制理论与控制工程]
-