-
题名基于义类同现频率的汉语语义排歧方法
被引量:4
- 1
-
-
作者
张永奎
张国清
-
机构
山西大学计算机科学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第7期892-896,共5页
-
基金
国家自然科学基金
山西省留学归国人员基金
-
文摘
义类标注是信息检索和自然语言处理中的一个重要问题.但依靠人工对义类进行标注不仅是一个十分烦琐的工作,而且很难把握标准.因此,对义类代码自动标注的研究就显得尤为迫切,而要实现自动标注,必须解决多义词排歧这一重要问题.在对《现代汉语词典》(以下简称《词典》)的义类标注过程中,文中通过统计相邻词语义类组合串的出现频率构造了一个同现频率矩阵集.这一同现频率矩阵集充分利用了义类体系的层次结构,极大地减少了数据稀疏和数据冗余.在此基础上,对《词典》中的多义词进行了排歧,结果较为满意.
-
关键词
义类代码串
汉语语义排歧法
自然语言处理
-
Keywords
co occurrence frequency matrix, sense code combination(SCC)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用分级建库技术建造汉语语义词典
- 2
-
-
作者
郑泽芝
张永奎
-
机构
太原师范学院数学系
山西大学计算机科学系
-
出处
《计算机工程与应用》
CSCD
北大核心
2001年第4期121-123,共3页
-
基金
国家自然科学基金项目!(69575011)
国家"863"项目!(863-306-ZT03-03-1)资助
-
文摘
文章介绍了立足于机读文本资源——机读《现代汉语词典》和机读《同义词词林》,分级建造以统一管理、共享数据资源为特征的汉语语义词典的研究工作。
-
关键词
中文信息处理
机读词典
义类代码
汉语语义词典
分级建库
-
Keywords
Chinese information processing, MRD,semantic system,semantic code,Chinese semantic dictionary
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于无指导的词义排歧方法
- 3
-
-
作者
张宝剑
-
机构
河南职技师院计算机科学系
-
出处
《河南职业技术师范学院学报》
2002年第1期53-54,57,共3页
-
文摘
介绍了一种利用《同义词词林》和训练语料生成义类代码同现频率矩阵 ,以此作为资源进行真实语料中多义词的词义排歧。由于该方法采用无指导的学习方法 ,可以免除人工标注的开支 。
-
关键词
词义排歧
义类代码
同义词词林
同现频率矩阵
无指导学习方法
计算机自然语言处理
人工智能
-
Keywords
word sense, disambignation, word sense code, co-ocearrence natrix
-
分类号
TP301.2
[自动化与计算机技术—计算机系统结构]
TP18
[自动化与计算机技术—控制理论与控制工程]
-