-
题名一种基于使用差异的词语领域性分析方法
被引量:5
- 1
-
-
作者
李素建
宋涛
高杰
幺鹏跃
李文捷
-
机构
北京大学计算语言学教育部重点实验室
山东菏泽学院
香港理工大学计算机系
-
出处
《中文信息学报》
CSCD
北大核心
2009年第6期72-78,共7页
-
基金
国家自然科学基金资助项目(60603093
60875042)
国家973课题资助项目(2004CB318102)
-
文摘
领域知识的表达形式最终体现在词汇的领域性上,因此对领域词及其部件的领域度分析是一个关键。该文在分词的基础上,对各个领域语料进行分析,利用词语之间的关系,引入链接分析方法分析词语在各个领域中的使用重要性,并通过词语在各个领域中的使用差异性计算其领域度,从而达到领域分析的目的,获取某个领域的领域部件词。该文采用以上方法在军事、娱乐等领域进行了实验,实验结果表明该方法相对于当前常用的tf×idf方法和Bootstrapping方法,可以更有效地进行领域分析获取领域部件词。
-
关键词
人工智能
自然语言处理
领域性分析
领域词
领域部件词
链接分析
使用差异
-
Keywords
artificial intelligence
natural language processing
domain analysis
domain term
domain term component
link analysis
usage discrepancy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-