-
题名基于典型句型的词语搭配定量分析及提取算法
被引量:6
- 1
-
-
作者
王璐
张仰森
-
机构
北京信息科技大学
-
出处
《计算机科学》
CSCD
北大核心
2012年第B06期232-234,270,共4页
-
基金
国家自然科学基金(60873013
61070119)
+1 种基金
北京大学计算语言学教育部重点实验室开放课题基金(KLCL-1005)
北京市属市管高等学校人才强教计划项目(PHR201007131)资助
-
文摘
在分析现有的词语搭配自动提取算法的不足后,提出了一种新的词语搭配提取算法,尝试从非结构化语言知识到结构化语言知识的转化。基于词语搭配的语言学知识,构建了基于典型句型的词语搭配模型,其以动词、名词及形容词为中心词分类搭配,以实词为主干提取搭配,利用共现频率及互信息等统计学模型在大规模语料库中进行筛选,固化这些搭配知识,构建搭配知识库。
-
关键词
词语搭配
典型句型
互信息
搭配数据库
-
Keywords
Collocation; Typical patterns; MI; Collocation database
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-