-
题名多义词词义搭配知识库与词义标注
被引量:1
- 1
-
-
作者
苏新春
-
机构
厦门大学国家语言资源监测与研究教育教材中心
-
出处
《江西科技师范大学学报》
2014年第2期1-5,共5页
-
基金
国家社科规划基金课题"基于国家语委‘通用语料库’的汉语义频词库的开发"(项目编号:04BYY009)
主持人:苏新春
-
文摘
"多义词词义搭配知识库与词义标注"是国家社科基金课题"基于国家语委‘通用语料库’的汉语义频词库的开发"的研究成果。研究过程中对最初设计的目标定位、处理的词语数量、语料规模都作了较大调整,表现为由义频研究转至义频获得,由部分多义词转至现代汉语的整体双音高频多义词,由2000万字的核心语料库转至2.5亿字的通用语料库。研究成果由7个资源库与3个软件处理平台构成,从而达到词义自动标注的目的。
-
关键词
多义词词义搭配知识库
多义词
词义自动标注
SCT
-
Keywords
the knowledge base of polysemous word meaning collocation
polyseme
automatic labeling meaning
SCT
-
分类号
H032
[语言文字—语言学]
-
-
题名基于多知识源的语义搭配知识获取及表示方法
被引量:2
- 2
-
-
作者
王璐
张仰森
吴林
-
机构
北京信息科技大学智能信息处理研究所
-
出处
《计算机工程》
CAS
CSCD
2012年第20期109-112,共4页
-
基金
国家自然科学基金资助项目(60873013
61070119)
+1 种基金
北京市属市管高等学校人才强教计划基金资助项目(PHR201007131)
北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1005)
-
文摘
为更全面准确地从字词搭配中获取语义搭配信息,提出一种新的语义搭配知识提取模型和知识库的表示方法。利用特殊度度量词语搭配的相关程度,在此基础上,基于知网的语义信息,实现从42万条记录的词语搭配中定量地抽取语义搭配信息。实验结果表明,该方法的语义搭配准确率为92.1%,且较大地扩充了字词搭配的规模。
-
关键词
词语搭配
语义搭配
特殊度
知识获取
知识表示
搭配知识库
-
Keywords
word collocation
semantic collocation
Special Degree(SD)
knowledge acquisition
knowledge representation
collocation knowledgebase
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语义频词库的开发研究
被引量:2
- 3
-
-
作者
苏新春
杜晶晶
-
机构
厦门大学
-
出处
《语言文字应用》
CSSCI
北大核心
2014年第1期10-19,共10页
-
文摘
词语库与规则库是在“多义词词义搭配知识库”中起基础与核心作用的两个子库。词语库有两个来源,一是词典词,二是真实语料词,两类词语有着书面语与口语词、正体词与异体词、语言词与言语词、通用词与领域词、稳定词与具体词等方面的差异。词语库特点会在很大程度上影响到词义标注的效果与正确率。纳入首批考察的词语为双音节多义词3771条,共有义项7861个。规则库统摄语义库、义项库、语料库,这些知识库通过规则库的组织而发挥作用。规则库是实现词义标注工程目标的直接依据,对于任何一个多义词,规则定义的多寡有无、质量好坏都会直接影响标注结果。规则库集中体现SCT整个系统的意义与价值,是语言知识与工程实施的结晶体。
-
关键词
多义词
词义搭配知识库
词语库
规则库
-
Keywords
polysemous words
word sense collocation knowledge base
word base
rule base
-
分类号
H08
[语言文字—语言学]
-