-
题名采用术语定义模式和多特征的新术语及定义识别方法
被引量:12
- 1
-
-
作者
荀恩东
李晟
-
机构
北京语言大学语言信息处理研究所
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第1期62-69,共8页
-
基金
国家"八六三"高技术研究发展计划基金项目(2006AA010101)
国家自然科学基金项目(60572158)~~
-
文摘
新术语及其定义抽取是信息抽取的重要研究内容之一.研究结果表明,在科技文献中,一个新术语往往伴随其定义出现,通过考察,在真实文本中,术语定义存在显著的语言表述特征,从大规模真实语料库中,通过考察术语定义构成的语言学模式、定义中词汇和术语周边的统计特征,提出了以术语定义的语言学模式(LPTD)作为待识别候选新术语集,同时考虑到有关新术语出现的上下文统计特征,用SVM分类器方法完成科技语料中新术语及其定义的识别.在大规模科技期刊上进行方法验证,开放性评测结果的精确率为90.5%、召回率达78.1%.
-
关键词
信息抽取
术语定义模式
统计语言学模型
支持向量机
句子隶属度
-
Keywords
information extraction
linguistic pattern of terminology definition
statistical language model
SVM classifiers membership degree of sentence
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-