-
题名基于二元分类的复述搭配抽取
被引量:1
- 1
-
-
作者
赵世奇
赵琳
刘挺
李生
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2010年第6期1267-1276,共10页
-
基金
国家自然科学基金Nos.60803093
60675034
国家高技术研究发展计划(863)No.2008AA01Z144~~
-
文摘
以动宾关系的搭配为例研究复述搭配的抽取.具体地,该方法将复述搭配抽取视作二元分类问题,并综合使用了基于翻译、词典、极性词以及网络挖掘的多种特征.实验结果表明,所采用的二元分类方法对于抽取复述搭配是行之有效的,其中使用的各种特征对于提高复述搭配抽取的效果皆有帮助.利用该方法,共抽取出28万余对的复述搭配,其准确率超过70%.进一步的实验结果表明,使用抽取的复述搭配,可以为约40%的句子实现复述生成,从而说明了该方法的实际应用价值.
-
关键词
复述搭配
二元分类
复述特征
-
Keywords
paraphrase collocation
binary classification
paraphrase feature
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-