-
题名基于词元语义特征的汉语框架排歧研究
被引量:7
- 1
-
-
作者
李国臣
张立凡
李茹
刘海静
石佼
-
机构
山西大学计算机与信息技术学院
太原工业学院
计算智能与中文信息处理教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2013年第4期44-51,共8页
-
基金
国家自然科学基金资助项目(60970053)
国家语委"十二五"科研规划资助项目(YB125-19)
+1 种基金
山西省国际科技合作资助项目(2010081044)
山西省自然科学基金资助项目(20090110594)
-
文摘
框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的。因此,该文为每个目标词设置一个特征模板,并提出了特征模板的自动选择算法,首先从语料中抽取特征构成特征集,然后利用打分机制,把特征集中得分最高的特征逐个加入到特征模板中,直到相邻两次的得分不再增加。该文借助汉语框架网语义资源,利用最大熵模型建模,使用自动特征选择算法选出特征模板,并进行5-fold交叉验证,平均精确率可达到84.46%。
-
关键词
框架排歧
汉语框架网语义资源
自动特征选择
词元语义特征
-
Keywords
Chinese frame disambiguation
Chinese FrameNet
automatic feature selection
semantic feature of lexi-cal units
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-