-
题名无指导学习语义优选
被引量:1
- 1
-
-
作者
李东明
张丽娟
赵伟
石晶
-
机构
吉林农业大学信息技术学院
长春工业大学计算机科学与工程学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第1期155-158,216,共5页
-
基金
吉林省科技发展计划项目青年基金(20100155)
吉林省科研发展计划科技支撑重点项目(20100214)
-
文摘
给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭配模式,且算法迭代收敛速度快。该方法无需语法标注的语料库,适合应用于汉语。
-
关键词
语义优选
潜在语义聚类
无指导学习
-
Keywords
semantic selectional preferences latent semantic clustering unsupervised learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于MDL和LSC的语义优选方法
- 2
-
-
作者
李东明
张丽娟
赵伟
石晶
-
机构
吉林农业大学信息技术学院
长春工业大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第17期15-18,共4页
-
基金
吉林省科研发展计划科技支撑基金资助重点项目(20100214)
吉林省科技发展计划青年基金资助项目(20100155)
-
文摘
为实现谓语动词对论元的自动选择,提出基于最小描述长度(MDL)和潜在语义聚类(LSC)的语义优选方法。基于MDL原则计算与动词搭配的名词的δsc值,根据LSC模型的EM算法求取动、名词的搭配概率P(v,n),并针对每一对动、名词计算δsc和P(v,n)之和,将其作为衡量两者语义关联度的标准。实验结果表明,该方法的F1值达到85.26%,优于单独使用MDL或LSC方法。
-
关键词
语义优选
最小描述长度
潜在语义聚类
无指导学习
期望极大化
-
Keywords
semantics preference
Minumum Description Length(MDL)
latent semantic clustering(LSC)
unsupervised learning
Expectation Maximization(EM)
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-