-
题名中心词驱动句法分析中的平滑技术
被引量:1
- 1
-
-
作者
袁里驰
-
机构
江西财经大学信息学院数据与知识工程江西省重点实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2013年第7期1337-1342,共6页
-
基金
国家自然科学基金(No.61262035)
江西省自然科学基金(No.2010GZS0072
+1 种基金
20122BAB201033)
江西省教育厅科技项目(No.GJJ12271)
-
文摘
解决数据稀疏问题是中心词驱动句法分析中的一个重要问题,基于词类的统计语言模型是解决统计模型数据稀疏问题的重要方法.本文在分析经典平滑算法的基础上,提出一种基于语义依存信息和互信息的词聚类算法,并利用绝对权重差分方法构造了一种可变长语言模型,即根据历史词对当前词预测所作的贡献不同,n值的大小也随之变化.进而提出了一种基于语义类和可变长模型的中心词驱动句法分析改进模型,既增强了句法分析模型的消歧能力,又解决了严重的数据稀疏问题.改进模型性能有了明显的提高,精确率和召回率分别为84.53%和82.41%,综合指标F值比Collins的中心词驱动句法分析模型提高了2.02个百分点.
-
关键词
句法分析模型
平滑算法
中心词驱动句法分析
聚类算法
-
Keywords
parsing model
smoothing algorithm
head-driven parsing
clustering algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-