-
题名基于高阶词汇依存的短语结构树重排序模型
被引量:3
- 1
-
-
作者
王志国
宗成庆
-
机构
模式识别国家重点实验室(中国科学院自动化研究所)
-
出处
《软件学报》
EI
CSCD
北大核心
2012年第10期2628-2642,共15页
-
基金
国家自然科学基金(60975053
61003160)
中国科学院对外合作交流项目
-
文摘
在句法分析中,已有研究工作表明,词汇依存信息对短语结构句法分析是有帮助的,但是已有的研究工作都仅局限于使用一阶的词汇依存信息.提出了一种使用高阶词汇依存信息对短语结构树进行重排序的模型,该模型首先为输入句子生成有约束的搜索空间(例如,N-best句法分析树列表或者句法分析森林),然后在约束空间内获取高阶词汇依存特征,并利用这些特征对短语结构候选树进行重排序,最终选择出最优短语结构分析树.在宾州中文树库上的实验结果表明,该模型的最高F1值达到了85.74%,超过了目前在宾州中文树库上的最好结果.另外,在短语结构分析树的基础上生成的依存结构树的准确率也有了大幅提升.
-
关键词
短语结构
依存结构
句法重排序
高阶词汇依存关系
句法森林
-
Keywords
phrase structure
dependency structure
parse reranking
higher-order lexical dependencies
parse forest
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于LIBSVM的“就是”句句间关系判别方法
- 2
-
-
作者
周建成
吴铤
王荣波
常若愚
-
机构
杭州电子科技大学认知与智能计算研究所
杭州电子科技大学浙江保密学院
-
出处
《计算机应用》
CSCD
北大核心
2015年第7期1950-1954,共5页
-
基金
国家自然科学基金资助项目(61202281)
教育部人文社会科学研究项目青年基金资助项目(12YJCZH201)
-
文摘
针对使用规则和机器学习方法判别句间关系时出现因机器学习多次迭代而导致规则权值削弱现象,进而导致判别正确率偏低的问题,提出了在规则和机器学习相结合过程中对导入的明显规则特征进行加强处理的方法。首先,抽取依存词汇、语义、句子结构等具有明显规则的特有特征;然后,基于一些句间关系指示词提取普适的特征;其次,将特征写入待输入的数据向量,并且增加一维向量用来存储出现的明显规则特征;最后,运用LIBSVM模型结合规则和机器学习进行实验。实验结果表明,加强后的实验正确率较之加强前平均提高了两个百分点,各句间关系准确率、召回率、F1值整体上都取得了较好的结果,平均值达到了82.02%、88.95%、84.76%。实验思路和方法对研究句子间联系紧密度具有重要价值。
-
关键词
句间关系
LIBSVM
机器学习
KAPPA值
依存词汇
-
Keywords
relationship between sentences
LIBSVM
machine learning
kappa value
dependency vocabulary
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
-