-
题名基于多元判别分析的汉语句群自动划分方法
被引量:4
- 1
-
-
作者
王荣波
李杰
黄孝喜
周昌乐
谌志群
王小华
-
机构
杭州电子科技大学认知与智能计算研究所
厦门大学智能科学与技术系
-
出处
《计算机应用》
CSCD
北大核心
2015年第5期1314-1319,共6页
-
基金
国家自然科学基金资助项目(61202281
61103101)
+1 种基金
教育部人文社会科学研究项目青年基金资助项目(10YJCZH052
12YJCZH201)
-
文摘
针对目前句群划分工作缺乏计算语言学数据支持、忽略篇章衔接词的问题以及当前篇章分析较少研究句群语法单位的现象,提出一种汉语句群自动划分方法。该方法以汉语句群理论为指导,构建汉语句群划分标注评测语料,并且基于多元判别分析(MDA)方法设计了一组评价函数J,从而实现汉语句群的自动划分。实验结果表明,引入切分片段长度因素和篇章衔接词因素可以改善句群划分性能,并且利用Skip-Gram Model比传统的向量空间模型(VSM)有更好的效果,其正确分割率Pμ达到85.37%、错误分割率Window Diff降到24.08%。同时该方法在句群划分任务上有更大的优势,比传统MDA方法有更好的句群划分效果。
-
关键词
汉语句群划分
多元判别分析
篇章分析
Skip-Gram模型
篇章衔接
-
Keywords
Chinese sentences grouping
Multiple Discriminant Analysis (MDA)
discourse analysis
Skip-Gram model
discourse coherence
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于指代消解的汉语句群自动划分方法
被引量:1
- 2
-
-
作者
王荣波
孙小雪
黄孝喜
刘和平
-
机构
杭州电子科技大学计算机学院
浙江大学软件学院
-
出处
《计算机技术与发展》
2017年第8期61-65,共5页
-
基金
国家自然科学基金资助项目(61202281
61103101)
+1 种基金
教育部人文社会科学研究项目青年基金(10YJCZH052
12YJCZH201)
-
文摘
汉语句群自动划分是将篇章划分成包含不同主题的文本片段,在信息提取、文摘生成、语篇理解及其他多个领域有着极为重要的应用。指代消解是识别篇章中先行词和照应词关联起来的过程,消解不同表达是自然语言理解的基础之一。针对目前的句群划分工作的重点在于划分出主题之间的边界而较少利用其本身指代关系来进行语言理解,或者因指代模糊而得到错误的划分结果的问题,提出了一种基于指代消解的句群自动划分方法。该方法从对篇章的指代情况消解出发,利用适合中文的多层过滤指代消解方法得到指代链信息,以消除不同名词代表相同实体、代词指代不明的问题。结合指代链信息,并同时考虑篇章衔接词因素,设计并进行了基于多元判别分析(Multiple Discriminate Analysis,MDA)的一组评价函数J评价句群划分验证实验。实验结果表明,所提出的方法能够有效地进行句群自动划分,统计正确分割平均Pμ提高了7%左右。
-
关键词
句群划分
指代消解
多层过滤
多元判别分析
-
Keywords
sentences grouping
coreference resolution
multi-pass sieve
MDA
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名英语阅读中句法分析的应用
- 3
-
-
作者
范文静
陈艳丽
-
机构
唐山学院
-
出处
《科技信息》
2006年第S3期151-151,154,共2页
-
文摘
语言学习的目的在于应用语言进行交流;语法学习的目的在于帮助人们更好地运用语言。阅读是获取信息的重要手段之一。在阅读中遇到长、难句子,如能恰当地运用句法知识,可以帮助我们准确地理解短文大意。本文试图在英语句法分析与阅读之间找到一个结合点,与读者共同复习有关句法知识,学会在阅读中恰当使用句法知识,以提高阅读理解的准确性。
-
关键词
句法分析
阅读理解
划分句群
-
分类号
H319
[语言文字—英语]
-