期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
论现代汉语句法层次分析的拓展——基于构式语法的应用 被引量:1
1
作者 南晓民 《南华大学学报(社会科学版)》 2012年第3期93-96,共4页
传统的句法层次分析法对于超出常见句法结构关系外的语句,按层次分析的原则往往难以进行"二分"操作;文章从构式语法出发,将层次分析中的句法构式分为三类,采用不同的处理策略,力图解决问题并拓展传统的句法层次分析;并主张针... 传统的句法层次分析法对于超出常见句法结构关系外的语句,按层次分析的原则往往难以进行"二分"操作;文章从构式语法出发,将层次分析中的句法构式分为三类,采用不同的处理策略,力图解决问题并拓展传统的句法层次分析;并主张针对不同构式的不同特点,采取不同的教学策略并遵循一定顺序,希望对传统的汉语语法教学能有所促进。 展开更多
关键词 现代汉语 句法层次分析 构式语法 能产性构式 凝固性构式
下载PDF
基于多层协同纠错的中文层次句法分析 被引量:3
2
作者 蒋志鹏 关毅 董喜双 《中文信息学报》 CSCD 北大核心 2014年第4期29-36,共8页
层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段。该文将其中的组块分析细分为基本块分析和复杂块分析,利用条件随机域模型代替最大熵模型进行序列化标注。由于层次句分... 层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段。该文将其中的组块分析细分为基本块分析和复杂块分析,利用条件随机域模型代替最大熵模型进行序列化标注。由于层次句分析中错误累积问题尤为严重,该文提出了一种简单可行的错误预判及协同纠错算法,跟踪本层预判的错误标注结果进入下一层,利用两层预测分数相结合的方式协同纠错。实验结果表明,加入纠错方法后,层次句法分析在保证解析速度的同时,获得了与主流中文句法分析器相当的解析精度。 展开更多
关键词 层次句法分析 条件随机域模型 组块分析 多层协同纠错
下载PDF
基于句法规则层次化分析的神经机器翻译 被引量:6
3
作者 张海玲 邵玉斌 +2 位作者 杨丹 龙华 杜庆治 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2300-2306,共7页
神经机器翻译是人工智能和自然语言处理领域中的一个非常重要的研究方向,而句法分析在信息处理中起着承上启下的作用,在翻译过程中融入句法层面的语言学知识,对于推动机器翻译的发展具有重要的理论意义和应用价值.针对句式结构复杂的长... 神经机器翻译是人工智能和自然语言处理领域中的一个非常重要的研究方向,而句法分析在信息处理中起着承上启下的作用,在翻译过程中融入句法层面的语言学知识,对于推动机器翻译的发展具有重要的理论意义和应用价值.针对句式结构复杂的长句翻译效果不佳的问题,本文提出了一种句法规则层次化分析方法,识别并提取出最长短语和句子框架部分,再采用分而治之的策略,训练基于自注意力机制的Transformer模型,对短语和框架分别翻译再组合,得到最终译文.在中-英翻译任务上,实验结果表明,与基准系统相比,该方法能显著提高翻译性能,译文BLEU值获得了0.95个点的提升. 展开更多
关键词 神经机器翻译 句法层次分析 最长短语 Transformer模型
下载PDF
基于CRF和多元规则的层次化句法分析 被引量:1
4
作者 杨陈菊 孙俊 +2 位作者 皮乾东 邵玉斌 龙华 《吉林大学学报(理学版)》 CAS 北大核心 2020年第6期1452-1460,共9页
针对句法分析中细粒度和粗粒度组块识别模型的冲突问题,为解决句法分析中词语搭配规则多、减少搭配优先级变动的影响,提出一种结合条件随机场(CRF)和多元规则的层次化句法分析模型.先利用CRF算法识别细粒度语句的组块标记序列,然后结合... 针对句法分析中细粒度和粗粒度组块识别模型的冲突问题,为解决句法分析中词语搭配规则多、减少搭配优先级变动的影响,提出一种结合条件随机场(CRF)和多元规则的层次化句法分析模型.先利用CRF算法识别细粒度语句的组块标记序列,然后结合统计和多元规则识别粗粒度组块,在识别出的组块中层层引入不同优先级的二元、三元规则.该模型实现了同时进行细粒度和粗粒度组块的识别,可更好地服务于句法分析.在Chinese TreeBank8.0(CTB8.0)语料上采用5-折交叉验证,结果表明,相比于仅使用二元、三元规则及使用CRF+二元规则的句法分析,该模型的正确率分别约提高12%,3%,5%,验证了该模型有效性和稳定性. 展开更多
关键词 层次句法分析 条件随机场 多元规则 组块识别
下载PDF
基于RNN的中文二分结构句法分析 被引量:15
5
作者 谷波 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2019年第1期35-45,共11页
为了构建一个简单易扩展的中文句法分析器,我们依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个3万句的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构。该文将中文句法分析转换... 为了构建一个简单易扩展的中文句法分析器,我们依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个3万句的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构。该文将中文句法分析转换为迭代二分的序列标注问题,并根据该任务的特点,提出了在词的间隔上进行标记的序列标注模型(RNN-Interval,RNN-INT),与常用的循环神经网络模型(RNN,LSTM)和条件随机场模型(CRF)进行对比实验,使用mx2交叉验证序贯t-检验来比较模型。实验结果表明,RNN-INT模型在窗口为1的词特征就可达到最好的性能,并好于其他窗口大小和其他序列标注模型(RNN,LSTM,CRF)。最后,在测试集上,在人工分词下,RNN-INT在短语级别的F1值(块F1)达到71.25%,在句子级别的准确率达到约43%。 展开更多
关键词 层次句法分析 循环神经网络(RNN) m×2CV序贯t-检验
下载PDF
面向中文电子病历的句法分析融合模型 被引量:4
6
作者 蒋志鹏 关毅 《自动化学报》 EI CSCD 北大核心 2019年第2期276-288,共13页
完全句法分析是自然语言处理(Natural language processing, NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record, CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病... 完全句法分析是自然语言处理(Natural language processing, NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record, CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病历模式化强的子语言特征,首次以树片段形式化中文电子病历复用的模式,提出了面向数据句法分析(Dataoriented parsing, DOP)和层次句法分析融合模型.在树片段抽取阶段,提出效率更高的标准树片段和局部树片段抽取算法,分别解决了标准树片段的重复比对问题,以及二次树核(Quadratic tree kernel, QTK)的效率低下问题,获得了标准树片段集和局部树片段集.基于上述两个树片段集,提出词汇和词性混合匹配策略和最大化树片段组合算法改进面向数据句法分析模型,缓解了无效树片段带来的噪声.实验结果表明,该融合模型能够有效改善中文电子病历句法分析效果,基于少量标注语料F1值能够达到目前最高的80.87%,并且在跨科室句法分析上超过Stanford parser和Berkeley parser 2%以上. 展开更多
关键词 中文电子病历 完全句法分析 面向数据句法分析 层次句法分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部