期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于浅层句法特征的评价对象抽取研究 被引量:48
1
作者 徐冰 赵铁军 +1 位作者 王山雨 郑德权 《自动化学报》 EI CSCD 北大核心 2011年第10期1241-1247,共7页
随着网络评论文本数量的快速增长,文本情感分析越来越受到研究者的广泛关注.句子级文本情感分析就是对主观性文本进行细粒度的挖掘,有重要的研究价值.评论句中的评价对象抽取是句子级情感分析要研究的关键问题之一.为了提高评价对象抽... 随着网络评论文本数量的快速增长,文本情感分析越来越受到研究者的广泛关注.句子级文本情感分析就是对主观性文本进行细粒度的挖掘,有重要的研究价值.评论句中的评价对象抽取是句子级情感分析要研究的关键问题之一.为了提高评价对象抽取的性能,本文提出在系统模型的训练过程中引入浅层句法信息和启发式位置信息,同时在不增加领域词典的情况下,有效提高系统的精确率.实验结果表明,将本文提出的特征引入到条件随机域模型和对比模型后,系统的各项指标均有所提高,并且条件随机域模型的结果优于对比模型.同时,将条件随机域模型的结果与2008年国内中文评测的最大值比较,其F值超过最大值5%. 展开更多
关键词 文本情感分析 意见挖掘 评价对象抽取 浅层句法特征 位置特征
下载PDF
基于浅层句法分析的中文语义角色标注研究 被引量:9
2
作者 王鑫 孙薇薇 穗志方 《中文信息学报》 CSCD 北大核心 2011年第1期116-122,共7页
语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想。因此该文将中文语义角色标注... 语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想。因此该文将中文语义角色标注建立在了浅层句法分析的基础上。在句法分析阶段,利用构词法获得词语的"伪中心语素"特征,有效缓解了词语级别的数据稀疏问题,从而提高了句法分析的性能,F值达到了0.93。在角色标注阶段,利用构词法获得了目标动词的语素特征,细粒度地描述了动词本身的结构,从而为角色标注提供了更多的信息。此外,该文还提出了句子的"粗框架"特征,有效模拟了基于完全句法分析的角色标注中的子类框架信息。该文所实现的角色标注系统的F值达到了0.74,比前人的工作(0.71)有较为显著的提升,从而证明了该文的方法是有效的。 展开更多
关键词 语义角色标注 浅层句法分析 语素 构词法
下载PDF
融合浅层句法分析的蛋白质互作用信息抽取方法 被引量:2
3
作者 钱伟中 王娟 +1 位作者 傅翀 秦志光 《计算机应用研究》 CSCD 北大核心 2011年第3期972-975,共4页
针对传统基于机器学习方法在蛋白质互作用信息抽取中的缺陷,提出融合浅层句法分析的信息抽取方法,该方法将候选的句子进行浅层句法分析,包括对短语切分、同位语分析、并列结构分析、句子切分的处理。经过该步骤,句子被划分为多个单独的... 针对传统基于机器学习方法在蛋白质互作用信息抽取中的缺陷,提出融合浅层句法分析的信息抽取方法,该方法将候选的句子进行浅层句法分析,包括对短语切分、同位语分析、并列结构分析、句子切分的处理。经过该步骤,句子被划分为多个单独的语法单元。然后,对每个语法单元采用基于最大熵的分类方法进行蛋白质互作用信息抽取。该方法在BC-PPI语料库中获得了62.1%的F1性能。比较实验结果表明,该方法能有效减少误判和漏判,提高信息抽取的性能。 展开更多
关键词 蛋白质互作用 信息抽取 浅层句法分析 最大熵
下载PDF
基于浅层句法分析和最大熵的问句语义分析 被引量:2
4
作者 李冬梅 张琪 +1 位作者 王璇 檀稳 《计算机科学与探索》 CSCD 北大核心 2017年第8期1288-1295,共8页
为了使中文问答系统能够准确高效地识别问句的语义,在构建生物医学领域本体的基础上,提出了一种基于浅层句法分析和最大熵模型的语义分析算法。该算法首先对自然语言问句进行语义块识别,如果识别成功,则形成问句向量,然后利用本体进行SP... 为了使中文问答系统能够准确高效地识别问句的语义,在构建生物医学领域本体的基础上,提出了一种基于浅层句法分析和最大熵模型的语义分析算法。该算法首先对自然语言问句进行语义块识别,如果识别成功,则形成问句向量,然后利用本体进行SPARQL查询;如果识别失败,则调用最大熵模型,判断问句的语义角色。最大熵模型利用标注好语义的熟语料进行训练,提取语义组块特征,从而判断出最可能的句型,形成问句向量,然后再利用本体进行查询,获取答案。通过实验与其他方法相比,新算法具有更高的查准率和召回率。 展开更多
关键词 中文问答系统 本体 浅层句法分析 最大熵 SPARQL查询
下载PDF
基于HMSVM模型的中文浅层句法分析 被引量:1
5
作者 王仲华 卢娇丽 付继宗 《电脑开发与应用》 2013年第2期30-32,共3页
隐马尔科夫支持向量机(HMSVM)是一种新颖的结构化支持向量机模型,该模型在序列标注学习任务比如英文组块分析中的有效性已经被证明,将该模型用于中文浅层句法分析识别任务,实验结果表明,该模型获得了较好的准确率和召回率。
关键词 浅层句法 隐马尔科夫支持向量机 序列标注 边界识别
下载PDF
基于浅层句法信息的翻译实例获取方法研究
6
作者 陈鄞 赵铁军 +1 位作者 杨沐昀 李生 《电子与信息学报》 EI CSCD 北大核心 2009年第2期310-313,共4页
翻译实例库是基于实例的机器翻译系统的主要知识源。本文采用基于浅层句法分析的方法进行翻译实例的获取。首先根据浅层句法信息划分源语言和目标语言的翻译单元,然后在词对齐结果的指导下,利用统计对齐模型确定源语言和目标语言翻译单... 翻译实例库是基于实例的机器翻译系统的主要知识源。本文采用基于浅层句法分析的方法进行翻译实例的获取。首先根据浅层句法信息划分源语言和目标语言的翻译单元,然后在词对齐结果的指导下,利用统计对齐模型确定源语言和目标语言翻译单元之间的映射关系,从而获取翻译实例。通过与几种较具代表性的翻译实例获取方法进行对比实验发现,无论是对翻译实例库直接评测,还是通过EBMT系统进行间接评测,该方法都获得了令人满意的效果。 展开更多
关键词 翻译实例库 基于实例的机器翻译 浅层句法分析
下载PDF
基于CRF和转换错误驱动学习的浅层句法分析 被引量:1
7
作者 张芬 曲维光 +1 位作者 赵红艳 周俊生 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第3期147-150,共4页
本文提出一种CRF和基于转换错误驱动相结合的中文浅层句法分析方法。该方法应用于宾州大学中文树库,取得不错的组块识别效果。在CRF识别的基础上,对初始识别结果中的组块标注信息进行统计分析,获得候选转换规则集合;再根据定义的规则评... 本文提出一种CRF和基于转换错误驱动相结合的中文浅层句法分析方法。该方法应用于宾州大学中文树库,取得不错的组块识别效果。在CRF识别的基础上,对初始识别结果中的组块标注信息进行统计分析,获得候选转换规则集合;再根据定义的规则评价函数对候选集进行筛选,得到最终的转换规则集合;最后应用转换规则集对CRF标注的结果进行校正。实验结果表明,与单独使用CRF结果相比,组块识别的精确率、召回率以及F值均得到了提高。 展开更多
关键词 浅层句法分析 CRF 转换错误驱动学习 转换规则集
下载PDF
利用浅层句法分析提取特征的词义消歧
8
作者 孙超 张仰森 《计算机工程与设计》 CSCD 北大核心 2010年第21期4704-4707,共4页
针对如何从文本中提取高质量消歧特征的问题,提出了基于浅层句法分析的消歧特征提取算法,建立了以语块分析识别为核心的特征提取模型。该模型通过对实词类型语块识别、分析中心词语词性和虚词类型语块分析,得到多义词的消歧特征。以北... 针对如何从文本中提取高质量消歧特征的问题,提出了基于浅层句法分析的消歧特征提取算法,建立了以语块分析识别为核心的特征提取模型。该模型通过对实词类型语块识别、分析中心词语词性和虚词类型语块分析,得到多义词的消歧特征。以北京大学计算语言研究所的现代汉语基本标注语料库为基础,选取了44个多义词,通过使用最大熵消歧模型进行训练和预测实验,准确率达到了78.71%。 展开更多
关键词 词义消歧 浅层句法分析 语块 特征提取 最大熵模型
下载PDF
随机森林及其改进模型在浅层句法分析中的应用
9
作者 魏松 《计算机工程与应用》 CSCD 北大核心 2008年第9期159-161,共3页
文章首先阐述浅层句法分析可以转化为一个分类问题,然后论述了如何用随机森林的方法来完成这个分类任务。接下来对随机森林算法进行了改进,即基本模型+Bootstrap方式。实验结果显示,针对CoNLL2000提出的浅层句法分析任务,基本模型+Boots... 文章首先阐述浅层句法分析可以转化为一个分类问题,然后论述了如何用随机森林的方法来完成这个分类任务。接下来对随机森林算法进行了改进,即基本模型+Bootstrap方式。实验结果显示,针对CoNLL2000提出的浅层句法分析任务,基本模型+Bootstrap方式的Fβ值可以达到92.25%,较基本模型有明显提高。 展开更多
关键词 浅层句法分析 随机森林 决策树 BOOTSTRAP
下载PDF
基于浅层句法分析的术语抽取研究
10
作者 刘俊杰 黄圆圆 +1 位作者 任智军 崔碧莹 《微计算机信息》 2010年第18期180-182,共3页
本文提出基于浅层句法分析的术语抽取的算法,其基本思想是大规模无标注真实科技文本库中,通过基于概率模型的句法分析对句子进行句子切分,提取形成术语数据库。在此方法基础上,我们对管理科学各学科领域的技术文本自动提取出管理科学关... 本文提出基于浅层句法分析的术语抽取的算法,其基本思想是大规模无标注真实科技文本库中,通过基于概率模型的句法分析对句子进行句子切分,提取形成术语数据库。在此方法基础上,我们对管理科学各学科领域的技术文本自动提取出管理科学关键词体系。实验证明基于浅层句法分析的术语自动抽取技术对术语抽取有很好的成效。 展开更多
关键词 术语抽取 浅层句法分析 科技管理
下载PDF
基于实例学习在浅层句法分析中的应用
11
作者 徐睿 王惠临 《情报科学》 CSSCI 北大核心 2010年第2期248-251,256,共5页
机器学习技术在自然语言处理中的应用是一个研究热点。简单介绍并分析、评价了机器学习的方法之一--基于实例学习。就其在自然语言处理关键环节之一--浅层句法分析方面进行实验研究并分析其结果。最后,讨论了基于实例学习在自然语言处... 机器学习技术在自然语言处理中的应用是一个研究热点。简单介绍并分析、评价了机器学习的方法之一--基于实例学习。就其在自然语言处理关键环节之一--浅层句法分析方面进行实验研究并分析其结果。最后,讨论了基于实例学习在自然语言处理中的应用。 展开更多
关键词 机器学习 浅层句法分析 相似度比较
原文传递
面向特定领域的汉语句法主干分析 被引量:8
12
作者 齐浩亮 杨沐昀 +2 位作者 孟遥 韩习武 赵铁军 《中文信息学报》 CSCD 北大核心 2004年第1期1-5,13,共6页
本文提出了一种面向特定领域的汉语句法主干分析方法。该方法中包括浅层句法分析、模板匹配两个关键环节 ,形成用模板表示的句法主干。在浅层句法分析中 ,本文使用了级联的隐马尔可夫模型进行了短语的归并 ;而后以已有的汉语句子模板为... 本文提出了一种面向特定领域的汉语句法主干分析方法。该方法中包括浅层句法分析、模板匹配两个关键环节 ,形成用模板表示的句法主干。在浅层句法分析中 ,本文使用了级联的隐马尔可夫模型进行了短语的归并 ;而后以已有的汉语句子模板为基础 ,进行模板匹配以达到句法主干分析的目标。在针对体育新闻领域语料的开放测试中 ,模板匹配的精确率和召回率分别达到了 98 0 4 %和 81 4 3% ,句子级的精确率和召回率分别达到了 96 97%、84 85 % 。 展开更多
关键词 人工智能 自然语言处理 浅层句法分析 句法主干分析 模板
下载PDF
一种基于上下文的隐马尔可夫模型的汉语句法分析模型的实现
13
作者 郑伟发 《福建电脑》 2009年第7期71-72,共2页
本文采用中科院句法分析树库所采用的短语标记,基于汉语句子结构中上下文相关的特点,计算隐马尔科夫模型的观察概率,并利用隐马尔科夫模型构建汉语自动句法分析模型,从浅层到完全对句法进行分析;同时,利用规则集和最大成组法对划分歧义... 本文采用中科院句法分析树库所采用的短语标记,基于汉语句子结构中上下文相关的特点,计算隐马尔科夫模型的观察概率,并利用隐马尔科夫模型构建汉语自动句法分析模型,从浅层到完全对句法进行分析;同时,利用规则集和最大成组法对划分歧义进行制约和优选。实验证明,该算法能有效地消除歧义并提高句法分析正确率。 展开更多
关键词 句法分析 浅层句法分析 HMM模型 歧义消除
下载PDF
基于条件随机域模型的比较要素抽取研究 被引量:4
14
作者 王巍 赵铁军 +1 位作者 辛国栋 徐永东 《自动化学报》 EI CSCD 北大核心 2015年第8期1385-1393,共9页
随着主观性评价文本数量的不断增长,文本情感分析已经成为众多研究者关注的对象.比较要素抽取是比较句情感分析的重要研究任务之一,比较句的情感分析结果与比较要素相结合才更有意义.为了提高比较要素抽取的性能,本文提出在构建系统模... 随着主观性评价文本数量的不断增长,文本情感分析已经成为众多研究者关注的对象.比较要素抽取是比较句情感分析的重要研究任务之一,比较句的情感分析结果与比较要素相结合才更有意义.为了提高比较要素抽取的性能,本文提出在构建系统模型的过程中引入浅层句法信息、比较词候选信息和启发式位置信息等多种语言学相关特征,并且在不增加领域知识的情况下,有效提高系统的准确率和F1值,同时本文提出的方法可以有效处理含有多个比较关系的句子.实验结果表明,将本文提出的特征应用于条件随机域(Conditional random fields,CRFs)模型可以有效提高比较要素抽取的各项性能指标,同时,将本文的实验结果与2012年中文情感分析评测结果的最大值进行了比较,各项指标均超过最大值,进一步证明了本文方法的有效性. 展开更多
关键词 情感分析 比较要素抽取 浅层句法特征 比较词候选特征 启发式位置特征
下载PDF
汉语组块分析研究综述 被引量:12
15
作者 李业刚 黄河燕 《中文信息学报》 CSCD 北大核心 2013年第3期1-8,共8页
组块分析作为浅层句法分析的代表,既可以满足很多语言信息处理系统对于句法功能的需求,又可以作为子任务,在词法分析和完全句法分析以及语义分析中间架起一座桥梁,为句子进行进一步深入分析提供有力的支持,因此众多的研究将注意力集中... 组块分析作为浅层句法分析的代表,既可以满足很多语言信息处理系统对于句法功能的需求,又可以作为子任务,在词法分析和完全句法分析以及语义分析中间架起一座桥梁,为句子进行进一步深入分析提供有力的支持,因此众多的研究将注意力集中于组块分析上。该文主要对组块的定义和分类、组块识别方法、组块的标注和评测以及组块内部关系分析等几方面的研究进展进行详细的综述。最后,探讨了组块分析存在的问题并对未来的发展方向进行了展望。 展开更多
关键词 中文信息处理 浅层句法分析 组块分析 组块识别
下载PDF
分布式策略与CRFs相结合识别汉语组块 被引量:6
16
作者 黄德根 于静 《中文信息学报》 CSCD 北大核心 2009年第1期16-22,共7页
该文提出了一种基于CRFs的分布式策略及错误驱动的方法识别汉语组块。该方法首先将11种类型的汉语组块进行分组,结合CRFs构建不同的组块识别模型来识别组块;之后利用基于CRFs的错误驱动技术自动对分组组块进行二次识别;最后依据各分组F... 该文提出了一种基于CRFs的分布式策略及错误驱动的方法识别汉语组块。该方法首先将11种类型的汉语组块进行分组,结合CRFs构建不同的组块识别模型来识别组块;之后利用基于CRFs的错误驱动技术自动对分组组块进行二次识别;最后依据各分组F值大小顺序处理类型冲突。实验结果表明,基于CRFs的分布式策略及错误驱动方法识别汉语组块是有效的,系统开放式测试的精确率、召回率、F值分别达到94.90%、91.00%和92.91%,好于单独的CRFs方法、分布式策略方法及其他组合方法。 展开更多
关键词 计算机应用 中文信息处理 组块识别 条件随机域(CRFs) 分布式策略 基于CRFs的错误驱动 浅层句法分析
下载PDF
基于最大熵的汉语短语结构识别方法 被引量:2
17
作者 霍亚格 黄广君 《计算机工程》 CAS CSCD 北大核心 2011年第16期206-208,211,共4页
为提高计算机对汉语信息的处理能力,更好地进行浅层句法分析,提出一种基于最大熵的汉语短语结构识别方法。利用词语之间的互信息知识对句子的短语结构边界进行预测,应用最大熵模型建立原子模板与复合模板,选择有效的特征构成特征集,实... 为提高计算机对汉语信息的处理能力,更好地进行浅层句法分析,提出一种基于最大熵的汉语短语结构识别方法。利用词语之间的互信息知识对句子的短语结构边界进行预测,应用最大熵模型建立原子模板与复合模板,选择有效的特征构成特征集,实现对句子短语结构的识别。实例证明,基于互信息的最大熵模型能取得较好的精确率和召回率。 展开更多
关键词 浅层句法分析 互信息 边界预测 最大熵模型 特征选择
下载PDF
汉语句子谓词的自动识别方法研究 被引量:1
18
作者 谌志群 《计算机工程与应用》 CSCD 北大核心 2007年第17期176-178,共3页
谓词的自动识别是浅层句法分析的重要内容。以汉语的“谓词中枢论”为语言学基础,详细分析了汉语句子中谓词所处的上下文环境,讨论了影响谓词出现的主要语境因素。提出了一种基于统计学原理的汉语句子谓词自动识别概率模型,通过极大似... 谓词的自动识别是浅层句法分析的重要内容。以汉语的“谓词中枢论”为语言学基础,详细分析了汉语句子中谓词所处的上下文环境,讨论了影响谓词出现的主要语境因素。提出了一种基于统计学原理的汉语句子谓词自动识别概率模型,通过极大似然估计对谓词候选词在句中充当谓词的概率进行近似计算,利用绝对折扣模型对参数进行平滑。在小规模语料库上进行的实验显示,谓词识别率最高分别达到了80.6%(动词性谓词)和83.2%(形容词性谓词),表明了该方法的可行性和有效性。 展开更多
关键词 中文信息处理 浅层句法分析 谓词识别 概率模型 折扣模型
下载PDF
以“的”字结构为核心的最长名词短语识别研究 被引量:1
19
作者 钱小飞 《计算机工程与应用》 CSCD 北大核心 2010年第18期138-141,共4页
以"的"字结构为核心的最长名词短语是汉语最长名词短语的一个特殊子类。以该短语的自动识别为基础重新分化了汉语MNP的识别任务。在考察其结构和分布特征的基础上,提出"先识别右边界,识别成果参与左边界识别"的策略... 以"的"字结构为核心的最长名词短语是汉语最长名词短语的一个特殊子类。以该短语的自动识别为基础重新分化了汉语MNP的识别任务。在考察其结构和分布特征的基础上,提出"先识别右边界,识别成果参与左边界识别"的策略,并使用边界分布概率模型分治了左右边界。实验基于85万字的新闻语料上进行训练,并在42万字的同质语料上进行了开放测试,取得了80.63%的正确率和75.68%的召回率。 展开更多
关键词 最长名词短语 “的”字结构 识别 浅层句法分析
下载PDF
基于神经元网络的汉语短语边界识别 被引量:6
20
作者 奚晨海 孙茂松 《中文信息学报》 CSCD 北大核心 2002年第2期20-26,共7页
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2... 短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。 展开更多
关键词 汉语短语边界自动识别 神经元网络 中文信息处理 浅层句法分析 组块分析 文字识别
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部