期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
匹配树和决策树方法识别英语句子中的BaseNP 被引量:2
1
作者 荀恩东 李生 赵铁军 《计算机研究与发展》 EI CSCD 北大核心 2000年第7期826-832,共7页
提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语 (Base NP) .在含有词性标注和 Base NP边界标注的训练语料中 ,抽取所有不同类型 Base NP短语对应的词性序列 (Base NP规则 ) ,通过规则排序和语言学知识 ... 提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语 (Base NP) .在含有词性标注和 Base NP边界标注的训练语料中 ,抽取所有不同类型 Base NP短语对应的词性序列 (Base NP规则 ) ,通过规则排序和语言学知识 ,对其中正确率低且明显不符合语法的规则进行剔除 .在识别时 ,采取规则匹配树的方法进行最大长度匹配 ,通过归纳机器学习 C4.5算法引入上下文信息 ,由 C4.5算法学习出有效 (或无效 )应用 Base NP规则的条件 ,参照上下文条件 ,约束应用 Base NP规则 .实验结果表明 ,提出的方法具有很高的正确率和召回率 . 展开更多
关键词 basenp 匹配树 决策树 英语句子 自然语言处理
下载PDF
最大熵和Brill方法结合识别英语BaseNPs 被引量:6
2
作者 吕琳 刘玉树 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第6期500-503,共4页
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基... 为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比. 展开更多
关键词 基本名词短语 短语识别 最大熵 Brill方法
下载PDF
基于最大熵方法的中英文基本名词短语识别 被引量:61
3
作者 周雅倩 郭以昆 +1 位作者 黄萱菁 吴立德 《计算机研究与发展》 EI CSCD 北大核心 2003年第3期440-446,共7页
使用了基于最大熵的方法识别中文基本名词短语 在开放语料ChineseTreeBank上 ,只使用词性标注 ,达到了平均 87 4 3% / 88 0 9%的查全率 /准确率 由于 ,关于中文的基本名词短语识别的结果没有很好的可比性 ,又使用相同的算法 ,尝试了英... 使用了基于最大熵的方法识别中文基本名词短语 在开放语料ChineseTreeBank上 ,只使用词性标注 ,达到了平均 87 4 3% / 88 0 9%的查全率 /准确率 由于 ,关于中文的基本名词短语识别的结果没有很好的可比性 ,又使用相同的算法 ,尝试了英文的基本名词短语识别 在英文标准语料TREEBANKⅡ上 ,开放测试达到了 93 31% / 93 0 4 %的查全率/准确率 ,极为接近国际最优水平 这既证明了此算法的行之有效 。 展开更多
关键词 最大熵 基本名词短语 自然语言处理
下载PDF
汉语基本名词短语结构分析模型 被引量:28
4
作者 赵军 黄昌宁 《计算机学报》 EI CSCD 北大核心 1999年第2期141-146,共6页
本文提出了用词语潜在依存关系分析汉语baseNP结构的模型,它有以下的特点:①将依存语法知识融入概率模型中,使得baseNP结构分析在依存语法知识的指导下进行,其性能优于纯粹的概率模型——相邻模型;②词语潜在依存强度... 本文提出了用词语潜在依存关系分析汉语baseNP结构的模型,它有以下的特点:①将依存语法知识融入概率模型中,使得baseNP结构分析在依存语法知识的指导下进行,其性能优于纯粹的概率模型——相邻模型;②词语潜在依存强度的获取算法是基于MDL原则的,在模型建造时既考虑数据拟合性,又考虑模型归纳性,其性能优于基于极大似然原则的词语潜在依存强度获取算法;③词语潜在依存强度获取算法在复杂特征集上进行,可以有效地解决参数估计中的数据稀疏问题.实验结果显示,这个模型对于汉语baseNP结构分析是有效的. 展开更多
关键词 自然语言处理 语料库 名词短语 结构分析
下载PDF
结合句法组成模板识别汉语基本名词短语的概率模型 被引量:11
5
作者 赵军 黄昌宁 《计算机研究与发展》 EI CSCD 北大核心 1999年第11期1384-1390,共7页
文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决... 文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题.据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N 元模型结合起来,形成了汉语baseNP识别的新模型.实验证明,该模型的性能优于单纯基于词性标记的N 展开更多
关键词 自然语言处理 语料库 模板识别 汉语名词短语
下载PDF
混合的汉语基本名词短语识别方法 被引量:7
6
作者 胡乃全 朱巧明 周国栋 《计算机工程》 CAS CSCD 北大核心 2009年第20期199-201,共3页
提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证... 提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证明该方法能有效地识别BaseNP。 展开更多
关键词 基本名词短语 规则模板 组合分类器
下载PDF
基于知识图的汉语基本名词短语分析模型 被引量:8
7
作者 张瑞霞 张蕾 《中文信息学报》 CSCD 北大核心 2004年第3期47-53,共7页
本文提出了一种基于知识图的汉语baseNP分析模型。它以知识图为知识表示方法 ,利用《知网》为语义知识资源 ,采用以语义为主、语法为辅的策略 ,先为短语中的每一个实词构造“词图” ,然后合并“词图”而组成“短语图” ,最后得到一个关... 本文提出了一种基于知识图的汉语baseNP分析模型。它以知识图为知识表示方法 ,利用《知网》为语义知识资源 ,采用以语义为主、语法为辅的策略 ,先为短语中的每一个实词构造“词图” ,然后合并“词图”而组成“短语图” ,最后得到一个关于汉语baseNP结构信息和语义信息的知识图。因此它不仅分析了汉语ba seNP结构的内部句法关系 ,而且分析了汉语baseNP结构成分间的语义关系并以知识图的形式表示出了这种语义关系。实验结果表明这个模型对于汉语baseNP的分析是有效的。 展开更多
关键词 人工智能 自然语言处理 知识图 知网 基本名词短语
下载PDF
基于归约的汉语最长名词短语识别方法 被引量:4
8
作者 钱小飞 侯敏 《中文信息学报》 CSCD 北大核心 2015年第2期40-48,共9页
该文提出了最长名词短语(MNP)的操作性定义,分析了其构造和分布特征,并设计了一种基于baseNP归约的识别方法,利用MNP结构特性及起始有定成分、语义核心等语言学特征,缓解了最长名词短语长距离依赖与模型观察窗口受限的矛盾。开放测试取... 该文提出了最长名词短语(MNP)的操作性定义,分析了其构造和分布特征,并设计了一种基于baseNP归约的识别方法,利用MNP结构特性及起始有定成分、语义核心等语言学特征,缓解了最长名词短语长距离依赖与模型观察窗口受限的矛盾。开放测试取得了88.68%的正确率和89.21%的召回率;归约方法全面提升了识别性能,特别是将多词结构的调和平均值提高1%,优化幅度达6%以上,并且对长距离复杂结构有着更好的识别效果。 展开更多
关键词 最长名词短语 识别 归约 基本名词短语
下载PDF
基于中心语块扩展的汉藏基本名词短语对的识别 被引量:1
9
作者 诺明花 刘汇丹 +2 位作者 马龙龙 吴健 丁治明 《中文信息学报》 CSCD 北大核心 2013年第4期63-69,共7页
该文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提出基于中心语块扩展的藏语基本名词短语识别方法。提出词典与自动词对齐结果相结合的方法和基于序列相交... 该文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提出基于中心语块扩展的藏语基本名词短语识别方法。提出词典与自动词对齐结果相结合的方法和基于序列相交的方法抽取藏语中心语块,再以扩展可信度为依据扩展中心语块。实验结果表明,基于序列相交的方法所抽取的汉藏基本名词短语对能够节省人工校正的工作量,有效辅助于汉藏基本名词短语库的建设。 展开更多
关键词 藏文信息处理 基本名词短语 中心语块扩展
下载PDF
最大熵方法在英语名词短语识别中的应用研究 被引量:2
10
作者 王晓涓 赵春 《计算机仿真》 CSCD 北大核心 2011年第3期414-417,共4页
研究英语名词短语识别不仅是句法分析的基本问题,而且是进行机器翻译的基础。针对英语名词短语传统识别算法存在速度慢,效率低的难题,为提高识别准确率,提出一种基于最大熵原理的英语基本名词短语识别方法。首先综合考虑英语短语结构特... 研究英语名词短语识别不仅是句法分析的基本问题,而且是进行机器翻译的基础。针对英语名词短语传统识别算法存在速度慢,效率低的难题,为提高识别准确率,提出一种基于最大熵原理的英语基本名词短语识别方法。首先综合考虑英语短语结构特性和上下文的位置来建立特征集模板,采用改进的频次和平均互信息相结合方法提取有效特征,表示为最大熵模型形式,最大熵原理完成最后的识别过程。对Penn Treebank语料库中的英语名词短语进行仿真,证明改进方法对短语识别正确率和召回率均达90%以上,远远高于传统方法的识别率,是一种简单、快速、高效的英语名词短语识别方法。 展开更多
关键词 最大熵 名词短语 特征提取 机器翻译
下载PDF
基于语料库的基本名词短语研究 被引量:5
11
作者 徐艳华 《语言文字应用》 CSSCI 北大核心 2008年第1期120-125,共6页
词类知识的粗糙和不完备是影响自动句法分析的一个重要因素。论文以一个完全按照语法功能标准建立起来的实词词类体系为依托,考察了基本名词短语的识别问题。研究表明,利用这个实词词类体系识别基本名词短语,正确率可以达到71.3%。
关键词 基本名词短语 功能匹配 组合模式
下载PDF
基于粗糙集的翻译方法的改进仿真研究 被引量:4
12
作者 邓子龄 《科技通报》 北大核心 2013年第10期26-29,共4页
研究提高翻译算法的翻译准确性问题。由于英语名词短语语法复杂、规则多,导致传统机器翻译算法存在效率低、准确率不高难题。为提高英语名词短语识别准确率,提出一种粗糙集的名词短语识别方法。粗糙集方法把英语名词短语识别当成一个决... 研究提高翻译算法的翻译准确性问题。由于英语名词短语语法复杂、规则多,导致传统机器翻译算法存在效率低、准确率不高难题。为提高英语名词短语识别准确率,提出一种粗糙集的名词短语识别方法。粗糙集方法把英语名词短语识别当成一个决策问题,通过粗糙集理论对特征约简和规则优化,最后对其进行进识别。采用粗糙集方法对WSJ英语名词短语样本进行仿真实验,仿真结果表明,粗糙集的名词短语识别正确率高于其它翻译方法,是一种有效英语名词短语机器识别方法。为实际设计提供依据。 展开更多
关键词 名词短语 机器翻译 粗糙集
下载PDF
基于例子的基本名词短语识别中词语分布相似度的研究 被引量:1
13
作者 赵军 黄昌宁 《模式识别与人工智能》 EI CSCD 北大核心 1998年第2期140-146,共7页
本文提出一种基于例子的基本名词短语的识别模型,并着重讨论了其中的词语相似度度量方法:首先根据词语在限定距离内的同现关系计算词语的关联度,然后利用关联词语和关联度建立词语的语境向量,并基于"相似语境中出现的词语相似"... 本文提出一种基于例子的基本名词短语的识别模型,并着重讨论了其中的词语相似度度量方法:首先根据词语在限定距离内的同现关系计算词语的关联度,然后利用关联词语和关联度建立词语的语境向量,并基于"相似语境中出现的词语相似"的假设,用词语出现的语境相似度来度量词语分布相似度.实验结果表明,这种基于分布的词语相似度度量方法是基于义类词典的相似度度量方法的重要补充. 展开更多
关键词 自然语言处理 名词短语识别 词语分布相似度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部