期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
利用上下文信息解决汉语自动分词中的组合型歧义 被引量:24
1
作者 肖云 孙茂松 邹嘉彦 《计算机工程与应用》 CSCD 北大核心 2001年第19期87-89,106,共4页
组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分... 组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分而治之”的策略,继而根据实验确定了与特征矩阵相关联的上下文窗口大小、窗口位置区分、权值估计等要素,并且针对数据稀疏问题,利用词的语义代码信息对特征矩阵进行了降维处理,取得了较好的效果。笔者相信,这个模型对组合型歧义切分字段的排歧具有一般性。 展开更多
关键词 自然语言处理 中文计算 汉语自动分词 组合型歧义切分字段 中文信息处理
下载PDF
基于规则挖掘和Nave Bayes方法的组合型歧义字段切分 被引量:5
2
作者 张严虎 潘璐璐 +2 位作者 彭子平 张靖波 于中华 《计算机应用》 CSCD 北大核心 2008年第7期1686-1688,1704,共4页
组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分... 组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。 展开更多
关键词 中文分词 组合型歧义 词语搭配规则 语法规则
下载PDF
用于中文分词的组合型歧义消解算法 被引量:5
3
作者 袁鼎荣 李新友 邵延振 《计算机应用与软件》 CSCD 2011年第6期57-58,134,共3页
自动分词技术的瓶颈是切分歧义,切分歧义可分为交集型切分歧义和组合型切分歧义。以组合型歧义字段所在句子为研究对象,考察歧义字段不同切分方式所得结果与其前后搭配所得词在全文中的支持度,构造从合或从分切分支持度度量因子,依据该... 自动分词技术的瓶颈是切分歧义,切分歧义可分为交集型切分歧义和组合型切分歧义。以组合型歧义字段所在句子为研究对象,考察歧义字段不同切分方式所得结果与其前后搭配所得词在全文中的支持度,构造从合或从分切分支持度度量因子,依据该因子消除组合型歧义。通过样例说明和实验验证该方法可行并优于现有技术。 展开更多
关键词 中文信息处理 组合型歧义 共现支持度 歧义消解 支持度因子
下载PDF
一种基于SVM和规则消除组合型歧义的算法 被引量:2
4
作者 刘禹孜 何中市 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第10期50-53,共4页
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类... 歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径. 展开更多
关键词 自然语言处理 中文分词 组合型歧义 支持向量机 规则
下载PDF
基于语境信息的汉语组合型歧义消歧方法 被引量:7
5
作者 冯素琴 陈惠明 《中文信息学报》 CSCD 北大核心 2007年第6期13-16,42,共5页
组合型歧义切分字段一直是汉语自动分词的难点,难点在于消歧依赖其上下文语境信息。本文采集、统计了组合型歧义字段的前后语境信息,应用对数似然比建立了语境计算模型,并考虑了语境信息的窗口大小、位置和频次对消歧的影响而设计了权... 组合型歧义切分字段一直是汉语自动分词的难点,难点在于消歧依赖其上下文语境信息。本文采集、统计了组合型歧义字段的前后语境信息,应用对数似然比建立了语境计算模型,并考虑了语境信息的窗口大小、位置和频次对消歧的影响而设计了权值计算公式。在此基础上,1.使用语境信息中对数似然比的最大值进行消歧;2.使用语境信息中合、分两种情况下各自的对数似然比之和,取值大者进行消歧。对高频出现的14个组合型分词歧义进行实验,前者的平均准确率为84.93%,后者的平均准确率为95.60%。实验证明使用语境信息之和对消解组合型分词歧义具有良好效果。 展开更多
关键词 计算机应用 中文信息处理 自然语言处理 汉语自动分词 组合型切分歧义 对数似然比 语境信息
下载PDF
一种自组织的汉语组合型歧义消歧方法 被引量:3
6
作者 冯素琴 陈惠明 《计算机工程与设计》 CSCD 北大核心 2007年第3期737-739,742,共4页
组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值... 组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值估计等要素;在此基础上采用自组织方法自动扩充搭配集,使消歧信息趋于稳定;最后,对提出的方法进行了实验,实验表明,该算法能有效提高消歧准确率。 展开更多
关键词 自然语言处理 汉语自动分词 组合型切分歧义 自组织方法 消歧
下载PDF
在特定类型的二字词组合型歧义消解过程中保证分词的一致性
7
作者 陈丽江 《文教资料》 2006年第23期99-100,共2页
在汉语的自动分词过程中,组合型歧义和分词不一致常常交织在一起,严重影响了切分结果的质量。本文试通过对熟语料库中“v+a”和“m+q”结构类型的二字词进行分类,每一类确定不同的方法来消解组合型歧义,以保证分词过程中的一致性。
关键词 组合型歧义 分词一致性 结构类型
下载PDF
基于语境信息的组合型分词歧义消解方法 被引量:10
8
作者 曲维光 吉根林 +1 位作者 穗志方 周俊生 《计算机工程》 CAS CSCD 北大核心 2006年第17期74-76,共3页
提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧义进行实验,平均准确率达到95%以上,证明该方法对于消解组合型分词歧义具有良好效果。
关键词 中文自动分词 组合型歧义 相对词频 语境计算模型
下载PDF
中文分词中组合型切分歧义的消解研究 被引量:1
9
作者 尤慧丽 晏立 杨晓东 《计算机工程与应用》 CSCD 北大核心 2011年第31期125-127,134,共4页
针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提取歧义字段的上下文信息来建立规则库,然后利用C-SVM模型结合规则对组合型歧义字段进行歧义消解。最后以1... 针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提取歧义字段的上下文信息来建立规则库,然后利用C-SVM模型结合规则对组合型歧义字段进行歧义消解。最后以1998年1月《人民日报》语料中出现的组合型歧义字段进行训练和测试,实验显示消歧的平均准确率达89.33%。 展开更多
关键词 中文自动分词 组合型歧义 上下文信息 C-支持向量机
下载PDF
不同水平留学生汉语交集型与组合型切分歧义识别实验研究
10
作者 杨万兵 杨峥琳 《语言科学》 CSSCI 北大核心 2016年第3期280-290,共11页
通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2... 通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2识别错误率无显著差异,但链长为3时识别错误率显著提高;链长为1时,初级与中级识别错误率相当,链长为2、3时,初级识别错误率高于中级。文章从两类切分歧义特点、汉语水平与链长、动态语境与修改意识等方面分析了造成这些差异的原因,并提出了相应的教学建议。 展开更多
关键词 交集型切分歧义 组合型切分歧义 链长 词语识别 动态语境
下载PDF
一种改进的上下文相关的歧义字段切分算法 被引量:6
11
作者 张培颖 李村合 《计算机系统应用》 2006年第5期46-48,14,共4页
无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。歧义字段切分是中文自动分词研究中的一个“拦路虎”。在分析基于规则和基于上下文的歧义字段切分策硌基础上,提出了一种改进的上下文相关歧义字段切分算法,并根... 无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。歧义字段切分是中文自动分词研究中的一个“拦路虎”。在分析基于规则和基于上下文的歧义字段切分策硌基础上,提出了一种改进的上下文相关歧义字段切分算法,并根据汉语中特殊的语法现象,给出了切分算法的辅助策略来对待切分字符串进行预处理,不仅提高了分词的精度,还加快了分词的速度。 展开更多
关键词 自动分词 歧义字段 交集型歧义 组合型歧义
下载PDF
基于语义计算的中文歧义字段消歧算法 被引量:1
12
作者 邓凡 鱼滨 《计算机技术与发展》 2008年第6期107-110,共4页
针对中文中歧义字段对中文处理及理解带来的诸多问题提出了一种基于自然语言理解的中文汉字歧义消除算法。对于交集型歧义和组合型歧义,利用《知网》为主要语义资源,以知识图知识表示方法,通过提出的字段消歧算法,对歧义字段以及上下文... 针对中文中歧义字段对中文处理及理解带来的诸多问题提出了一种基于自然语言理解的中文汉字歧义消除算法。对于交集型歧义和组合型歧义,利用《知网》为主要语义资源,以知识图知识表示方法,通过提出的字段消歧算法,对歧义字段以及上下文的语义进行计算,从而选出正确的句子切分方案,达到消除歧义的目的。经过实验数据表明本算法提高了中文歧义字段歧义切分的正确率。 展开更多
关键词 自然语言理解 交集型歧义 组合型歧义 词义消歧 关联度
下载PDF
中文分词中的歧义识别处理策略 被引量:6
13
作者 魏莎莎 熊海灵 《微计算机信息》 2010年第30期190-192,共3页
中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。歧义现象出现频繁,是目前中文分词的一大难题。本文通过介绍歧义存在的种类,分别介绍了目前各种歧义识别的处理策略,就各种策略进行了比较分析,以及... 中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。歧义现象出现频繁,是目前中文分词的一大难题。本文通过介绍歧义存在的种类,分别介绍了目前各种歧义识别的处理策略,就各种策略进行了比较分析,以及指出未来的研究方向。 展开更多
关键词 中文分词 交集型歧义 组合型歧义 歧义识别
下载PDF
MIS智能接口中汉语分词系统的设计与应用 被引量:5
14
作者 谈文蓉 杨宪泽 +1 位作者 谈进 刘莉 《计算机科学》 CSCD 北大核心 2006年第7期204-206,共3页
提供汉语检索接口是MIS应用的一大趋势,其主要困难在于如何让计算机理解汉语检索用语,为此本文构建了MIS智能检索接口中的汉语分词系统,并提出了分词策略。对汉语切分中的歧义问题进行了深入的探讨,应用互信息和t-信息差完成了消歧算法... 提供汉语检索接口是MIS应用的一大趋势,其主要困难在于如何让计算机理解汉语检索用语,为此本文构建了MIS智能检索接口中的汉语分词系统,并提出了分词策略。对汉语切分中的歧义问题进行了深入的探讨,应用互信息和t-信息差完成了消歧算法的设计。实验表明,该系统具有较高的切分正确率与效率。 展开更多
关键词 MIS 自动分词 切分歧义 交集型歧义 组合型歧义
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部