期刊文献+
共找到255篇文章
< 1 2 13 >
每页显示 20 50 100
A Brief Analysis of Ambiguity of Words' Meaning in Translation
1
作者 杨柳 《海外英语》 2016年第7期140-141,共2页
As you can see from the title,we try to provide a brief analysis of ambiguity of words' meaning in translation practice,namely,what is ambiguity of a meaning of a word and how it is caused,and how it affects trans... As you can see from the title,we try to provide a brief analysis of ambiguity of words' meaning in translation practice,namely,what is ambiguity of a meaning of a word and how it is caused,and how it affects translation.What effective methods are available to help us achieve a successful translation? Although a perfect solution for the problems presented by the ambiguity of words' meaning is difficult to find,we try to do what it can to contribute to the solution and draw people's attention to those problems. 展开更多
关键词 ambiguITY MEANING of words TRANSLATION
下载PDF
Feature study for improving Chinese overlapping ambiguity resolution based on SVM 被引量:1
2
作者 熊英 朱杰 《Journal of Southeast University(English Edition)》 EI CAS 2007年第2期179-184,共6页
In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual informat... In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual information, accessor variety, two-character word frequency and single-character word frequency are used to describe the feature vectors respectively. Then other parameters are tried to add as complementary features to the parameters which obtain the best results for further improving the classification performance. Experimental results show that features represented by mutual information, single-character word frequency and accessor variety can obtain an optimum result of 94. 39%. Compared with a commonly used word probability model, the accuracy has been improved by 6. 62%. Such comparative results confirm that the classification performance can be improved by feature selection and representation. 展开更多
关键词 support vector machine Chinese overlapping ambiguity Chinese word segmentation word probability model
下载PDF
WORD BASED MACHINE TRANSLATION SYSTEM
3
作者 谢金宝 孙岗 杨振宇 《Journal of Shanghai Jiaotong university(Science)》 EI 1999年第2期104-108,共5页
This paper compared several methods of machine translation(MT) design, drew lessons from the idea of phrase structure, GPSG, HPSG and Corpus, took words as the core, built a set of word rules, and developed an English... This paper compared several methods of machine translation(MT) design, drew lessons from the idea of phrase structure, GPSG, HPSG and Corpus, took words as the core, built a set of word rules, and developed an English Chinese Machine Translation System based on it. The paper also discussed some technical problems on building MT system, and provided an estimation principle for using rules. With this principle the syntax ambiguities in MT system are solved better. 展开更多
关键词 machine translation word RULES DICTIONARY estimation PRINCIPLE ambiguITY ATTRIBUTE
下载PDF
Effective Analysis of Chinese Word-Segmentation Accuracy
4
作者 MA Weiyin 《现代电子技术》 2007年第4期108-110,共3页
Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidate... Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidates are invalid.These false unknown word candidates deteriorate the overall segmentation accuracy,as it will affect the segmentation accuracy of known words.In this paper,we propose several methods for reducing the difficulties and improving the accuracy of the word-segmentation of written Chinese,such as full segmentation of a sentence,processing the duplicative word,idioms and statistical identification for unknown words.A simulation shows the feasibility of our proposed methods in improving the accuracy of word-segmentation of Chinese. 展开更多
关键词 中文信息处理 汉字处理 自动分割 效率分析
下载PDF
融合多特征和句法引导的中文命名实体识别
5
作者 李莉 奚雪峰 +2 位作者 盛胜利 崔志明 周悦尧 《计算机工程与设计》 北大核心 2024年第11期3448-3456,共9页
针对基于字符的中文命名实体识别模型中所存在一词多义和实体边界潜在词歧义的问题,提出一种融合多层语义特征和句法依存引导的中文NER模型。将句法依存引导的注意力机制与双向长短期记忆网络(BiLSTM)结合,获得字特征向量。通过迭代卷... 针对基于字符的中文命名实体识别模型中所存在一词多义和实体边界潜在词歧义的问题,提出一种融合多层语义特征和句法依存引导的中文NER模型。将句法依存引导的注意力机制与双向长短期记忆网络(BiLSTM)结合,获得字特征向量。通过迭代卷积神经网络(IDCNN)提取汉字独有特征:部首与拼音。采用协同注意力机制对句法依存引导的多种向量进行特征融合。使用CRF层来获得最佳标记序列。在多个公开数据集上的实验结果表明了模型的有效性。 展开更多
关键词 中文命名实体识别 多特征融合 句法依存树 BERT 协同注意力机制 一词多义 潜在词歧义
下载PDF
聋生阅读中加工空间歧义词的眼动特征研究
6
作者 龚炜 娄龙霞 +2 位作者 柴林 陈朝阳 刘志方 《现代特殊教育》 2024年第20期30-38,共9页
通过操控句子特定区域内文字的空间歧义类型和歧义词频,追踪聋生和健听学生阅读这些句子时的眼动轨迹,探讨聋生在中文阅读语境中解决空间歧义词汇的认知特点。空间歧义区内结果显示:健听学生阅读有歧义词汇的时间(包括总注视时间和凝视... 通过操控句子特定区域内文字的空间歧义类型和歧义词频,追踪聋生和健听学生阅读这些句子时的眼动轨迹,探讨聋生在中文阅读语境中解决空间歧义词汇的认知特点。空间歧义区内结果显示:健听学生阅读有歧义词汇的时间(包括总注视时间和凝视时间)长于前词、后词一致条件;聋生的阅读时间不受空间歧义词影响。健听学生回视高频歧义词空间的概率高于回视低频歧义词空间,聋生未出现这种效应。在后置目标词汇区结果探讨前置歧义空间类型影响的持续效果,发现空间歧义词不影响目标词汇区的注视时间,聋生词频效应小于健听学生。由此得出结论:聋生解决空间歧义词的认知机制与健听学生有所差异。因此,语文教学中应重点关注提高聋生词汇表征的丰富度和词汇识别的效率,充分利用语境信息辅助其词汇学习。 展开更多
关键词 聋生 空间歧义词 词频效应 中文阅读 眼动
下载PDF
相位模糊下基于软判决的卷积码识别方法
7
作者 简熠 《现代电子技术》 北大核心 2024年第9期35-39,共5页
QPSK数据流通常具有相位模糊的问题,传统方法常采用卷积码遍历识别码字起始位置的译码算法,这将导致算法计算量大、资源占用高等诸多问题。因此,提出一种基于软判决的卷积码起始位置识别与QPSK相位模糊消除的译码方法,以有效提升译码算... QPSK数据流通常具有相位模糊的问题,传统方法常采用卷积码遍历识别码字起始位置的译码算法,这将导致算法计算量大、资源占用高等诸多问题。因此,提出一种基于软判决的卷积码起始位置识别与QPSK相位模糊消除的译码方法,以有效提升译码算法性能。首先,推导了卷积码编码序列与校验矩阵之间的数学表达式,明晰了卷积码码字起始位置与相位模糊的逻辑关系;然后,求解CCSDS标准卷积码的校验矩阵,以方程成立的概率作为判决的度量,该方法适用于各种码率的删除卷积码,具有工程实用性;最后,通过仿真分析验证了所提出方法的有效性。研究表明该方法无需遍历卷积码的码字起始位置和相位模糊,且鲁棒性较强,所需数据量较小,随着数据量的增大和卷积码码率的降低,识别准确率逐渐提高。 展开更多
关键词 卷积码 码字起始位置 相位模糊 校验矩阵 软判决 QPSK
下载PDF
《论语》歧解辨正举隅
8
作者 高霞 《现代语文》 2024年第5期55-59,共5页
整体来看,《论语》一书虽然比较通俗易懂,但也存在着少量较难解读的字词。这些字词,往往众说纷纭,使初学者无从适从,不仅影响了对句意、篇章的正确理解,也可能会导致对孔子思想乃至儒家思想的误解。兹选择“格”“曾”“施”“恶”“適... 整体来看,《论语》一书虽然比较通俗易懂,但也存在着少量较难解读的字词。这些字词,往往众说纷纭,使初学者无从适从,不仅影响了对句意、篇章的正确理解,也可能会导致对孔子思想乃至儒家思想的误解。兹选择“格”“曾”“施”“恶”“適”“莫”“几谏”“亡”“骍”“齐衰”等歧解字词,斟酌诸家之说,加以考释辨正。希望通过这一研究,能为初读者扫清部分语言障碍,并加深对孔子思想的认识。 展开更多
关键词 《论语》 歧解字词 解读
下载PDF
一种规则与统计相结合的汉语分词方法 被引量:35
9
作者 赵伟 戴新宇 +1 位作者 尹存燕 陈家骏 《计算机应用研究》 CSCD 北大核心 2004年第3期23-25,共3页
汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。
关键词 中文信息处理 分词 语料库 交集型歧义
下载PDF
分词中的歧义处理 被引量:29
10
作者 谭琼 史忠植 《计算机工程与应用》 CSCD 北大核心 2002年第11期125-127,236,共4页
歧义处理是影响分词系统切分精度的重要因素,是自动分词系统设计中的一个最困难也是最核心的问题。该文利用一种统计的方法来解决交集型歧义字段的切分。
关键词 分词 歧义处理 交集型歧义 汉字信息处理
下载PDF
汉语自动分词研究及其在信息检索中的应用 被引量:18
11
作者 曹倩 丁艳 +1 位作者 王超 潘金贵 《计算机应用研究》 CSCD 北大核心 2004年第5期71-74,91,共5页
汉语自动分词问题是中文信息检索的基础问题,也是阻碍其向前发展的“瓶颈”问题。介绍了分词技术的发展状况,分析了分词技术在信息检索过程中的应用,并讨论了信息检索和分词技术结合的方式和需要以及解决的关键技术问题。
关键词 汉语分词 分词模型 歧义分析 中文信息检索
下载PDF
基于改进BP网络的中文歧义字段分词方法研究 被引量:12
12
作者 张利 张立勇 +2 位作者 张晓淼 耿铁锁 岳宗阁 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第1期131-135,共5页
文本挖掘中中文歧义字段的自动分词是计算机科学面临的一个难题.针对汉语书写时按句连写,词间无间隙,歧义字段分词困难的特点,对典型歧义中所蕴含的语法现象进行了归纳总结,建立了供词性编码使用的词性代码库.以此为基础,通过对具有特... 文本挖掘中中文歧义字段的自动分词是计算机科学面临的一个难题.针对汉语书写时按句连写,词间无间隙,歧义字段分词困难的特点,对典型歧义中所蕴含的语法现象进行了归纳总结,建立了供词性编码使用的词性代码库.以此为基础,通过对具有特殊语法规则的歧义字段中的字、词进行代码设定,转化为神经网络能够接受的输入向量表示形式,然后对样本进行训练,通过改进BP神经网络的自学习来掌握这些语法规则.训练结果表明:算法在歧义字段分词上达到了93.13%的训练精度和92.50%的测试精度. 展开更多
关键词 文本挖掘 歧义字段 自然语言处理 神经网络
下载PDF
字典与统计相结合的中文分词方法 被引量:42
13
作者 翟凤文 赫枫龄 左万利 《小型微型计算机系统》 CSCD 北大核心 2006年第9期1766-1771,共6页
提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速... 提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速度;在基于统计的处理过程中,通过统计和规则相结合的方法提高了交集型歧义切分的准确率,并且一定条件下解决了语境中高频未登录词问题,实验结果表明,由本文算法实现的分词系统DS fenc i的分全率达99.52%,准确率达98.52%. 展开更多
关键词 中文分词 基于字典的分词 基于统计的分词 交集型分词歧义
下载PDF
基于语境信息的组合型分词歧义消解方法 被引量:10
14
作者 曲维光 吉根林 +1 位作者 穗志方 周俊生 《计算机工程》 CAS CSCD 北大核心 2006年第17期74-76,共3页
提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧义进行实验,平均准确率达到95%以上,证明该方法对于消解组合型分词歧义具有良好效果。
关键词 中文自动分词 组合型歧义 相对词频 语境计算模型
下载PDF
交集型歧义字段切分方法研究 被引量:22
15
作者 闫引堂 周晓强 《情报学报》 CSSCI 北大核心 2000年第6期637-643,共7页
本文通过动态建立独立成词能力频次库的方法以及基于词语 /词性搭配的规则库 ,对交集型歧义字段进行处理 ,大大提高了切分正确率。在 4万语料的开放测试中 ,交集型歧义字段的切分正确率可达 98%以上。
关键词 汉语 自动分词 汉字切分 交集型 歧义 独立成词能力频次
下载PDF
MIS智能接口中汉语分词系统的设计与应用 被引量:5
16
作者 谈文蓉 杨宪泽 +1 位作者 谈进 刘莉 《计算机科学》 CSCD 北大核心 2006年第7期204-206,共3页
提供汉语检索接口是MIS应用的一大趋势,其主要困难在于如何让计算机理解汉语检索用语,为此本文构建了MIS智能检索接口中的汉语分词系统,并提出了分词策略。对汉语切分中的歧义问题进行了深入的探讨,应用互信息和t-信息差完成了消歧算法... 提供汉语检索接口是MIS应用的一大趋势,其主要困难在于如何让计算机理解汉语检索用语,为此本文构建了MIS智能检索接口中的汉语分词系统,并提出了分词策略。对汉语切分中的歧义问题进行了深入的探讨,应用互信息和t-信息差完成了消歧算法的设计。实验表明,该系统具有较高的切分正确率与效率。 展开更多
关键词 MIS 自动分词 切分歧义 交集型歧义 组合型歧义
下载PDF
基于两字词簇的汉语快速自动分词算法 被引量:18
17
作者 郭祥昊 钟义信 杨丽 《情报学报》 CSSCI 北大核心 1998年第5期352-357,共6页
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提... 本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快。 展开更多
关键词 自然语言处理 汉语 分词算法 自分分词 两字词族
下载PDF
基于词典和词频的中文分词方法 被引量:19
18
作者 张恒 杨文昭 +3 位作者 屈景辉 卢虹冰 张亮 赵飞 《微计算机信息》 北大核心 2008年第3期239-240,232,共3页
汉语分词是中文信息处理的前提和基础。由于中文句子中,词与词之间没有明显的分隔标志,且存在多音多义词,因此不可避免的存在切分歧义。汉语分词已成为中文信息处理的"瓶颈"。本文通过使用带有词频的词典,采用逐词分解实现了... 汉语分词是中文信息处理的前提和基础。由于中文句子中,词与词之间没有明显的分隔标志,且存在多音多义词,因此不可避免的存在切分歧义。汉语分词已成为中文信息处理的"瓶颈"。本文通过使用带有词频的词典,采用逐词分解实现了中文自动分词,并使用词频计算、歧义消除等方法提高了分词的准确率。 展开更多
关键词 中文分词 歧义消除 词频
下载PDF
利用上下文信息解决汉语自动分词中的组合型歧义 被引量:24
19
作者 肖云 孙茂松 邹嘉彦 《计算机工程与应用》 CSCD 北大核心 2001年第19期87-89,106,共4页
组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分... 组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分而治之”的策略,继而根据实验确定了与特征矩阵相关联的上下文窗口大小、窗口位置区分、权值估计等要素,并且针对数据稀疏问题,利用词的语义代码信息对特征矩阵进行了降维处理,取得了较好的效果。笔者相信,这个模型对组合型歧义切分字段的排歧具有一般性。 展开更多
关键词 自然语言处理 中文计算 汉语自动分词 组合型歧义切分字段 中文信息处理
下载PDF
汉语双字多义词的识别优势效应 被引量:11
20
作者 陈宝国 彭聃龄 《心理学报》 CSSCI CSCD 北大核心 2001年第4期300-304,共5页
采用词汇判断法、命名法考察汉语双字多义词的识别优势效应。结果发现 ,在词汇判断任务中存在着多义词较单义词的识别优势 ,但这种识别优势只表现在低频词中。在命名任务中未发现多义词的识别优势。
关键词 多义词 单义词 频率 词汇判断 命名
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部