期刊文献+
共找到344篇文章
< 1 2 18 >
每页显示 20 50 100
High performance word level sequential and parallel coding methods and architectures for bit plane coding 被引量:1
1
作者 XIONG ChengYi TIAN JinWen LIU Jian 《Science in China(Series F)》 2008年第4期337-351,共15页
This paper introduced a novel high performance algorithm and VLSI architectures for achieving bit plane coding (BPC) in word level sequential and parallel mode. The proposed BPC algorithm adopts the techniques of co... This paper introduced a novel high performance algorithm and VLSI architectures for achieving bit plane coding (BPC) in word level sequential and parallel mode. The proposed BPC algorithm adopts the techniques of coding pass prediction and parallel & pipeline to reduce the number of accessing memory and to increase the ability of concurrently processing of the system, where all the coefficient bits of a code block could be coded by only one scan. A new parallel bit plane architecture (PA) was proposed to achieve word-level sequential coding. Moreover, an efficient high-speed architecture (HA) was presented to achieve multi-word parallel coding. Compared to the state of the art, the proposed PA could reduce the hardware cost more efficiently, though the throughput retains one coefficient coded per clock. While the proposed HA could perform coding for 4 coefficients belonging to a stripe column at one intra-clock cycle, so that coding for an NxN code-block could be completed in approximate N2/4 intra-clock cycles. Theoretical analysis and experimental results demonstrate that the proposed designs have high throughput rate with good performance in terms of speedup to cost, which can be good alternatives for low power applications. 展开更多
关键词 bit plane coding high performance word-level sequential multi-word parallel
原文传递
A Pulse Width Modulation Scheme With Zero-sequence Voltage Injection for Single Phase Three-level NPC Rectifiers 被引量:9
2
作者 宋文胜 冯晓云 《中国电机工程学报》 EI CSCD 北大核心 2011年第36期I0003-I0003,共1页
直流侧中点电位电压偏移是多电平中性点钳位型变流器的主要缺点。以单相三电平NPC整流器为研究对象,以实现直流侧中点电位无漂移为控制目标,以传统的单相三电平单极性载波脉宽调制方法为基础,首先提出一种基于零序电压分量注入的载... 直流侧中点电位电压偏移是多电平中性点钳位型变流器的主要缺点。以单相三电平NPC整流器为研究对象,以实现直流侧中点电位无漂移为控制目标,以传统的单相三电平单极性载波脉宽调制方法为基础,首先提出一种基于零序电压分量注入的载波脉宽调制算法;然后在此基础上给出基于零序电压分量极限值注入的载波脉宽调制算法;并给出这2种方法的零序电压分量的设计方案;最后,对这2种方法进行了详细的理论分析、计算机仿真和1kW样机实验对比验证。研究结果表明:所提出的2种算法都能有效实现直流侧中点电位平衡控制,其中基于零序电压分量极限值注入的载波调制算法的中点电位控制具有更快动态响应速度,且其网侧电流的高次谐波主要分布在开关频率附近;而基于零序电压分量注入的载波调制算法的网侧电流高次谐波主要分布在2倍开关频率附近。但是在一个调制信号周期内,基于零序电压分量极限值注入的载波调制算法的开关切换次数比基于零序电压分量注入的载波调制算法低25%左右。 展开更多
关键词 三电平 脉冲宽度 零序电压 单相 整流器 中性点电压 调制 直流母线
下载PDF
Reading Developmental Trends in Early Years: The Influence of Word Identification Skills and Target Langauge Oral Ability to Comprehension
3
作者 Grace Njoki Mwathe 《Journalism and Mass Communication》 2015年第10期522-536,共15页
Language, reading, and reading-related tasks were administered to 148 children from lower primary (Standard 1, 2, and 3) in Kenyan schools. The aim was to investigate the literacy developmental trends across the yea... Language, reading, and reading-related tasks were administered to 148 children from lower primary (Standard 1, 2, and 3) in Kenyan schools. The aim was to investigate the literacy developmental trends across the years and establish which of the two variables, word identification skills or target language oral proficiency influenced reading comprehension performance. The results indicated that word identification skills independently influenced reading comprehension performance in both standard 2 and standard 3 classes, but target language oral skills did not. Further, the analysis of invented spelling task performance revealed evidence of transfer of alphabetic coding skills of first language to English orthography. The spelling errors reflected letter-sound patterns not found in English orthography. Analysis of the miscues in the spelling task revealed that children rely on first language phonological processes to spell target language unfamiliar words as long the languages have a common alphabetic system. 展开更多
关键词 first language oral ability target language word level skills
下载PDF
基于改进的Bag of Visual Words算法的SAR图像目标分类 被引量:1
4
作者 王跃 薄华 《电子设计工程》 2013年第12期124-127,131,共5页
"视觉词袋"(Bag of Visual Words,BOV)算法是一种有效的基于语义特征表达的物体识别算法。针对传统BOV模型存在的不足,综合利用SAR图像的灰度和纹理特征,提出基于感兴趣目标(Target of Interest,TOI)的"视觉词袋"... "视觉词袋"(Bag of Visual Words,BOV)算法是一种有效的基于语义特征表达的物体识别算法。针对传统BOV模型存在的不足,综合利用SAR图像的灰度和纹理特征,提出基于感兴趣目标(Target of Interest,TOI)的"视觉词袋"算法。首先,对训练图像进行TOI选取,用灰度共生矩阵模型提取TOI的纹理特征,再结合灰度特征,组成多维特征向量集,以簇内相似度最高、数据分布密度最大为准则,生成"视觉词袋"。其次,对测试图像,依据已生成的"视觉词袋",采用支持向量机(Support Vector Machine,SVM)分类器,实现SAR图像感兴趣目标的有效分类。实验结果表明,与传统的"视觉词袋"构建算法相比,该算法在分类正确率提高的同时,能够在训练图像较少的情况下达到良好的分类效果。 展开更多
关键词 BAG of VISUAL words算法 灰度共生矩阵 感兴趣目标 簇内相似度 支持向量机 目标分类
下载PDF
一种基于Word2vec的敏感内容识别技术 被引量:8
5
作者 金贵涛 石元兵 +2 位作者 魏忠 王雍 刘峻豪 《通信技术》 2019年第11期2750-2756,共7页
随着数据量的爆炸式增长,企业面临数据安全防护的难题,尤其是文本数据的安全防护。传统的精确匹配识别文本中敏感词的方法,因存在相似词而导致遗漏,造成数据泄露。于是,提出了一种基于Word2vec结合人工设定的不同等级敏感词识别技术,从... 随着数据量的爆炸式增长,企业面临数据安全防护的难题,尤其是文本数据的安全防护。传统的精确匹配识别文本中敏感词的方法,因存在相似词而导致遗漏,造成数据泄露。于是,提出了一种基于Word2vec结合人工设定的不同等级敏感词识别技术,从语义层面识别文本中的敏感词,并根据提出的敏感度模型计算文本敏感度,判断文本敏感等级。实验结果表明,与传统方法相比,提出的技术方法能够更准确、全面地识别文本敏感内容,并确定文本敏感等级。 展开更多
关键词 敏感词 TextRank算法 word2vec 文本敏感等级
下载PDF
文档编辑中提升Word 字处理软件使用水平的策略 被引量:3
6
作者 岳云艳 《信息与电脑》 2020年第21期98-100,共3页
随着科技的发展,计算机技术在各个行业的发展中扮演着重要的角色,Word字处理软件作为当前工作中重要的办公软件,极大提升了人们的工作效率。但在Word字处理软件的实际应用中,由于对其认识不全面,在使用上的水平仍比较低,只是简单的文字... 随着科技的发展,计算机技术在各个行业的发展中扮演着重要的角色,Word字处理软件作为当前工作中重要的办公软件,极大提升了人们的工作效率。但在Word字处理软件的实际应用中,由于对其认识不全面,在使用上的水平仍比较低,只是简单的文字输入与处理,很多功能缺乏有效的利用,从而对办公效率产生了一定的影响,也造成了一定程度的资源浪费。因此本文针对在文档编辑中如何提升Word字处理软件的使用水平进行分析,并提出相应的策略,旨在为有效提升办公效率以及使用水平提供参考。 展开更多
关键词 文档编辑 word 处理软件 使用水平
下载PDF
语音邻域密度、词性类别、语言水平对二语词汇联想反应的影响
7
作者 张萍 徐雅琛 《外语学刊》 CSSCI 北大核心 2024年第1期61-68,共8页
本文研究语音邻域密度、词性类别及语言水平对中国英语学习者二语词汇联想反应的影响。使用Lex_30测量词汇水平,采用“听—写”词联想任务考察所选词的语音邻域稀疏与密集程度以及名、动、形不同词性的刺激词联想反应差异。结果表明:(1... 本文研究语音邻域密度、词性类别及语言水平对中国英语学习者二语词汇联想反应的影响。使用Lex_30测量词汇水平,采用“听—写”词联想任务考察所选词的语音邻域稀疏与密集程度以及名、动、形不同词性的刺激词联想反应差异。结果表明:(1)高低水平学生产出的语音和语义反应均存在显著差异,语音反应比例与语言水平成负向相关;(2)不同词性的语义联想反应有显著差异,但在语音反应上无差异;(3)不同语音邻域密度的刺激词只在高语言水平者的语义反应上有显著差异,低水平者只有名词的语音及语义反应存在显著差异,部分支持邻域激活模型。 展开更多
关键词 语音邻域密度 词性类别 二语水平 二语词汇联想 语音—语义反应
下载PDF
论科技英语中wh-words引导名词性从句的用法
8
作者 陈晓霞 《大连理工大学学报(社会科学版)》 2007年第1期80-83,共4页
科技英语因其自身特点而成为一个独特的语域。wh-words可以用来引导各种从句。文章研究在科技英语中wh-words的句法功能,重点研究wh-words引导名词性从句的用法。运用统计学方法对wh-words在科技英语(T4)等语料库中的分布频率进行分析,... 科技英语因其自身特点而成为一个独特的语域。wh-words可以用来引导各种从句。文章研究在科技英语中wh-words的句法功能,重点研究wh-words引导名词性从句的用法。运用统计学方法对wh-words在科技英语(T4)等语料库中的分布频率进行分析,根据卡方测试的结果做出判断。wh-words在不同的从句中使用的频率高低不等,有些wh-words在不同的语料库中的分布存在着显著不同,如what等词。因此,在某种程度上可以说,wh-words这一组词的用法特点是科技英语区别于普通英语的一个反映。 展开更多
关键词 wh-词语 科技英语 名词性从句 语料库 卡方测试 显著水平
下载PDF
融合双图卷积与门控线性单元的方面级情感分析模型
9
作者 杨春霞 吴亚雷 +1 位作者 闫晗 黄昱锟 《计算机工程》 CAS CSCD 北大核心 2024年第4期141-149,共9页
方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融... 方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融合双图卷积与门控线性单元(GLU)的方面级情感分析模型。该模型首先采用全局词汇图来编码语料库中的词共现信息,在词汇图和句法图上利用分类概括结构来区分各种词共现频率和不同类型的句法依存关系。然后分别在2个图上进行双层卷积,继而使用Bi Affine变换模块作为桥梁,在2个图卷积网络模块之间有效地交换相关特征,从而有效地融合句法信息和词汇信息。最后利用GLU控制情感信息流向给定方面,使模型可以更专注地分析与该方面相关的情感信息,避免不相关的情感信息影响对给定方面的情感分析结果,从而提高分析的准确性。实验结果表明,在Twitter、Laptop14、Restaurant15和Restaurant16数据集上,该模型的准确率分别达到74.82%、77.61%、82.29%和89.81%,F1值分别达到72.97%、73.52%、67.72%和73.37%,方面级情感分类效果明显优于其他基线模型。 展开更多
关键词 方面级情感分析 词共现信息 双图卷积 信息交互 门控线性单元
下载PDF
面向多模态情感分析的多通道时序卷积融合
10
作者 孙杰 车文刚 高盛祥 《计算机科学与探索》 CSCD 北大核心 2024年第11期3041-3050,共10页
多模态情感分析已成为情感计算领域中的热门研究方向,它将基于单模态的情感分析扩展到基于多模态信息交流的环境。词级表示融合是建模跨模态信息交互的关键技术之一,旨在建模不同模态元素之间的相互作用。该任务面临两大挑战:模态元素... 多模态情感分析已成为情感计算领域中的热门研究方向,它将基于单模态的情感分析扩展到基于多模态信息交流的环境。词级表示融合是建模跨模态信息交互的关键技术之一,旨在建模不同模态元素之间的相互作用。该任务面临两大挑战:模态元素之间的局部交互和时间维度上的全局交互。现有方法在建模局部交互时,常采用注意力机制刻画模态元素整体特征间的相关性,但忽视了相邻元素及局部特征间的交互作用,计算成本也较高。为解决上述问题,提出一种多通道时序卷积融合(MCTCF)模型,该方法运用二维卷积网络获取多模态元素之间的局部交互。其中,局部连接可捕获相邻元素的关联,多通道卷积可学习多模态元素局部特征之间的融合,权重共享大幅降低了计算量。在得到局部交互后的序列上,时序LSTM网络可进一步建模时间维度上的全局关联。在MOSI和MOSEI数据集上的大量实验证明了MCTCF的有效性与高效性。仅用一个卷积核(三通道,28个权重参数),在许多指标上取得了最先进或具有竞争力的结果。消融研究表明,局部卷积融合和全局时序建模都是提高性能的关键。该研究强化了词级表示融合,降低了计算复杂度。 展开更多
关键词 多模态 情感分析 词级表示融合 二维卷积网络
下载PDF
混合特征及多头注意力的中文短文本分类
11
作者 江结林 朱永伟 +2 位作者 许小龙 崔燕 赵英男 《计算机工程与应用》 CSCD 北大核心 2024年第9期237-243,共7页
传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本... 传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本的字符级向量和词级向量表示,以得到更全面的文本特征向量表示;采用多头注意力机制捕捉文本序列中的依赖关系,以提高文本的语义理解;通过卷积神经网络分别提取两种向量表示的特征,并将其融合为一个特征向量,以整合文本的全局和局部信息;通过输出层得到分类结果。在三个公开数据集上的实验表明,HF-MHA能够有效地提升中文短文本分类的性能。 展开更多
关键词 中文短文本分类 注意力机制 词级向量 字符级向量
下载PDF
融合双通道的语义信息的方面级情感分析
12
作者 廖列法 张文豪 《计算机工程与设计》 北大核心 2024年第7期2228-2234,共7页
针对方面级情感分析任务中语义信息难以提取以及方面词信息难以和上下文信息相关联的问题,提出一种融合双通道的语义信息模型(FDCS)。通过BERT预训练模型搭建两个通道获取不同层次的语义信息,一个是全局信息通道,另一个是句子信息通道;... 针对方面级情感分析任务中语义信息难以提取以及方面词信息难以和上下文信息相关联的问题,提出一种融合双通道的语义信息模型(FDCS)。通过BERT预训练模型搭建两个通道获取不同层次的语义信息,一个是全局信息通道,另一个是句子信息通道;使用语义注意力融合双通道中不同层次的语义信息,将融合后的语义信息再次分别融入全局信息和句子信息;根据每个通道语义信息的不同分别提取相应的特征信息。在3个基准数据集上的实验结果表明,该模型的性能优于其它模型。 展开更多
关键词 方面级情感分析 方面词 预训练模型 双通道 语义信息 语义注意力 特征信息
下载PDF
基于语用交互的跨目标立场检测
13
作者 任科兰 张明书 +2 位作者 魏彬 姜文 闫法成 《计算机工程与设计》 北大核心 2024年第8期2513-2519,共7页
针对缺乏足够的带标注意见数据、跨目标立场检测结果不佳且可解释性弱等问题,提出一种基于语用交互(pragmatic interaction graph convolution, PIGCN)的跨目标立场检测模型。考虑情感与立场在语义上的耦合关系,利用交互式图卷积神经网... 针对缺乏足够的带标注意见数据、跨目标立场检测结果不佳且可解释性弱等问题,提出一种基于语用交互(pragmatic interaction graph convolution, PIGCN)的跨目标立场检测模型。考虑情感与立场在语义上的耦合关系,利用交互式图卷积神经网络(graphical convolutional network, GCN),增量式聚合单词在不同目标之间语用信息的相互作用,缓解目标间的信息孤岛问题。实验结果表明,该模型在平均F1值上达到了53.4%,优于基准模型,具有更好的可扩展性和适应性,在提升模型可解释性方面具有潜力。 展开更多
关键词 跨目标立场检测 图卷积神经网络 语用交互 词级粒度 情感词汇 可解释性 依存图
下载PDF
基于字形的汉字字符复杂度算法及其应用 被引量:1
14
作者 陈天序 王钗 吴子昂 《语言文字应用》 CSSCI 北大核心 2024年第2期135-144,共10页
汉字字符复杂度是影响汉字识别的重要因素之一,常以笔画数代表,而字形对视觉复杂度的影响尚未得到充分研究。本研究引入汉字字符复杂度的新算法,即将汉字处理为图像后对汉字轮廓进行分块切割,计算字形整体的周长复杂度,得出汉字字符复... 汉字字符复杂度是影响汉字识别的重要因素之一,常以笔画数代表,而字形对视觉复杂度的影响尚未得到充分研究。本研究引入汉字字符复杂度的新算法,即将汉字处理为图像后对汉字轮廓进行分块切割,计算字形整体的周长复杂度,得出汉字字符复杂度值。本研究尝试将新算法应用于国际中文教育的字表研究,发现:相较于用笔画数代表汉字字符复杂度的传统方法,新算法计算出的汉字字符复杂度更能够体现同一笔画数下不同汉字视觉上的字形差异;以国际中文教育领域的等级字表为样本,部分等级之间汉字字符复杂度无显著差异。 展开更多
关键词 汉字字符复杂度 测算方法 等级字表 国际中文教育
下载PDF
融合词法句法信息的方面级情感分析模型
15
作者 衡红军 杨鼎诚 《计算机工程与设计》 北大核心 2024年第3期837-844,共8页
为解决现有方面级情感分析方法缺乏句法约束和词义信息的问题,将句法依存树和知识图谱融合起来对句子编码,提出一种词法句法相结合的图神经网络模型。利用图神经网络分别提取句法依存树中的句法信息和知识图谱中的词法信息,经过位置编... 为解决现有方面级情感分析方法缺乏句法约束和词义信息的问题,将句法依存树和知识图谱融合起来对句子编码,提出一种词法句法相结合的图神经网络模型。利用图神经网络分别提取句法依存树中的句法信息和知识图谱中的词法信息,经过位置编码模块和掩码加权模块捕捉重要性更高的单词;将两种特征进行结合获得融合句法词法信息的文本表示,进行情感分类。在3个公开数据集上的实验结果验证了该模型的有效性。 展开更多
关键词 方面级情感分析 句法约束 词义信息 句法依存树 知识图谱 关系图注意力网络 图卷积网络
下载PDF
融合单词级段信息的中文医疗命名实体识别
16
作者 王海鹏 杜方 +1 位作者 宋丽娟 李婷 《计算机技术与发展》 2024年第6期110-117,共8页
中文医疗命名实体识别(Named Entity Recognition,NER)是医学领域的一项基础任务,在知识图谱等许多下游任务中起着重要的作用。常用的NER方法可分为基于词级信息和基于段级信息,已有研究表明两种信息融合能取得更好的性能。目前,词级信... 中文医疗命名实体识别(Named Entity Recognition,NER)是医学领域的一项基础任务,在知识图谱等许多下游任务中起着重要的作用。常用的NER方法可分为基于词级信息和基于段级信息,已有研究表明两种信息融合能取得更好的性能。目前,词级信息和段级信息融合的方法在中文医疗NER任务中还未被充分研究,且现有的融合方法为段中的每个单词赋予相同的权重,不考虑单词的不同贡献。而医疗实体中每个单词和实体(段)有着不同的相关性,忽略这种相关性的差异将影响医疗NER的性能。基于此,通过分析中文医疗实体特性,提出了一种单词级段信息抽取方法(Word-Level Segment Information Extraction,WL-SIE)。该方法为实体中的每个单词分配一个权重矩阵集,学习单词与实体之间的关联信息,在与实体词组交互之后输出不同的单词级段信息。在CCKS2017和CMeEE中文临床NER数据集上的实验结果表明,WL-SIE方法较对比方法在F1值上提升了3%~5%,特别是在实体样本不均衡场景下和长实体识别任务上表现出了优异的性能。 展开更多
关键词 命名实体识别 深度神经网络 词级信息 段级信息 中文医疗信息处理
下载PDF
文档级事件抽取反向推理模型
17
作者 纪婉婷 马宇航 +2 位作者 鲁闻一 王俊陆 宋宝燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期122-129,共8页
事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件... 事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件抽取反向推理模型(reverse inference model for document-level event extraction,RIDEE)。基于无触发词的设计,将文档级事件抽取转化为候选事件要素抽取和事件触发推理两个子任务,并行式抽取事件要素并检测事件类型。此外,设计了一种用于存储历史事件的事件依赖池,使得模型在处理多事件文本时可以充分利用事件之间的依赖关系。公开数据集上的实验结果表明,与现有事件抽取模型相比,RIDEE在进行文档级事件抽取时具有更优的性能。 展开更多
关键词 文档级事件抽取 反向推理 无触发词 事件依赖池
下载PDF
基于位置增强词向量和GRU-CNN的方面级情感分析模型研究 被引量:1
18
作者 陶林娟 华庚兴 李波 《计算机工程与应用》 CSCD 北大核心 2024年第9期212-218,共7页
方面级情感分析旨在判断一段文本中特定方面词的情感倾向,其核心问题是方面词的上下文如何准确表征。与现有研究主要关注注意力机制的改进不同,该文从词语表征和上下文编码模型两个方面进行改进。在词语表征方面,通过BERT模型和位置度... 方面级情感分析旨在判断一段文本中特定方面词的情感倾向,其核心问题是方面词的上下文如何准确表征。与现有研究主要关注注意力机制的改进不同,该文从词语表征和上下文编码模型两个方面进行改进。在词语表征方面,通过BERT模型和位置度量公式获得增强的词向量表示;在上下文编码模型方面,使用GRU-CNN网络提取文本语义特征。在SemEval2014 Task4数据集上的实验表明,提出的模型在Restaurant和Laptop领域中的准确率分别达到了85.54%和80.35%,证实了所提出模型的有效性。 展开更多
关键词 方面级情感分析 卷积神经网络 预训练词向量 位置函数 注意力机制
下载PDF
基于词典和统计的语料库词汇级对齐算法 被引量:8
19
作者 刘小虎 吴葳 +3 位作者 李生 赵铁军 蔡萌 鞠英杰 《情报学报》 CSSCI 北大核心 1997年第1期21-27,共7页
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词... 语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。 展开更多
关键词 语料库 词汇级对齐 共现概率 信息处理
下载PDF
基于分解与动态规划策略的汉语未登录词识别 被引量:43
20
作者 吕雅娟 赵铁军 +2 位作者 杨沐昀 于浩 李生 《中文信息学报》 CSCD 北大核心 2001年第1期28-33,共6页
:未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名 ,中国地名和外国译名进行整体识别为目标 ,采用分解处理策略降低了整体处理难度 ,并使用动态规划方法实现了最佳路径的搜索 ,较好地解决了未登录词之间的冲突问题。通过... :未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名 ,中国地名和外国译名进行整体识别为目标 ,采用分解处理策略降低了整体处理难度 ,并使用动态规划方法实现了最佳路径的搜索 ,较好地解决了未登录词之间的冲突问题。通过对真实语料识别的测试 。 展开更多
关键词 未登录词识别 分解处理 动态规划 汉语自动分词 路径搜索 整体识别
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部