期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
Improvement in Accuracy of Word Segmentation of a Web-Based Japanese-to-Braille Translation Program for Medical Information
1
作者 Tsuyoshi Oda Aki Sugano +10 位作者 Masashi Shimbo Kenji Miura Mika Ohta Masako Matsuura Mineko Ikegami Tetsuya Watanabe Shinichi Kita Akihiro Ichinose Eiichi Maeda Yuji Matsumoto Yutaka Takaoka 《通讯和计算机(中英文版)》 2013年第1期82-89,共8页
关键词 医疗信息 翻译程序 Web 盲文 分词 精度 自然语言处理 专有名词
下载PDF
字典与统计相结合的中文分词方法 被引量:41
2
作者 翟凤文 赫枫龄 左万利 《小型微型计算机系统》 CSCD 北大核心 2006年第9期1766-1771,共6页
提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速... 提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速度;在基于统计的处理过程中,通过统计和规则相结合的方法提高了交集型歧义切分的准确率,并且一定条件下解决了语境中高频未登录词问题,实验结果表明,由本文算法实现的分词系统DS fenc i的分全率达99.52%,准确率达98.52%. 展开更多
关键词 中文分词 基于字典的分词 基于统计的分词 交集型分词歧义
下载PDF
基于字典和统计的分词方法 被引量:13
3
作者 陈平 刘晓霞 李亚军 《计算机工程与应用》 CSCD 北大核心 2008年第10期144-146,共3页
提出了一种基于字典与统计相结合的中文分词方法,该方法利用改进的字典结构能够快速切分,在其基础上进一步利用统计的方法处理所产生未登录词,并且能解决大部分交集歧义问题。
关键词 基于字典的分词 基于统计的分词 交叉歧义 未登录词
下载PDF
一种基于可信度的人名识别方法 被引量:20
4
作者 罗智勇 宋柔 《中文信息学报》 CSCD 北大核心 2005年第3期67-72,86,共7页
专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一。本文以人名识别为例,分析了目前流行的基于语料库和统计语言模型的专名识别方法中在概率估值问题上存在的弊端;同时在规则和统计相结合的基础上,提出了... 专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一。本文以人名识别为例,分析了目前流行的基于语料库和统计语言模型的专名识别方法中在概率估值问题上存在的弊端;同时在规则和统计相结合的基础上,提出了一种基于可信度的人名识别方法,并给出了一个渐进式模型训练方法,克服了人工标注语料库规模的限制。从我们对《人民日报》1998年1月、2 0 0 0年12月(共约379万字)语料的测试结果来看,基于可信度的人名识别方法比传统的概率估值方法识别效果有一定的提高。 展开更多
关键词 计算机应用 中文信息处理 自动分词 人名识别 统计方法 可信度
下载PDF
基于BP神经网络的词义消歧模型 被引量:3
5
作者 谢芳 胡泉 《计算机工程与应用》 CSCD 北大核心 2006年第12期187-189,203,共4页
词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节。文章首先介绍了目前一些常用词义消歧方法的特点和这些方法的研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消... 词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节。文章首先介绍了目前一些常用词义消歧方法的特点和这些方法的研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,最后详细讲解了BP神经网络原理,并对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论。 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
规则与统计结合分析汉语 被引量:4
6
作者 刘颖 《计算机工程与应用》 CSCD 北大核心 2002年第7期3-6,共4页
在自然语言处理中,规则方法和统计方法各有优缺点。采用规则方法进行汉语切分、标注,并采用规则方法与切分标注评分结合进行消歧。对切分标注正确的句子进行句法分析,并采用规则方法与句法语义评分结合进行消歧。根据对多个结果的评分,... 在自然语言处理中,规则方法和统计方法各有优缺点。采用规则方法进行汉语切分、标注,并采用规则方法与切分标注评分结合进行消歧。对切分标注正确的句子进行句法分析,并采用规则方法与句法语义评分结合进行消歧。根据对多个结果的评分,选择出评分较大的结果,尽可能早地删除掉不正确的结果,从而加快汉语分析的速度,减少分析的空间消耗,提高分析的正确率。 展开更多
关键词 切分 标注 句法分析 规则方法 统计方法 自然语言处理 计算机
下载PDF
利用BP神经网络的中文词义消歧模型 被引量:1
7
作者 何婷婷 谢芳 《华中师范大学学报(自然科学版)》 CAS CSCD 2005年第4期470-474,共5页
词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节.本文介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,详细讲解了BP神经网络原理;对使用这种混合人工智能的消歧模型的可能性和... 词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节.本文介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,详细讲解了BP神经网络原理;对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论;通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误差随着次数的增加在零的附近呈现波动状态,即使用很少的迭代次数也可以得到比较好的结果.由此得出,BP神经网络预测模型在词义消歧的中具有良好的应用前景. 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
基于肤色识别的人机交互方法在游戏中的应用研究
8
作者 闫玉宝 夏露 侯宪锋 《常州大学学报(自然科学版)》 CAS 2012年第1期73-77,共5页
利用计算机视觉技术实现游戏人机交互来提高游戏的娱乐性,是当前国内外应用研究的热点。文中提出了采用肤色检测技术应用于游戏交互的方法。通过摄像头对肤色进行采样,再利用统计方法对皮肤颜色进行分析建立肤色模型;采用背景差分阈值... 利用计算机视觉技术实现游戏人机交互来提高游戏的娱乐性,是当前国内外应用研究的热点。文中提出了采用肤色检测技术应用于游戏交互的方法。通过摄像头对肤色进行采样,再利用统计方法对皮肤颜色进行分析建立肤色模型;采用背景差分阈值分割法和Camshift算法进行手势跟踪监测,获取手的位置;将手的位置作为信号传递给游戏角色,从而控制游戏。在VC++6.0下,使用OpenCV和OpenGL开源库,构建了普通摄像头视觉游戏实验平台,通过手势的运动轨迹控制粒子系统喷射方向。实验结果表明,通过肤色进行手势跟踪监测,进而控制游戏角色运动,具有很好的实时性和交互性。 展开更多
关键词 基于统计的肤色检测 背景差分阈值分割法 CAMSHIFT算法 粒子系统
下载PDF
一种基于语料库的词义消歧策略 被引量:4
9
作者 郭池 陈家骏 王启祥 《计算机工程与应用》 CSCD 北大核心 2003年第35期33-36,65,共5页
词义消歧一直是一个难点,同时,也是很多领域都需解决的一个环节。该文首先介绍了目前基于语料库进行词义消歧方法的研究进展和各自的特点,在此基础上探讨了一种基于实例和基于统计的方法(即基于语料库的两种主流方法)相结合的混合策略,... 词义消歧一直是一个难点,同时,也是很多领域都需解决的一个环节。该文首先介绍了目前基于语料库进行词义消歧方法的研究进展和各自的特点,在此基础上探讨了一种基于实例和基于统计的方法(即基于语料库的两种主流方法)相结合的混合策略,并对其可能性和优越性进行了讨论。 展开更多
关键词 词义消歧 机器翻译 语料库 基于实例 基于统计 混合策略
下载PDF
基于Hash结构词典的双向最大匹配分词法 被引量:18
10
作者 陈之彦 李晓杰 +2 位作者 朱淑华 付丹龙 邢诒海 《计算机科学》 CSCD 北大核心 2015年第B11期49-54,共6页
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分... 针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分词中出现的交集型歧义。该算法可以在分词的过程中显著提高分词的精确度,适用于对词语切分精度要求较高的中文语言处理系统。 展开更多
关键词 分词词典 双向最大匹配法 基于Hash的单字索引 互信息歧义处理
下载PDF
中文分词在邮件过滤系统中的应用 被引量:3
11
作者 林珊 宁国宁 赵之霖 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期112-116,共5页
针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中还利用Φ2统计法生成新词,对词典起到了动态更新的作用,提高了分... 针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中还利用Φ2统计法生成新词,对词典起到了动态更新的作用,提高了分词的精度和准确度.两种方法在邮件过滤系统中结合应用,使分词的误分率低于0.025. 展开更多
关键词 分词 φ2统计法 最大匹配法 垃圾邮件
下载PDF
中文分词模型的领域适应性方法 被引量:59
12
作者 韩冬煦 常宝宝 《计算机学报》 EI CSCD 北大核心 2015年第2期272-281,共10页
字标注分词方法是当前中文分词领域中一种较为有效的分词方法.但因为受制于训练语料的领域和规模,该方法在领域适应性方面效果不佳,影响了该方法在应用系统中的实际应用.在文中,作者提出使用卡方统计量以及边界熵提升未登录词的处理能力... 字标注分词方法是当前中文分词领域中一种较为有效的分词方法.但因为受制于训练语料的领域和规模,该方法在领域适应性方面效果不佳,影响了该方法在应用系统中的实际应用.在文中,作者提出使用卡方统计量以及边界熵提升未登录词的处理能力,并结合自学习和协同学习策略进一步改善字标注分词方法在领域适应性方面的性能.实验结果证实,文中提出的这些方法有效改善了分词方法的领域适应性. 展开更多
关键词 卡方统计量 边界熵 领域适应性 自举算法 中文分词 社会计算 社交网络
下载PDF
可扩展统计分词系统的构造
13
作者 金华兴 戴新宇 陈家骏 《计算机工程与应用》 CSCD 北大核心 2005年第23期176-178,共3页
论文从实用的角度出发,在自行开发的一套分词系统的基础上,简要说明了一个分词系统的各个组成部分以及各部分的处理方法,并提出了一个可扩展分词系统的框架。这个框架具有很好的适应性和灵活性,能够适用于各种不同的统计方法或者规则统... 论文从实用的角度出发,在自行开发的一套分词系统的基础上,简要说明了一个分词系统的各个组成部分以及各部分的处理方法,并提出了一个可扩展分词系统的框架。这个框架具有很好的适应性和灵活性,能够适用于各种不同的统计方法或者规则统计相结合的方法。该框架也可包容各种未登录词识别的方法。可以作为进一步研究和开发分词系统的一个基础平台,也可以为构造一个分词系统作指导。 展开更多
关键词 分词 统计方法 可扩展 框架
下载PDF
统计与神经网络相结合的词义消歧模型 被引量:2
14
作者 曹鸿霞 《武汉理工大学学报》 EI CAS CSCD 北大核心 2006年第8期131-134,共4页
介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,阐述了BP神经网络原理,通过对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论,最后通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误... 介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,阐述了BP神经网络原理,通过对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论,最后通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误差随着次数的增加在零的附近呈现波动状态,即使用很少的迭代次数也可以得到比较好的结果。 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
中国学习者英语书面语多词动词特征研究——基于语料库的方法
15
作者 冯浩达 石峰 《渤海大学学报(哲学社会科学版)》 2015年第3期112-116,共5页
根据Biber等人(1999)提出的研究框架,对中国学习者使用英语中频率最高的141个多词动词的情况进行调查分析。分别从中国英语学习者语料库和英国国家语料库的采样中提取出多词动词,并采取中介语对比研究的方法对两组数据进行对比。研究结... 根据Biber等人(1999)提出的研究框架,对中国学习者使用英语中频率最高的141个多词动词的情况进行调查分析。分别从中国英语学习者语料库和英国国家语料库的采样中提取出多词动词,并采取中介语对比研究的方法对两组数据进行对比。研究结果表明,两组所得多词动词分布模式存在显著性差异。与英语母语者相比,中国学习者英语多词动词的使用总体偏低,并且倾向于过多使用语法结构相对简单的多词动词。 展开更多
关键词 多词动词 基于语料库的方法 统计手段
下载PDF
基于混合模型的中文命名实体抽取系统 被引量:10
16
作者 王睿 张洁 +2 位作者 张由仪 于禛 姚天昉 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1908-1914,共7页
中文命名实体抽取的研究,存在分词、领域和方法三个方面的问题需要解决。解决方案是:利用规则,对机器分词后的文本进行修正;提出“群山”模型,对不同领域制定不同的语言学规则;以统计学方法和语言学方法结合,对不同命名实体采用不同的... 中文命名实体抽取的研究,存在分词、领域和方法三个方面的问题需要解决。解决方案是:利用规则,对机器分词后的文本进行修正;提出“群山”模型,对不同领域制定不同的语言学规则;以统计学方法和语言学方法结合,对不同命名实体采用不同的方法等。根据实验结果,得出以下结论:分词的错误将严重影响到最终的抽取结果;领域规则的应用可以提升抽取效果;不同方法的有机结合比采用单一方法有效。 展开更多
关键词 分词 领域 统计学方法 语言学方法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部