医药文献中文分词研究被引量：1

Research of Chinese Word Segmentation on Medical Documents

下载PDF

导出

摘要为提高医药文献中文分词的准确率,根据医药文献的特点,研究了中文分词的算法。首先介绍了基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法和基于匹配与统计结合分词方法,并在设计思想上对各算法进行了比较。在此基础上,运用C语言,VC6.0平台实现各算法,并对医药文献进行分词实验。实验结果显示,基于字符串匹配的最大正向匹配法取得了较好的性能。 To improve the accuracy of Chinese word segmentation on medical documents,the Chinese segmentation methods based on the characteristics of the medical literature are studied.Firstly,the word segmentation algorithms based on string matching,based on seman tic,based on statistics and based on combining string matching with statistics are respectively introduced.Then,the comparisons of algo rithm ideas are made for various algorithms.The system is realized with C language on VC6.0 platform.The experiment results show that the Forward Maximum Matching algorithm based on string matching makes better performance.

作者周健欣张启蕊

机构地区广东药学院医药信息工程学院

出处《电脑知识与技术（过刊）》 2012年第6X期4138-4140,4151,共4页 Computer Knowledge and Technology

基金广东省大学生创新实验项目(1057310031)

关键词医药文献中文分词字符串匹配 medical documents Chinese word segmentation string matching

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1刘挺,吴岩,王开铸.串频统计和词形匹配相结合的汉语自动分词系统[J].中文信息学报,1998,12(1):17-25. 被引量：65
2孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量：66
3骆正清,陈增武,胡上序.一种改进的MM分词方法的算法设计[J].中文信息学报,1996,10(3):30-36. 被引量：28
4揭春雨,刘源,梁南元.论汉语自动分词方法[J].中文信息学报,1989,3(1):1-9. 被引量：55
5WU A,JIANG Z X.Word Segmentation in Sentence Analysis[].Proceedings of the International Conferenceon Chinese InformationProcessing.1998

二级参考文献35

1冯志伟，中文信息处理与汉语研究，1992年
2张国煊，计算机研究与发展，1991年，1期
3黄祥熹，计算机应用与软件，1991年，6期
4贺银云，计算机杂志，1991年，1期
5贺银云，计算机杂志，1991年，2期
6贺银云，计算机杂志，1991年，3期
7黄俊杰，计算机杂志，1991年，1期
8黄俊杰，计算机杂志，1991年，2期
9黄俊杰，计算机杂志，1991年，3期
10何克抗，中文信息学报，1991年，2期

共引文献186

1周蕾,朱巧明,李培峰.一种基于统计和规则的未登录词识别方法[J].南京大学学报（自然科学版）,2005,41(z1):819-825. 被引量：1
2王军辉.汉语自动分词研究进展[J].魅力中国,2009(30):333-333.
3肖升,胡金柱,姚双云,吴锋文.关系词搭配的联列分析[J].宁夏大学学报（人文社会科学版）,2009,31(6):75-79. 被引量：2
4许桢.基于语义网的文本分类系统设计与实现[J].硅谷,2009,2(18).
5施建军.用计算机对日语进行研究的基础——浅谈机器单词辞典和单词的自动切分[J].解放军外国语学院学报,1991,14(3):25-28.
6洪虹,李波.汉语自动分词研究进展[J].魅力中国,2009,0(22):114-114.
7李强,李侯润.半自动分词技术[J].计算机工程与设计,1992,13(1):37-40.
8曹倩,丁艳,王超,潘金贵.汉语自动分词研究及其在信息检索中的应用[J].计算机应用研究,2004,21(5):71-74. 被引量：18
9张素娟,郑庆华,胡云华,孙霞.一种面向网络答疑的汉语切分歧义消除算法[J].计算机工程与应用,2004,40(25):55-58. 被引量：4
10孙茂松,肖明,邹嘉彦.基于无指导学习策略的无词表条件下的汉语自动分词[J].计算机学报,2004,27(6):736-742. 被引量：37

同被引文献8

1王瑞雷,栾静,潘晓花,卢修配.一种改进的中文分词正向最大匹配算法[J].计算机应用与软件,2011,28(3):195-197. 被引量：41
2李玲.基于双词典机制的中文分词系统设计[J].机械工程与自动化,2013(1):17-19. 被引量：4
3莫建文,郑阳,首照宇,张顺岚.改进的基于词典的中文分词方法[J].计算机工程与设计,2013,34(5):1802-1807. 被引量：40
4王锡钢,王正,陈虎.关于搜索引擎的中文分词与页面排序的研究[J].计算机应用与软件,2013,30(9):211-214. 被引量：4
5孟帮杰,王占刚.两种中文分词算法在云计算平台上的实现及比较[J].网络安全技术与应用,2014(12):67-67. 被引量：5
6梁喜涛,顾磊.中文分词与词性标注研究[J].计算机技术与发展,2015,25(2):175-180. 被引量：48
7韩冬煦,常宝宝.中文分词模型的领域适应性方法[J].计算机学报,2015,38(2):272-281. 被引量：59
8贺菲菲,贺炎,齐静娜.一种适用于移动搜索的中文分词算法[J].西安邮电大学学报,2015,20(4):62-65. 被引量：2

引证文献1

1丁洁.基于最佳粒度匹配的中文分词算法的研究[J].自动化与仪器仪表,2016(7):169-170. 被引量：1

二级引证文献1

1高毅.基于长短时神经网络的古汉语分词系统[J].自动化与仪器仪表,2020,0(2):128-131. 被引量：1

1夏朦.云计算技术及其在医学中的应用[J].电子世界,2015(13):191-192. 被引量：1
2于彤,朱玲,张竹绿,于琦,李敬华,刘丽红,杨硕,贾李蓉.中医药文献元数据规范在语义网环境中的应用[J].中国数字医学,2014,9(7):91-93. 被引量：3
3王凡秀,王自强.汉语自动分词技术研究[J].计算机与数字工程,2008,36(11):57-59. 被引量：3
4朱小娟,陈特放.基于SVM的词频统计中文分词研究[J].微计算机信息,2007,23(30):205-207. 被引量：10
5钱爱民.免费MEDLARS数据库及相关服务器特色[J].药学进展,2001,25(5):301-303.
6姚兴山.基于Hash算法的中文分词研究[J].现代图书情报技术,2008(3):78-81. 被引量：5
7张妍,许云峰,张立全.基于云计算的中文分词研究[J].河北科技大学学报,2012,33(3):266-269. 被引量：5
8张黎,徐蔚然.中文分词研究[J].软件,2012,33(12):103-108. 被引量：6
9张慧芳.汉语词汇分词研究——隐性分词词典在信息检索中的应用[J].商,2015,0(34):291-292.
10马光志,李专.基于特征词的自动分词研究[J].华中科技大学学报（自然科学版）,2003,31(3):60-62. 被引量：4

电脑知识与技术（过刊）

2012年第6X期

浏览历史

内容加载中请稍等...

医药文献中文分词研究被引量：1

参考文献5

二级参考文献35

共引文献186

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

医药文献中文分词研究 被引量：1

参考文献5

二级参考文献35

共引文献186

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

医药文献中文分词研究被引量：1