基于DRIS系统中的中文自动分词模块设计与实现被引量：1

Design and implementation of Chinese automatic word segmentation module based on DRIS system

下载PDF

导出

摘要随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接将结果传送给搜索引擎进行检索。文中在域内资源整合系统(DRIS)的基础上,设计并开发了一个全新的中文自动分词模块。通过算法的比对,选择了正向匹配算法作为该模块的基本算法,对其文件结构,中文词典初始化及识别处理过程做出详细介绍。经后期使用后可比较出该模块在检索效率与服务质量上都有了很大程度上的提高,达到了设计要求。 With more and more get people＇s attention, information retrieval technology of Chinese automatic word segmentation technology becomes more and more important. Computer through to identify and handle the words in the text,direct to send search engine search results. Domain resource integration system（DRIS） is presented in this paper, on the basis of design and develop a new Chinese automatic word segmentation module. Through the alignment algorithm, a forward matching algorithm as the basic algorithm of the module, the file structure, Chinese dictionary initialized and recognition process in detail. After the late use comparable out the module on the retrieval efficiency and quality of service has improved to a great extent, has reached the design requirements.

作者张昭楠马亚蕾

机构地区陕西职业技术学院

出处《电子设计工程》 2016年第14期158-160,共3页 Electronic Design Engineering

关键词 DRIS系统中文自动分词搜索引擎正向最大匹配法 DRIS Chinese words auto-segmentation search engine forward maximum match method

分类号 TN99 [电子电信—信号与信息处理]

引文网络
相关文献

参考文献16

1粱南元.书面汉语自定分词系统-CDWS[J].中文信息学报,1987,1(2):44-52.
2李朝虹,陆建湖.现代汉语自动分析研究现状综述[J].广西教育学院学报,2003(1):112-116. 被引量：1
3韩客松,王永成,陈桂林.汉语语言的无词典分词模型系统[J].计算机应用研究,1999,16(10):8-9. 被引量：22
4付国宏,王平,王晓龙.汉语分词和词性标注一体化分析的方法研究[J].计算机应用研究,2001,18(7):24-26. 被引量：4
5刘颖.用隐马尔柯夫模型对汉语进行切分和标注排歧[J].计算机工程与设计,2001,22(4):58-62. 被引量：11
6刘开瑛.现代汉语自动分词评测技术研究[J].语言文字应用,1997(1):103-108. 被引量：15
7王鑫,王丁,李向宏.基于汉语分词的信息抽取技术[J].信息技术,2003,27(4):101-101. 被引量：4
8黄德根,杨元生,王省,张艳丽,钟万勰.基于统计方法的中文姓名识别[J].中文信息学报,2001,15(2):31-37. 被引量：34
9孙茂松,张维杰.计算语言学研究与应用[M].北京:北京语言学院出版社.1993.
10张小衡,王玲玲.中文机构名称的识别与分析[J].中文信息学报,1997,11(4):21-32. 被引量：82

二级参考文献130

1孙茂松.谈谈汉语分词语料库的一致性问题[J].语言文字应用,1999(2):90-93. 被引量：20
2孙茂松,张磊.人机并存,“质”“量”合一—谈谈制定信息处理用汉语词表的策略[J].语言文字应用,1997(1):81-88. 被引量：7
3黄居仁,陈克健,陈凤仪,魏文真,张丽丽.《资讯处理用中文分词规范》设计理念及规范内容[J].语言文字应用,1997(1):94-102. 被引量：6
4刘开瑛.现代汉语自动分词评测技术研究[J].语言文字应用,1997(1):103-108. 被引量：15
5董振东.汉语分词研究漫谈[J].语言文字应用,1997(1):109-114. 被引量：11
6孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
7黄昌宁,李涓子.词义排歧的一种语言模型[J].语言文字应用,2000(3):85-90. 被引量：16
8徐秉铮,詹剑,贺前华.基于神经网络的分词方法[J].中文信息学报,1993,7(2):36-44. 被引量：15
9孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87
10周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43

共引文献331

1唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
2李斌,袁义国,芦靖雅,冯敏萱,许超,曲维光,王东波.第一届古代汉语分词和词性标注国际评测[J].中文信息学报,2023,37(3):46-53. 被引量：5
3姚露露,李云岭,宋凯丽.中文地名地址标注方法研究[J].测绘地理信息,2021,46(S01):182-184. 被引量：1
4张恒,杨文昭,屈景辉,卢虹冰,张亮,赵飞.基于词典和词频的中文分词方法[J].微计算机信息,2008,24(3):239-240. 被引量：19
5张泉,曾国荪,王伟,孙明军,谷华楠.基于改进的模糊C-均值聚类的信任文摘[J].计算机研究与发展,2008,45(z1):268-273. 被引量：2
6张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报（理学版）,2009,41(2):40-43. 被引量：7
7曹娟,周经野.一种计算汉字串之间相关程度的新方法[J].中文信息学报,2004,18(4):55-59. 被引量：6
8郑炜冬.多种方法融合的中文自动分词系统的设计与实现[J].韩山师范学院学报,2009,30(6):37-43.
9王军辉.汉语自动分词研究进展[J].魅力中国,2009(30):333-333.
10王建新.我国在语料库语言学研究方面的部分进展(概述)[J].外语与外语教学,1999(3):18-20. 被引量：10

同被引文献1

1江耿豪.自动答疑系统中文自动分词模块设计与实现[J].现代计算机,2010,16(2):8-10. 被引量：3

引证文献1

1阙玲丽.自动答疑系统中文自动分词模块设计与实现[J].电子技术与软件工程,2018(5):166-166.

1整合系统资源加固网络安全——爱立信MSC Pool方案介绍[J].通讯世界,2009(10):70-71. 被引量：2
2安达斯参展CCBN2016[J].现代电视技术,2016(4):147-147.
3刘帅.雷达目标识别与处理系统的设计与实现[J].数字通信世界,2017(3):13-15.
4高通和TDK合资企业已筹备完成[J].中国集成电路,2017,26(3):5-5.
5晋晓曦,冉阳,李淼,邓瑞.暗脉冲激光器的研究进展[J].激光与光电子学进展,2012,49(9):38-45. 被引量：2
6Bose推出两款功率放大器[J].电声技术,2012,36(4):89-89.
7袁钢,王国龙,李文斌.基于CPLD的含有PROM数字电路设计[J].计算机测量与控制,2013,21(2):442-444.
8Avid现场混音技术讲座走进中国台湾[J].现代电视技术,2013(1):150-150.
9杨中山.深能级瞬态谱仪中的信号识别与处理技术[J].LSI制造与测试,1991,12(2):26-31.
10秦勃.数字视音频压缩技术新发展[J].科学时代,2008,0(3):18-19.

电子设计工程

2016年第14期

浏览历史

内容加载中请稍等...

基于DRIS系统中的中文自动分词模块设计与实现被引量：1

参考文献16

二级参考文献130

共引文献331

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于DRIS系统中的中文自动分词模块设计与实现 被引量：1

参考文献16

二级参考文献130

共引文献331

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于DRIS系统中的中文自动分词模块设计与实现被引量：1