期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于二元中文分词的高效检索算法研究

An Effective Retrieval Research Based on 2-gram Chinese Word Segmentation

原文传递

导出

摘要针对传统的like通配符检索存在的问题,提出基于二元中文分词的高效率检索算法的思路、流程,给出核心算法代码;在消除重复词语、查全率、查准率、多字词检索等方面,与传统检索进行比较,各方面评测结果都优于传统检索;基于二元中文分词的高效率检索算法,简单、高效、容易实现,以期在信息系统的检索模块中得以利用,提高信息检索效率,减小信息搜索成本。 For the problem of ＇like＇ in traditional information retrieval, this paper gives ideas, processes, and the core algorithm code which based on the 2-gram Chinese word segmentation. It compares the new solution with the traditional information retrieval on the eliminating same words, precision ratio, recall ratio, and multi-words search, and finds it works more effective. The effective way which based on the 2-gram Chinese word segmentation is simple, effective, and can be implemented easily in the search module of many information systems. It can improve the efficiency of information retrieval, and reduce the cost of information search.

作者宗乾进游静

机构地区华南师范大学广东理工职业学院工程技术系

出处《图书情报工作》 CSSCI 北大核心 2009年第22期68-71,55,共5页 Library and Information Service

关键词中文分词二元切分中文检索 Chinese word segmentation 2-Gram segmentation Chinese retrieval

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1张玎,梅红,冉文琼.应用人工神经网络识别水淹层[J].测井技术,1996,20(3):210-214. 被引量：27
2张启宇,朱玲,张雅萍.中文分词算法研究综述[J].情报探索,2008(11):53-56. 被引量：35
3傅立云,刘新.基于词典的汉语自动分词算法的改进[J].情报杂志,2006,25(1):40-41. 被引量：10
4黄河燕,李渝生.上下文相关汉语自动分词及词法预处理算法[J].应用科学学报,1999,17(2):148-155. 被引量：10
5李振星,徐泽平,唐卫清,唐荣锡.全二分最大匹配快速分词算法[J].计算机工程与应用,2002,38(11):106-109. 被引量：39
6秦文,苑春法.基于决策树的汉语未登录词识别[J].中文信息学报,2004,18(1):14-19. 被引量：23
7MSDN.ASCⅡ字符代码.http://msdn.microsoft.com/zh-cn/library/424t9ed1(VS.80).aspx,[2009-04-24].
8安兴茹.检索效率的图示初探[J].图书馆论坛,2005,25(1):36-38. 被引量：4
9常娥,侯汉清.平均检准率研究[J].情报科学,2006,24(4):627-631. 被引量：6

二级参考文献70

1陈小荷.自动分词中未登录词问题的一揽子解决方案[J].语言文字应用,1999(3):103-109. 被引量：26
2曹倩,丁艳,王超,潘金贵.汉语自动分词研究及其在信息检索中的应用[J].计算机应用研究,2004,21(5):71-74. 被引量：18
3文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
4孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
5黄祥喜.书面汉语自动分词的现状和问题[J].情报学报,1989,8(2):125-133. 被引量：11
6张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
7吴建胜,战学刚,迟呈英.一种基于自动机的分词方法[J].计算机工程与应用,2005,41(8):81-82. 被引量：8
8杨宪泽.中文自动分词探讨[J].西南民族学院学报（自然科学版）,1994,20(3):242-245. 被引量：8
9岳涛.汉语自动分词技术的最新发展及其在信息检索中的应用[J].情报杂志,2005,24(4):55-57. 被引量：6
10邓曙光,曾朝晖.汉语分词中一种逐词匹配算法的研究[J].湖南城市学院学报（自然科学版）,2005,14(1):76-78. 被引量：6

共引文献143

1丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：3
2曾志伟,刁明光,王欣鹏,何炳辉.基于口罩评论数据的用户情感趋势与关注分析[J].计算机系统应用,2020,29(12):263-267.
3苏芳仲,林世平.Web文本挖掘中的一种中文分词算法研究及其实现[J].福州大学学报（自然科学版）,2004,32(z1):67-71. 被引量：5
4王玉娟,方逵,罗武.农业知识库检索排序算法研究[J].农机化研究,2012,34(9):24-27. 被引量：1
5许少华,刘扬,何新贵.基于过程神经网络的水淹层自动识别系统[J].石油学报,2004,25(4):54-57. 被引量：24
6张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
7易灿,李根生,陈真.基于神经网络的高压水射流冲蚀破碎预测模型的研究[J].石油钻探技术,2005,33(3):6-8. 被引量：8
8傅立云,刘新.基于词典的汉语自动分词算法的改进[J].情报杂志,2006,25(1):40-41. 被引量：10
9侯济恭.公路收费站远程监控与冲关稽查系统[J].计算机系统应用,2006,15(5):10-14. 被引量：2
10张培颖,李村合.一种改进的上下文相关的歧义字段切分算法[J].计算机系统应用,2006,15(5):46-48. 被引量：6

1张迎新.文档搭“积木” 繁杂化便利 Word 2007轻松构造各种文档部件[J].电脑爱好者,2007(6):61-61.
2牛强,邱波,夏士雄,周勇,张磊.基于领域本体的学习资源语义检索模型[J].计算机应用研究,2008,25(7):1977-1978. 被引量：6
3牛四强,贺兴时,王慧敏.基于粒子群的大量信息模糊检索[J].西南科技大学学报,2013,28(4):53-56. 被引量：1
4刘晓.提高信息检索效率的途径——提高查全率与查准率[J].科技信息,2013(22):236-236. 被引量：1
5李明江.基于SOA的线性回归散布型数据一致性集成分析[J].科技通报,2015,31(4):73-75. 被引量：1
6韩云苏,欧贤,刘嘉勇.一种适于中文检索的单模式匹配算法[J].信息安全与通信保密,2014,12(11):88-91.
7陆建平.在Alta Vista中巧用中文[J].电脑技术——Hello-IT,1998(7):49-52.
8I-SEARCH——中文检索新手段[J].互联网周刊,1998(17).
9王东,熊世桓.基于拼音首字母查询的去重优化设计[J].贵州师范学院学报,2010,26(6):37-39. 被引量：4
10王华栋,饶培伦.基于搜索引擎的中文分词评估方法[J].情报科学,2007,25(1):108-112. 被引量：5

图书情报工作

2009年第22期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部