基于语义理解的智能搜索引擎研究被引量：13

Research on Intelligent Search Engine Based on Semantic Comprehension

下载PDF

导出

摘要本文提出了一种基于自然语言理解的搜索引擎模型。它的核心技术是基于自然语言理解的相关技术,包括从关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向Web网页内容的特征库,提出返回文档排序的算法,基于Lucene全文索引工具包建立了搜索引擎,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。 This article proposes a search engine model which is based on the natural language understanding. It includes a method to analyze users＇ quest ions in natural language from three layers, that is, keyword, quest ion type and question focus. The analysis consists of semantic analysis, feature extraction and semantic matching. And with this thought the feature base that faces to Web page content is built. In addition, this article proposes an algorithm of returning to the documents arrangement, it investigates implementing retrieval system based on the Lucene toolkit. The feature words, which are collected in the feature base, are tested, and the precision ratio is about 86. 7%. The test result indicates that the module can realize the semantic comprehension to query, and it has an evident effect to improve the precision of search engine

作者陈林杨丹赵俊芹

机构地区重庆大学软件学院

出处《计算机科学》 CSCD 北大核心 2008年第6期152-154,共3页 Computer Science

关键词自然语言处理分词语义分析向量空间模型 Natural language process, Word segmentation, Semantic analysis, Vector space model

分类号 TP393.4 [自动化与计算机技术—计算机应用技术] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1杜阿宁,方滨兴,胡铭曾,云晓春.中文交互式网络搜索引擎及其自学习能力[J].计算机工程与应用,2003,39(10):148-150. 被引量：14
2Schubert F, Li Hui. Chinese Word Segmentation and Its Effect on Information Retrieval[D]. Information Processing & Management , 2002
3Wu Z M, Tseng G. Chinese Text Segmentation for Text Retrieval: Achievements and Problems[J]. Journal of the American Society for Information Science, 1993,44(9):532-542
4Gao Jianfeng. An Empirical Study of CLIR at MSRCN, 2001 [C]. Shanghai: International Workshop ILT&CIP-2001 on Innovative Language and Chinese information processing Technology, 2001
5尤昉,李涓子,王作英.基于《知网》的中文信息结构抽取研究[J].计算机工程与应用,2002,38(18):56-58. 被引量：4
6周强,冯松岩.构建知网关系的网状表示[J].中文信息学报,2000,14(6):21-27. 被引量：11

二级参考文献5

1董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：58
2李涓子.基于语义依存关系的汉语理解语言模型研究：博士后出站报告[M].北京:清华大学电子工程系,2001..
3张建平.大词汇量连续语音识别中的语言模型和理解算法的研究：博士学位论文[M].北京:清华大学电子工程系,1999..
4王忠,周士波.Internet英文搜索引擎评析[J].图书情报工作,1999,43(4):33-37. 被引量：28
5邹海山,吴勇,吴月珠,陈阵.中文搜索引擎中的中文信息处理技术[J].计算机应用研究,2000,17(12):21-24. 被引量：35

共引文献24

1孟庆国,王友奎,田红红.政务服务中的智能化搜索:特征、应用场景和运行机理[J].电子政务,2020,0(2):21-33. 被引量：21
2李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A系统的[J].计算机工程与应用,2004,40(20):70-73. 被引量：8
3张辉,吴辉.用户协作式智能搜索模型的研究[J].计算机工程与应用,2005,41(11):155-157. 被引量：3
4曹二堂,刘玉林.基于语义理解的智能搜索引擎的研究[J].情报杂志,2005,24(6):58-59. 被引量：7
5王彤宇,李兴福.应用于学生知识拓展的智能Web检索系统[J].济南职业学院学报,2005(2):57-61.
6许云,樊孝忠,张锋.基于《知网》信息结构模式的词汇化树邻接文法消歧[J].计算机工程,2005,31(13):4-6. 被引量：1
7石晶,戴国忠.基于知网的文本推理[J].中文信息学报,2006,20(1):76-84. 被引量：8
8曹二堂,刘玉林.一种基于语义理解的元搜索引擎的研究[J].计算机工程,2006,32(7):210-211. 被引量：8
9郑鑫,秦建军,陈汉辉,李伟宏.基于可拓学的自然语言处理与系统建模研究[J].哈尔滨工业大学学报,2006,38(7):1209-1212. 被引量：5
10陈蓉芳,郑晓波,王占朝,王海滨,董秀成.基于“会诊式”推理控制策略的智能型搜索引擎的研究[J].安装,2007(1):43-46. 被引量：1

同被引文献99

1张恒,杨文昭,屈景辉,卢虹冰,张亮,赵飞.基于词典和词频的中文分词方法[J].微计算机信息,2008,24(3):239-240. 被引量：19
2朱素媛,马溪俊,梁昌勇.人工智能技术在搜索引擎中的应用[J].合肥工业大学学报（自然科学版）,2003,26(z1):657-661. 被引量：17
3蔡雷.语料库技术在英语教学中的应用与研究[J].宿州学院学报,2008,23(5):159-161. 被引量：8
4杜海峰,悦中山,李树茁,陈盈晖,费尔德曼.基于模块性指标的动态网络社群结构探测方法[J].系统工程理论与实践,2009,29(3):162-171. 被引量：6
5邓立平.关于短时记忆存贮库容量的甄别——与汪悃款同志商榷[J].云南师范大学学报（哲学社会科学版）,1997,29(3):65-69. 被引量：4
6蔡晟,王泽兵,冯雁,陈海燕.基于Super-peer的对等网络研究[J].计算机应用研究,2004,21(6):258-260. 被引量：24
7刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：197
8刘亚军,徐易.一种基于加权语义相似度模型的自动问答系统[J].东南大学学报（自然科学版）,2004,34(5):609-612. 被引量：35
9蒋萍,崔志明.智能搜索引擎中用户兴趣模型分析与研究[J].微电子学与计算机,2004,21(11):24-26. 被引量：32
10黄南川,邓振杰,王嵬嵬,张皓健.语音合成技术的研究与发展[J].华北航天工业学院学报,2002,12(3):37-39. 被引量：16

引证文献13

1孟庆国,王友奎,田红红.政务服务中的智能化搜索:特征、应用场景和运行机理[J].电子政务,2020,0(2):21-33. 被引量：21
2田占霄,韩宪忠,王克俭.一种改进的长词优先逆向最大匹配分词消歧策略[J].河北农业大学学报,2009,32(4):100-102. 被引量：1
3孙素芬,罗长寿,魏清凤.Web农业实用技术自动问答系统设计实现[J].现代图书情报技术,2009(7):70-74. 被引量：5
4陈文君,於文雪.汉英跨语言检索系统中关键词提取方法的研究[J].电脑知识与技术,2009,5(10):7848-7849.
5余坦,王益民.一种基于用户属性的搜索算法[J].计算机系统应用,2010,19(7):201-203. 被引量：1
6梁晓诚,岳晓光,麦范金,赵子强,路英,王挺.基于NLP技术和相似度计算的智能搜索引擎研究[J].昆明理工大学学报（理工版）,2010,35(4):76-79. 被引量：3
7陆秋琴,黄光球,周娇.基于生物记忆原理的个性化搜索引擎模型[J].计算机工程与应用,2012,48(12):67-73.
8魏清凤,罗长寿,贺立源,张峻峰.基于二维向量空间模型的农业技术智能问答系统研究[J].江苏农业科学,2012,40(7):362-364. 被引量：2
9王亚辉.基于遗传算法的语义搜索结果排序算法[J].晋城职业技术学院学报,2013,6(1):55-58.
10刘晓婉,胡燕祝,艾新波.开源中文分词器在web搜索引擎中的应用[J].软件,2013,34(3):80-83. 被引量：12

二级引证文献53

1贾君枝,王永芳,李婷.面向农民的问答系统问句处理研究[J].现代图书情报技术,2010(5):43-49. 被引量：5
2谢贤明,吴庆波,谭郁松.基于搜索历史的密文检索系统研究[J].中国电子商情（通信市场）,2011(4):99-104.
3王永芳.农民信息服务问答系统设计与实现[J].农业网络信息,2012(8):5-12.
4张丽春,周新志.DGP系统中分词技术的实现[J].通信技术,2013,46(1):51-53.
5徐治.Visual C++调用MATLAB函数库的混合编程技术[J].软件,2015,36(2):55-58. 被引量：11
6孟鹤,罗长寿,孙素芬.多通道精准化农业信息服务平台建设——以北京市大兴区安定镇农业信息服务示范基地为例[J].江苏农业科学,2015,43(7):475-478. 被引量：3
7刘丽娟,王丰斌.基于语义相似度计算的农业实用技术FAQ系统平台设计[J].信阳农林学院学报,2015,25(2):117-119. 被引量：2
8侯忠辉,刘亮亮,杜渂.面向消防行业的热词分析系统的研究与设计[J].电信快报（网络与通信）,2016(6):31-36.
9李响,谭静.融合相关性与多样性的学术论文推荐方法研究[J].情报理论与实践,2017,40(6):99-103. 被引量：8
10张兴厅,文栋,雷健波.中文消费者健康词的发现方法研究[J].医学信息学杂志,2017,38(5):2-6.

1曹二堂,刘玉林.基于语义理解的智能搜索引擎的研究[J].情报杂志,2005,24(6):58-59. 被引量：7
2严尚维,田绪红,孙爱东,王洁桦.基于关系数据库的XML查询效率测试方法[J].计算机工程与应用,2004,40(2):180-181. 被引量：1
3廖小飞,李津生,洪佩琳,薛开平.一种基于移动代理技术的类应用层组播的搜索引擎模型[J].应用科学学报,2007,25(1):51-56.
4徐德智,吴敏,陆文彦.基于Agent的专业搜索引擎的研究和构造[J].计算机工程,2002,28(10):99-101. 被引量：9
5徐荣国,陆晓希.高效搜索引擎的模型设计与算法实现[J].柳州职业技术学院学报,2008,8(4):79-81.
6曹二堂,刘玉林.一种基于语义理解的元搜索引擎的研究[J].计算机工程,2006,32(7):210-211. 被引量：8
7余艳.搜索引擎原理剖析及其技术发展[J].图书馆学刊,2004,26(1):58-60. 被引量：16
8张功耀,黄水松,汪小栋.基于多Agent的搜索引擎模型[J].计算机工程与设计,2002,23(10):65-67. 被引量：10
9魏毅峰,张亮.基于本体的搜索引擎模型设计[J].软件导刊,2010,9(7):118-119. 被引量：1
10姚兰,林鸿飞,林原,马云龙.基于句法特征的冗长查询处理技术[J].北京大学学报（自然科学版）,2013,49(2):213-218.

计算机科学

2008年第6期

浏览历史

内容加载中请稍等...

基于语义理解的智能搜索引擎研究被引量：13

参考文献6

二级参考文献5

共引文献24

同被引文献99

引证文献13

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于语义理解的智能搜索引擎研究 被引量：13

参考文献6

二级参考文献5

共引文献24

同被引文献99

引证文献13

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于语义理解的智能搜索引擎研究被引量：13