基于概念的文档评价模型被引量：4

A Concept-based Document Evaluation Model

下载PDF

导出

摘要理解文档的内容和查询的真实意图是提高搜索引擎智能水平的一种有效途径。提出了一种以分析概念及其关系为基础来理解文档、揣摩查询意图的模型。在该模型中,结合用户背景知识构造一个用户概念库,将文档及查询要求转化为概念集,并适当扩充查询要求概念集,最后将两概念集转化为特征向量,计算其相似度,作为文档的评价值。文中详细给出了概念库及必需的概念运算的数学模型。 There exists an obstacle in understanding the retrieval document and in comprehending the request, whose being overcome would effectively improve the search engines performance. This paper presents a concept-based mathematical model to tackle this problem.It includes the concept hierarchy and some concept operations. Based on them, gives a document evaluation schema involving thefollowing stepsas construct a concept base specific to the requester whose background knowledge, his or her interest points, is included, evolve the concept sets from the document and the request and expand the latter one to explicate some hints, translate the sets into two corresponding feature vectors referring the concept relations, evaluat the similarity between them and the degree, the document fulfills the request. In order to implement the schema, it also takes efforts on some basic concept operations.

作者罗三定冯元勇沈德耀贾维嘉

机构地区中南大学信息工程学院香港城市大学电脑工程与信息技术系

出处《计算机工程》 CAS CSCD 北大核心 2002年第8期79-80,283,共3页 Computer Engineering

基金香港Research on lnternet Reliable Multicast Protocol (7000765)

关键词概念文档评价模型搜索引擎概念库 INTERNET Document evaluation Document feature Retrieval intention Search engine Concept base

分类号 TP393.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1郭万召.网络搜索引擎的分析与比较研究[J].情报科学,2000,18(1):80-84. 被引量：21
2罗三定,黄勇.一个应用模糊方法的智能搜索引擎的构建[J].计算机工程,2000,26(12):113-115. 被引量：15
3黄曾阳.概念层次网络（HNC）理论[M].北京:清华大学出版社,1998..
4黄勇.一种基于概念的搜索引擎的研究与核心算法的实验：硕士学位论文[M].长沙:中南大学,2001..
5俞士汶.语法知识在语言信息处理研究中的作用[J].语言文字应用,1997(4):82-88. 被引量：17
6鲁松,李晓黎,白硕,王实.文档中词语权重计算方法的改进[J].中文信息学报,2000,14(6):8-13. 被引量：120

二级参考文献5

1肖丹.Interneth上的检索工具[J].计算机与通信,1996(6):6-7. 被引量：3
2何新贵.模糊数据库系统[M].北京:清华大学出版社,1996..
3Yang Yiming，ProceedingsoftheSeventeenthInternationalACMSIGIRConferenceonResearchandDevelopme，1994年，12页
4何新贵，模糊数据库系统，1996年
5刁倩,张惠惠,王永成.Internet上的英文搜索引擎[J].计算机工程,1999,25(7):40-42. 被引量：15

共引文献169

1王利民.刍议电子文件档案的Web检索[J].中北大学学报（社会科学版）,2007,23(S1):236-238.
2周延泉,张传福,张瑞华,李蕾,何华灿.移动个性化信息服务中的用户兴趣模型[J].北京邮电大学学报,2006,29(z2):144-147. 被引量：1
3刘云,俞士汶.“句管控”与中文信息处理[J].汉语学报,2004(2):56-62. 被引量：5
4中国技工的志气[J].成才与就业,2005(16):13-13.
5陆俭明,郭锐.汉语语法研究所面临的挑战[J].世界汉语教学,1998,12(4):3-21. 被引量：95
6黄文忠.国外四个著名网络搜索引擎的比较研究[J].图书馆学研究,2004(8):68-71. 被引量：3
7许增福,梁静国,田晓宇.基于FVSM和自组织映射网络的Web文本自动分类方法[J].哈尔滨工业大学学报,2004,36(9):1168-1172. 被引量：2
8胡卓颖,徐可,万中英,陆玉昌,丁树良.专题型网页搜集系统的设计与实现[J].计算机与现代化,2004(10):1-5.
9许云,樊孝忠,张锋.基于生成语法的英语时态判断[J].计算机工程与应用,2004,40(26):226-228. 被引量：3
10王大亮,孙建涛,陆玉昌,夏克俭.一种面向自动文本摘要特征评价的新方法[J].计算机工程与应用,2004,40(33):176-178.

同被引文献34

1金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量：80
2吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
3沙莎,曾慧宏,罗三定.一种面向元数据描述文档的概念检索方法[J].计算机工程与应用,2005,41(25):168-171. 被引量：2
4章成志.基于多层特征的字符串相似度计算模型[J].情报学报,2005,24(6):696-701. 被引量：40
5Lewis D D. Naive (Bayes) at forty: The independence assumption in information retrieval. In Machine Leandng: Tenth European Conference on Machine Learning (ECML-98). Chemnitz,DE, 1998: 4-15.
6Apte C, Damerau J F, Weiss S. Automated learning of decision rules for text categorization. ACM Transactions on Information System, 1994, 12, (3): 233-251.
7G.W.Fumas, T.K.Landauer, L.M.Gomez, et al. The Vocabulary Problem in Human-System Communication. Cotmnunlcations of the ACM, 1987, 30, (11): 964-971.
8Yang Y. Expert network: Effective and efficient learning from human decisions in text categorization and retrieval. In: Proc of the Seventeenth Int'l ACM SIGIR Conf on Research and Development in Information Retrieval. Dublin, 1994: 13-22.
9Lewis D D, Sehapore R E, Callan,J P, et al. Tmining algorithms for linear text classifiers. In: Proceeding of the Nineteenth Int'l ACM SIGIR Conf on Research and Developmnet in Information Retrieval. Zurich, 1996: 298-306.
10Cohen W W, Singer Y. Context-sensitive learning methods for text categorization. In:Proceeding of the 19th Int'l ACM SIGIR Conf on Research and Develpment in Information Retrieval.Zurich, 1996: 307-315.

引证文献4

1黄倩.基于概念网的智能信息服务实现[J].现代情报,2005,25(4):188-191.
2李玮.《中外知识产权国际论坛》在京召开争端中寻合作[J].中国计算机用户,2006(4):8-8.
3邢军,韩敏,周开朋.领域本体信息源选取方法研究与实现[J].大连理工大学学报,2007,47(4):598-604. 被引量：3
4沙莎,胡发连.基于概念结构的科技论文知识管理[J].情报学报,2007,26(6):858-862.

二级引证文献3

1邢军,韩敏.基于两层向量空间模型和模糊FCA本体学习方法[J].计算机研究与发展,2009,46(3):443-451. 被引量：13
2杨朝阳,刘永坚.智能视频内容构建及无线投送系统的设计[J].武汉理工大学学报（信息与管理工程版）,2013,35(4):500-502.
3钟寒,钟宁,陈建辉,韩健.基于数据脑本体的脑信息相关文档选取[J].广西师范大学学报（自然科学版）,2014,32(4):45-51.

1廖日平.AID：类比与演绎推理有机结合的系统[J].模式识别与人工智能,1993,6(4):307-311.
2张云涛,龚玲,王永成.基于概念扩展的关键词检索技术[J].广西师范大学学报（自然科学版）,2003,21(1):94-100. 被引量：4
3唐郑熠,韦立,李均涛,万良.语义Web中本体概念的语义匹配分离方法[J].计算机工程与设计,2014,35(11):4054-4060. 被引量：2
4扩建SNS——华硕服务器助力国内某大型网站[J].网管员世界,2008(20):107-107.
5张云.互联网服务设计的价值[J].数码设计,2013(11):76-77.
6朱金伟,曾小雨,郑娟.系统时钟序列的均匀测试模型[J].软件导刊,2009,8(3):17-19.
7刘练珍,张向阳.图灵机概念的教学思考[J].科技创新导报,2016,13(29):162-163.
8隆萍,刘兴莉,刘琴.可靠性信息分析探讨[J].自动化与仪器仪表,2016(3):226-227. 被引量：2
9张建宇.后DVR时代来临视频监控产品的市场分析[J].A&S（安全&自动化）,2008(3):122-125.
10俞铁岳,林建欢,黄宜坚.虚拟仪器和LabVIEW简介[J].福建电脑,2004,20(2):2-3. 被引量：6

计算机工程

2002年第8期

浏览历史

内容加载中请稍等...

基于概念的文档评价模型被引量：4

参考文献6

二级参考文献5

共引文献169

同被引文献34

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于概念的文档评价模型 被引量：4

参考文献6

二级参考文献5

共引文献169

同被引文献34

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于概念的文档评价模型被引量：4