基于向量空间模型的中文信息检索技术研究被引量：31

The Research of Chinese Information Retrieval Technology Based on the Vector Space Model

下载PDF

导出

摘要该文运用在西文信息检索中非常成功的向量空间模型来解决中文信息检索的问题,在中文文档的特征项抽取,加权、相似度计算,模型的建立等方面做了一些探讨,并建立系统原型,在小范围内进行了测试。 The full text seaching in the CJK(Chinese-Japanese-Korean)platform is a classical problem in the infor-mation searching field.This paper introduces the classical Vector Space Model(VSM)in the IR field and adoptes it into the Chinese full text seaching.The paper analyzes the problem laid in the word segmentation and approaches on the symbol-based searching in the Chinese environment.The paper makes a prototype to test the approach.The results are also presented in the paper.

作者杨小平丁浩黄都培

机构地区中国人民大学信息学院挪威科技大学信息技术中国政法大学计算机教研室

出处《计算机工程与应用》 CSCD 北大核心 2003年第15期109-111,共3页 Computer Engineering and Applications

关键词信息检索中文信息检索向量空间模型 Information searching,Chinese information searching,VSM

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Robert E Filman,Sangam Pant.Searching the Intemet[J].IEEE Intemet Computing, 1998;2(4) :59-69.
2Eric W Brown,James P Callan,W Bruce Croft.Fast Incremental Indexing for Full-Text Information Retrieval[C].In:Proceedings of the 20th VLDB Conference Santiago,Chile, 1994.
3Clifford A Lynch.Networked Information Resource Discovery:An Overview of Current Issues[J].IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, 1995; 13 (8) : 1505-1522.
4Sahon G,McGill M J.Introduction to modern Information Retrieval[M]. New York : McGraw-Hill Book company, 1983.
5Ian H Witten.How to build Digital Library[M].Morgan Kaufmann Publishers, 2003.

同被引文献158

1闫晓婧,闫浩文,王小龙,王卓,马文骏.微地图符号的智能化匹配——“识图配符”[J].测绘科学,2022,47(10):205-212. 被引量：8
2殷国鹏,莫云生,陈禹.利用社会网络分析促进隐性知识管理[J].清华大学学报（自然科学版）,2006,46(z1):964-969. 被引量：94
3吴光远,何丕廉,曹桂宏,聂颂.基于向量空间模型的词共现研究及其在文本分类中的应用[J].计算机应用,2003,23(z1):138-140. 被引量：23
4谢耘.“相关性”的理论分析[J].重庆邮电大学学报（社会科学版）,2006,18(6):816-818. 被引量：3
5赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量：17
6郑邦坤.隐性知识信息组织研究[J].情报杂志,2004,23(7):63-64. 被引量：10
7宋枫溪,高林.文本分类器性能评估指标[J].计算机工程,2004,30(13):107-109. 被引量：33
8李善平,尹奇韡,胡玉杰,郭鸣,付相君.本体论研究综述[J].计算机研究与发展,2004,41(7):1041-1052. 被引量：274
9张志远,张忠能,凌君逸.基于呼叫中心的客户管理系统在制造业的应用[J].计算机工程,2004,30(B12):427-429. 被引量：3
10陈述彭.新型地图产品前瞻[J].地球信息科学,2005,7(2):8-10. 被引量：13

引证文献31

1侯宇豪,杨维芳,马文骏,王卓,余懿韬,闫香蓉,闫浩文.一种利用VSM检索微地图的方法[J].测绘科学,2023,48(12):225-233.
2刘娟,荆一昕.基于兴趣特征的协作过滤模式研究[J].开封教育学院学报,2008,28(4):92-93.
3贝雨馨,崔荣一.文本分类中特征项权重的计算方法[J].延边大学学报（自然科学版）,2004,30(3):202-204. 被引量：9
4原福永,褚蓓蓓.一种基于超链接结构的向量空间模型改进算法[J].中文信息学报,2005,19(4):68-71.
5包金龙.基于向量空间模型的信息检索系统的设计[J].情报杂志,2005,24(7):44-45. 被引量：16
6陈丽珍,卡米力.毛依丁.基于WEB信息检索系统中维文处理方面的研究[J].电脑知识与技术（技术论坛）,2005(12):5-6.
7陈丽珍,卡米力.毛依丁.WEB维文信息检索系统中维文的存储和特征项抽取[J].新疆大学学报（自然科学版）,2006,23(1):90-92. 被引量：1
8吴俊森,吐尔根.依不拉音.基于内容的维文文本检索系统[J].现代计算机,2006,12(10):90-92. 被引量：2
9朱征宇,苑昆峰,陈杏环.一种基于最大权匹配计算的信息检索方法[J].计算机工程与应用,2007,43(33):176-180. 被引量：6
10张敏.信息过滤系统模型的相关问题研究[J].科技情报开发与经济,2008,18(1):85-86. 被引量：5

二级引证文献101

1贺德方.基于多视角的情报分析方法研究进展[J].情报学进展,2014(1):154-197. 被引量：2
2贾宏.数字图书馆个性化服务的用户建模技术论略[J].江西图书馆学刊,2006,36(4):60-61. 被引量：1
3谢科,张辉,陈鹏,庞斌.文本分类系统关键技术[J].广西师范大学学报（自然科学版）,2007,25(2):123-126. 被引量：7
4邱宇红,郭继军.向量空间模型在医学文献相关性研究中的应用[J].现代图书情报技术,2007(7):63-67. 被引量：6
5谭金波.文本层次分类中特征项权重算法的比较研究[J].情报杂志,2007,26(9):87-88. 被引量：5
6吴春颖,王士同,蔡崇超.一种基于新词发现的Web文本表示方法[J].计算机应用,2008,28(3):764-767. 被引量：4
7张小芳.几种常见信息检索模型的分析与评价[J].情报杂志,2008,27(3):121-123. 被引量：7
8徐衍,蒋运韫.信息管理中的中文信息检索[J].商场现代化,2008(12):100-101.
9余希田,万莉莉,胡铁军,李丹亚.基于向量空间模型的文献相关性数据库的研究与实现[J].现代图书情报技术,2008(6):61-66. 被引量：5
10王序臻.Web文本层次分类方法研究[J].温州职业技术学院学报,2008,8(3):44-47.

1凌云,魏贵义,刘军.基于Ontology的Web文本分类法[J].情报学报,2006,25(2):202-207. 被引量：2
2李翔鹰,陈钟,唐礼勇,李欣.一种基于后缀数组聚类(SAC)的中文垃圾邮件过滤方法[J].计算机科学,2006,33(5):107-109. 被引量：1
3代宽,赵辉,韩冬,宋天勇.基于向量空间模型的中文网页主题特征项抽取[J].吉林大学学报（信息科学版）,2014,32(1):88-94. 被引量：10
4肖升,胡金柱,姚双云,舒江波.基于本体视图特征项抽取方法研究[J].计算机应用研究,2010,27(1):42-44. 被引量：1
5陈丽珍,卡米力.毛依丁.WEB维文信息检索系统中维文的存储和特征项抽取[J].新疆大学学报（自然科学版）,2006,23(1):90-92. 被引量：1
6郝文宁,穆新国,陈刚,靳大尉,赵水宁.基于军事训练本体的文档向量空间模型构建[J].计算机应用,2012,32(A02):10-12. 被引量：2
7赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量：17
8陈丽珍,卡米力.毛依丁.基于WEB信息检索系统中维文处理方面的研究[J].电脑知识与技术（技术论坛）,2005(12):5-6.
9孙珠婷,顾倩颐.领域概念术语提取中特征项自动抽取方法[J].计算机工程与设计,2012,33(8):3189-3193. 被引量：3
10赵华,赵铁军,于浩,郑德权.基于查询向量的英语话题跟踪研究[J].计算机研究与发展,2007,44(8):1412-1417. 被引量：8

计算机工程与应用

2003年第15期

浏览历史

内容加载中请稍等...

基于向量空间模型的中文信息检索技术研究被引量：31

参考文献5

同被引文献158

引证文献31

二级引证文献101

相关作者

相关机构

相关主题

浏览历史

基于向量空间模型的中文信息检索技术研究 被引量：31

参考文献5

同被引文献158

引证文献31

二级引证文献101

相关作者

相关机构

相关主题

浏览历史

基于向量空间模型的中文信息检索技术研究被引量：31