-
题名基于分类和关键词组抽取的信息检索算法
被引量:11
- 1
-
-
作者
钟敏娟
林亚平
陈治平
-
机构
湖南大学计算机与通信学院
-
出处
《系统仿真学报》
CAS
CSCD
2004年第5期1009-1012,1016,共5页
-
基金
国家自然科学基金(60272051)
-
文摘
本文提出一种基于分类和关键词组抽取的信息检索算法。该算法利用文本分类和信息抽取技术辅助检索,避免了向量空间模型算法中时间复杂度过大,查准率不高的缺点。针对传统的信息检索性能指标无法有效地衡量检索结果的排序状况,本文还引入了排序误差率概念用于评价检索结果的排序。实验结果表明,所提算法与TFIDF算法、基于分类的交互式检索算法相比,具有更快的查询速度,更高的查准率和更小的排序误差率。
-
关键词
向量空间模型
文本分类
关键词组抽取
查准率
排序误差率
-
Keywords
vector space model
text classification
key phrase extraction
precision
ranking error
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名CDSE:一个面向领域的智能搜索引擎
- 2
-
-
作者
钟敏娟
凌传繁
白耀辉
郭攀
-
机构
江西财经大学信息管理学院
江西财经大学电子学院
江西科技师范学院数学与计算机科学系
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第24期206-208,共3页
-
基金
江西省教育厅科技基金资助项目(赣教计字[2005]326
赣教计字[2005]327)
-
文摘
介绍了一个面向领域的智能搜索引擎CDSE(Computer Document Search Engine)的设计和实现。CDSE结合文本分类和关键词组抽取检索用户需要的信息。利用了多个算法,综合运用了统计学方法、数据挖掘技术和Agent技术,较好地解决了现有搜索引擎普遍存在的搜索精度差、相关文档列序较后的问题。
-
关键词
钳能搜索引擎
关键词组抽取
数据挖掘
AGENT
-
Keywords
Intelligent search engine
Key phrase extraction
Data mining
Agent
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-