-
题名自适应信息过滤中使用少量正例进行阈值优化(英文)
被引量:6
- 1
-
-
作者
夏迎炬
黄萱菁
胡恬
吴立德
-
机构
复旦大学计算机科学系
-
出处
《软件学报》
EI
CSCD
北大核心
2003年第10期1697-1705,共9页
-
基金
国家自然科学基金
国家高技术研究发展计划(863)~~
-
文摘
自适应信息过滤中一个大的挑战在于其数据稀疏问题.因此,在对输入的文本流进行过滤的同时学习最优阈值非常重要.提出了一种新颖的阈值优化算法.该算法可以通过少量的正例进行快速的学习,所需数据的获得具有增量性,故而其计算量及所需的存储空间很小.此外,该算法还具有高效、健壮、实用性强等优点.在第10届国际文本检索会议(TREC10)上,复旦大学的自适应信息过滤系统使用了该阈值优化算法,并取得了第3名的成绩.其T10U和T10F分别达到了0.215和0.414.
-
关键词
自适应信息过滤
向量空间模型
阈值优化
检出率
相关反馈
-
Keywords
Adaptive systems
Computer software
Data processing
Learning algorithms
Optimization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于层次聚类的自适应信息过滤学习算法
- 2
-
-
作者
洪宇
张宇
刘挺
郑伟
龚诚
李生
-
机构
哈尔滨工业大学计算机科学与技术学院信息检索实验室
-
出处
《中文信息学报》
CSCD
北大核心
2007年第3期47-53,共7页
-
基金
国家自然科学基金资助项目(60435020
60575042
60503072)
-
文摘
本文采用一种基于层次聚类的自适应学习策略,从系统反馈的信息流中,动态提取一类最优信息的质心更新用户模型,有效屏蔽了阈值失真和初始信息稀疏造成的大量反馈噪声,并且能够近似模仿人工反馈,完善自适应学习机制的智能性。
-
关键词
计算机应用
中文信息处理
自适应信息过滤
用户模型
相关反馈
阈值
层次聚类
-
Keywords
computer application
Chinese information processing
adaptive information filtering
user profile
relevant feedback
threshold
hierarchy clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于增量学习和阈值优化的自适应信息过滤研究
- 3
-
-
作者
王金宝
-
机构
大连理工大学计算机科学与工程系
-
出处
《计算机应用》
CSCD
北大核心
2006年第5期1099-1101,共3页
-
文摘
为了适应实时在线的网络信息过滤需求,提出了一种新的自适应过滤模型。在系统的初始化阶段,运用增量学习方法对附加的少量伪相关文档进行学习,采用改进的文档词频方法来抽取特征词,以此扩展需求模板,提高模板准确度。在系统测试阶段,以系统效能指标最优为目标,提出了将概率模型和文档正例分布统计方法相结合来实现阈值优化的新算法。
-
关键词
自适应信息过滤
伪相关反馈
增量学习
阈值优化
-
Keywords
adaptive information filtering
pseudo relevance feedback
incremental learning
threshold optimization
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的自适应文本信息过滤模型
被引量:18
- 4
-
-
作者
马亮
陈群秀
蔡莲红
-
机构
清华大学计算机科学与技术系智能技术与系统国家重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第1期79-84,共6页
-
基金
国家"八六三"高技术研究发展计划基金项目(2001AA14040)
-
文摘
自适应信息过滤技术能够帮助用户从Web等信息海洋中获得感兴趣的内容或过滤无关垃圾信息.针对现有自适应过滤系统的不足,提出了一种改进的自适应文本信息过滤模型.模型中提供了两种相关性检索机制,在此基础上改进了反馈算法,并采用了增量训练的思想,对过滤中的自适应学习机制也提出了新的算法.基于本模型的系统在相关领域的国际评测中取得良好成绩.试验数据说明各项改进是有效的,新模型具有更高的性能.
-
关键词
信息检索
WEB
自适应信息过滤
LANGUAGE
MODEL
相关性反馈
-
Keywords
information retrieval
Web
adaptive information filtering
language model
relevance feedback
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的Web文本自适应过滤策略
被引量:1
- 5
-
-
作者
沈凤仙
朱巧明
刘粉香
-
机构
三江学院计算机基础教学部
江苏省计算机信息处理技术重点实验室
-
出处
《计算机与现代化》
2010年第9期48-52,共5页
-
文摘
面对实时网络信息过滤的新挑战,自适应信息过滤基本上能够解决问题。针对现有自适应系统的不足,本文提出提高模板准确性的学习和过滤阈值优化的新方法。改进的过滤策略过滤初期采用SVM算法,中后期采用改进的自适应模板过滤法。模板的更新采用改进的模板系数调整策略,并引入特征衰减因子来提高过滤的准确率。该系统运行于一个校园网关上,取得了较好的结果。
-
关键词
网页过滤
自适应信息过滤
语义倾向
-
Keywords
Web page filtering
adaptive information filtering
semantic orientation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-