期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于三维文档向量的自适应话题追踪器模型 被引量:11
1
作者 张辉 周敬民 +1 位作者 王亮 赵莉萍 《中文信息学报》 CSCD 北大核心 2010年第5期70-76,共7页
话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道。该文通过分析传统文档向量空间模型的不足,结合新闻报道... 话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道。该文通过分析传统文档向量空间模型的不足,结合新闻报道的特征,提出了一种三维文档向量模型,在此基础上建立了一种符合新闻报道特征的话题模型。该话题模型在追踪过程中能够根据事件的动态发展进行自我学习和自我修正。结合话题模型,该文还设计了一种自适应的KNN新闻话题追踪器,从而形成了一种完整的中文话题追踪器模型。实验数据表明该方法在描述新闻话题、避免话题漂移方面具有一定优势,在中文话题追踪领域取得了较好效果。 展开更多
关键词 话题追踪 话题模型 三维文档向量模型 自适应KNN追踪器
下载PDF
基于智能代理的网上专题信息服务模型及算法研究 被引量:12
2
作者 李进华 焦玉英 《情报理论与实践》 CSSCI 北大核心 2002年第1期51-54,共4页
This article discusses the theoretical basis,functional characteristics,design model and algorithms of Internet special subject information service based on intelligent agent.
关键词 智能代理 因特网 专题信息服务 模型 文档向量模型算法 目录表示算法
下载PDF
MatchLink:一种主题爬行方法
3
作者 蒋宗礼 鲁国相 《北京工业大学学报》 EI CAS CSCD 北大核心 2007年第11期1227-1232,共6页
为了在浩如烟海的Web信息中更快地找到用户关心的信息,提出了一种主题爬行方法——MatchLink,它通过文档向量模型来评估网页链接的主题相关度,通过朴素贝叶斯算法和多层分类的方法计算链接所在网页的主题相关度,并根据这2个相关度优先... 为了在浩如烟海的Web信息中更快地找到用户关心的信息,提出了一种主题爬行方法——MatchLink,它通过文档向量模型来评估网页链接的主题相关度,通过朴素贝叶斯算法和多层分类的方法计算链接所在网页的主题相关度,并根据这2个相关度优先下载主题相关的页面,实验表明其结果好于BestFirst和BreadthFirst。 展开更多
关键词 主题爬行器 文档向量模型 朴素贝叶斯
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部