期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于网页主题重要性的专题搜索策略研究
被引量:
1
1
作者
魏本洁
董守斌
《江西师范大学学报(自然科学版)》
CAS
北大核心
2008年第2期162-165,共4页
网页之间的链接结构为评价网页的主题重要性提供了丰富的信息,但传统的基于链接结构评价的主题排序算法,虽然提出了用向量来表示网页在不同主题中的重要程度,但它们在计算过程中没有充分考虑网页本身的主题相关度.为解决这一问题,本文...
网页之间的链接结构为评价网页的主题重要性提供了丰富的信息,但传统的基于链接结构评价的主题排序算法,虽然提出了用向量来表示网页在不同主题中的重要程度,但它们在计算过程中没有充分考虑网页本身的主题相关度.为解决这一问题,本文提出根据链接上下文信息得到主题相关度预测,并将其融合到主题重要性的计算中.同时,根据网页的主题重要性排序,来指导专题爬行器的爬行方向.实验结果表明,基于网页主题重要性的排序测度TopicalRank比PageRank、TSPR(Topical-Sensitive PageRank)对专题爬行更有指导意义.
展开更多
关键词
链接结构
链接上下文
标签树
主题重要性
下载PDF
职称材料
主题-引文融合视角下重要主题发现及知识流动路径研究
2
作者
梁爽
刘小平
柴文越
《数据分析与知识发现》
EI
CSCD
北大核心
2024年第2期99-113,共15页
【目的】理解与探究知识流动的内在机理与轨迹方向,为科技创新与发展、科学评价与决策提供参考。【方法】以主题作为研究视角,建立知识网络,综合主题影响因子与节点交叉度构建主题重要度指标。基于识别得到的重要主题,分别从知识流入与...
【目的】理解与探究知识流动的内在机理与轨迹方向,为科技创新与发展、科学评价与决策提供参考。【方法】以主题作为研究视角,建立知识网络,综合主题影响因子与节点交叉度构建主题重要度指标。基于识别得到的重要主题,分别从知识流入与知识流出视角,利用最大路径搜索算法实现知识流动路径的构建。【结果】实证分析表明,所构建的指标能够对领域重要主题实现有效识别。在此基础上,构造知识流动路径,并得到具有最大知识传播量的领域路径。【局限】知识节点间的知识流动强度度量具有一定的局限性,未能全面考虑到引用行为发生的动机、引用类型等实际引用情况的多变性。【结论】综合分析两种视角下的流动路径可以发现,主题间具有较为普遍的双向知识流动,学科内部存在交流紧密的主题群,为从整体上把握研究主题的形成脉络与继承发展提供有益参考。
展开更多
关键词
引文分析
主题
引用网络
主题重要性
知识流动
路径分析
原文传递
定向网络信息采集系统的研究
被引量:
1
3
作者
熊菲
刘云
李勇
《电脑与电信》
2008年第9期24-26,共3页
通用网络信息采集系统效率低,数据冗余大,因此本文研究了一种高性能的定向信息采集系统。该系统针对目标网站,抓取主题及回复网页。获取网页时控制并发线程和链接收集策略,消除无关和重复信息,并将数据结构化。同时本文提出了主题重要...
通用网络信息采集系统效率低,数据冗余大,因此本文研究了一种高性能的定向信息采集系统。该系统针对目标网站,抓取主题及回复网页。获取网页时控制并发线程和链接收集策略,消除无关和重复信息,并将数据结构化。同时本文提出了主题重要性评估模型,分析主题对回复的吸附力,分配系统资源,指引新回复的抓取。系统连续运行8小时,获得的有效网页总数在通用爬虫的1.2倍以上。
展开更多
关键词
信息采集
定向爬虫
面向
主题
主题重要性
下载PDF
职称材料
题名
基于网页主题重要性的专题搜索策略研究
被引量:
1
1
作者
魏本洁
董守斌
机构
华南理工大学计算机科学与工程学院广东省计算机网络重点实验室
出处
《江西师范大学学报(自然科学版)》
CAS
北大核心
2008年第2期162-165,共4页
基金
863计划(2006AA01Z196)资助项目
文摘
网页之间的链接结构为评价网页的主题重要性提供了丰富的信息,但传统的基于链接结构评价的主题排序算法,虽然提出了用向量来表示网页在不同主题中的重要程度,但它们在计算过程中没有充分考虑网页本身的主题相关度.为解决这一问题,本文提出根据链接上下文信息得到主题相关度预测,并将其融合到主题重要性的计算中.同时,根据网页的主题重要性排序,来指导专题爬行器的爬行方向.实验结果表明,基于网页主题重要性的排序测度TopicalRank比PageRank、TSPR(Topical-Sensitive PageRank)对专题爬行更有指导意义.
关键词
链接结构
链接上下文
标签树
主题重要性
Keywords
link structure
link context
tag tree
topical importance
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
主题-引文融合视角下重要主题发现及知识流动路径研究
2
作者
梁爽
刘小平
柴文越
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院信息资源管理系
出处
《数据分析与知识发现》
EI
CSCD
北大核心
2024年第2期99-113,共15页
基金
中国科学院文献情报能力建设专项(项目编号:E1290423)的研究成果之一。
文摘
【目的】理解与探究知识流动的内在机理与轨迹方向,为科技创新与发展、科学评价与决策提供参考。【方法】以主题作为研究视角,建立知识网络,综合主题影响因子与节点交叉度构建主题重要度指标。基于识别得到的重要主题,分别从知识流入与知识流出视角,利用最大路径搜索算法实现知识流动路径的构建。【结果】实证分析表明,所构建的指标能够对领域重要主题实现有效识别。在此基础上,构造知识流动路径,并得到具有最大知识传播量的领域路径。【局限】知识节点间的知识流动强度度量具有一定的局限性,未能全面考虑到引用行为发生的动机、引用类型等实际引用情况的多变性。【结论】综合分析两种视角下的流动路径可以发现,主题间具有较为普遍的双向知识流动,学科内部存在交流紧密的主题群,为从整体上把握研究主题的形成脉络与继承发展提供有益参考。
关键词
引文分析
主题
引用网络
主题重要性
知识流动
路径分析
Keywords
Citation Analysis
Topic Citation Network
Topic Importance Knowledge Flow
Path Analysis
分类号
G353 [文化科学—情报学]
原文传递
题名
定向网络信息采集系统的研究
被引量:
1
3
作者
熊菲
刘云
李勇
机构
北京交通大学通信与信息系统北京市重点实验室
出处
《电脑与电信》
2008年第9期24-26,共3页
基金
教育部高等学校科技创新工程重大项目培育基金项目
项目编号:707006
+3 种基金
通信与信息系统北京市重点实验室资助项目
北京市教育委员会共建项目专项资助
北京交通大学校基金项目
项目编号:2006XM001
文摘
通用网络信息采集系统效率低,数据冗余大,因此本文研究了一种高性能的定向信息采集系统。该系统针对目标网站,抓取主题及回复网页。获取网页时控制并发线程和链接收集策略,消除无关和重复信息,并将数据结构化。同时本文提出了主题重要性评估模型,分析主题对回复的吸附力,分配系统资源,指引新回复的抓取。系统连续运行8小时,获得的有效网页总数在通用爬虫的1.2倍以上。
关键词
信息采集
定向爬虫
面向
主题
主题重要性
Keywords
information collection
directional crawler
subject oriented
topic adsorbability
分类号
TP393 [自动化与计算机技术—计算机应用技术]
TU113.51 [建筑科学—建筑理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于网页主题重要性的专题搜索策略研究
魏本洁
董守斌
《江西师范大学学报(自然科学版)》
CAS
北大核心
2008
1
下载PDF
职称材料
2
主题-引文融合视角下重要主题发现及知识流动路径研究
梁爽
刘小平
柴文越
《数据分析与知识发现》
EI
CSCD
北大核心
2024
0
原文传递
3
定向网络信息采集系统的研究
熊菲
刘云
李勇
《电脑与电信》
2008
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部