-
题名基于链接结构和内容相似度的聚焦爬虫系统
被引量:3
- 1
-
-
作者
倪贤贵
蔡明
-
机构
江南大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第7期1709-1710,1763,共3页
-
文摘
介绍了基于链接结构和内容相似度的主题Web Crawler系统结构,重点介绍了其中的联合网页链接结构和内容相似度来计算网页相关度算法。该算法计算种子网页集到抓取网页的链接数目和抓取网页到种子网页集的链接数目,及Web内容与主题的内容相似度,综合计算该网页的相关度权值,从中选择权威网页或hub网页作为种子网页,从而提高主题爬虫系统的爬行效率和抓取网页的查准率。
-
关键词
聚焦爬虫
链接结构
内容相似度
向量空间模型
查准率
-
Keywords
focused crawler
link structure
content similarity
VSM
harvest ratio
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于超链接和内容相关度的综合爬行策略
- 2
-
-
作者
蔡明
倪贤贵
-
机构
江南大学信息工程学院
-
出处
《微计算机信息》
北大核心
2008年第27期204-205,208,共3页
-
文摘
介绍了网页分析算法HITS算法,并对HITS算法进行改进,提出了一种基于超链接和内容相关度的网页排序算法VHITS算法。VHITS算法引入向量空间模型计算网页内容的主题相关度,并用来评价超链接的重要性,从而避免了HITS算法所产生的主题漂移现象,有效的引导主题挖掘。
-
关键词
聚焦爬行
超链接
向量空间模型
内容相关度
-
Keywords
Focused Crawling
Hyperlink
VSM
Content Similarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名银行企业化进程中亟待解决的几个问题
- 3
-
-
作者
倪贤贵
-
机构
建设银行湖北省分行
-
出处
《财会通讯(上)》
1994年第7期25-26,共2页
-
文摘
国务院《关于金融体制改革的决定》明确指出,我国现有专业银行要转变为国有商业银行,走企业化道路,但是在专业银行企业化的实践过程中,存在许多实际问题,影响了商业银行的转化世程,亟待研究和解决。
-
关键词
银行企业
经营原则
建设银行
利润留成
利率档次
国家金融政策
实现利润
农副产品收购
预提
负债管理
-
分类号
F832
[经济管理—金融学]
-
-
题名谈建设银行会计改革
- 4
-
-
作者
倪贤贵
-
出处
《投资与建设》
1993年第5期4-6,共3页
-
-
关键词
建设银行
会计
-
分类号
F830.42
[经济管理—金融学]
-