期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)
被引量:
3
1
作者
蔡元哲
李佩
+2 位作者
刘红岩
何军
杜小勇
《计算机科学与探索》
CSCD
2009年第4期378-391,共14页
文档的内容分析和连接分析是计算文档相似度的两种方法。连接分析能够发现文档之间的隐含关系,但是,由于文档之间的噪声的存在,这种方法很难得到精确的结果。为了解决这个问题,提出了一个新的算法—S-SimRank(Star-SimRank),有效地将文...
文档的内容分析和连接分析是计算文档相似度的两种方法。连接分析能够发现文档之间的隐含关系,但是,由于文档之间的噪声的存在,这种方法很难得到精确的结果。为了解决这个问题,提出了一个新的算法—S-SimRank(Star-SimRank),有效地将文档的内容信息和连接信息结合在一起从而提高了文档相似度计算的准确性。S-Simrank算法在ACM数据集上无论是准确性和效率都比其他算法有了很大地提高。最后,给出了S-SimRank的收敛性的数学证明。
展开更多
关键词
连接分析
相似度计算
文本分析
下载PDF
职称材料
题名
S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)
被引量:
3
1
作者
蔡元哲
李佩
刘红岩
何军
杜小勇
机构
中国人民大学教育部数据工程和知识工程重点实验室
中国人民大学信息学院
清华大学管理科学与工程系
出处
《计算机科学与探索》
CSCD
2009年第4期378-391,共14页
基金
The National Natural Science Foundation of China under Grant No.70871068,70621061,70890083,60873017,60573092~~
文摘
文档的内容分析和连接分析是计算文档相似度的两种方法。连接分析能够发现文档之间的隐含关系,但是,由于文档之间的噪声的存在,这种方法很难得到精确的结果。为了解决这个问题,提出了一个新的算法—S-SimRank(Star-SimRank),有效地将文档的内容信息和连接信息结合在一起从而提高了文档相似度计算的准确性。S-Simrank算法在ACM数据集上无论是准确性和效率都比其他算法有了很大地提高。最后,给出了S-SimRank的收敛性的数学证明。
关键词
连接分析
相似度计算
文本分析
Keywords
linkage mining
similarity calculation
text mining
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)
蔡元哲
李佩
刘红岩
何军
杜小勇
《计算机科学与探索》
CSCD
2009
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部