期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
链接相似性的微博重叠社区发现算法 被引量:2
1
作者 于洪涛 崔瑞飞 黄瑞阳 《小型微型计算机系统》 CSCD 北大核心 2015年第5期928-933,共6页
针对传统基于节点聚类的微博社区发现算法不能发现重叠社区且需要先验知识这一问题,从边聚类的角度出发,提出一种基于链接相似性的微博重叠社区发现算法.首先将用户兴趣相似度矩阵映射为虚拟兴趣网并求该网络的链接相似度,然后结合微博... 针对传统基于节点聚类的微博社区发现算法不能发现重叠社区且需要先验知识这一问题,从边聚类的角度出发,提出一种基于链接相似性的微博重叠社区发现算法.首先将用户兴趣相似度矩阵映射为虚拟兴趣网并求该网络的链接相似度,然后结合微博用户的真实关注关系得到总的链接相似度.为了将链接相似度用于社区发现,推广了传统的Ward层次聚类算法,使之适用于具有相似性度量的任意对象,并将其用于社区发现.真实数据集上的实验表明,该算法不需要先验知识就能准确地发现微博中的重叠社区,准确率可达83.4%. 展开更多
关键词 虚拟兴趣网 关注网络 链接相似 层次聚类 重叠社区
下载PDF
基于链接相似度和作弊系数的Spam网页识别算法
2
作者 陆钊 李石君 《计算机工程与科学》 CSCD 北大核心 2015年第10期1983-1988,共6页
Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子... Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子集合的链接指向关系设置权重,将待判定的网页进行度量。最后选取Anti-Trust Rank等算法作对比实验,结果验证了本文算法在准确率和适应性方面优于对比算法。 展开更多
关键词 Spam网页 作弊 链接相似 作弊系数 权重系数
下载PDF
基于链接相似性聚类的重叠社区识别 被引量:4
3
作者 张桂杰 张健沛 +1 位作者 杨静 辛宇 《电子学报》 EI CAS CSCD 北大核心 2015年第7期1329-1335,共7页
社区结构是社会网络最普遍和重要的拓扑属性之一,提出一种基于链接相似性聚类的重叠社区识别算法.该算法首先根据相邻链接的度分布状态,提出链接间的相似性度量方法;其次以链接相似性矩阵为输入,以链接社区的最优划分为目标,建立链接局... 社区结构是社会网络最普遍和重要的拓扑属性之一,提出一种基于链接相似性聚类的重叠社区识别算法.该算法首先根据相邻链接的度分布状态,提出链接间的相似性度量方法;其次以链接相似性矩阵为输入,以链接社区的最优划分为目标,建立链接局部相似性聚类算法,实现了重叠社区的有效识别;然后对链接社区进行优化,解决了可能出现的过度重叠及孤立社区问题;最后在真实网络及人工合成网络上的实验验证了算法的高效性. 展开更多
关键词 社区识别 社区 局部链接相似性度量 层次聚类 重叠社区
下载PDF
基于决策树和链接相似的Deep Web查询接口判定
4
作者 李雪玲 施化吉 +1 位作者 兰均 李星毅 《计算机应用研究》 CSCD 北大核心 2011年第11期4086-4088,4099,共4页
针对现有Deep Web查询接口判定方法误判较多、无法有效区分搜索引擎类接口的不足,提出了基于决策树和链接相似的Deep Web查询接口判定方法。该方法利用信息增益率选取重要属性,并构建决策树对接口表单进行预判定,识别特征较为明显的接口... 针对现有Deep Web查询接口判定方法误判较多、无法有效区分搜索引擎类接口的不足,提出了基于决策树和链接相似的Deep Web查询接口判定方法。该方法利用信息增益率选取重要属性,并构建决策树对接口表单进行预判定,识别特征较为明显的接口;然后利用基于链接相似的判定方法对未识别出的接口进行二次判定,准确识别真正查询接口,排除搜索引擎类接口。结果表明,该方法能有效区分搜索引擎类接口,提高了分类的准确率和查全率。 展开更多
关键词 DEEP WEB 查询 决策树 链接相似
下载PDF
基于链接和内容的BLCT主题爬行算法研究 被引量:1
5
作者 王宏艳 《计算机应用研究》 CSCD 北大核心 2011年第2期495-497,528,共4页
为了高效地获取与主题相关的资源,就垂直搜索引擎展开了研究。首先,在现有的PageRank算法基础上,提出一种改进的PageRank算法来测量网页的链接相似度;其次,从单个网页考虑,利用每个网页的url、title和正文,给出基于内容的相似度的计算方... 为了高效地获取与主题相关的资源,就垂直搜索引擎展开了研究。首先,在现有的PageRank算法基础上,提出一种改进的PageRank算法来测量网页的链接相似度;其次,从单个网页考虑,利用每个网页的url、title和正文,给出基于内容的相似度的计算方法;最后结合内容相似度和链接相似度,提出了一种基于链接和内容的BLCT主题爬行算法。实验结果表明,该算法在平均收获率和目标召回率上有显著提高,爬行的网页主题相关性也提高了。 展开更多
关键词 垂直搜索引擎 PAGERANK算法 主题爬行 链接相似 内容相似
下载PDF
基于小世界理论的工程信息网络检索的探究
6
作者 王石奇 赵正旭 《河北省科学院学报》 CAS 2014年第2期18-23,共6页
在实际工程中查找信息时,索引是很重要的指向信息,便于快速有效地查找和定位所需资源的位置。通过在索引中进行检索,快速定位查找对象,筛选不满足条件的数据,减少需要精确计算的计算量,达到提高查询效率的效果。"小世界网络"... 在实际工程中查找信息时,索引是很重要的指向信息,便于快速有效地查找和定位所需资源的位置。通过在索引中进行检索,快速定位查找对象,筛选不满足条件的数据,减少需要精确计算的计算量,达到提高查询效率的效果。"小世界网络"是一种存在捷径的网络结构,真实世界中的许多网络属于"小世界网络"。利用小世界效应可以帮助我们通过寻找捷径来快速找到真正需要的信息。本文首先对工程信息中的网络信息检索算法进行了一定概括,同时对小世界的相似性方法进行了研究,最终将小世界的链接相似性引入排序算法对索引数据的排序提出了改进。经过优化的算法可以提高返回信息的质量,将最符合用户要求的页面和链接进行返回,从而提高搜索结果的准确性和快速性。 展开更多
关键词 检索 索引模型 小世界效应 链接相似 排序
下载PDF
基于文本频率页面分割算法对论坛正文提取
7
作者 马凯凯 钱亚赫 阮东跃 《中国水运(下半月)》 2018年第2期78-79,共2页
如何在网页数据中避开干扰的图标、广告、链接等"噪音"元素来提取正文是互联网数据处理的重点问题之一。网页的URL由网络协议、主机名、页面文件相对路径等多个部分组成,对于有多个页面的帖子,其URL十分相似。根据这一特性,... 如何在网页数据中避开干扰的图标、广告、链接等"噪音"元素来提取正文是互联网数据处理的重点问题之一。网页的URL由网络协议、主机名、页面文件相对路径等多个部分组成,对于有多个页面的帖子,其URL十分相似。根据这一特性,通过分析页面内的链接文本及结构特征,找出帖子所分布在的所有网址。再利用页面文本的频率特征,去除HTML标签后按空格对文本进行分词,根据其频率分布计算网页的分割标志,得到回帖所在的文本块。再用正则表达式提取时间信息,进一步去噪后即可得到主贴及回帖信息。 展开更多
关键词 网页链接相似 文本频率 正则表达式 网页去噪
下载PDF
3D-QSAR and docking studies on 2-arylbenzoxazole and linker-Y transthyretin amyloidogenesis inhibitors
8
作者 ZHAO LiJun ZHANG LiangRen LEI Ming 《Science China Chemistry》 SCIE EI CAS 2013年第11期1550-1563,共14页
Transthyretin(TTR),a plasma protein with a tetramer structure,could form amyloid fibril associated with several human diseases through the dissociation of tetramer and the misfolding of monomer.These amyloidogenesis c... Transthyretin(TTR),a plasma protein with a tetramer structure,could form amyloid fibril associated with several human diseases through the dissociation of tetramer and the misfolding of monomer.These amyloidogenesis can be inhibited by small molecules which bind to the central channel of TTR.A number of small molecules like 2-arylbenzoxazoles(ABZ)analogues are proposed as promising therapeutic strategy to treat amyloidosis.In this work,comparative molecular field analysis(CoMFA)and comparative molecular similarity indices analysis(CoMSIA)three-dimensional quantitative structure-activity relationship(3D-QSAR)and docking studies were performed on series of 2-arylbenzoxazoles(ABZ)and linker-Y analogues to investigate the inhibitory activities of TTR amyloidogenesis at atomic level.Significant correlation coefficients for ABZ series(CoMFA,r2=0.877,q2=0.431;CoMSIA,r2=0.836,q2=0.447)and those for linker-Y series(CoMFA,r2=0.828,q2=0.522;CoMSIA,r2=0.800,q2=0.493)were obtained,and the generated models were validated using test sets.In addition,docking studies on 6 compounds binding to TTR were performed to analyze the forward or reverse binding mode and interactions between molecules and TTR.These results from 3D-QSAR and docking studies have great significance for designing novel TTR amyloidogenesis inhibitors in the future. 展开更多
关键词 TRANSTHYRETIN 3D-QSAR 2-arylbenzoxazoles linker-Y DOCKING binding mode
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部