一方面,社区信息沿着最短路径传播且随着传播逐渐衰减,信息传到较远位置可能性很小。另一方面,在信息量一定的情况下,在不同路径长度下,每条边累积信息量不同。由此两方面的考虑,引入节点影响力和局部中心度,结合GN算法删除最大边介数...一方面,社区信息沿着最短路径传播且随着传播逐渐衰减,信息传到较远位置可能性很小。另一方面,在信息量一定的情况下,在不同路径长度下,每条边累积信息量不同。由此两方面的考虑,引入节点影响力和局部中心度,结合GN算法删除最大边介数的核心思想,得到一种新的社区发现算法WLCD(weighted local community detection,WLCD)。实验证明,在三种真实网络数据集中,WLCD算法对比其他几种经典社区检测算法更好,在模块度、调整兰德系数、标准互信息以及准确率等评价指标方面都有比较好的结果。展开更多
阐述了自动文摘和PageRank算法的概念和步骤,并介绍了部分基于图排序的自动摘录算法;提出了一种基于中心词耦合度和PageRank的图排序文本自动摘录算法,通过文本特征筛选技术提取出文档中的中心词并定义了句子之间的中心词耦合度函数,再...阐述了自动文摘和PageRank算法的概念和步骤,并介绍了部分基于图排序的自动摘录算法;提出了一种基于中心词耦合度和PageRank的图排序文本自动摘录算法,通过文本特征筛选技术提取出文档中的中心词并定义了句子之间的中心词耦合度函数,再将中心词耦合度应用在PageRank算法中,最后通过句子的PageRank值来生成摘录;以SUMMAC的Computation and Language语料库中的新闻文档作为实验对象,采用ROUGE作为摘录效果评价工具进行实验。实验结果表明,本文算法跟单纯PageRank摘要算法相比摘录效果和摘录效率都有所提升。展开更多
文摘一方面,社区信息沿着最短路径传播且随着传播逐渐衰减,信息传到较远位置可能性很小。另一方面,在信息量一定的情况下,在不同路径长度下,每条边累积信息量不同。由此两方面的考虑,引入节点影响力和局部中心度,结合GN算法删除最大边介数的核心思想,得到一种新的社区发现算法WLCD(weighted local community detection,WLCD)。实验证明,在三种真实网络数据集中,WLCD算法对比其他几种经典社区检测算法更好,在模块度、调整兰德系数、标准互信息以及准确率等评价指标方面都有比较好的结果。
文摘阐述了自动文摘和PageRank算法的概念和步骤,并介绍了部分基于图排序的自动摘录算法;提出了一种基于中心词耦合度和PageRank的图排序文本自动摘录算法,通过文本特征筛选技术提取出文档中的中心词并定义了句子之间的中心词耦合度函数,再将中心词耦合度应用在PageRank算法中,最后通过句子的PageRank值来生成摘录;以SUMMAC的Computation and Language语料库中的新闻文档作为实验对象,采用ROUGE作为摘录效果评价工具进行实验。实验结果表明,本文算法跟单纯PageRank摘要算法相比摘录效果和摘录效率都有所提升。