期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种基于层次距离计算的聚类算法 被引量:11
1
作者 彭京 唐常杰 +2 位作者 程温泉 石葆梅 乔少杰 《计算机学报》 EI CSCD 北大核心 2007年第5期786-795,共10页
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算... 针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算法标称型计算的缺陷,提高了聚类精度.针对聚类算法的中心点问题,提出了相应的层次编码型数据的快速处理算法,并从理论上证明了算法的正确性.实验表明,对比朴素处理算法,HDCA的性能明显提高.新算法已经应用到警用流动人口分析当中,取得了良好效果. 展开更多
关键词 聚类 层次距离 层次编码变量 k-中心 数据挖掘
下载PDF
基于中心性和PageRank的网页综合评分方法 被引量:8
2
作者 乔少杰 彭京 +3 位作者 李天瑞 李红 李太勇 王超 《西南交通大学学报》 EI CSCD 北大核心 2011年第3期456-460,共5页
为准确、高效地对网页进行评分,提出了一种基于中心性(结点度、居间度和紧密度)和PageRank算法的网页评分方法CentralRank.它采用PageRank算法计算网页分数,借助中心性度量的方法计算页面在Web社会网络中的重要性.为了验证CentralRank... 为准确、高效地对网页进行评分,提出了一种基于中心性(结点度、居间度和紧密度)和PageRank算法的网页评分方法CentralRank.它采用PageRank算法计算网页分数,借助中心性度量的方法计算页面在Web社会网络中的重要性.为了验证CentralRank的性能优势,设计了一个网页抓取器,可利用该抓取器自动、准确地下载网页信息.该网页抓取器集成了网络信息采集、页面内容分析和页面消重3项技术.基于大量真实数据的实验结果表明:CentralRank在保证网页评分时间性能的前提下,比单纯基于中心性的网页评分算法和PageRank算法更准确、有效,预测准确性分别提高约14.2%和7.5%. 展开更多
关键词 社会网络分析 Web社会网络 中心性 PAGERANK算法 网页评分
下载PDF
Web实时环境两级过滤中文文本内容自学习算法 被引量:3
3
作者 段磊 唐常杰 +3 位作者 左劼 彭京 刘婷婷 苟驰 《计算机科学与探索》 CSCD 2011年第8期695-706,共12页
用户在互联网发布信息的自由性对Web信息内容过滤提出新的挑战。为此,给出一种自学习的两级内容过滤算法SAFE(self-study algorithm of filtering Chinese text content)。SAFE以数据流的方式处理文本,并根据Apriori性质,在不依赖词典... 用户在互联网发布信息的自由性对Web信息内容过滤提出新的挑战。为此,给出一种自学习的两级内容过滤算法SAFE(self-study algorithm of filtering Chinese text content)。SAFE以数据流的方式处理文本,并根据Apriori性质,在不依赖词典的情况下,通过挖掘关键字和关键词实现对文档的两级内容过滤。利用真实世界Web文档验证了SAFE的有效性,实验表明对给定的主题进行文本内容过滤,SAFE的查全率达到93.75%以上,查准率达到100%,执行时间能够满足Web应用的实时性要求。 展开更多
关键词 数据挖掘 文本内容过滤 关键词挖掘
下载PDF
TP-Miner:基于生物启发计算的警用流动人口分析系统 被引量:1
4
作者 彭京 唐常杰 +3 位作者 程温泉 叶尚玉 方全心 石葆梅 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2006年第5期128-135,共8页
目前对流动人口的管理仅停留在数据查询比对和简单统计上,缺少对数据的深层次分析,难以对决策指挥提供支持。针对流动人口的分析问题,提出了构建一个基于生物启发计算的智能分析系统,用于发现流动人口中各类人员的流动模式以及流动人口... 目前对流动人口的管理仅停留在数据查询比对和简单统计上,缺少对数据的深层次分析,难以对决策指挥提供支持。针对流动人口的分析问题,提出了构建一个基于生物启发计算的智能分析系统,用于发现流动人口中各类人员的流动模式以及流动人口的趋势性问题,找出异常的流动信息和模式。该系统综合运用了前沿的生物启发计算技术———基于多层染色体基因表达式编程算法、重叠基因表达进化算法、基于概念相似度神经网络分类模型和层次距离计算的聚类算法搭建了一个警用流动人口的分析平台。同时根据实际需求,提出了一种新的基于智能分析结果的分级报警模型。实验表明系统具有较高的性能和实用性。 展开更多
关键词 生物启发计算 流动人口 概念相似度 人工神经网络 数据挖掘
下载PDF
一种基于边序列的任意两点间最短路径算法 被引量:14
5
作者 徐小玲 彭京 +2 位作者 石葆梅 方全心 张竞 《计算机工程与应用》 CSCD 北大核心 2005年第29期88-90,103,共4页
基于边序列信息,论文提出了一种新的求取任意两点间最短路径的算法:EBSP(EdgesBasedall-pairsShortestPathsAlgorithm)。该算法在算法时间复杂度上同Floyd算法相近,并在一定条件下相同;通过试验表明,在边数m满足m=c*n的情况下,EBSP算法... 基于边序列信息,论文提出了一种新的求取任意两点间最短路径的算法:EBSP(EdgesBasedall-pairsShortestPathsAlgorithm)。该算法在算法时间复杂度上同Floyd算法相近,并在一定条件下相同;通过试验表明,在边数m满足m=c*n的情况下,EBSP算法速度约为Floyd算法的10倍到63倍。 展开更多
关键词 边序列 最短路径 FLOYD DIJKSTRA 稀疏图
下载PDF
基于概念相似度的文本相似计算 被引量:17
6
作者 彭京 杨冬青 +2 位作者 唐世渭 王腾蛟 高军 《中国科学(F辑:信息科学)》 CSCD 2009年第5期534-544,共11页
根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1... 根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性. 展开更多
关键词 概念相似度 相似计算 向量空间 内积空间
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部