期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
一种基于算法机制设计的社会法则合成方法
1
作者 吴骏 曹杰 +1 位作者 王崇骏 谢俊元 《软件学报》 EI CSCD 北大核心 2024年第3期1440-1465,共26页
社会法则是在多Agent系统中为确立某种目标属性而对各个Agent实施的行为限制集合.在Agent具有“个体理性”及“私有信息”的“策略情况”下,社会法则合成问题不应建模成通常的优化问题,而应建模成算法机制设计问题.“最小化副作用”经... 社会法则是在多Agent系统中为确立某种目标属性而对各个Agent实施的行为限制集合.在Agent具有“个体理性”及“私有信息”的“策略情况”下,社会法则合成问题不应建模成通常的优化问题,而应建模成算法机制设计问题.“最小化副作用”经常是社会法则需要满足的基本要求.从博弈论的角度来看,“最小化副作用”与“最大化社会福利”的概念紧密相关,可以将“最小化副作用的社会法则合成”建模为一种效率机制设计问题.不仅需要为给定目标属性找到有效且社会福利最大的社会法则,还需要向Agent支付适当的金额,以实现激励相容性和个体理性.首先基于VCG机制设计一种名叫VCG-SLM的效率机制,证明它可满足所有必需的形式属性.然而,由于发现可证明该机制的计算是一个FP^(NP)-完全问题,针对性地提出该机制的一种基于整数规划的实现方式VCG-SLM-ILP,基于ATL语义将分配及支付的计算转化为整数规划,并严格地证明其正确性,从而可有效利用目前已非常成熟的工业级整数规划求解器,成功解决棘手的机制计算问题. 展开更多
关键词 多AGENT系统 社会法则 算法机制设计
下载PDF
基于特征选择的推荐系统托攻击检测算法 被引量:23
2
作者 伍之昂 庄毅 +1 位作者 王有权 曹杰 《电子学报》 EI CAS CSCD 北大核心 2012年第8期1687-1693,共7页
基于协同过滤的电子商务推荐系统极易受到托攻击,托攻击者注入伪造的用户模型增加或减少目标对象的推荐频率,如何检测托攻击是目前推荐系统领域的热点研究课题.分析五种类型托攻击对不同协同过滤算法产生的危害性,提出一种特征选择算法... 基于协同过滤的电子商务推荐系统极易受到托攻击,托攻击者注入伪造的用户模型增加或减少目标对象的推荐频率,如何检测托攻击是目前推荐系统领域的热点研究课题.分析五种类型托攻击对不同协同过滤算法产生的危害性,提出一种特征选择算法,为不同类型托攻击选取有效的检测指标.基于选择出的指标,提出两种基于监督学习的托攻击检测算法,第一种算法基于朴素贝叶斯分类;第二种算法基于k近邻分类.最后,通过实验验证了特征选择算法的有效性,及两种算法的灵敏性和特效性. 展开更多
关键词 推荐系统 托攻击检测 特征选择 朴素贝叶斯分类 K近邻分类
下载PDF
在线评论情感计算与博弈预测 被引量:13
3
作者 卜湛 伍之昂 +1 位作者 曹杰 朱桂祥 《电子学报》 EI CAS CSCD 北大核心 2015年第12期2530-2535,共6页
传统的情感分析研究大多立足于解决主观性文本的情感分类问题,面向复杂交互式文本的情感演化分析却力所不逮.本文以天涯论坛短文本中文在线评论为研究对象,首先提出一种高效的情感计算框架捕捉在线评论所蕴含的情感倾向;然后将情感计算... 传统的情感分析研究大多立足于解决主观性文本的情感分类问题,面向复杂交互式文本的情感演化分析却力所不逮.本文以天涯论坛短文本中文在线评论为研究对象,首先提出一种高效的情感计算框架捕捉在线评论所蕴含的情感倾向;然后将情感计算和博弈论相结合提出情感演化预测算法,以混合纳什均衡策略作为交互行为的预测结果;最后在大规模评论数据集上,验证了情感计算框架的有效性和情感演化预测算法的准确性. 展开更多
关键词 情感分析 在线评论 情感计算 博弈论 情感演化
下载PDF
Roster:一种开发者潜在同行推荐方法 被引量:8
4
作者 何鹏 李兵 +2 位作者 杨习辉 熊伟 陈军 《计算机学报》 EI CSCD 北大核心 2014年第4期859-872,共14页
根据开发者的历史开发信息,推荐潜在合作对象或能够胜任的任务,对于减少开发延时,提高团队开发效率有极大的促进作用.大量已有工作主要研究单个开源项目开发者社区,通过确定开发者的个人技能实施推荐.然而,以整个开源社区为视角,研究使... 根据开发者的历史开发信息,推荐潜在合作对象或能够胜任的任务,对于减少开发延时,提高团队开发效率有极大的促进作用.大量已有工作主要研究单个开源项目开发者社区,通过确定开发者的个人技能实施推荐.然而,以整个开源社区为视角,研究使用开发者实践技能做推荐,实现开发者跨项目与组织边界合作的工作相对甚少.为丰富这一工作,文中结合开发者的实践技能相似性与共同开发者数,为Sourceforge.net社区未曾合作的开发者提供一种同行推荐的方法.研究结果表明文中的方法能够有效地实现开发者同行推荐,相比只考虑共同开发者数时成功推荐的开发者数增加了31.1%,且推荐精度提高0.4倍,缓解了社区合作的稀疏性.最后,应用文中提出的方法开发了一个Roster推荐系统,为社区开发者的交流建立了一种新的辅助途径. 展开更多
关键词 开源社区 开发者实践技能 群体软件工程 软件工程推荐系统 社会计算
下载PDF
基于词句协同排序的单文档自动摘要算法 被引量:8
5
作者 张璐 曹杰 +1 位作者 蒲朝仪 伍之昂 《计算机应用》 CSCD 北大核心 2017年第7期2100-2105,共6页
对于节录式自动摘要需要从文档中提取一定数量的重要句子,以生成涵盖原文主旨的短文的问题,提出一种基于词句协同排序的单文档自动摘要算法,将词句关系融入以图排序为基础的句子权重计算过程中。首先给出了算法中词句协同计算的框架;然... 对于节录式自动摘要需要从文档中提取一定数量的重要句子,以生成涵盖原文主旨的短文的问题,提出一种基于词句协同排序的单文档自动摘要算法,将词句关系融入以图排序为基础的句子权重计算过程中。首先给出了算法中词句协同计算的框架;然后转化为简洁的矩阵表示形式,并从理论上证明了收敛性;最后进一步通过去冗余方法提高自动摘要的质量。真实数据集上的实验表明,基于词句协同排序的自动摘要算法较经典的TextRank算法在Rouge指标上提升13%~30%,能够有效提高摘要的生成质量。 展开更多
关键词 自动摘要 节录式摘要 单文档 图排序 词句协同
下载PDF
跨数据中心的动态资源联合预留研究 被引量:4
6
作者 伍之昂 罗军舟 +1 位作者 宋爱波 东方 《计算机学报》 EI CSCD 北大核心 2014年第11期2317-2326,共10页
如何有效保障服务质量(Quality of Service,QoS)是网格计算和云计算等网络计算平台面临的核心问题之一,资源可获得性和性能的动态变化使得将多媒体网络的资源提前预留机制直接应用到网络计算平台面临巨大挑战.为此提出了一种跨数据中心... 如何有效保障服务质量(Quality of Service,QoS)是网格计算和云计算等网络计算平台面临的核心问题之一,资源可获得性和性能的动态变化使得将多媒体网络的资源提前预留机制直接应用到网络计算平台面临巨大挑战.为此提出了一种跨数据中心的资源联合预留体系架构,引入虚拟资源容器以适应资源的动态性,提出了资源预留协商算法以增加预留请求与资源的匹配率.在东南大学校园云计算平台的实验结果表明,在资源动态变化的网络计算环境中,所提出的体系架构能显著提高预留请求的成功率,且具有更强的稳定性. 展开更多
关键词 网络计算 数据中心 资源提前预留 虚拟资源容器
下载PDF
一种改进的死锁和活锁避免资源联合分配协议 被引量:5
7
作者 伍之昂 曹杰 王有权 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2589-2596,共8页
提出一种改进的死锁和活锁避免资源联合分配协议——OODP3(Optimal ODP3),OODP3基于ODP3(Or-der-based Deadlock Prevention Protocol with Parallel requests)的安全状态方法避免死锁和活锁,但是,OODP3将其时间复杂度降到多项式级,并对... 提出一种改进的死锁和活锁避免资源联合分配协议——OODP3(Optimal ODP3),OODP3基于ODP3(Or-der-based Deadlock Prevention Protocol with Parallel requests)的安全状态方法避免死锁和活锁,但是,OODP3将其时间复杂度降到多项式级,并对OODP3的正确性进行了理论证明,实验结果表明OODP3的执行速度快,而且比现有的资源联合分配协议具有更优越的性能;最后进一步讨论了退避时间协议和资源分配策略对OODP3性能的影响. 展开更多
关键词 资源联合分配协议 死锁 活锁 NP-COMPLETE
下载PDF
基于局部紧耦合结构的模块性优化社区检测方法 被引量:4
8
作者 张华健 王有权 +1 位作者 伍之昂 孙知信 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第3期504-509,共6页
利用局部紧耦合结构提升社区检测的模块性优化质量.首先,定义了4类边缘紧耦合结构,并提出了一种具有线性复杂度的边缘紧耦合结构挖掘算法.其次,分别选择k-clique,k-clan,k-plex结构作为核心紧耦合结构,并以长结构优先和短结构优先2种策... 利用局部紧耦合结构提升社区检测的模块性优化质量.首先,定义了4类边缘紧耦合结构,并提出了一种具有线性复杂度的边缘紧耦合结构挖掘算法.其次,分别选择k-clique,k-clan,k-plex结构作为核心紧耦合结构,并以长结构优先和短结构优先2种策略将边缘与核心紧耦合结构合并.然后,将合并后的局部紧耦合结构融入模块性优化过程,提出了一种NFN算法.该算法将每个局部紧耦合结构初始化为独立社区,不断凝聚模块性增量最大的2个社区,直至找到预定义数量的社区.6个真实数据集上针对外部指标和内部指标的实验结果均表明,相比于传统的FN算法,NFN算法能发现更高质量的社区.在参数设置方面,长结构优先策略优于短结构优先策略,且采用k-clique结构作为核心紧耦合结构优于采用其他结构.因此,长结构优先策略结合k-clique成为NFN算法的最佳参数组合. 展开更多
关键词 社区检测 模块性 FN算法 社会网络 紧耦合结构
下载PDF
开源软件社区开发者角色的演化分析 被引量:7
9
作者 汪文娟 李兵 何鹏 《复杂系统与复杂性科学》 EI CSCD 北大核心 2015年第1期1-7,共7页
收集了Tomcat 6项目从2006—2010年10个版本的开发者修改日志和邮件列表信息,分析各个版本下开发者网络中开发者的活跃度演化趋势,从中提取典型的角色演化模式,并对比不同演化模式的开发者在特定工作类型上的贡献程度。实验结果表明,开... 收集了Tomcat 6项目从2006—2010年10个版本的开发者修改日志和邮件列表信息,分析各个版本下开发者网络中开发者的活跃度演化趋势,从中提取典型的角色演化模式,并对比不同演化模式的开发者在特定工作类型上的贡献程度。实验结果表明,开发者网络中存在5种典型的角色演化模式,而且不同演化模式下的开发者从事的工作类型也有所不同。 展开更多
关键词 开源软件社区 开发者网络分析 角色演化 活跃度
下载PDF
基于主题序列模式的旅游产品推荐引擎 被引量:9
10
作者 朱桂祥 曹杰 《计算机研究与发展》 EI CSCD 北大核心 2018年第5期920-932,共13页
旅游产品推荐是当前推荐系统研究领域中的新兴议题之一.由于旅游产品描述信息维度多样复杂、"用户-产品"关联矩阵极为稀疏且冷启动问题突出,已经在电子商务领域获得成功的协同过滤推荐往往难以直接被应用于旅游产品推荐.提出... 旅游产品推荐是当前推荐系统研究领域中的新兴议题之一.由于旅游产品描述信息维度多样复杂、"用户-产品"关联矩阵极为稀疏且冷启动问题突出,已经在电子商务领域获得成功的协同过滤推荐往往难以直接被应用于旅游产品推荐.提出基于主题序列模式的旅游产品推荐引擎SECT,试图通过在线旅游网站点击日志的挖掘产生推荐.首先,从页面语义描述文本中挖掘主题,以在泛化层面捕捉用户行为模式;其次,从页面访问时间序列数据中挖掘频繁序列模式及其候选产品集,形成序列模式库;最后,提出Markov n-gram模型,完成用户实时点击流与模式库匹配计算.为了提升在线匹配计算的效率,设计一种新的多叉树数据结构PSC-tree用于存储历史模式库,并与在线计算模块无缝衔接.在真实旅游数据集上的实验结果表明:该推荐引擎比传统推荐算法具有更优越的性能,而且能有效提升冷启动用户的推荐率和准确率.此外,针对长尾物品的推荐,SECT也优于基准算法. 展开更多
关键词 旅游产品推荐 频繁序列模式 冷启动用户 Web日志数据 推荐系统
下载PDF
基于动态类簇形成博弈的属性图聚类方法 被引量:6
11
作者 卜湛 王煜尧 +2 位作者 马丽娜 蒋玖川 曹杰 《计算机学报》 EI CAS CSCD 北大核心 2021年第9期1824-1840,共17页
以微博、微信为代表的社交网络不仅包含丰富的节点属性信息,还蕴含复杂的网络拓扑信息,这些社交网络通常可被建模为属性图.传统的图聚类方法假设节点属性与网络拓扑共享同一类簇结构.然而,在真实社交网络中,节点属性与网络拓扑所对应的... 以微博、微信为代表的社交网络不仅包含丰富的节点属性信息,还蕴含复杂的网络拓扑信息,这些社交网络通常可被建模为属性图.传统的图聚类方法假设节点属性与网络拓扑共享同一类簇结构.然而,在真实社交网络中,节点属性与网络拓扑所对应的类簇结构并非完全一致.譬如,通过社团发现技术分析新浪微博的好友关注列表能够直观地获取聚集在同一群组的用户集合;而借助文本挖掘技术分析同一群组的用户生成内容却会发现用户讨论话题的分布广泛,体现出差异化的用户偏好特征.如何有效融合属性与拓扑信息对属性图进行聚类是理解、分析和可视化大规模社交网络的关键难题之一.为此,本文将属性图聚类建模为多目标优化问题,提出一种基于动态类簇形成博弈的属性图聚类方法.首先定义一种新颖的中心性指标度量节点的影响力,并提出一种启发式方法初始化属性图类簇质心;其次在动态博弈理论框架下,提出一种贪心的局部搜索策略更新节点类簇标签,并严格证明该局部搜索策略可使类簇结构收敛至局部帕累托最优解;最后设计一种基于多智能体自治计算的属性图聚类算法,该算法无需预设初始类簇个数,且复杂度近似线性于边的数目.为验证本文所提算法的性能,我们依次从三个方面来对其进行测试和评估.首先我们在Google+属性图上对所提算法进行了单独的收敛性分析.我们测试了算法中四个需要优化的目标函数(K-means损失函数、Havrda-Charvat生成熵、负模块度和负紧凑度)在三个不同的Bregman散度(欧氏距离平方、KL散度距离和余弦距离)设置下的收敛性情况.实验结果表明,四个目标函数能在50轮迭代之后达到收敛状态.然后,我们在4个大规模属性图上分别从聚类精度和可扩展性两个方面将本文所提算法与9个基准方法作了充分对比.对比结果表明,本文所提算法在NMI指标下比其它算法所得最优结果高出0.7%;而在AvgF1指标下比大多数算法所得的最优结果高出0.2%.在可扩展性方面,本文所提算法即使在最大规模的Google+属性图上也能在1个小时内计算出聚类结果.最后,我们在小规模PolBK数据集上进行了可视化分析.从可视化结果可以看出,在14轮迭代后本文所提算法就达到了稳定状态,与此同时找到了与真实情况接近的类簇结构.总体实验结果表明,本文方法能够准确发现大规模社交网络潜在的类簇结构,且同已有方法相比具备较好的有效性和高效性. 展开更多
关键词 属性图聚类 多目标优化 动态类簇形成博弈 局部帕累托最优 自治计算
下载PDF
一种基于云模型的不确定性数据的建模与分类方法 被引量:7
12
作者 秦丽 李兵 《计算机科学》 CSCD 北大核心 2014年第8期233-240,共8页
不确定性是数据的本质特征,它的产生可能来自于样本误差、更新延迟或重复测量等,对不确定性数据的分析在越来越多的领域得到了关注。传统的不确定性数据的数据项被表示成一个值域及其上的概率分布函数。由于不确定性数据存在模糊性与随... 不确定性是数据的本质特征,它的产生可能来自于样本误差、更新延迟或重复测量等,对不确定性数据的分析在越来越多的领域得到了关注。传统的不确定性数据的数据项被表示成一个值域及其上的概率分布函数。由于不确定性数据存在模糊性与随机性,传统的概率分布函数难以准确定义不确定性数据的实际分布,因此利用云模型中云滴的分布提出一种不确定性数据的云建模过程,并通过云综合与云相似度计算来实现不确定性数据的分类。云模型能有效地将数据的随机性与模糊性融合在一起,能更真实地反映数据的实际分布,从而实现有效的数据分类。实验结果也证明了此种方法的有效性。 展开更多
关键词 不确定性数据分类 高斯云 均匀云 云综合 云相似度计算
下载PDF
Phishing detection method based on URL features 被引量:2
13
作者 曹玖新 董丹 +1 位作者 毛波 王田峰 《Journal of Southeast University(English Edition)》 EI CAS 2013年第2期134-138,共5页
In order to effectively detect malicious phishing behaviors, a phishing detection method based on the uniform resource locator (URL) features is proposed. First, the method compares the phishing URLs with legal ones... In order to effectively detect malicious phishing behaviors, a phishing detection method based on the uniform resource locator (URL) features is proposed. First, the method compares the phishing URLs with legal ones to extract the features of phishing URLs. Then a machine learning algorithm is applied to obtain the URL classification model from the sample data set training. In order to adapt to the change of a phishing URL, the classification model should be constantly updated according to the new samples. So, an incremental learning algorithm based on the feedback of the original sample data set is designed. The experiments verify that the combination of the URL features extracted in this paper and the support vector machine (SVM) classification algorithm can achieve a high phishing detection accuracy, and the incremental learning algorithm is also effective. 展开更多
关键词 uniform resource locator (URL) features phishingdetection support vector machine incremental learning
下载PDF
满足原子事务的QoS感知的自适应服务选择 被引量:1
14
作者 杨荣 李兵 +2 位作者 杜宝同 熊伟 何鹏 《计算机科学与探索》 CSCD 2014年第5期582-592,共11页
随着云计算的兴起,服务计算成为其实现的一种关键技术,学术领域对服务组合有新的思考。提出了满足原子事务的服务质量(quality of service,QoS)感知的自适应服务选择方法,既考虑QoS约束,也考虑服务间的事务约束,在进行全局优化选择时结... 随着云计算的兴起,服务计算成为其实现的一种关键技术,学术领域对服务组合有新的思考。提出了满足原子事务的服务质量(quality of service,QoS)感知的自适应服务选择方法,既考虑QoS约束,也考虑服务间的事务约束,在进行全局优化选择时结合适当的协调模式选择策略,以进一步提高可靠性。首先制定自适应规则和建立QoS模型,并引用其他学者关于事务构建和规约规则的模型。接着分析事务与QoS约束下自适应服务选择算法机制。最后通过实验评价了方法的有效性和健壮性。 展开更多
关键词 云计算 服务组合 QOS约束 事务约束 自适应
下载PDF
基于异质图表达学习的跨境电商推荐模型 被引量:3
15
作者 张瑾 朱桂祥 +2 位作者 王宇琛 郑烁佳 陈镜潞 《电子与信息学报》 EI CSCD 北大核心 2022年第11期4008-4017,共10页
跨境电商产品推荐已经成为电子商务领域新兴的研究议题之一。由于电商产品信息复杂多样、“用户-产品”关联矩阵极为稀疏并且冷启动问题突出,因此传统的协同过滤推荐模型很难奏效。而改进的深度协同过滤模型,只考虑了用户对产品的“显... 跨境电商产品推荐已经成为电子商务领域新兴的研究议题之一。由于电商产品信息复杂多样、“用户-产品”关联矩阵极为稀疏并且冷启动问题突出,因此传统的协同过滤推荐模型很难奏效。而改进的深度协同过滤模型,只考虑了用户对产品的“显式”和“隐式”的反馈信息,忽视了由用户与项目组成的图结构信息,推荐性能很难满足平台和用户的要求。为了解决这些难题,该文提出基于异质图表达学习的图神经网络模型(HGNR)用于个性化的跨境电商产品推荐,该模型具有2个显著的优势:(1)构造“用户-产品-主题”3部图作为模型的输入,通过图卷积神经网络(GCN)在异质图上进行高质量信息传播和聚合;(2)能够获取高质量的用户和产品表征向量,实现了用户和产品复杂交互关系的建模。在真实的跨境电商订单数据集上的实验结果表明,HGNR模型不仅在推荐性能上表现出色,还能有效提升冷启动用户的推荐准确率,与9种推荐基准算法相比,HGNR在评价指标HitRate@10,Item-coverage@10,MRR@10上至少提升了3.33%,0.91%,0.54%。 展开更多
关键词 推荐系统 图神经网络 异质图神经网络 冷启动推荐 跨境电商
下载PDF
基于p阶组合云模型的QoS不确定性建模与Web服务过滤 被引量:1
16
作者 秦丽 李兵 《小型微型计算机系统》 CSCD 北大核心 2015年第11期2439-2444,共6页
Qo S由于网络环境及物理位置等因素的变化,会产生内在的不确定性,而云模型是定义数据不确定性的有效工具,但传统云模型在描述不确定性Qo S的过程中不能处理Qo S分布的高峰特点与不对称问题,因此提出一种用p阶组合云来为不确定性Qo S建... Qo S由于网络环境及物理位置等因素的变化,会产生内在的不确定性,而云模型是定义数据不确定性的有效工具,但传统云模型在描述不确定性Qo S的过程中不能处理Qo S分布的高峰特点与不对称问题,因此提出一种用p阶组合云来为不确定性Qo S建模的方法,p阶云被证明了有高峰的特点,且峰度随着p的增大而增加,可以满足Qo S分布的要求,组合云可以解决数据分布不对称的问题,而实验也证明了p阶组合云能更有效的模拟Qo S属性值的分布,最后还根据实验分析结果提出了一种基于p阶组合云参数的服务过滤策略,为服务选择提供新方法. 展开更多
关键词 服务质量 不确定性 云模型 服务过滤
下载PDF
具有强健壮性的并发服务选择与组合
17
作者 杨荣 李兵 +2 位作者 杜宝同 熊伟 何鹏 《小型微型计算机系统》 CSCD 北大核心 2014年第7期1556-1560,共5页
提出一种动态Web服务环境下,并发请求时的服务组合方案KSC.该方案通过对QoS的建模和计算,从每个组件中选出效用值最优的前k个原子服务,然后进行组合去执行批量用户请求.接着,本文提出了当组合服务执行失败时的解决方案,即当组合服务中... 提出一种动态Web服务环境下,并发请求时的服务组合方案KSC.该方案通过对QoS的建模和计算,从每个组件中选出效用值最优的前k个原子服务,然后进行组合去执行批量用户请求.接着,本文提出了当组合服务执行失败时的解决方案,即当组合服务中有原子服务不能满足要求时,根据前后组件各自选出的k个原子服务之间的输入输出功能关系,画出服务依赖图,进一步对出错的那个组件中的k个原子服务画出类聚图,最后利用A-KSC算法进行原子服务替换.最后,通过实验验证了本文中提出的模型与算法的可行性与有效性. 展开更多
关键词 并发请求 QOS 服务组合 原子服务
下载PDF
一种基于改进的密度聚类的区域数据可视化方法 被引量:1
18
作者 李秀怡 《计算机光盘软件与应用》 2014年第19期119-119,121,共2页
目前的可视化应用不管动态还是静态可视化,已经存在二维图形展示和点密度展示几种形式,而点密度已经成为作为体现密度特征的最有力手段。但目前的一般手段都只是简单的在特定区域内实现随即点的输出。由于数据本身的密度属性与其所属区... 目前的可视化应用不管动态还是静态可视化,已经存在二维图形展示和点密度展示几种形式,而点密度已经成为作为体现密度特征的最有力手段。但目前的一般手段都只是简单的在特定区域内实现随即点的输出。由于数据本身的密度属性与其所属区域存在内在属性关联,本文在前期通过密度处理分析进行聚类,将数据集进行归类划分后在对应区域进行判断输出实现可视化,实验证明具有更符合区域特征的可视化效果,并且时间和空间复杂度明显小于直接进行点密度可视化输出的算法。 展开更多
关键词 可视化 点密度 聚类
下载PDF
关联规则推荐的高效分布式计算框架 被引量:19
19
作者 李昌盛 伍之昂 +1 位作者 张璐 曹杰 《计算机学报》 EI CSCD 北大核心 2019年第6期1218-1231,共14页
关联规则推荐模型是在电子商务网站应用最广泛的商用推荐引擎之一,目前已有的工作大多聚焦于如何挑选高质量规则,以提升推荐精度.然而,关联规则数量庞大,且用户并发访问量通常极大,如何快速匹配用户浏览记录和关联规则库,为海量在线用... 关联规则推荐模型是在电子商务网站应用最广泛的商用推荐引擎之一,目前已有的工作大多聚焦于如何挑选高质量规则,以提升推荐精度.然而,关联规则数量庞大,且用户并发访问量通常极大,如何快速匹配用户浏览记录和关联规则库,为海量在线用户产生近实时推荐,成为制约关联规则推荐能否胜任真实电子商务网站推荐的重要因素.为此,本文研究关联规则推荐的效率问题,提出服务于高效关联规则推荐的分布式计算框架,将规则挖掘与推荐计算无缝衔接.具体而言,本文首先设计有序模式森林,用于压缩存储频繁模式;然后将候选规则挖掘转化为森林上的路径搜索计算,并提出高效的单机路径搜索算法;最后提出负载均衡的数据分割策略,同时降低分布式规则挖掘与推荐计算中的任务最迟完成时间.在3个公开数据集的实验结果表明基于有序模式森林的推荐计算比传统穷举匹配策略降低6倍以上时间,同时所提出的分布式计算框架可随计算节点数量达到近线性扩展. 展开更多
关键词 推荐系统 关联规则 频繁模式 FP-GROWTH算法 SPARK 负载均衡
下载PDF
基于成对约束Info-Kmeans聚类的图像索引方法 被引量:7
20
作者 刘文杰 伍之昂 +1 位作者 曹杰 潘金贵 《通信学报》 EI CSCD 北大核心 2013年第7期159-166,173,共9页
针对图像数据噪声大和高维稀疏的特点,提出了一种基于噪声过滤和Info-Kmeans聚类的图像索引构建方法。首先,利用余弦兴趣模式过滤噪声。其次,提出了一种新的Info-Kmeans聚类算法,该算法不仅避免KL-divergence计算过程中的零值困境问题,... 针对图像数据噪声大和高维稀疏的特点,提出了一种基于噪声过滤和Info-Kmeans聚类的图像索引构建方法。首先,利用余弦兴趣模式过滤噪声。其次,提出了一种新的Info-Kmeans聚类算法,该算法不仅避免KL-divergence计算过程中的零值困境问题,还能融合以成对约束出现的先验知识。最后,在LFW和Oxford_5K 2个图像数据集上的实验表明:噪声过滤能显著提高聚类性能;Info-Kmeans比已有聚类工具具有更优越的性能。 展开更多
关键词 图像索引 兴趣模式 噪声过滤 聚类分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部