题名 基于变分持续贝叶斯元学习的推荐算法
1
作者
朱文韬
刘威
梁上松
朱怀杰
印鉴
机构
中山大学计算机学院
中山大学人工智能学院
广东省大数据分析与处理重点实验室
出处
《计算机科学》
CSCD
北大核心
2023年第7期66-71,共6页
基金
国家自然科学基金(U1911203,61902439,61902438,62002396)
广东省基础与应用基础研究基金(2021A1515011902,2020A1515011251,2019A1515011159,2019A1515011704)。
文摘
元学习方法近年被引入推荐系统以缓解冷启动问题。现有元学习算法只能提高算法处理一组静态分布的数据集(任务)的能力。当面对多个服从非平稳分布的数据集时,现有模型往往会出现负知识转移以及灾难性遗忘问题,导致算法推荐性能大幅下降。探索了基于变分持续贝叶斯元学习(Variational Continuous Bayesian Meta-Learning, VC-BML)的推荐算法。首先,算法假设元参数服从动态混合高斯模型,使其具有更大的参数空间,提高了模型适应不同任务的能力,缓解了负知识转移问题。然后,VC-BML的任务集群数量由中国餐馆过程(Chinese Restaurant Process, CRP)来灵活确定,使得模型在不同的混合分量中存储不同任务分布的知识,并在类似任务出现时调用这些知识,有助于缓解传统算法中的灾难性遗忘问题。为了估计模型参数的后验概率,算法采用了一种更稳健的结构化变分推理方法来近似后验值,以避免遗忘知识。最后,VC-BML在4个非平稳分布的数据集上的表现均优于基准算法。与基于点估计的基准算法相比,VC-BML提高了模型的稳健型,有助于缓解灾难性遗忘问题。
关键词
推荐算法
冷启动
元学习
动态混合高斯模型
Keywords
Recommendation algorithm
Cold-start problem
Meta-learning
Dynamic Gaussian mixture model
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于大规模隐式反馈的个性化推荐
被引量:58
2
作者
印鉴
王智圣
李琪
苏伟杰
机构
中山大学信息科学与技术学院
出处
《软件学报》
EI
CSCD
北大核心
2014年第9期1953-1966,共14页
基金
国家自然科学基金(61033010
61272065
+4 种基金
61472453)
广东省自然科学基金(S2011020001182
S2012010009311)
广东省科技计划项目(2011B040200007
2012A010701013)
文摘
对如何利用大规模隐式反馈数据进行个性化推荐进行了研究,提出了潜在要素模型IFRM.该模型通过将推荐任务转化为选择行为发生概率的优化问题,克服了在隐式反馈推荐场景下只有正反馈而缺乏负反馈导致的困难.在此基础上,为了进一步提高效率和可扩展性,提出了并行化的隐式反馈推荐模型p-IFRM.该模型通过将用户及产品随机分桶并重构优化更新序列,达到了并行优化的目的.通过概率推导,所提出的模型有坚实的理论基础.通过在MapReduce并行计算框架下实现p-IFRM,并在大规模真实数据集上进行实验,可以证明所提出的模型能够有效提高推荐质量并且有良好的可扩展性.
关键词
隐式反馈
推荐系统
大数据
Keywords
MapReduce
implicit feedback
recommendation system
big data
MapReduce
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 一种基于索引的高效k-支配Skyline算法
被引量:14
3
作者
印鉴
姚树宇
薛少锷
杨文新
刘玉葆
机构
中山大学信息科学与技术学院
出处
《计算机学报》
EI
CSCD
北大核心
2010年第7期1236-1245,共10页
基金
国家自然科学基金(60773198
60703111)
+6 种基金
广东省自然科学基金(7300272
8151027501000021)
国家科技计划项目(2008ZX10005-013)
广东省科技计划项目(2008B050100040
2009A080207005
2009B090300450)
新世纪优秀人才支持计划(NCET-06-0727)资助
文摘
由于在多标准决策支持等应用上具有重要的意义,skyline查询成为近年来数据库和数据挖掘领域的一个研究热点.然而随着数据集维数的增加,数据点之间形成支配关系的可能性越来越小,导致了skyline点数目过多而无法提供任何有效信息.为了在高维数据集中找到更重要和更有意义的skyline点,人们提出了k-支配skyline的定义.但现有的用于k-支配skyline的算法在时间效率、空间复杂度和渐进输出性上都有待提高.该文提出了一种基于索引的高效k-支配skyline算法,通过为数据集建立两个索引,算法可以高效地进行计算,在时间、空间和渐进性上均优于现有的算法.
关键词
SKYLINE
决策支持
k-支配skyline
基于索引
Keywords
skyline
decision support
k-dominant skyline
index based
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 科研项目管理系统的设计与实现
被引量:36
4
作者
印鉴
曹王华
杨敏
胡菁
机构
中山大学计算机科学系
中山大学科技处
出处
《计算机应用研究》
CSCD
北大核心
2005年第3期214-216,共3页
基金
广东省自然科学基金资助项目 (031558)
广东省科技计划项目(2003C50118)
南京大学计算机软件新技术国家重点实验室研究基金资助项目
文摘
提出了基于Browser/Server的多层次结构建立科研项目管理系统的设计思想和体系结构,给出了数据输入、数据维护、浏览查询、统计分析报表生成等模块的实现方法和具体的实现过程。
关键词
决策支持
信息管理系统
科研管理
Keywords
Decision Support
Information Management System
Scientific Research Management
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 搜索引擎技术研究与发展
被引量:53
5
作者
印鉴
陈忆群
张钢
机构
中山大学计算机科学系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第14期54-56,104,共4页
基金
国家自然科学基金资助项目(60205007)
广东省自然科学基金资助项目(001264
+1 种基金
031558)
广东省科技计划基金资助项目(2003C50118)
文摘
介绍搜索引擎技术。首先以工作方式作分类介绍,接着介绍各部分工作原理和技术研究,包括如搜索器策略、检索策略、搜索结果处理、信息检索Agent、多媒体搜索引擎等关键技术。最后展望搜索引擎发展重要方向。
关键词
搜索引擎
多媒体搜索引擎
信息检索
Keywords
Search engine
Multimedia search engine
Information retrieval
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于χ~2统计量的kNN文本分类算法
被引量:13
6
作者
印鉴
谭焕云
机构
中山大学计算机科学系
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第6期1094-1097,共4页
基金
国家自然科学基金项目(60573097)资助
广东省自然科学基金项目(05200302
+3 种基金
06104916)资助
国家科技(2004BA721A02)资助
广东省科技计划项目(2005B10101032)资助
高等学校博士学科点专项科研基金项目(20050558017)资助.
文摘
随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于χ2统计量能很好地体现词和类别之间的相关性,因此成为特征选择中常用的评估函数.本文分析了χ2统计量在特征选择和分类决策阶段的性质,提出了一种新的基于χ2统计量的相似度定义,并结合基于两次类别判定的快速搜索算法,改进了传统的kNN算法.实验结果显示基于χ2统计量的改进kNN文本分类算法能大大减少kNN算法的分类时间,并提高了kNN算法的准确率和召回率.
关键词
文本分类
特征选择
KNN
Χ^2统计量
Keywords
text categorization
feature selection
kNN
Χ^2 statistic
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于Honeynet的网络入侵模式挖掘
被引量:5
7
作者
印鉴
张钢
陈忆群
机构
中山大学计算机科学系
出处
《计算机工程与应用》
CSCD
北大核心
2004年第11期114-117,共4页
基金
国家自然科学基金资助(编号:60205007)
广东省自然科学基金资助(编号:001264
+2 种基金
031558)
广东省科技计划项目资助(编号:2003C50118)
南京大学计算机软件新技术国家重点实验室研究基金
文摘
随着互联网的扩张和基于互联网应用的发展,网络安全越来越受到人们的关注。网络入侵的检测和防范也越来越受到人们的重视。构建一个安全的网络,就要对攻击者的行为模式和攻击手段进行分析。该文提出了一个基于Hon-eynet的网络安全系统,通过Honeynet中的机器收集攻击者的有效信息,然后使用数据挖掘算法从这些数据中找出入侵者的攻击模式,从而提高入侵检测系统和防火墙的检测和防范能力。
关键词
网络安全
入侵检测
HONEYNET
数据挖掘
Keywords
Network Security,Intrusion Detection,Honeynet,Data Mini ng
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于遗传算法的最优布局问题求解
被引量:9
8
作者
印鉴
李明
机构
中山大学计算机科学系
南京大学计算机软件新技术国家重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第10期1269-1273,共5页
基金
国家自然科学基金 ( 6 97330 30 )
广东省自然科学基金 ( 0 0 1 2 6 4)
+1 种基金
广东省教育厅软件技术重点实验室研究基金
南京大学计算机软件新技术国家重点实验室基金资助
文摘
二维不规则形状物体的自动最优布局问题是一个在许多生产实践如 VL SI制造、造船、金属切割和纺织等中有关键应用的重要问题 ,也是一个计算机科学和运筹学中的基本问题 ,但使用传统的方法很难得到满意解答 .针对该问题 ,提出了一个基于遗传算法的求解方法 ,并将它应用到服装计算机辅助设计中去 .给出了此问题的形式化描述 ,并将问题归约为一种关于多边形运动规划的等价形式 .根据问题的特性设计了算法的 3个重要算子 ,在解的解码和评价过程中则充分利用了已有的关于多边形运动规划的最优算法 .
关键词
遗传算法
最优布局问题
求解
多边形运动规划
运筹学
Keywords
genetic algorithm, optimization layout, polygon motion planning
分类号
O224
[理学—运筹学与控制论]
题名 基于数据仓库的联机分析挖掘系统
被引量:5
9
作者
印鉴
陈忆群
张钢
机构
中山大学计算机科学系
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第19期49-51,共3页
基金
国家自然科学基金资助项目(60205007)
广东省科技计划资助项目
南京大学计算机软件新技术国家重点实验室研究基金资助项目
文摘
基于数据仓库的联机分析挖掘系统的应用已成为趋势,设计并实现了一个应用模型。该模型建立了一个B/S架构的双服务器数据仓库,将数据挖掘与OLAP思想相结合,提供多维度事务内、事务间关联规则的挖掘。介绍了系统设计思想和体系结构,对系统的各部分功能进行了分析,并在此基础上提出了传统OLAP系统到OLAM系统平滑过渡的解决方案。
关键词
联机分析挖掘
数据挖掘
数据仓库
Keywords
Ontine analysis mining(OLAM)
Data mining
Data warehouse
分类号
TP302.1
[自动化与计算机技术—计算机系统结构]
题名 不完整数据库中的数据挖掘
被引量:3
10
作者
印鉴
周祥福
杨敏
机构
中山大学计算机科学系
中山大学附属第三医院
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第12期34-36,共3页
基金
国家自然科学基金资助项目(60205007)
广东省自然科学基金资助项目(031558
+3 种基金
04300462)
国家科技计划基金资助项目(2004BA721A02)
广东省科技计划基金资助项目(2003C50118)
广州市科技计划基金资助项目(2002Z3-E0017)
文摘
数据挖掘是从数据中提取有用知识的过程。在现实生活中,数据丢失的情况是很常见的,尤其是在商业数据库中,由于文件错误、纪录缺失、存储策略的改变等都会引起数据丢失而造成数据库的不完整。这种不完整性会影响关联规则的挖掘过程,因为在有数据缺失时对规则的支持度以及可信度的计算都得不到确定值。把Apriori算法应用于不完整数据库,基于期望支持度和期望可信度,给出了一个挖掘不完整事务数据库中关联规则的算法。
关键词
不完整数据库
数据挖掘
关联规则
期望支持度
期望可信度
Keywords
Incomplete database
Data mining
Association rules
Expected support
Expected confidence
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于先验知识下支持向量机P-SVM的分类算法
被引量:2
11
作者
印鉴
梅芳
张钢
任江涛
机构
中山大学计算机科学系
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第3期474-478,共5页
基金
国家自然科学基金(60573097)资助
广东自然科学基金(05200302
+3 种基金
06104916)资助
国家科技计划项目(2004BA721A02)资助
广东科技计划项目(2005B10101032)资助
高等学校博士学科点专项科研基金(20050558017)资助.
文摘
支持向量机在分类算法原理中的顺次最小优化算法SMO一般比传统的块算法和固定工作样本集的算法具有更好的时间和空间复杂性,但是由于在实际应用领域中对样本的需求量很大,使得对样本的标记是应用中耗时耗力的工作.本文提出了基于先验知识下的支持向量机,通过引入先验信息量而减少所需样本的数量,同时给出了相应的P-SMO算法.分类应用背景利用中医证候数据,通过专家知识提供的证候知识规则,对训练样本集进行置信度的计算,然后使用P-SMO算法训练出P-SVM,实验结果表明分类效率有较大的提高.
关键词
支持向量机
文本分类
置信度
P—SMO
Keywords
SVM
text mining
confidence
P-SMO
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 网上购物系统的设计与实现
被引量:2
12
作者
印鉴
刘星成
汤庸
机构
中山大学计算机科学系
中山大学电子系
广东工业大学计算机工程系
出处
《计算机工程与应用》
CSCD
北大核心
2001年第16期88-90,共3页
基金
国家自然科学基金部分资助
广东省自然科学基金资助
文摘
网上购物模块是目前电子商务系统中一个最重要的部件之一。文章对当前网上购物的各种实现方案进行了深入讨论,指出了其某些不足之处,并在此基础上提出了改进方案。且在自己所设计的网上购物系统中实现了这些改进。
关键词
电子商务
网上购物系统
安全性
INTERNET
WEB
服务器
设计
Keywords
: E-Business,Netshop,Security,Friendship
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
F713.36
[经济管理—产业经济]
题名 一种新的分形图像压缩方法
被引量:5
13
作者
印鉴
魏思兵
谭兆信
机构
中山大学计算机科学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第4期451-454,共4页
基金
国家自然科学基金
文摘
文中提出了一种新的分形图像压缩方法.该方法将固定矢量的概念应用于分形块编码中,对图像的平缓区进行固定矢量的线性组合编码,对图像的丰富细节区用分形编码,并且在分形编码时,采取了层次处理.实验表明,与基本的分形块编码方法相比,该固定矢量层次分形编码方法在保证一定的重建图像质量下,使图像的压缩比有了明显的提高。
关键词
图像编码
分形
图像压缩
图像处理
Keywords
柚
分类号
TN919.8
[电子电信—通信与信息系统]
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于CWM的数据挖掘服务中心设计
被引量:3
14
作者
印鉴
陈忆群
张钢
机构
中山大学计算机科学系
南京大学计算机软件新技术国家重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2004年第32期177-180,共4页
基金
国家自然科学基金资助(编号:60205007)
广东省自然科学基金资助(编号:001264
+2 种基金
031558)
广东省科技计划项目资助(编号:2003C50118)
南京大学计算机软件新技术国家重点实验室研究基金资助
文摘
跨平台的数据挖掘服务具有广阔前景。该文利用Web服务技术和公共数据仓库元数据模型(CWM),设计了一个具有平台无关性的数据挖掘服务中心,为决策支持分析员和技术人员之间架起一座桥梁,面向各种平台客户端和数据仓库环境,实现目前数据挖掘工具缺乏的通用性、灵活性和可重用性。文中介绍了系统架构设计以及关键内容如元数据、CWM、WEB服务技术等。
关键词
数据挖掘
WEB服务
CWM
Keywords
data mining,Web service,CWM
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 一种分布式搜索引擎设计
被引量:4
15
作者
印鉴
邹胜
机构
中山大学计算机科学系
深圳证券交易所
出处
《计算机科学》
CSCD
北大核心
2001年第10期74-77,共4页
基金
国家自然科学基金
广东省自然科学基金
文摘
This paper presents a distributed search engine design of an on-line bookstore system. Sever-al principles are introduced such as database miniaturization,the entire structure and the main modules are explained in detail. Compared with a centralized structure,the distributed structure has several ad-vantages including high speed, efficient usage of network bandwidth, less security problems, etc. The system uses feedback of the users to judge the information quality, select search engines and update databases. So,the system performances are improved.
关键词
INTERNET
分布式搜索引擎
信息检索
设计
Keywords
Search engine, Distributed structure,On-line bookstore system
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
题名 基于矢量量化的层次分形编码方法
被引量:4
16
作者
印鉴
魏思兵
机构
中山大学计算机科学系
出处
《通信学报》
EI
CSCD
北大核心
2001年第1期92-96,共5页
基金
国家自然科学基金!资助项目 ( 697330 30 )
广东省自然科学基金!资助项目 ( 0 0 12 64)
文摘
文中提出了一种新的分形图像压缩方法 ,该方法将矢量量化的概念应用于分形块编码中 ,对图像的平缓区进行矢量量化的线性组合编码 ,对图像的丰富细节区用分形编码 ,并且在分形编码时 ,采取了层次处理。实验表明 ,与基本的分形块编码方法相比 ,本文提出的矢量量化层次分形编码方法在保证一定的重建图像质量下 ,使图像的压缩比有了明显的提高 ,并且大大提高了编码和解码速度。
关键词
图像编码
矢量量化
层次分形编码
Keywords
image coding
fractal
vector quantization
hierar8
分类号
TN919.81
[电子电信—通信与信息系统]
题名 一个数据挖掘工具的设计与实现
被引量:1
17
作者
印鉴
杨敏
陈浩
曹王华
机构
中山大学计算机科学系
南京大学计算机软件新技术国家重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第7期22-24,共3页
基金
国家自然科学基金资助项目(60205007)
广东省自然科学基金资助项目(001264)
广东省教育厅<软件技术>重点实验室研究基金资助项目
文摘
数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些模型和关系可以用来做出预测。该文介绍了一个数据挖掘工具的设计,以Apriori算法为核心,实现了数据挖掘中基于数据库的几种常用挖掘方法,包括基于关系数据库的数据挖掘,不完整数据库中的数据挖掘和根据兴趣度测量来挖掘感兴趣知识的异常关联规则挖掘。
关键词
数据挖掘
关联规则
兴趣度
Keywords
Data mining
Association rules
Interest measure
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 CT图象特征的Fuzzy识别方法
被引量:1
18
作者
印鉴
刘星成
郑鹏
汤庸
机构
中山大学岭南学院计算机科学系
武汉水利电力大学计算机科学系
广东工业大学计算机科学系
出处
《计算机工程与应用》
CSCD
北大核心
1998年第6期35-36,38,共3页
基金
广东省自然科学基金
文摘
Fuzy(模糊)模式识别是模式识别的一个新分支。本文以Fuzy集理论及模式识别理论为基础,根据专家提供并用语言变量描述的CT征象,通过对数字化图象进行边检、分割和特征提取,识别出了小肺癌分叶、毛刺、空泡、星芒、瘤体密度均匀性等特征并描述了识别结果。
关键词
CT
图象特征
肺癌
Fuzzy识别
分类号
R734.2
[医药卫生—肿瘤]
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 试题质量评估系统的设计与实现
被引量:2
19
作者
印鉴
刘星成
李师贤
机构
中山大学计算机科学系
中山大学电子系
出处
《计算机工程》
CAS
CSCD
北大核心
2000年第12期19-20,共2页
基金
国家自然科学基金部分资助!(69733030-1
79840761843)
文摘
试题质量的好坏对评估考生的实际能力非常重要,而考生成绩分布概率曲线是测定试题质量的的最主要标准之一。该文对不同类型的考生生成绩分布曲线特点进行了分析,并设计了一个辅助教师对试题质量进行评估的决策支持系统。实验表明,该系统与主观的评判符合较好。
关键词
决策支持系统
试题质量评估系统
设计
Keywords
Quality evaluation of test paper;Decision support system;Grade distribution curve
分类号
G424.79
[文化科学—课程与教学论]
题名 用演化Agent方法处理整数线性规划问题
被引量:1
20
作者
印鉴
刘斌
邹胜
李师贤
机构
中山大学计算机科学系
出处
《小型微型计算机系统》
CSCD
北大核心
2000年第6期608-610,共3页
基金
国家自然科学基金部分资助
广东省自然科学基金资助
文摘
描述了一种演化 agent模型 ,并用这种模型来处理整数线性规划问题 .该模型基于求解整数线性规划问题的分枝定界方法 ,具有求解并行、目标驱动、时间复杂性低等特点 .
关键词
AGENT
整数线性规划
分布式人工智能
Keywords
Agent
Integer linear programming
Duplication
分类号
O221.4
[理学—运筹学与控制论]
TP18
[自动化与计算机技术—控制理论与控制工程]