期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
开源软件库生态治理技术研究综述:二十年进展
被引量:
1
1
作者
王莹
伍盈欣
+4 位作者
高天
陈子莺
许畅
于海
张成志
《软件学报》
EI
CSCD
北大核心
2024年第2期629-674,共46页
在“人-机-物”三元融合、泛在计算的时代蓝海下,“开放多变”“需求多样”和“场景复杂”的软件部署和运行环境对开源软件库生态的治理技术提出了更多需求和更高期望.为进一步推动构建可信软件供应链生态,围绕泛在计算模式、打造自主...
在“人-机-物”三元融合、泛在计算的时代蓝海下,“开放多变”“需求多样”和“场景复杂”的软件部署和运行环境对开源软件库生态的治理技术提出了更多需求和更高期望.为进一步推动构建可信软件供应链生态,围绕泛在计算模式、打造自主可控的技术体系,聚焦于开源软件库管理生态,收集近20多年来(2001–2023)发表于软件工程领域较高影响力的学术期刊和会议的348篇论文,对开源软件库生态治理技术的研究工作进行梳理.讨论开源软件库生态的建模与分析、演化与维护、质量保证和管理等方面的工作,总结研究现状、问题、挑战与趋势.
展开更多
关键词
开源软件供应链
开源治理
软件库生态系统
下载PDF
职称材料
一种基于程序变异的软件错误定位技术
被引量:
15
2
作者
贺韬
王欣明
+3 位作者
周晓聪
李文军
张震宇
张成志
《计算机学报》
EI
CSCD
北大核心
2013年第11期2236-2244,共9页
发现软件不能正常运行后,如何定位错误代码在程序中的位置是软件开发一个众所周知的难点.最近许多软件自动调试技术通过分析成功和失败测试用例的覆盖信息辅助程序员定位错误代码,但这些技术的准确率会受到偶然性成功测试用例的影响.偶...
发现软件不能正常运行后,如何定位错误代码在程序中的位置是软件开发一个众所周知的难点.最近许多软件自动调试技术通过分析成功和失败测试用例的覆盖信息辅助程序员定位错误代码,但这些技术的准确率会受到偶然性成功测试用例的影响.偶然性成功测试用例执行了错误代码,但却没有引发失败的测试结果.研究表明这种测试用例在实际测试中广泛存在,而它们的存在会显著降低错误定位的准确率.针对此问题,文中提出一种称为Muffler的技术.Muffler使用程序变异分析来修正错误代码定位结果,以提高定位的准确率.文中利用8个在错误代码定位研究领域广泛使用的基准程序验证了Muffler的有效性.实验结果表明,与传统错误代码定位技术相比,Muffler能减少程序员50.26%的错误定位代价.
展开更多
关键词
软件调试
错误定位
程序变异分析
软件工程
下载PDF
职称材料
隐结构分析与西医疾病的辨证分型(Ⅲ):辨证规则的建立
被引量:
14
3
作者
张连文
傅晨
+3 位作者
刘腾飞
陈宝鑫
刘桦
张允岭
《世界科学技术-中医药现代化》
北大核心
2014年第4期723-730,共8页
目的:通过使用隐树模型对症状数据进行分析,为西医疾病的辨证分型提供证据,初步建立辨证分型方案和辨证规则。方法:本文为一个文章系列的第3篇,前两篇论文探讨了通过分析症状数据为辨证分型提供证据的基本原理,展示了隐树分析可以系统...
目的:通过使用隐树模型对症状数据进行分析,为西医疾病的辨证分型提供证据,初步建立辨证分型方案和辨证规则。方法:本文为一个文章系列的第3篇,前两篇论文探讨了通过分析症状数据为辨证分型提供证据的基本原理,展示了隐树分析可以系统地揭示数据不同侧面,并且提出基于数个相关侧面对患者群进行综合聚类,获得辨证分型方案。本文以综合聚类的结果为出发点,提出一种建立辨证分型规则的方法。结果:使用该法对一组血管源性轻度认知障碍数据进行研究,获得辨证分型方案和相应的辨证规则。结论:通过一系列文章构建一套研究西医疾病之辨证分型的完整方法,遵循该法以从疾病患者群的症状数据出发,最终得到辨证分型方案和辨证规则。
展开更多
关键词
病证结合研究
辨证分型
辨证规则
客观依据
隐树分析
下载PDF
职称材料
动态模拟中国水墨画中的笔画绘制
被引量:
13
4
作者
杨丽洁
徐添辰
吴恩华
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2016年第5期742-749,共8页
提出一个动画生成工具,通过重建中国水墨画中的笔画,动态模拟水墨画原有的绘画过程.首先将输入的水墨画图像进行笔画拆分;然后根据笔画形状,包括轮廓、骨架信息,估算绘画轨迹,并通过类椭圆形的瞬时足迹模型中的一系列参数(如坐标、大小...
提出一个动画生成工具,通过重建中国水墨画中的笔画,动态模拟水墨画原有的绘画过程.首先将输入的水墨画图像进行笔画拆分;然后根据笔画形状,包括轮廓、骨架信息,估算绘画轨迹,并通过类椭圆形的瞬时足迹模型中的一系列参数(如坐标、大小、方向)约束轨迹质量;文中的实时渲染模型用采样自原画的足迹纹理,动态渲染估算的轨迹.实验结果表明,与已有的方法相比,文中提出的方法可根据笔画轮廓自动提取其绘画轨迹,并对画笔在纸上的瞬时足迹进行建模.在应用价值方面,该工具可用于中国水墨画的鉴赏分析,艺术教育与实践.
展开更多
关键词
笔画轨迹
非真实感绘制
实时渲染
中国水墨画
下载PDF
职称材料
论证候研究中变量聚类结果的诠释
被引量:
6
5
作者
张连文
周雪忠
+2 位作者
陈弢
何丽云
刘保延
《中国中医药信息杂志》
CAS
CSCD
2007年第7期102-103,共2页
近年来,有不少学者利用系统变量聚类方法对西医病种中中医症状的分布情况进行研究。例如,麻氏等通过对739例胆病病案进行分析,得到9个类,并把它们分别诠释为肝胆湿热证、肝胆郁热证、肝胆蕴热证、肝胆气郁证、血瘀证、脾失健运证、...
近年来,有不少学者利用系统变量聚类方法对西医病种中中医症状的分布情况进行研究。例如,麻氏等通过对739例胆病病案进行分析,得到9个类,并把它们分别诠释为肝胆湿热证、肝胆郁热证、肝胆蕴热证、肝胆气郁证、血瘀证、脾失健运证、阳虚寒湿证、阴虚内热证和热毒亡阳证。笔者剖析系统变量聚类结果的统计学含义,并基于此讨论把它们诠释为证候的合理性。我们的结论是,变量聚类的结果不能诠释为证候。
展开更多
关键词
证候研究
变量聚类
下载PDF
职称材料
隐结构模型对2型糖尿病病机规律的探讨
被引量:
3
6
作者
龚燕冰
张连文
+3 位作者
高思华
罗增刚
倪青
谢雁鸣
《世界科学技术-中医药现代化》
2009年第4期516-521,共6页
目的:探索2型糖尿病的病机规律。方法:以2501例2型糖尿病的临床数据为基础,运用隐结构模型的方法加以研究。结果:得出隐结构模型关于2型糖尿病"症-证—病机"相互关系及病机规律。结论:隐结构模型是一种非线性的方法,这对于研...
目的:探索2型糖尿病的病机规律。方法:以2501例2型糖尿病的临床数据为基础,运用隐结构模型的方法加以研究。结果:得出隐结构模型关于2型糖尿病"症-证—病机"相互关系及病机规律。结论:隐结构模型是一种非线性的方法,这对于研究非线性、复杂性的中医证候无疑是一种比较合适的手段。
展开更多
关键词
2型糖尿病病机规律
隐结构模型
决定性水平曲线
累积互信息曲线
两两互信息曲线
隐类
下载PDF
职称材料
基于机器学习模型的专利质量预测初探
被引量:
14
7
作者
刘夏
黄灿
余骁锋
《情报学报》
CSSCI
CSCD
北大核心
2019年第4期402-410,共9页
随着专利数量的迅速增长,如何预测专利质量,已成为企业、政府以及学术界越发关注的问题。传统的统计分析方法虽然对专利质量评估进行了多方面探索,却较少对专利质量进行预测,尤其是充分利用到专利数据的海量样本和持续更新的优势。本文...
随着专利数量的迅速增长,如何预测专利质量,已成为企业、政府以及学术界越发关注的问题。传统的统计分析方法虽然对专利质量评估进行了多方面探索,却较少对专利质量进行预测,尤其是充分利用到专利数据的海量样本和持续更新的优势。本文以2010—2011年国家知识产权局受理的共计85万余件专利申请为研究对象,抓取申请文档中以及相关引文的特征信息,搭建完整的随机森林模型,对后续被引情况进行机器学习及预测。除此之外,随机森林对特征重要性的评估结果显示,专利的向前引证专利的特征比该专利本身的特征对后续引证的预测提供了更多有效信息,进一步显示出专利审查中对前引专利检索工作的重要性。同时,文章结尾指出了本文模型的局限性以及今后借助机器学习对专利预测的改进方法。
展开更多
关键词
专利质量
机器学习
随机森林
预测
下载PDF
职称材料
基于用户查询日志的网络搜索主题分析
被引量:
2
8
作者
张森
张晨
+4 位作者
林培光
张春云
郭玉超
任威龙
任可
《智能系统学报》
CSCD
北大核心
2017年第5期668-677,共10页
网络搜索分析在优化搜索引擎方面具有举足轻重的作用,而且对用户个人搜索特性进行分析能够提高搜索引擎的精准度。目前,大多数已有模型(比如点击图模型及其变体),注重研究用户群体的共同特点。然而,关于如何做到既可以获取用户群体共同...
网络搜索分析在优化搜索引擎方面具有举足轻重的作用,而且对用户个人搜索特性进行分析能够提高搜索引擎的精准度。目前,大多数已有模型(比如点击图模型及其变体),注重研究用户群体的共同特点。然而,关于如何做到既可以获取用户群体共同特点又可以获取用户个人特点方面的研究却非常少。本文研究了基于个人用户网络搜索分析新问题,即通过研究用户搜索的突发性现象,获取个人用户搜索查询的主题分布情况。提出了两个搜索主题模型,即搜索突发性模型(SBM)和耦合敏感搜索突发性模型(CS-SBM)。SBM假设查询词和URL主题是无关的,CS-SBM假设查询词和URL之间是有主题关联的,得到的主题分布信息存储在偏Dirichlet先验中,采用Beta分布刻画用户搜索的时间特性。实验结果表明,每一个用户的网络搜索轨迹都有多种基于用户的独有特点。同时,在使用大量真实用户查询日志数据情况下,与LDA、DCMLDA、TOT相比,本文提出的模型具有明显的泛化性能优势,并且有效地描绘了用户搜索查询主题在时间上的变化过程。
展开更多
关键词
网络搜索
搜索引擎
自然语言处理
主题模型
文本挖掘
突发性
时间分析
参数估计
下载PDF
职称材料
基于联邦学习的推荐系统综述
被引量:
10
9
作者
梁锋
羊恩跃
+2 位作者
潘微科
杨强
明仲
《中国科学:信息科学》
CSCD
北大核心
2022年第5期713-741,共29页
随着互联网和移动计算等技术的发展,人们的在线行为产生了越来越多的数据,想要从海量数据中挑选出用户可能喜欢的物品,推荐系统不可或缺.然而传统的推荐算法需要将用户数据收集到服务端才能构建模型,这会泄露用户隐私.最近,谷歌针对机...
随着互联网和移动计算等技术的发展,人们的在线行为产生了越来越多的数据,想要从海量数据中挑选出用户可能喜欢的物品,推荐系统不可或缺.然而传统的推荐算法需要将用户数据收集到服务端才能构建模型,这会泄露用户隐私.最近,谷歌针对机器学习任务中需要收集用户数据才能进行建模的问题,提出了一种新的学习范式——联邦学习.联邦学习与推荐系统相结合,使得联邦推荐算法能够在模型构建过程中,始终将用户数据保留在客户端本地,从而保护了用户隐私.本文主要对联邦学习与推荐系统相结合的研究工作进行综述,并从架构设计、系统的联邦化和隐私保护技术的应用3个角度重点分析联邦推荐算法的研究进展.最后,对基于联邦学习的推荐系统可研究的方向进行展望.
展开更多
关键词
推荐系统
联邦学习
隐私保护
联邦推荐
协同过滤
原文传递
题名
开源软件库生态治理技术研究综述:二十年进展
被引量:
1
1
作者
王莹
伍盈欣
高天
陈子莺
许畅
于海
张成志
机构
东北
大学
软件学院
南京
大学
计算机
科学
与技术系
计算机
软件新技术国家重点实验室(南京
大学
)
智能工业数据解析与优化教育部重点实验室(东北
大学
工业智能与系统优化国家级前沿
科学
中心)
香港科技大学计算机科学及工程学系
出处
《软件学报》
EI
CSCD
北大核心
2024年第2期629-674,共46页
基金
国家自然科学基金(62141210,61932021,61902056,61802164,61977014)
中央高校基本科研业务费(N2217005)
+1 种基金
南京大学软件新技术国家重点实验室开放基金(KFKT2021B01)
111项目(B16009)。
文摘
在“人-机-物”三元融合、泛在计算的时代蓝海下,“开放多变”“需求多样”和“场景复杂”的软件部署和运行环境对开源软件库生态的治理技术提出了更多需求和更高期望.为进一步推动构建可信软件供应链生态,围绕泛在计算模式、打造自主可控的技术体系,聚焦于开源软件库管理生态,收集近20多年来(2001–2023)发表于软件工程领域较高影响力的学术期刊和会议的348篇论文,对开源软件库生态治理技术的研究工作进行梳理.讨论开源软件库生态的建模与分析、演化与维护、质量保证和管理等方面的工作,总结研究现状、问题、挑战与趋势.
关键词
开源软件供应链
开源治理
软件库生态系统
Keywords
open-source software supply chain
open-source governance
software library ecosystem
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种基于程序变异的软件错误定位技术
被引量:
15
2
作者
贺韬
王欣明
周晓聪
李文军
张震宇
张成志
机构
中山
大学
信息
科学
与技术学院
香港科技大学计算机科学及工程学系
中山
大学
软件学院
中国
科学
院软件研究所
出处
《计算机学报》
EI
CSCD
北大核心
2013年第11期2236-2244,共9页
基金
国家自然科学基金(6103027)
中山大学中央高校基本科研业务费专项资金(10LGZD05,1LGPY39)
+1 种基金
香港研究资助局项目(61210)
国家科技重大专项经费(2012ZX01039-004)资助~~
文摘
发现软件不能正常运行后,如何定位错误代码在程序中的位置是软件开发一个众所周知的难点.最近许多软件自动调试技术通过分析成功和失败测试用例的覆盖信息辅助程序员定位错误代码,但这些技术的准确率会受到偶然性成功测试用例的影响.偶然性成功测试用例执行了错误代码,但却没有引发失败的测试结果.研究表明这种测试用例在实际测试中广泛存在,而它们的存在会显著降低错误定位的准确率.针对此问题,文中提出一种称为Muffler的技术.Muffler使用程序变异分析来修正错误代码定位结果,以提高定位的准确率.文中利用8个在错误代码定位研究领域广泛使用的基准程序验证了Muffler的有效性.实验结果表明,与传统错误代码定位技术相比,Muffler能减少程序员50.26%的错误定位代价.
关键词
软件调试
错误定位
程序变异分析
软件工程
Keywords
software debugging
fault localization
program mutation analysis
software engineering
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
隐结构分析与西医疾病的辨证分型(Ⅲ):辨证规则的建立
被引量:
14
3
作者
张连文
傅晨
刘腾飞
陈宝鑫
刘桦
张允岭
机构
香港科技大学计算机科学及工程学系
北京中医药
大学
东方医院
出处
《世界科学技术-中医药现代化》
北大核心
2014年第4期723-730,共8页
基金
科学技术部中医药行业科研专项(200807011):老年期轻度认知障碍社区辨识
筛查及中医干预项目
+4 种基金
负责人:张允岭
科学技术部中医药行业科研专项(201007002):中医防治中风病技术转化与社区推广研究-中风后认知障碍社区中医药防治与管理研究
负责人:张允岭
北京市教育委员会新医药学科群建设项目(XK100270569):基于健康医学模式的社区慢病防护及康复研究-老年期轻度认知障碍社区筛查及中医药防治研究
负责人:张允岭
文摘
目的:通过使用隐树模型对症状数据进行分析,为西医疾病的辨证分型提供证据,初步建立辨证分型方案和辨证规则。方法:本文为一个文章系列的第3篇,前两篇论文探讨了通过分析症状数据为辨证分型提供证据的基本原理,展示了隐树分析可以系统地揭示数据不同侧面,并且提出基于数个相关侧面对患者群进行综合聚类,获得辨证分型方案。本文以综合聚类的结果为出发点,提出一种建立辨证分型规则的方法。结果:使用该法对一组血管源性轻度认知障碍数据进行研究,获得辨证分型方案和相应的辨证规则。结论:通过一系列文章构建一套研究西医疾病之辨证分型的完整方法,遵循该法以从疾病患者群的症状数据出发,最终得到辨证分型方案和辨证规则。
关键词
病证结合研究
辨证分型
辨证规则
客观依据
隐树分析
Keywords
Integration of traditional Chinese medicine and western medicine
syndrome differentiation
classification rules
objective evidence
latent tree analysis
分类号
R2-03 [医药卫生—中医学]
下载PDF
职称材料
题名
动态模拟中国水墨画中的笔画绘制
被引量:
13
4
作者
杨丽洁
徐添辰
吴恩华
机构
华侨
大学
计算机
科学
与技术学院
香港科技大学计算机科学及工程学系
澳门
大学
科技
学院
中国
科学
院软件研究所
计算机
科学
国家重点实验室
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2016年第5期742-749,共8页
基金
华侨大学科研基金(15BS304)
国家自然科学基金(61272326)
澳门大学科研基金(MYRG202(Y1-L4)-FST11-WEH)
文摘
提出一个动画生成工具,通过重建中国水墨画中的笔画,动态模拟水墨画原有的绘画过程.首先将输入的水墨画图像进行笔画拆分;然后根据笔画形状,包括轮廓、骨架信息,估算绘画轨迹,并通过类椭圆形的瞬时足迹模型中的一系列参数(如坐标、大小、方向)约束轨迹质量;文中的实时渲染模型用采样自原画的足迹纹理,动态渲染估算的轨迹.实验结果表明,与已有的方法相比,文中提出的方法可根据笔画轮廓自动提取其绘画轨迹,并对画笔在纸上的瞬时足迹进行建模.在应用价值方面,该工具可用于中国水墨画的鉴赏分析,艺术教育与实践.
关键词
笔画轨迹
非真实感绘制
实时渲染
中国水墨画
Keywords
brush trajectory
non-photorealistic rendering
real-time rendering
Chinese ink painting
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
论证候研究中变量聚类结果的诠释
被引量:
6
5
作者
张连文
周雪忠
陈弢
何丽云
刘保延
机构
香港科技大学计算机科学及工程学系
中国中医
科学
院
出处
《中国中医药信息杂志》
CAS
CSCD
2007年第7期102-103,共2页
基金
香港研究资助局项目(622105)
北京市科委重大计划项目(H020920010031)
中国博士后科学基金(2005037106)
文摘
近年来,有不少学者利用系统变量聚类方法对西医病种中中医症状的分布情况进行研究。例如,麻氏等通过对739例胆病病案进行分析,得到9个类,并把它们分别诠释为肝胆湿热证、肝胆郁热证、肝胆蕴热证、肝胆气郁证、血瘀证、脾失健运证、阳虚寒湿证、阴虚内热证和热毒亡阳证。笔者剖析系统变量聚类结果的统计学含义,并基于此讨论把它们诠释为证候的合理性。我们的结论是,变量聚类的结果不能诠释为证候。
关键词
证候研究
变量聚类
分类号
R2-05 [医药卫生—中医学]
下载PDF
职称材料
题名
隐结构模型对2型糖尿病病机规律的探讨
被引量:
3
6
作者
龚燕冰
张连文
高思华
罗增刚
倪青
谢雁鸣
机构
中国中医
科学
院广安门医院内分泌科
香港科技大学计算机科学及工程学系
北京中医药
大学
中国中医
科学
院
中国中医
科学
院中医临床基础医学研究所
出处
《世界科学技术-中医药现代化》
2009年第4期516-521,共6页
基金
国家自然基金面上资助课题(90209012):糖尿病中医证候的量化标准的研究
负责人:高思华
+5 种基金
香港研究资助局项目(622408):有监督学习与无监督学习中隐结构挖掘的一个共同框架
负责人:张连文
香港研究资助局项目(622307):加快多层隐类模型的学习
负责人:张连文
科技部基础性工作专项基金资助项目(2001DEA20010):中药材标准及中医临床疗效评价标准
负责人:王永炎
文摘
目的:探索2型糖尿病的病机规律。方法:以2501例2型糖尿病的临床数据为基础,运用隐结构模型的方法加以研究。结果:得出隐结构模型关于2型糖尿病"症-证—病机"相互关系及病机规律。结论:隐结构模型是一种非线性的方法,这对于研究非线性、复杂性的中医证候无疑是一种比较合适的手段。
关键词
2型糖尿病病机规律
隐结构模型
决定性水平曲线
累积互信息曲线
两两互信息曲线
隐类
Keywords
type 2 diabetes
pathogenesis
latent structural model
分类号
R587.1 [医药卫生—内分泌]
R197 [医药卫生—卫生事业管理]
下载PDF
职称材料
题名
基于机器学习模型的专利质量预测初探
被引量:
14
7
作者
刘夏
黄灿
余骁锋
机构
浙江
大学
管理学院知识产权管理研究所
香港科技大学计算机科学及工程学系
出处
《情报学报》
CSSCI
CSCD
北大核心
2019年第4期402-410,共9页
基金
浙江省博士后科研项目择优资助"基于专利存续期和溢价的中国企业专利价值估测和研究"(71402161)
"互联网+"嵌入企业协同创新生态系统研究项目(71732008)
文摘
随着专利数量的迅速增长,如何预测专利质量,已成为企业、政府以及学术界越发关注的问题。传统的统计分析方法虽然对专利质量评估进行了多方面探索,却较少对专利质量进行预测,尤其是充分利用到专利数据的海量样本和持续更新的优势。本文以2010—2011年国家知识产权局受理的共计85万余件专利申请为研究对象,抓取申请文档中以及相关引文的特征信息,搭建完整的随机森林模型,对后续被引情况进行机器学习及预测。除此之外,随机森林对特征重要性的评估结果显示,专利的向前引证专利的特征比该专利本身的特征对后续引证的预测提供了更多有效信息,进一步显示出专利审查中对前引专利检索工作的重要性。同时,文章结尾指出了本文模型的局限性以及今后借助机器学习对专利预测的改进方法。
关键词
专利质量
机器学习
随机森林
预测
Keywords
patent value
machine learning
random forest
prediction
分类号
G255.53 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于用户查询日志的网络搜索主题分析
被引量:
2
8
作者
张森
张晨
林培光
张春云
郭玉超
任威龙
任可
机构
山东财经
大学
计算机
科学
与技术学院
香港科技大学计算机科学及工程学系
出处
《智能系统学报》
CSCD
北大核心
2017年第5期668-677,共10页
基金
国家自然科学基金重点项目(U1201258)
山东省自然科学杰出青年基金项目(JQ201316)
教育部人文社会科学研究项目(15YJAZH042)
文摘
网络搜索分析在优化搜索引擎方面具有举足轻重的作用,而且对用户个人搜索特性进行分析能够提高搜索引擎的精准度。目前,大多数已有模型(比如点击图模型及其变体),注重研究用户群体的共同特点。然而,关于如何做到既可以获取用户群体共同特点又可以获取用户个人特点方面的研究却非常少。本文研究了基于个人用户网络搜索分析新问题,即通过研究用户搜索的突发性现象,获取个人用户搜索查询的主题分布情况。提出了两个搜索主题模型,即搜索突发性模型(SBM)和耦合敏感搜索突发性模型(CS-SBM)。SBM假设查询词和URL主题是无关的,CS-SBM假设查询词和URL之间是有主题关联的,得到的主题分布信息存储在偏Dirichlet先验中,采用Beta分布刻画用户搜索的时间特性。实验结果表明,每一个用户的网络搜索轨迹都有多种基于用户的独有特点。同时,在使用大量真实用户查询日志数据情况下,与LDA、DCMLDA、TOT相比,本文提出的模型具有明显的泛化性能优势,并且有效地描绘了用户搜索查询主题在时间上的变化过程。
关键词
网络搜索
搜索引擎
自然语言处理
主题模型
文本挖掘
突发性
时间分析
参数估计
Keywords
web search
search engine
natural language processing
topic model
data mining
burstiness
temporal analysis
parameter estimate
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于联邦学习的推荐系统综述
被引量:
10
9
作者
梁锋
羊恩跃
潘微科
杨强
明仲
机构
深圳
大学
计算机
与软件学院
香港科技大学计算机科学及工程学系
出处
《中国科学:信息科学》
CSCD
北大核心
2022年第5期713-741,共29页
基金
国家自然科学基金项目(批准号:61836005,62172283)
科技创新2030—“新一代人工智能”重大项目(批准号:2018AAA0102300)资助。
文摘
随着互联网和移动计算等技术的发展,人们的在线行为产生了越来越多的数据,想要从海量数据中挑选出用户可能喜欢的物品,推荐系统不可或缺.然而传统的推荐算法需要将用户数据收集到服务端才能构建模型,这会泄露用户隐私.最近,谷歌针对机器学习任务中需要收集用户数据才能进行建模的问题,提出了一种新的学习范式——联邦学习.联邦学习与推荐系统相结合,使得联邦推荐算法能够在模型构建过程中,始终将用户数据保留在客户端本地,从而保护了用户隐私.本文主要对联邦学习与推荐系统相结合的研究工作进行综述,并从架构设计、系统的联邦化和隐私保护技术的应用3个角度重点分析联邦推荐算法的研究进展.最后,对基于联邦学习的推荐系统可研究的方向进行展望.
关键词
推荐系统
联邦学习
隐私保护
联邦推荐
协同过滤
Keywords
recommender systems
federated learning
privacy protection
federated recommendation
collaborative filtering
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
TP18 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
开源软件库生态治理技术研究综述:二十年进展
王莹
伍盈欣
高天
陈子莺
许畅
于海
张成志
《软件学报》
EI
CSCD
北大核心
2024
1
下载PDF
职称材料
2
一种基于程序变异的软件错误定位技术
贺韬
王欣明
周晓聪
李文军
张震宇
张成志
《计算机学报》
EI
CSCD
北大核心
2013
15
下载PDF
职称材料
3
隐结构分析与西医疾病的辨证分型(Ⅲ):辨证规则的建立
张连文
傅晨
刘腾飞
陈宝鑫
刘桦
张允岭
《世界科学技术-中医药现代化》
北大核心
2014
14
下载PDF
职称材料
4
动态模拟中国水墨画中的笔画绘制
杨丽洁
徐添辰
吴恩华
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2016
13
下载PDF
职称材料
5
论证候研究中变量聚类结果的诠释
张连文
周雪忠
陈弢
何丽云
刘保延
《中国中医药信息杂志》
CAS
CSCD
2007
6
下载PDF
职称材料
6
隐结构模型对2型糖尿病病机规律的探讨
龚燕冰
张连文
高思华
罗增刚
倪青
谢雁鸣
《世界科学技术-中医药现代化》
2009
3
下载PDF
职称材料
7
基于机器学习模型的专利质量预测初探
刘夏
黄灿
余骁锋
《情报学报》
CSSCI
CSCD
北大核心
2019
14
下载PDF
职称材料
8
基于用户查询日志的网络搜索主题分析
张森
张晨
林培光
张春云
郭玉超
任威龙
任可
《智能系统学报》
CSCD
北大核心
2017
2
下载PDF
职称材料
9
基于联邦学习的推荐系统综述
梁锋
羊恩跃
潘微科
杨强
明仲
《中国科学:信息科学》
CSCD
北大核心
2022
10
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部