期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于标签权重评分的推荐模型及算法研究 被引量:37
1
作者 孔欣欣 苏本昌 +2 位作者 王宏志 高宏 李建中 《计算机学报》 EI CSCD 北大核心 2017年第6期1440-1452,共13页
推荐系统已经被越来越频繁地应用到电子商务网站与一些社交网站,在提高用户满意度的同时也带来了巨大的商业利益.然而,当前的推荐算法由于原始数据的不完整性以及算法本身处理数据的特殊性,导致推荐效果不理想.例如,某些推荐系统会产生... 推荐系统已经被越来越频繁地应用到电子商务网站与一些社交网站,在提高用户满意度的同时也带来了巨大的商业利益.然而,当前的推荐算法由于原始数据的不完整性以及算法本身处理数据的特殊性,导致推荐效果不理想.例如,某些推荐系统会产生冷启动、复杂兴趣推荐困难、解释性差等问题.为此,该文提出一种基于标签权重评分的推荐系统模型(Label-Weight Rating based Recommendation,LWR),旨在使用一种较为简洁的方式——标签权重评分来获取用户最准确的评价和需求,并通过改进当前的一些推荐算法来处理标签权重评分数据,从而生成对用户的推荐,最后以标签权重评分的形式向用户展示推荐结果并作出合理的解释.扩展实验中,通过电影推荐实验,证明了该文技术的有效性和可行性. 展开更多
关键词 推荐系统 标签 标签权重评分 数据挖掘 人工智能
下载PDF
XML检索中的标签权重设置模型 被引量:1
2
作者 刘德喜 万常选 +1 位作者 刘喜平 焦贤沛 《计算机科学与探索》 CSCD 2010年第8期723-730,共8页
XML检索时,考虑关键词在文档中的位置有助于改善检索效果,一种常用的方法是为文档中不同的标签赋予不同的权重,并根据关键词所在结点的标签合理地设置权重。然而,目前为标签赋予权重的方法大都是人工设置,这种方法工作量大且主观性强。... XML检索时,考虑关键词在文档中的位置有助于改善检索效果,一种常用的方法是为文档中不同的标签赋予不同的权重,并根据关键词所在结点的标签合理地设置权重。然而,目前为标签赋予权重的方法大都是人工设置,这种方法工作量大且主观性强。提出了用主题概括强度衡量XML标签权重的方法,实验结果显示,该方法能有效提高XML检索的质量。 展开更多
关键词 XML检索 标签权重 主题概括强度
下载PDF
基于标签权重的协同过滤推荐算法 被引量:18
3
作者 雷曼 龚琴 +1 位作者 王纪超 王保群 《计算机应用》 CSCD 北大核心 2019年第3期634-638,共5页
针对传统协同过滤推荐算法中由于相似度计算导致推荐精度不足的问题,提出一种基于标签权重相似度量方法的协同过滤推荐算法。首先,通过改进当前算法中标签权重的计算,并构成用户-标签权重矩阵和物品-标签权重矩阵;其次,考虑到推荐系统... 针对传统协同过滤推荐算法中由于相似度计算导致推荐精度不足的问题,提出一种基于标签权重相似度量方法的协同过滤推荐算法。首先,通过改进当前算法中标签权重的计算,并构成用户-标签权重矩阵和物品-标签权重矩阵;其次,考虑到推荐系统是以用户为中心进行推荐,继而通过构建用户-物品关联矩阵来获取用户对物品最准确的评价和需求;最后,根据用户-物品的二部图,利用物质扩散算法计算基于标签权重的用户间相似度,并为目标用户生成推荐列表。实验结果表明,与一种基于"用户-项目-用户兴趣标签图"的协同好友推荐算法(UITGCF)相比,在稀疏度环境为0.1时该算法的召回率、准确率和F1值分别提高了14.69%、9.44%、17.23%。当推荐项目数量为10时,三个指标分别提高了17.99%、8.98%、16.27%。结果表明基于标签权重的协同过滤推荐算法可有效提高推荐结果。 展开更多
关键词 用户-标签权重 物品-标签权重 推荐系统 协同过滤 物质扩散
下载PDF
基于标签权重系数的社团发现算法
4
作者 滕彬 李玲娟 《南京邮电大学学报(自然科学版)》 北大核心 2016年第6期74-80,共7页
为了提高社团发现的准确性和稳定性,文中提出了一种基于标签权重系数(label weight coefficient,LWC)的社团发现算法。该算法参考了标签传播算法(label propagation algorithm,LPA)的基本思想,并针对LPA中随机策略导致的结果不稳定问题... 为了提高社团发现的准确性和稳定性,文中提出了一种基于标签权重系数(label weight coefficient,LWC)的社团发现算法。该算法参考了标签传播算法(label propagation algorithm,LPA)的基本思想,并针对LPA中随机策略导致的结果不稳定问题做了改进。LWC算法按照节点度由高到低的顺序,依据节点之间的局部相似度和邻居节点度来计算标签权重系数,再依据标签权重系数进行节点标签的更新。当节点具有多个满足条件的候选标签时,依据标签连接度、相同标签的节点度之和选出标签,避免标签的随机选择。在人工合成网络数据集和真实网络数据集上的实验结果都表明,LWC算法不仅提高了社团发现结果的质量和准确率,而且具有较高的稳定性。 展开更多
关键词 社团发现 标签传播算法 标签权重系数
下载PDF
基于内容和标签权重的混合推荐算法 被引量:8
5
作者 刘宇 朱文浩 《计算机与数字工程》 2020年第4期773-777,共5页
传统的基于内容的推荐算法虽然在解决可解释性问题及冷启动问题时有一定的优势,但是由于对大部分的物品的内容特征信息提取困难,难以得到广泛的应用。论文直接利用标签作为物品的内容信息,生成关键词向量,省去了对各种非结构化数据内容... 传统的基于内容的推荐算法虽然在解决可解释性问题及冷启动问题时有一定的优势,但是由于对大部分的物品的内容特征信息提取困难,难以得到广泛的应用。论文直接利用标签作为物品的内容信息,生成关键词向量,省去了对各种非结构化数据内容的复杂提取过程,解决了基于内容的推荐算法提取信息困难这一问题,同时引入标签权重,不仅避免了不同物品侧重点不同对推荐结果的影响,而且能进一步提高了推荐算法的准确性。在计算过程中为了减小时间复杂度,对推荐系统中传统的倒排表方法做出了适应标签权重的改进,且在计算得到Top-N推荐列表时对数据进行了预处理。 展开更多
关键词 基于内容 关键词向量 标签权重 冷启动
下载PDF
基于标签传播与多指标的重叠社区检测算法
6
作者 王明月 邹晓红 +1 位作者 陈晶 许成伟 《计算机应用》 CSCD 北大核心 2023年第S02期105-110,共6页
为解决标签传播的社区检测算法容易产生怪物社区和不稳定社区划分的问题,以标签熵为基础,提出一种重叠社区检测算法LEKA(Label Entropy and K-shell Algorithm in overlapping community),综合考虑了标签初始化、标签更新和标签传播的... 为解决标签传播的社区检测算法容易产生怪物社区和不稳定社区划分的问题,以标签熵为基础,提出一种重叠社区检测算法LEKA(Label Entropy and K-shell Algorithm in overlapping community),综合考虑了标签初始化、标签更新和标签传播的各个阶段。首先,利用K-shell算法对节点进行初始化以获取节点的层次信息;其次,依据标签熵升序依次更新节点标签,在选择标签时综合节点间的层次信息和节点间的影响,在存在多个候选标签的情况下基于节点标签权重进行选取。在真实网络数据集上的实验结果表明,LEKA在运行时间较短的情况下,重叠模块度EQ(ExtendQ)相较于OCKELP(Overlapping Community detection algorithm based on K-shell and label Entropy in Label Propagation)提高了2.3%~13.2%,具有较高的准确性和稳定性,更适合挖掘网络中的重叠社区结构。 展开更多
关键词 叠社区检测 标签 节点影响力 标签权重 标签传播
下载PDF
融合标签关联关系与用户社交关系的微博推荐方法 被引量:12
7
作者 马慧芳 贾美惠子 +1 位作者 张迪 蔺想红 《电子学报》 EI CAS CSCD 北大核心 2017年第1期112-118,共7页
通过分析微博特点及现有微博推荐算法的缺陷,提出一种融合了标签间关联关系与用户间社交关系的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户标签权重,为了解决该矩阵中稀疏的问题,通... 通过分析微博特点及现有微博推荐算法的缺陷,提出一种融合了标签间关联关系与用户间社交关系的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户标签权重,为了解决该矩阵中稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵.考虑到多用户之间社交关系对挖掘用户兴趣并进行微博推荐的重要性,构建用户-用户社交关系相似度矩阵,并与更新后的用户-标签矩阵进行迭代,得到最终的用户兴趣并进行相关推荐.实验证明了该算法针对微博信息推荐是有效的. 展开更多
关键词 微博推荐 标签检索 用户-标签矩阵 用户标签权重 标签关联关系 用户-用户社交关系相似度矩阵
下载PDF
一种基于标签关联关系的微博推荐方法 被引量:9
8
作者 马慧芳 贾美惠子 +1 位作者 李晓红 鲁小勇 《计算机工程》 CAS CSCD 北大核心 2016年第4期197-201,208,共6页
通过分析微博特点及现有微博推荐发现算法的缺陷,提出一种新的微博推荐方法。采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户-标签权重并利用标签信息表征用户兴趣。为解决该矩阵中高维稀疏的问题,通... 通过分析微博特点及现有微博推荐发现算法的缺陷,提出一种新的微博推荐方法。采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户-标签权重并利用标签信息表征用户兴趣。为解决该矩阵中高维稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵,获得最终的用户兴趣并进行相关推荐。实验结果表明,与忽略标签间关系的微博推荐方法相比,该推荐方法能够更有效地进行微博推荐。 展开更多
关键词 微博推荐 标签检索 用户-标签矩阵 用户-标签权重 标签关联关系
下载PDF
一种基于标签概率相关性的微博推荐方法 被引量:3
9
作者 张迪 马慧芳 +1 位作者 贾俊杰 余丽 《计算机工程与科学》 CSCD 北大核心 2017年第9期1742-1748,共7页
向微博用户推荐对其有价值和感兴趣的内容,是改善用户体验的重要途径。通过分析微博的特点以及现有微博推荐算法的缺陷,利用标签信息表征用户兴趣,提出一种基于标签概率相关性的微博推荐方法 LPCMR。首先,该方法利用标签之间的概率相关... 向微博用户推荐对其有价值和感兴趣的内容,是改善用户体验的重要途径。通过分析微博的特点以及现有微博推荐算法的缺陷,利用标签信息表征用户兴趣,提出一种基于标签概率相关性的微博推荐方法 LPCMR。首先,该方法利用标签之间的概率相关性,构造标签相似性矩阵。然后通过相关性标签权重加权方案,加强标签权重,构建用户-标签矩阵。针对用户标签矩阵稀疏的问题,采用标签相似性矩阵对用户-标签矩阵进行更新,使该矩阵既包含用户兴趣信息,又包含标签与标签之间的关系。以新浪微博公开API抓取的微博信息作为实验数据,进行了一系列的实验和分析,结果表明本文提出的推荐算法具有较好的效果。 展开更多
关键词 概率相关性 微博推荐 用户-标签矩阵 标签权重
下载PDF
基于TF-IDF算法的运营商用户画像分析 被引量:1
10
作者 刘佳 陈敏时 +2 位作者 谢懿 苏昭玉 武星宇 《电信工程技术与标准化》 2023年第10期1-5,30,共6页
随着通信技术的迅速发展,海量日志的产生给企业运营带来了安全隐患,除了能否及时检测出电信运营商企业内各类业务系统及设备的海量日志是否安全、合规之外,基于用户行为的分析对日志安全也尤为重要。为了直观掌握用户行为,本文基于TF-ID... 随着通信技术的迅速发展,海量日志的产生给企业运营带来了安全隐患,除了能否及时检测出电信运营商企业内各类业务系统及设备的海量日志是否安全、合规之外,基于用户行为的分析对日志安全也尤为重要。为了直观掌握用户行为,本文基于TF-IDF标签权重算法对运营商海量用户业务日志数据构建用户画像。根据实际业务场景构建RFS模型,通过开发的用户画像标签体系分析研究运营商用户行为,对用户操作日志中的潜在高风险信息进行数据挖掘,并输出可视化用户行为分析画像结果。实际应用表明,通过用户画像能识别风险用户行为信息,同时也能为日志安全分析提供参考价值,帮助企业实现数据安全运营动态监测。 展开更多
关键词 日志安全 用户行为分析 用户画像 标签权重算法 数据挖掘
下载PDF
基于通信业务日志的用户行为安全审计研究
11
作者 刘佳 陈敏时 +4 位作者 谢懿 徐世权 苏昭玉 武星宇 张晨 《电信快报》 2023年第11期8-12,共5页
为更直观掌握用户行为,基于运营商的海量用户业务日志为实验数据构建用户画像,分析研究用户基本属性、操作行为、偏好特征等维度。根据实际业务场景,结合改进的TF-IDF(词频-逆文档频率)标签权重算法开发不同维度用户画像标签体系,对用... 为更直观掌握用户行为,基于运营商的海量用户业务日志为实验数据构建用户画像,分析研究用户基本属性、操作行为、偏好特征等维度。根据实际业务场景,结合改进的TF-IDF(词频-逆文档频率)标签权重算法开发不同维度用户画像标签体系,对用户操作日志中的潜在高风险信息进行数据挖掘,并输出可视化画像结果。实际应用表明通过用户画像能识别风险用户行为信息,同时也能为日志安全审计提供参考价值,帮助企业实现数据安全运营动态监测。 展开更多
关键词 日志安全审计 用户行为 用户画像 标签权重算法 数据挖掘
下载PDF
基于高维相关性多标签在线流特征选择
12
作者 朱礼全 林耀进 +1 位作者 毛煜 程雨轩 《山东大学学报(理学版)》 CAS CSCD 北大核心 2024年第5期90-99,共10页
提出了一种基于高维相关性的多标签在线流特征选择算法,该算法将标签空间进行等价映射,构建基于高维标签空间的权重无向图,利用图信息和Jaccard指数来衡量标签之间的高维权重,利用标签的高维相关性计算新到达特征的显著性。通过迭代显... 提出了一种基于高维相关性的多标签在线流特征选择算法,该算法将标签空间进行等价映射,构建基于高维标签空间的权重无向图,利用图信息和Jaccard指数来衡量标签之间的高维权重,利用标签的高维相关性计算新到达特征的显著性。通过迭代显著性均值来判断新特征的显著水平,设计了一种基于平衡全局和局部的在线特征选择算法对已选特征子集进行动态优化,考虑已选特征与标签空间的全局相关性,过滤掉不相关的特征。分析已选特征之间的局部相关性,剔除冗余特征。与6种多标签特征选择方法进行对比实验,实验结果验证了所提算法的有效性。 展开更多
关键词 标签特征选择 在线流特征 高维相关性 标签权重
原文传递
大型网络中近似子图匹配研究 被引量:1
13
作者 黄云 洪佳明 覃遵跃 《计算机工程》 CAS CSCD 2012年第18期50-52,56,共4页
为降低噪声对近似子图匹配准确率的影响,提出一种改进的近似子图匹配方法。在预处理阶段,利用k-近邻顶点集为数据图中的每个顶点建立标签-权重向量索引。在查询过程中,基于单个近邻标签的权重距离和所有近邻标签的整体匹配程度进行两级... 为降低噪声对近似子图匹配准确率的影响,提出一种改进的近似子图匹配方法。在预处理阶段,利用k-近邻顶点集为数据图中的每个顶点建立标签-权重向量索引。在查询过程中,基于单个近邻标签的权重距离和所有近邻标签的整体匹配程度进行两级过滤,生成顶点候选集,采用生成树匹配和图匹配的方式确定查询图在大型网络中的位置。在真实数据集上的实验结果表明,该方法具有较高的执行效率和匹配准确率。 展开更多
关键词 近似匹配 K-近邻 标签权重 顶点匹配度 生成树匹配
下载PDF
基于内容与结构语义相融合的XML检索结果聚类 被引量:5
14
作者 钟敏娟 《情报学报》 CSSCI 北大核心 2012年第5期515-525,共11页
检索结果聚类是提高检索性能的一种有效手段.其中,如何衡量文档间的相似性是影响聚类质量的关键因素.针对XML文档的内容和结构双重特性,提出了内容与结构语义相融合的扩展向量空间模型,并分析了影响相似性度量的各种特征,进而提出了内... 检索结果聚类是提高检索性能的一种有效手段.其中,如何衡量文档间的相似性是影响聚类质量的关键因素.针对XML文档的内容和结构双重特性,提出了内容与结构语义相融合的扩展向量空间模型,并分析了影响相似性度量的各种特征,进而提出了内容与结构语义相融合的XML语义相似性度量方法.同时,针对IEEE数据集无法提供每篇文档的类别信息,本文从相关文档的分布情况引入了相关簇率和相关文档分布率的概念来进行聚类质量评价.数据集IEEE CS上的实验表明,与同类相似性度量方法和传统方法相比,本文所提方法具有可行性和更好的聚类效果. 展开更多
关键词 XML聚类 标签权重 节点层次 相关簇率 相关文档分布率
下载PDF
基于高质量反馈源的XML查询扩展 被引量:1
15
作者 钟敏娟 万常选 +1 位作者 刘德喜 江腾蛟 《情报学报》 CSSCI 北大核心 2013年第6期610-617,共8页
有效避免伪反馈的“查询主题漂移”主要需要解决两大问题,一是如何确定相关文档,形成较高质量的伪相关文档集,另一个是在伪相关文档集里如何挑选扩展信息。本文主要研究在获取了高质量伪相关文档集合的基础上如何有效进行XML查询扩... 有效避免伪反馈的“查询主题漂移”主要需要解决两大问题,一是如何确定相关文档,形成较高质量的伪相关文档集,另一个是在伪相关文档集里如何挑选扩展信息。本文主要研究在获取了高质量伪相关文档集合的基础上如何有效进行XML查询扩展。针对XML文档的特点,提出了扩展向量空间模型的查询词扩展方法。实验结果表明,与初始查询和传统的词项扩展方法相比,该扩展方法更能获得与用户查询意图相关的扩展信息,更能有效地提高检索质量和性能。 展开更多
关键词 伪反馈 XML查询扩展 标签语义 节点层次
下载PDF
结合深度学习与词性标注的网页分类算法研究 被引量:1
16
作者 骆聪 王帅 《计算机技术与发展》 2018年第8期71-74,95,共5页
为了方便互联网用户高效地从海量网页中获取自己所需的信息,准确的网页分类技术越来越受到人们的重视。网页分类技术一般采用信息增益、互信息等进行特征选取,并使用k NN(k-nearest neighbor)、朴素贝叶斯(naive Bayes)和支持向量机(sup... 为了方便互联网用户高效地从海量网页中获取自己所需的信息,准确的网页分类技术越来越受到人们的重视。网页分类技术一般采用信息增益、互信息等进行特征选取,并使用k NN(k-nearest neighbor)、朴素贝叶斯(naive Bayes)和支持向量机(support vector machines)等进行分类。不同于传统的网页分类算法,结合深度学习的知识采用更深层次的方法进行特征提取。通过考虑网页HTML标签权重提取网页的内容,然后利用词性标注技术在剔除部分对网页分类贡献较小的词语的同时,也为区分能力高的名词赋予更高的权重,最后结合深度信念网络(deep belief network)进行特征提取和特征分类。实验结果表明,提出的网页分类算法具有和采用支持向量机相当的准确性,并且在使用词性标注技术后,网页分类结果的F1值又提升了3.35%。 展开更多
关键词 网页分类 深度学习 HTML标签权重 词性标注 深度信念网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部