期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于多源数据聚合的神经网络侧信道攻击
1
作者 张润莲 潘兆轩 +2 位作者 李金林 武小年 韦永壮 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期261-270,共10页
基于深度学习的侧信道攻击需要针对密码算法的每一个密钥字节建模并训练,数据采集和模型训练开销大.针对该问题,提出一种基于多源数据聚合的神经网络侧信道攻击方法.为筛选具有良好泛化效果的密钥字节泄露数据进行数据聚合,以AES-128算... 基于深度学习的侧信道攻击需要针对密码算法的每一个密钥字节建模并训练,数据采集和模型训练开销大.针对该问题,提出一种基于多源数据聚合的神经网络侧信道攻击方法.为筛选具有良好泛化效果的密钥字节泄露数据进行数据聚合,以AES-128算法为例,先基于16个密钥字节的泄露数据训练16个单密钥字节模型,分别实现对16个密钥字节的恢复;其次,设计一种打分机制评估各单密钥字节模型的泛化效果,通过得分排序筛选出对各密钥字节恢复效果最好的单密钥字节模型;最后,以筛选模型所对应的各密钥字节泄露数据集构建多源数据聚合模型进行训练,实现密钥恢复.实验测试结果表明,多源数据聚合模型具有良好的泛化效果,有效提高了密钥恢复的准确率和效率,降低了恢复密钥所需的能量迹数量,其在采集能量迹较少的情况下依然具有较好的攻击效果. 展开更多
关键词 侧信道攻击 神经网络 打分机制 数据聚合 数据标签
下载PDF
磁共振3D-ASL技术联合ABCD_(2)评分在前循环短暂性脑缺血发作中应用价值分析
2
作者 刘伟 任春慧 +7 位作者 常文轩 宫雪梅 冯晨 张晓鹏 程琳 毕博昊 穆实 朱敏 《中国医药科学》 2024年第7期144-148,共5页
目的探讨三维动脉自旋标记(3D-ASL)技术联合ABCD_(2)评分在前循环短暂性脑缺血发作(TIA)中的应用价值。方法选择2021年5月至2022年12月在牡丹江医学院附属红旗医院确诊为前循环TIA的患者64例,完成各项磁共振检查,其中双时相3D-ASL标记... 目的探讨三维动脉自旋标记(3D-ASL)技术联合ABCD_(2)评分在前循环短暂性脑缺血发作(TIA)中的应用价值。方法选择2021年5月至2022年12月在牡丹江医学院附属红旗医院确诊为前循环TIA的患者64例,完成各项磁共振检查,其中双时相3D-ASL标记后延迟时间(PLD)分别为1.5、2.5 s,完成ABCD_(2)评分并进行为期90 d的随访。对3D-ASL图像进行分析,测量脑血流量(CBF)并计算相对脑血流量(rCBF),分析3D-ASL、ABCD_(2)评分对TIA患者病情及预后的评估价值。结果PLD=1.5 s CBF值、rCBF值均小于PLD=2.5 s;rCBF值与ABCD_(2)评分呈负相关;3D-ASL对TIA患者异常检出率高于MRA;3D-ASL异常组脑梗死发生率高于正常组;不同ABCD_(2)评分风险组脑梗死发生率比较,差异有统计学意义(P<0.05);ROC曲线分析结果显示,3D-ASL联合ABCD_(2)评分预测TIA患者90 d预后的曲线下面积(AUC)最大为0.907。结论双时相3D-ASL能够发现TIA患者细微灌注改变,反映代偿情况,可作为TIA患者进一步检查的方式,联合ABCD_(2)评分可以有效预测TIA患者90 d预后,具有较大的临床应用价值。 展开更多
关键词 三维动脉自旋标记 ABCD_(2)评分 短暂性脑缺血发作 脑梗死
下载PDF
Nutri-score标签的应用实践及其对中国的启发 被引量:6
3
作者 黄泽颖 黄贝珣 《食品与机械》 北大核心 2021年第5期1-5,共5页
分别阐述了法国Nutri-score标签的推广、实施效果、运算法则以及Nutri-score标签与相关包装正面(FOP)标签的比较,总结了Nutri-score标签的应用实践,并提出了对中国实施FOP标签的若干启发。
关键词 Nutri-score标签 包装正面标签 营养标签 预包装食品
下载PDF
基于文本分类的Fisher Score快速多标记特征选择算法 被引量:7
4
作者 汪正凯 沈东升 王晨曦 《计算机工程》 CAS CSCD 北大核心 2022年第2期113-124,共12页
Fisher Score(FS)是一种快速高效的评价特征分类能力的指标,但传统的FS指标既无法直接应用于多标记学习,也不能有效处理样本极值导致的类中心与实际类中心的误差。提出一种结合中心偏移和多标记集合关联性的FS多标记特征选择算法,找出... Fisher Score(FS)是一种快速高效的评价特征分类能力的指标,但传统的FS指标既无法直接应用于多标记学习,也不能有效处理样本极值导致的类中心与实际类中心的误差。提出一种结合中心偏移和多标记集合关联性的FS多标记特征选择算法,找出不同标记下每类样本的极值点,以极值点到该类样本的中心距离乘以半径系数筛选新的样本,从而获得分布更为密集的样本集合,以此计算特征的FS得分,通过整体遍历全体样本的标记集合中的每个标记,并在遍历过程中针对具有更多标记数量的样本自适应地赋以标记权值,得到整体特征的平均FS得分,以特征的FS得分进行排序过滤出目标子集实现特征选择目标。在8个公开的多标记文本数据集上进行参数分析及5种指标性能比较,结果表明,该算法具有一定的有效性和鲁棒性,在多数指标上优于MLNB、MLRF、PMU、MLACO等多标记特征选择算法。 展开更多
关键词 多标记分类 特征选择 Fisher score指标 距离度量 类间散度
下载PDF
基于改进TF⁃IDF的电梯传媒广告推荐方法
5
作者 陈彦彬 杨泽华 +1 位作者 薛晓桂 黄锦钿 《现代计算机》 2023年第8期34-39,共6页
随着国家个人信息保护法的出台,电梯传媒终端精准广告投放面临多方面挑战,如何在不采集市民隐私信息的情况下,提高电梯传媒终端广告投放的精准度,为广告投放商提高经济效益是当前终端计算广告研究的重点,为此提出了基于改进TF⁃IDF的电... 随着国家个人信息保护法的出台,电梯传媒终端精准广告投放面临多方面挑战,如何在不采集市民隐私信息的情况下,提高电梯传媒终端广告投放的精准度,为广告投放商提高经济效益是当前终端计算广告研究的重点,为此提出了基于改进TF⁃IDF的电梯传媒广告推荐方法。利用改进的TF⁃IDF对电梯点周边POI、居民等情况进行标签提取,构建了电梯传媒终端标签向量模型;然后利用商户对电梯的评分计算商户对标签兴趣度,最后构建商户兴趣模型对TOP⁃N部电梯终端广告位进行排序,推荐给商户。实验结果表明,该推荐方法的准确率、召回率等均优于采用传统TF⁃IDF算法的结果,而且不用采集市民个人隐私数据,具有较强推广应用效益。 展开更多
关键词 词频-逆文本频率指数 传媒广告 标签评分 用户兴趣 个性化推荐
下载PDF
双延迟3D-ASL评估单侧大脑中动脉闭塞患者侧支循环的预后价值 被引量:3
6
作者 程艳华 金颢洋 +2 位作者 常莹 耿长帅 雷杰 《中国实验诊断学》 2023年第9期1020-1024,共5页
目的探讨双延迟三维动脉自旋标记(3D ASL)在评估单侧大脑中动脉(MCA)闭塞患者侧支循环状态及临床转归中的应用价值。方法回顾性分析2019年1月至2021年12月经MRA证实的单侧MCA闭塞的患者134例,所有患者治疗前行T2-FLAIR、DWI、MRA及双延... 目的探讨双延迟三维动脉自旋标记(3D ASL)在评估单侧大脑中动脉(MCA)闭塞患者侧支循环状态及临床转归中的应用价值。方法回顾性分析2019年1月至2021年12月经MRA证实的单侧MCA闭塞的患者134例,所有患者治疗前行T2-FLAIR、DWI、MRA及双延迟3D-ASL检查,入院当日和入院15日美国国立卫生研究院卒中量表(NIHSS)评分完整。测量患侧及镜像侧脑血流量(CBF)值,并计算相对脑血流量(rCBF)(rCBF=患侧CBF/健侧CBF);依据CBF伪彩图梗死核心周围低灌注区皮层及皮层下是否出现动脉穿行伪影(ATA)征象,将患者分为ATA(+)组和ATA(-)组;依据T2-FLAIR序列中高信号血管征(HVS),对所有患者进行侧支循环等级分组。结果(1)ATA(-)组28例,ATA(+)组106例,两组患者在侧支循环等级分组、PLD=1.5s rCBF值、入院15dNIHSS评分及入院15d NIHSS评分降度差异均有统计学意义(P<0.001),其中ATA(+)组PLD=1.5s rCBF明显低于ATA(-)组、入院15d NIHSS评分降度明显高于ATA(-)组;(2)侧支循环等级分组:0级28例,1级25例,2级33例,3级48例,各组间PLD=1.5s rCBF、入院15d NIHSS评分及入院15dNIHSS评分降度差异均有统计学意义(P<0.001),侧支循环等级越高,rCBF(PLD=1.5s)越低、入院15d NIHSS评分降度越大;(3)侧支循环评分与入院15d NIHSS评分降度呈明显正相关(t=10.241,B=0.096,95%CI 0.077~0.114,P<0.001)。结论双延迟3D-ASL可以无创、直观地判断单侧大脑中动脉闭塞患者是否存在侧支循环,与T2-FLAIR联合可进一步评估侧支循环的状态,为临床评价预后提供客观依据。 展开更多
关键词 大脑中动脉闭塞 三维动脉自旋标记 侧支循环 动脉穿行伪影 NIHSS评分
下载PDF
浙派古琴艺术记谱技法研究和乐谱数据结构及标记文本转换分析 被引量:7
7
作者 陈根方 章怡雯 张云良 《杭州师范大学学报(自然科学版)》 CAS 2012年第6期561-565,共5页
分析了浙派古琴的演奏技法,对古琴乐谱所包含的语义信息进行了分类,利用计算机技术对乐谱中的独立语义信息进行数据结构设计,提出了基于文本标记表示古琴乐谱的方法,解决了人机无法同时表示与阅读古琴乐谱的问题.实验结果显示:古琴的文... 分析了浙派古琴的演奏技法,对古琴乐谱所包含的语义信息进行了分类,利用计算机技术对乐谱中的独立语义信息进行数据结构设计,提出了基于文本标记表示古琴乐谱的方法,解决了人机无法同时表示与阅读古琴乐谱的问题.实验结果显示:古琴的文本乐谱能完整地重现原有乐谱的音乐信息,谱字的平均字节数为4.08;带标记的文本乐谱适合于计算机进行统计分析、智能打谱、乐谱文本语料库建设等,为古琴艺术的数字化和信息化提供了一种切实可行的方法. 展开更多
关键词 浙派古琴 语义信息 减字谱 文本乐谱 标记 语料库 智能打谱
下载PDF
基于标签关系改进的多标签特征选择算法 被引量:2
8
作者 陈福才 李思豪 +1 位作者 张建朋 黄瑞阳 《计算机科学》 CSCD 北大核心 2018年第6期228-234,共7页
多标签特征选择是应对数据维度灾难现象的主要方法之一,可以在降低特征维度的同时提高学习效率,优化分类性能。针对目前特征选择算法没有考虑标签间的相互关系,以及信息量的衡量范围存在偏差的问题,提出一种基于标签关系改进的多标签特... 多标签特征选择是应对数据维度灾难现象的主要方法之一,可以在降低特征维度的同时提高学习效率,优化分类性能。针对目前特征选择算法没有考虑标签间的相互关系,以及信息量的衡量范围存在偏差的问题,提出一种基于标签关系改进的多标签特征选择算法。首先引入对称不确定性对信息量进行归一化处理,然后用归一化的互信息量作为相关性的衡量方法,并据此定义标签的重要性权重,对依赖度和冗余度中的标签相关项进行加权处理;进而提出一种特征评分函数作为特征重要性的评价指标,并依次选择出评分最高的特征组成最佳特征子集。实验结果表明,与其他算法相比,该算法在提取出更加精确的低维特征子集后,不仅能够有效提高面向实体信息挖掘的多标签学习算法的性能,也能提高基于离散特征的多标签学习算法的效率。 展开更多
关键词 多标签特征选择 标签关系 依赖度 冗余度 特征评分
下载PDF
基于邻域维护准则的特征选择算法优化研究 被引量:4
9
作者 刘云 肖雪 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第3期58-64,共7页
应用特征选择处理多标签数据分类时"维度灾难"问题已成为重要研究方向,因此提出一种基于邻域维护准则的特征选择算法(NPFS,feature selection algorithm based on neighborhood preservation criterion)。通过近似基于特征子... 应用特征选择处理多标签数据分类时"维度灾难"问题已成为重要研究方向,因此提出一种基于邻域维护准则的特征选择算法(NPFS,feature selection algorithm based on neighborhood preservation criterion)。通过近似基于特征子空间和基于标签空间的2个相似度矩阵来构建相似性维护表达式,再通过线性近似扩展相似性维护公式得到邻域关系维护公式,并计算出邻域关系维护得分(NRPS,neighborhood relationship preserving score)来评估特征子集的重要性,结合贪婪方法设计具有NRPS的多标签特征选择算法(NPFS)。仿真结果表明,对比MMIFS算法和MDMR算法,所提出的算法在平均准确率、覆盖率、汉明损失、1-错误率、排名损失5个性能指标上均有改善。 展开更多
关键词 特征选择 多标签分类 邻域关系维护得分 贪婪算法
下载PDF
偏最小二乘改进算法与特征抽取 被引量:4
10
作者 杨茂龙 王远方 +1 位作者 孙权森 夏德深 《计算机工程与应用》 CSCD 北大核心 2011年第1期179-181,200,共4页
采用基于正交约束的非迭代PLS可以实现PLS成分的快速有效抽取,但不能保证所抽取的成分之间不相关。而基于统计不相关约束的非迭代PLS建模方法所抽取的成分之间是无关的,从而可以保证图像识别时的有效性和稳定性。基于2DPCA思想的2DPLS... 采用基于正交约束的非迭代PLS可以实现PLS成分的快速有效抽取,但不能保证所抽取的成分之间不相关。而基于统计不相关约束的非迭代PLS建模方法所抽取的成分之间是无关的,从而可以保证图像识别时的有效性和稳定性。基于2DPCA思想的2DPLS特征抽取技术,直接从图像矩阵中抽取特征,能有效地解决小样本问题。但在使用PLS对单特征数据进行维数压缩时,传统的类标编码过于简单,为了充分利用数据分布信息,采用模糊k-近邻法对每个样本赋予一个样本标号,将近邻样本类别信息反映在该样本的类编码中,从而提出了基于样本标号的PLS及2DPLS改进算法。在ORL人脸库上的实验结果表明,该改进算法优于传统的PLS,能够更有效地抽取识别特征,其识别率要高于传统的PLS算法。 展开更多
关键词 统计不相关 偏最小二乘 类标编码 特征抽取 人脸识别
下载PDF
基于文档解析和特征识别的Flash动画自动阅卷的研究 被引量:2
11
作者 蔡银珊 《甘肃联合大学学报(自然科学版)》 2010年第6期43-46,共4页
通过SWF文档结构分析和特征识别,提出Flash动画自动阅卷的原理,给出逻辑形式化阅卷的描述,对比分析了自动阅卷的效果,实践表明该方法对于Flash简单动画自动阅卷比较可行.
关键词 SWF文档 自动阅卷 标签 特征识别
下载PDF
古琴艺术的数字化与乐谱谱字提取的包围盒算法 被引量:2
12
作者 陈根方 张云良 +3 位作者 章怡雯 黄晓东 范文利 乐敏 《杭州师范大学学报(自然科学版)》 CAS 2010年第6期473-477,共5页
文章阐明古琴艺术的数字化应从元数据方案设计、古琴乐谱的编码方案设计、TrueType字库设计、软音源设计、乐谱识别和古琴艺术的音乐活动等6个方面进行.提出和分析了乐谱识别中谱字提取的包围盒算法,选取古琴乐谱"广陵散"为... 文章阐明古琴艺术的数字化应从元数据方案设计、古琴乐谱的编码方案设计、TrueType字库设计、软音源设计、乐谱识别和古琴艺术的音乐活动等6个方面进行.提出和分析了乐谱识别中谱字提取的包围盒算法,选取古琴乐谱"广陵散"为样本图像,实验结果表明,数据处理量可较传统的区域标记算法降低12.5%. 展开更多
关键词 古琴艺术数字化 包围盒算法 乐谱识别 图像分割 区域标记算法
下载PDF
基于标签重构的弹载毫米波距离像识别算法
13
作者 王剑桥 李跃华 陈建飞 《太赫兹科学与电子信息学报》 2016年第3期336-339,354,共5页
毫米波引信通过发射宽带信号获得目标的精细结构信息,然而在非合作目标的探测与识别过程中,由于缺乏目标的类别信息,大量的目标样本无法得到充分的利用。针对这一问题,将基于拉普拉斯得分(LS)的监督特征选择算法推广到半监督情况,得到... 毫米波引信通过发射宽带信号获得目标的精细结构信息,然而在非合作目标的探测与识别过程中,由于缺乏目标的类别信息,大量的目标样本无法得到充分的利用。针对这一问题,将基于拉普拉斯得分(LS)的监督特征选择算法推广到半监督情况,得到基于标签重构的拉普拉斯得分算法(LRLS),并应用到非合作目标的识别中。LRLS的理论框架与LS相同,并利用标签重构技术获得半监督情况下的图拉普拉斯矩阵。为了更好地描述高维目标样本的相似性,在标签重构的过程中使用测地距离代替欧氏距离。实验结果表明,相对于传统的特征选择算法,LRLS能够得到更好的识别效果。 展开更多
关键词 标签重构 特征选择 拉普拉斯得分 半监督学习
下载PDF
基于动态标签的关系抽取方法 被引量:6
14
作者 薛露 宋威 《计算机应用》 CSCD 北大核心 2020年第6期1601-1606,共6页
针对远程监督数据集的关系抽取研究方法存在着大量标签噪声的问题,提出了一种作用于分层注意力机制关系抽取模型的动态标签方法。首先,提出了一种根据关系类别相似性生成动态标签的概念。由于相同的关系标签包含相似的特征信息,计算特... 针对远程监督数据集的关系抽取研究方法存在着大量标签噪声的问题,提出了一种作用于分层注意力机制关系抽取模型的动态标签方法。首先,提出了一种根据关系类别相似性生成动态标签的概念。由于相同的关系标签包含相似的特征信息,计算特征信息的关系类别相似性有助于生成与特征信息相对应的动态标签。其次,利用动态标签方法的评分函数来评价远程监督标签是否为噪声,以决定是否需要生成新的标签代替远程监督标签,通过调整远程监督标签来抑制标签噪声对模型的影响。最后,根据动态标签来更新分层注意力机制以关注有效实例,重新学习每个有效实例的重要性,进一步抽取关键的关系特征信息。实验结果表明,相较于原始的分层注意力机制关系抽取模型,所提方法在Micro和Macro分数上分别有1.3个百分点和1.9个百分点的提升,实现了噪声标签的动态纠正,提升了模型的关系抽取能力。 展开更多
关键词 关系抽取 远程监督 动态标签方法 评分函数 分层注意力机制
下载PDF
基于流形学习的约束Laplacian分值多标签特征选择 被引量:9
15
作者 蒋伟东 黄睿 《计算机工程与应用》 CSCD 北大核心 2018年第19期147-150,共4页
多标签特征选择是针对多标签数据的特征选择技术,提高多标签分类器性能的重要手段。提出一种基于流形学习的约束Laplacian分值多标签特征选择方法(Manifold-based Constraint Laplacian Score,M-CLS)。方法分别在数据特征空间和类别标... 多标签特征选择是针对多标签数据的特征选择技术,提高多标签分类器性能的重要手段。提出一种基于流形学习的约束Laplacian分值多标签特征选择方法(Manifold-based Constraint Laplacian Score,M-CLS)。方法分别在数据特征空间和类别标签空间定义两种Laplacian分值:在特征空间利用逻辑型类别标签的相似性对邻接矩阵进行改进,定义特征空间的约束Laplacian分值;在标签空间基于流形学习将逻辑型类别标签映射为数值型,定义实值标签空间的Laplacian分值。将两种分值的乘积作为最终的特征评价指标。实验结果表明,所提方法性能优于多种多标签特征选择方法。 展开更多
关键词 多标签分类 特征选择 多标签流形学习 Laplacian分值
下载PDF
美国NuVal评分标签发展的经验分析与启示 被引量:7
16
作者 黄泽颖 黄贝珣 《食品与机械》 北大核心 2021年第8期12-15,145,共5页
为探索企业主导包装正面(FOP)标签提供的启发,研究利用美国NuVal评分标签官方资料总结国际经验。结果发现,NuVal评分标签基于整体营养质量指数,用1~100表达包装食品、生鲜农产品的营养价值,评分越高,营养状况越好。标签与食品价格相结合... 为探索企业主导包装正面(FOP)标签提供的启发,研究利用美国NuVal评分标签官方资料总结国际经验。结果发现,NuVal评分标签基于整体营养质量指数,用1~100表达包装食品、生鲜农产品的营养价值,评分越高,营养状况越好。标签与食品价格相结合,方便消费者比较所支付的营养价值。因此,中国可尝试设计营养评价信息与价格一体化的FOP标签,并在生鲜农产品试行推广,以及按照国民营养需求适时调整FOP标签算法。 展开更多
关键词 NuVal评分标签 NuVal营养评分系统 包装正面标签 营养标签
下载PDF
合理低价中标模式下建筑企业信用标识模型
17
作者 何婧 宋吉荣 张东卿 《西南民族大学学报(自然科学版)》 CAS 2010年第4期670-676,共7页
工程量清单计价模式下合理低价中标法在带来一系列优点的同时,也出现了种种问题,如一味追求低价中标造成工程质量低劣,工程材料以次充好、低价中标高价索赔、甚至由于低于成本运作导致施工中断使项目变成"胡子工程"等的事件... 工程量清单计价模式下合理低价中标法在带来一系列优点的同时,也出现了种种问题,如一味追求低价中标造成工程质量低劣,工程材料以次充好、低价中标高价索赔、甚至由于低于成本运作导致施工中断使项目变成"胡子工程"等的事件屡见不鲜,严重影响了投资方的利益和建筑市场的健康稳定发展.为保障合理低价中标模式的顺利推行,同时为评标专家提供切实评判的依据,提出了一种新的判定合理低价中标"合理"性的参考标准——建筑企业信用标识制度,构建了建筑企业信用评分模型,并给出了基于该模型的企业信用标识,最后通过案例分析验证了方法的可行性. 展开更多
关键词 建筑企业 信用标识制度 信用评分模型 合理低价 招投标
下载PDF
基于拉普拉斯评分的多标记特征选择算法 被引量:5
18
作者 胡敏杰 林耀进 +2 位作者 王晨曦 唐莉 郑荔平 《计算机应用》 CSCD 北大核心 2018年第11期3167-3174,共8页
针对传统的拉普拉斯评分特征选择算法只适应单标记学习,无法直接应用于多标记学习的问题,提出一种应用于多标记任务的拉普拉斯评分特征选择算法。首先,考虑样本在整体标记空间中共同关联和共同不关联的相关性,重新构建样本相似度矩阵;然... 针对传统的拉普拉斯评分特征选择算法只适应单标记学习,无法直接应用于多标记学习的问题,提出一种应用于多标记任务的拉普拉斯评分特征选择算法。首先,考虑样本在整体标记空间中共同关联和共同不关联的相关性,重新构建样本相似度矩阵;然后,将特征之间的相关性及冗余性判定引入拉普拉斯评分算法中,采用前向贪心搜索策略依次评价候选特征与已选特征的联合作用能力,用于评价特征的重要性;最后,在5个不同评价指标和6个多标记数据集上实验。实验结果表明:相比基于最大依赖的多标记维数约简方法(MDDM)、基于贝叶斯分类器的多标记特征选择算法(MLNB)及基于多元互信息的多标记分类特征选择算法(PMU),所提算法不仅分类性能最优,且存在显著性优异达65%。 展开更多
关键词 特征选择 拉普拉斯 多标记分类 搜索策略 特征关联
下载PDF
基于代表点评分策略的快速自适应聚类算法 被引量:5
19
作者 张远鹏 邓赵红 +2 位作者 钟富礼 杭文龙 王士同 《计算机研究与发展》 EI CSCD 北大核心 2018年第1期163-178,共16页
在基于代表点的聚类算法中,为了解决算法自适应性和聚类速度问题,在快速压缩集密度估计的基础上,提出了一种基于代表点评分策略的快速自适应聚类算法.该算法的提出基于3个非常重要的假设:1)每个簇有一个代表点,且代表点来自簇内高密度样... 在基于代表点的聚类算法中,为了解决算法自适应性和聚类速度问题,在快速压缩集密度估计的基础上,提出了一种基于代表点评分策略的快速自适应聚类算法.该算法的提出基于3个非常重要的假设:1)每个簇有一个代表点,且代表点来自簇内高密度样本;2)代表点或在压缩集中,或在压缩集附近且与压缩集中样本具有高度相似性;3)各簇中样本围绕代表点并沿着压缩集扩散.基于第1个和第2个假设,提出用代表点分值来评估样本成为代表点的可能性,并分析了其合理性.基于第3个假设和代表点分值,构建了一种快速的自适应聚类算法,该算法将所有样本按照其代表点分值从大到小排序,形成代表点候选集;然后从代表点候选集中逐个选择代表点,利用其邻域不断传递标签至整个压缩集;最后采用同样的方法将压缩集中样本的标签扩散至整个数据集,在此过程中引入抽样,提高标签传播速度.在人工数据集和真实数据集上的实验表明:所提出的算法能够处理任意形状的数据集和大规模数据集,且不需要指定类别数. 展开更多
关键词 词代表点分值 快速压缩集密度估计器 压缩集 标签传播 抽样
下载PDF
以位置特异性得分矩阵和基因本体为特征的蛋白质亚细胞定位预测 被引量:1
20
作者 刘冰静 郭红 《福州大学学报(自然科学版)》 CAS 北大核心 2017年第1期16-24,共9页
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因... 提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率. 展开更多
关键词 定位预测 蛋白质亚细胞 位置特异性得分矩阵 基因本体 多标签分类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部