期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
Video Summarization Approach Based on Binary Robust Invariant Scalable Keypoints and Bisecting K-Means
1
作者 Sameh Zarif Eman Morad +3 位作者 Khalid Amin Abdullah Alharbi Wail S.Elkilani Shouze Tang 《Computers, Materials & Continua》 SCIE EI 2024年第3期3565-3583,共19页
Due to the exponential growth of video data,aided by rapid advancements in multimedia technologies.It became difficult for the user to obtain information from a large video series.The process of providing an abstract ... Due to the exponential growth of video data,aided by rapid advancements in multimedia technologies.It became difficult for the user to obtain information from a large video series.The process of providing an abstract of the entire video that includes the most representative frames is known as static video summarization.This method resulted in rapid exploration,indexing,and retrieval of massive video libraries.We propose a framework for static video summary based on a Binary Robust Invariant Scalable Keypoint(BRISK)and bisecting K-means clustering algorithm.The current method effectively recognizes relevant frames using BRISK by extracting keypoints and the descriptors from video sequences.The video frames’BRISK features are clustered using a bisecting K-means,and the keyframe is determined by selecting the frame that is most near the cluster center.Without applying any clustering parameters,the appropriate clusters number is determined using the silhouette coefficient.Experiments were carried out on a publicly available open video project(OVP)dataset that contained videos of different genres.The proposed method’s effectiveness is compared to existing methods using a variety of evaluation metrics,and the proposed method achieves a trade-off between computational cost and quality. 展开更多
关键词 BRISK bisecting k-mean video summarization keyframe extraction shot detection
下载PDF
基于iForest+Biscting K-means的驾驶风格辨识方法研究 被引量:3
2
作者 邓天民 朱杰 +1 位作者 朱凯家 屈治华 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第6期1-6,共6页
提出了一种基于iForest+Biscting K-means模型的客运驾驶员驾驶风格辨识方法。该方法针对在Bisceting Kmeans模型中,聚类质心严重影响聚类结果问题,采用iForest模型训练聚类中心候选集作为聚类质心集的方法加以改进。通过考察某城际客... 提出了一种基于iForest+Biscting K-means模型的客运驾驶员驾驶风格辨识方法。该方法针对在Bisceting Kmeans模型中,聚类质心严重影响聚类结果问题,采用iForest模型训练聚类中心候选集作为聚类质心集的方法加以改进。通过考察某城际客运线路30位客车职业驾驶员,在直线道路行驶工况下,90余天约400万条客车行驶数据开展模型验证。试验表明:在加速度标准差和超速倾向系数作为聚类指标的情况下,客运驾驶员驾驶风格聚类为谨慎型、普通型和激进型3类,其中谨慎型11人,普通型19人,激进型0人。 展开更多
关键词 交通工程 驾驶风格 bisecting k-means算法 iForest算法 大数据
下载PDF
基于VSM和Bisecting K-means聚类的新闻推荐方法 被引量:16
3
作者 袁仁进 陈刚 +1 位作者 李锋 魏双建 《北京邮电大学学报》 EI CAS CSCD 北大核心 2019年第1期114-119,共6页
针对海量新闻数据给用户带来的困扰,为提升用户阅读新闻的个性化体验,提出了融合向量空间模型和Bisecting K-means聚类的新闻推荐方法.首先进行新闻文本向量化,使用向量空间模型和TF-IDF算法构建出新闻特征向量;采用Bisecting K-means... 针对海量新闻数据给用户带来的困扰,为提升用户阅读新闻的个性化体验,提出了融合向量空间模型和Bisecting K-means聚类的新闻推荐方法.首先进行新闻文本向量化,使用向量空间模型和TF-IDF算法构建出新闻特征向量;采用Bisecting K-means聚类算法对新闻特征向量集进行聚类;然后将已聚类的新闻集分为训练集和测试集,根据训练集构建"用户—新闻类别—新闻"三层层次结构的用户兴趣模型;最后采用余弦相似度方法得出新闻推荐结果,并与测试集进行对比分析.实验以基于用户的协同过滤算法、基于物品的协同过滤算法、结合向量空间模型和K-means聚类的推荐方法为基准,实验结果表明,该方法具有可行性,在准确率、召回率和F值上都有所提高. 展开更多
关键词 个性化推荐 向量空间模型 bisecting k-means聚类算法 用户兴趣模型
原文传递
二分K均值聚类算法优化及并行化研究 被引量:23
4
作者 张军伟 王念滨 +1 位作者 黄少滨 蔄世明 《计算机工程》 CAS CSCD 北大核心 2011年第17期23-25,共3页
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均... 二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。 展开更多
关键词 数据挖掘 聚类算法 二分K均值 并行化 群集系统
下载PDF
基于二分K-均值的SVM决策树自适应分类方法 被引量:8
5
作者 裘国永 张娇 《计算机应用研究》 CSCD 北大核心 2012年第10期3685-3687,3709,共4页
分析和研究了自适应降维算法在高维数据挖掘中的应用。针对已有数据挖掘算法因维灾难导致的在处理高维数据时准确率和聚类质量都较低的情况,将二分K-均值聚类和SVM决策树算法结合在一起,提出了一种适用于高维数据聚类的自适应方法 BKM-S... 分析和研究了自适应降维算法在高维数据挖掘中的应用。针对已有数据挖掘算法因维灾难导致的在处理高维数据时准确率和聚类质量都较低的情况,将二分K-均值聚类和SVM决策树算法结合在一起,提出了一种适用于高维数据聚类的自适应方法 BKM-SVMDT。该算法能保证二分K-均值聚类是在低维数据空间中进行,其结果再反过来帮助SVM在高维空间中的执行,这样反复执行以取得较好的分类精度和效率。标准数据集的实验结果证明了该方法的有效性。 展开更多
关键词 二分K-均值 支持向量机决策树 降维 自适应算法
下载PDF
基于随机数三角阵映射的高维大数据二分聚类初始中心高效鲁棒生成算法 被引量:7
6
作者 李旻 何婷婷 《电子与信息学报》 EI CSCD 北大核心 2021年第4期948-955,共8页
Bisecting K-means算法通过使用一组初始中心对分割簇,得到多个二分聚类结果,然后从中选优以减轻局部最优收敛问题对算法性能的不良影响。然而,现有的随机采样初始中心对生成方法存在效率低、稳定性差、缺失值等不同问题,难以胜任大数... Bisecting K-means算法通过使用一组初始中心对分割簇,得到多个二分聚类结果,然后从中选优以减轻局部最优收敛问题对算法性能的不良影响。然而,现有的随机采样初始中心对生成方法存在效率低、稳定性差、缺失值等不同问题,难以胜任大数据聚类场景。针对这些问题,该文首先创建出了初始中心对组合三角阵和初始中心对编号三角阵,然后通过建立两矩阵中元素及元素位置间的若干映射,从而实现了一种从随机整数集合中生成二分聚类初始中心对的线性复杂度算法。理论分析与实验结果均表明,该方法的时间效率及效率稳定性均明显优于常用的随机采样方法,特别适用于高维大数据聚类场景。 展开更多
关键词 bisecting k-means 初始中心生成 三角矩阵映射 随机整数 高维大数据聚类 线性算法
下载PDF
A Kernel Clustering Algorithm for Fast Training of Support Vector Machines
7
作者 刘笑嶂 冯国灿 《Journal of Donghua University(English Edition)》 EI CAS 2011年第1期53-56,共4页
A new algorithm named kernel bisecting k-means and sample removal(KBK-SR) is proposed as sampling preprocessing for support vector machine(SVM) training to improve the efficiency.The proposed algorithm tends to quickl... A new algorithm named kernel bisecting k-means and sample removal(KBK-SR) is proposed as sampling preprocessing for support vector machine(SVM) training to improve the efficiency.The proposed algorithm tends to quickly produce balanced clusters of similar sizes in the kernel feature space,which makes it efficient and effective for reducing training samples.Theoretical analysis and experimental results on three UCI real data benchmarks both show that,with very short sampling time,the proposed algorithm dramatically accelerates SVM sampling and training while maintaining high test accuracy. 展开更多
关键词 support vector machines(SVMs) sample reduction topdown hierarchical clustering kernel bisecting k-means
下载PDF
基于共词分析的文本主题词聚类与主题发现 被引量:34
8
作者 王小华 徐宁 谌志群 《情报科学》 CSSCI 北大核心 2011年第11期1621-1624,共4页
文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法... 文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。 展开更多
关键词 共词分析 TF-IDF 共词矩阵 bisecting k-means 主题
原文传递
基于用户浏览行为的兴趣识别管理模型 被引量:19
9
作者 刘洪伟 高鸿铭 +2 位作者 陈丽 詹明君 梁周扬 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第2期74-85,共12页
【目的】了解用户在线购物中的兴趣需求变化有利于个性化推荐。本文提出结合用户浏览行为分析的隐式动态兴趣识别和管理模型。【方法】通过三阶段实验构造用户点击流数据,以天猫和淘宝网页功能键为数据粒度对页面分类,再采用Bisecting K... 【目的】了解用户在线购物中的兴趣需求变化有利于个性化推荐。本文提出结合用户浏览行为分析的隐式动态兴趣识别和管理模型。【方法】通过三阶段实验构造用户点击流数据,以天猫和淘宝网页功能键为数据粒度对页面分类,再采用Bisecting K-means聚类算法进行兴趣状态挖掘,最后总结归纳兴趣与行为的特征映射。【结果】用户隐式兴趣存在4种状态:关注、理解信息、态度和购买意图,在态度和购买意图状态下,更倾向于产生购买;在不同状态的浏览路径特征有所差异。【局限】未添加网页广告促销等非结构化数据进行分析。【结论】从实时动态兴趣的角度,对购物决策中兴趣的状态进行验证挖掘,拓展动态兴趣研究;为电商网站管理用户行为提供了一个实现动态个性化推荐的视角。 展开更多
关键词 隐式兴趣 点击流 bisecting k-means算法
原文传递
基于汉英词性组合的短语级平行语料类别知识挖掘研究 被引量:1
10
作者 王东波 韩普 +1 位作者 沈耕宇 沈思 《图书情报工作》 CSSCI 北大核心 2013年第11期106-111,145,共7页
基于通过具体实验确定的Bisecting K-means聚类和Lemmatization形态变换算法,在汉英短语级人文社会科学平行语料基础上,尝试进行类别知识挖掘的实验。在中文社会科学引文索引(CSSCI)的类别和标题知识基础上,完成对汉英语料的预处理,并... 基于通过具体实验确定的Bisecting K-means聚类和Lemmatization形态变换算法,在汉英短语级人文社会科学平行语料基础上,尝试进行类别知识挖掘的实验。在中文社会科学引文索引(CSSCI)的类别和标题知识基础上,完成对汉英语料的预处理,并分析名词、动词和形容词的分布状况。在名词、动词和形容词等词性的组合基础上,对比不同词性组合的效果并确定最优的词性组合类别知识挖掘模型。 展开更多
关键词 词性组合bisecting k-means汉英平行语料库 类别知识
原文传递
Time-of-use Pricing Model Considering Wind Power Uncertainty 被引量:3
11
作者 Gang Zhang Ye Yan +4 位作者 Kaoshe Zhang Pingli Li Meng Li Qiang He Hailiang Chao 《CSEE Journal of Power and Energy Systems》 SCIE EI CSCD 2022年第4期1039-1047,共9页
Large-scale new energy pressures on the grids bring challenges to power system's security and stability.In order to optimize the user's electricity consumption behavior and ease pressure,which is caused by new... Large-scale new energy pressures on the grids bring challenges to power system's security and stability.In order to optimize the user's electricity consumption behavior and ease pressure,which is caused by new energy on the grid,this paper proposes a time-of-use price model that takes wind power uncertainty into account.First,the interval prediction method is used to predict wind power.Then typical wind power scenes are selected by random sampling and bisecting the K-means algorithm.On this basis,integer programming is used to divide the peak-valley period of the multi-scenes load.Finally,under the condition of many factors such as user response based on consumer psychology,user electricity charge and power consumption,this paper takes the peak-valley difference of equivalent net load and the user dissatisfaction degree as the goal,and using the NSGA-II multi-objective optimization algorithm,evaluates the Pareto solution set to obtain the optimal solution.In order to test the validity of the model proposed in this paper,we apply it to an industrial user and wind farms in Yan'an city,China.The results show that the model can effectively ensure the user's electrical comfort while achieving the role of peak shaving and valley flling. 展开更多
关键词 bisecting k-means algorithm interval prediction integer programming NSGA-II algorithm peakvalley difference time-of-use price user dissatisfaction wind power uncertainty
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部