期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Python的多线程聚焦网络爬虫设计与实现
被引量:
3
1
作者
王美芝
支学超
刘财辉
《赣南师范大学学报》
2019年第6期35-38,共4页
在大数据时代下,人们要想从大量数据中找到自己需要的信息变得越来越困难,因此使用网络爬虫处理网络中大量的信息成为了必不可少的方法.本文利用Python语言设计并实现了一种多线程聚焦网络爬虫.首先,通过聚焦爬虫,获取目标网站数据,然...
在大数据时代下,人们要想从大量数据中找到自己需要的信息变得越来越困难,因此使用网络爬虫处理网络中大量的信息成为了必不可少的方法.本文利用Python语言设计并实现了一种多线程聚焦网络爬虫.首先,通过聚焦爬虫,获取目标网站数据,然后建立相应索引数据库.在爬取数据库的基础上,用户可以通过输入关键字,从多个网络地址URL中获取大量用户所需要的数据.
展开更多
关键词
PYTHON
网络爬虫
网络地址URL
多线程
下载PDF
职称材料
基于属性代表的多粒度集成分类算法
被引量:
1
2
作者
张清华
支学超
+2 位作者
王国胤
杨帆
薛付忠
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第8期1712-1729,共18页
面对复杂多变的信息系统,传统的机器学习多分类模型无法实现一个动态分类的过程.序贯三支决策作为一种多粒度分类算法,常用于解决多粒度空间下动态分类问题.然而,序贯三支决策在粗粒度空间下容易产生决策冲突,在细粒度空间下要考虑很多...
面对复杂多变的信息系统,传统的机器学习多分类模型无法实现一个动态分类的过程.序贯三支决策作为一种多粒度分类算法,常用于解决多粒度空间下动态分类问题.然而,序贯三支决策在粗粒度空间下容易产生决策冲突,在细粒度空间下要考虑很多属性导致其分类效率不高以及无法对最终未分类对象进行处理.因此,本文结合集成学习和粒计算的思想提出了一种基于属性代表的多粒度集成分类算法.首先,通过选择每一粒层中分类能力较强的属性作为属性代表来构建分类器,形成基于属性代表的集成分类器.其次,通过评分表保留粗粒度空间下分类器的分类意见以减少细粒度下需要考虑的属性个数.最后,采用“相对最优”的策略,将反对率最少的决策类作为最终未分类对象的分类结果.通过实验验证,本文方法相比于序贯三支决策以及其他机器学习的多分类算法具有较好的鲁棒性、分类效率以及分类性能.
展开更多
关键词
动态分类
序贯三支决策
集成学习
属性代表
多粒度
下载PDF
职称材料
融合相对密度与近邻关系的密度峰值聚类算法
被引量:
6
3
作者
代永杨
张清华
支学超
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2021年第5期791-805,共15页
密度峰值聚类算法(density peaks cluster,DPC)是一种基于密度的聚类算法,该算法可以聚类任意形状的类簇。在类簇间有密度差距的数据集上,DPC不能准确地选择聚类中心。DPC的非中心点分配策略会引起连续错误,影响算法的聚类效果。模糊k...
密度峰值聚类算法(density peaks cluster,DPC)是一种基于密度的聚类算法,该算法可以聚类任意形状的类簇。在类簇间有密度差距的数据集上,DPC不能准确地选择聚类中心。DPC的非中心点分配策略会引起连续错误,影响算法的聚类效果。模糊k近邻密度峰值算法(fuzzy k-nearest neighbor DPC,FKNN-DPC)是一种改进的DPC算法,该算法采用边界点检测并结合2步分配策略来避免连续错误。当类簇间有密度差距时,FKNN-DPC的边界点检测效果不理想,此外,其非中心点分配策略缺乏对样本近邻信息的考虑。定义相对密度(relative density)并结合近邻关系(nearest neighbor relationship)提出RN-DPC算法解决上述问题。针对DPC因为类簇间的密度差距而不能准确选择聚类中心的问题,定义相对密度用于消除类簇间的密度差距。基于反向k近邻关系检测边界点并且引入共享最近邻关系来对FKNN-DPC的分配策略进行改进。RN-DPC算法在人工数据集和真实数据集上分别与不同的聚类算法进行了对比,实验结果验证了RN-DPC算法的有效性和合理性。
展开更多
关键词
聚类
密度峰值
近邻关系
边界点检测
近邻分配
下载PDF
职称材料
题名
基于Python的多线程聚焦网络爬虫设计与实现
被引量:
3
1
作者
王美芝
支学超
刘财辉
机构
赣南师范大学体育学院
赣南师范大学数学与计算机科学学院
出处
《赣南师范大学学报》
2019年第6期35-38,共4页
基金
国家自然科学基金项目(61663002)。
文摘
在大数据时代下,人们要想从大量数据中找到自己需要的信息变得越来越困难,因此使用网络爬虫处理网络中大量的信息成为了必不可少的方法.本文利用Python语言设计并实现了一种多线程聚焦网络爬虫.首先,通过聚焦爬虫,获取目标网站数据,然后建立相应索引数据库.在爬取数据库的基础上,用户可以通过输入关键字,从多个网络地址URL中获取大量用户所需要的数据.
关键词
PYTHON
网络爬虫
网络地址URL
多线程
Keywords
Python
crawler
big data
network address URL
multithread
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于属性代表的多粒度集成分类算法
被引量:
1
2
作者
张清华
支学超
王国胤
杨帆
薛付忠
机构
旅游多源数据感知与决策技术文化和旅游部重点实验室
重庆邮电大学计算智能重庆市重点实验室
山东大学公共卫生学院
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第8期1712-1729,共18页
基金
国家重点研究发展计划(2020YFC2003502)
国家自然科学基金(61876201)
重庆市自然科学基金(cstc2019jcyj-cxttX0002)资助.
文摘
面对复杂多变的信息系统,传统的机器学习多分类模型无法实现一个动态分类的过程.序贯三支决策作为一种多粒度分类算法,常用于解决多粒度空间下动态分类问题.然而,序贯三支决策在粗粒度空间下容易产生决策冲突,在细粒度空间下要考虑很多属性导致其分类效率不高以及无法对最终未分类对象进行处理.因此,本文结合集成学习和粒计算的思想提出了一种基于属性代表的多粒度集成分类算法.首先,通过选择每一粒层中分类能力较强的属性作为属性代表来构建分类器,形成基于属性代表的集成分类器.其次,通过评分表保留粗粒度空间下分类器的分类意见以减少细粒度下需要考虑的属性个数.最后,采用“相对最优”的策略,将反对率最少的决策类作为最终未分类对象的分类结果.通过实验验证,本文方法相比于序贯三支决策以及其他机器学习的多分类算法具有较好的鲁棒性、分类效率以及分类性能.
关键词
动态分类
序贯三支决策
集成学习
属性代表
多粒度
Keywords
dynamic classification
sequential three-way decisions
ensemble learning
attribute representation
multi-granularity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合相对密度与近邻关系的密度峰值聚类算法
被引量:
6
3
作者
代永杨
张清华
支学超
机构
重庆邮电大学计算智能重庆市重点实验室
出处
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2021年第5期791-805,共15页
基金
国家重点研发计划(2020YFC2003502)
国家自然科学基金(61876201)。
文摘
密度峰值聚类算法(density peaks cluster,DPC)是一种基于密度的聚类算法,该算法可以聚类任意形状的类簇。在类簇间有密度差距的数据集上,DPC不能准确地选择聚类中心。DPC的非中心点分配策略会引起连续错误,影响算法的聚类效果。模糊k近邻密度峰值算法(fuzzy k-nearest neighbor DPC,FKNN-DPC)是一种改进的DPC算法,该算法采用边界点检测并结合2步分配策略来避免连续错误。当类簇间有密度差距时,FKNN-DPC的边界点检测效果不理想,此外,其非中心点分配策略缺乏对样本近邻信息的考虑。定义相对密度(relative density)并结合近邻关系(nearest neighbor relationship)提出RN-DPC算法解决上述问题。针对DPC因为类簇间的密度差距而不能准确选择聚类中心的问题,定义相对密度用于消除类簇间的密度差距。基于反向k近邻关系检测边界点并且引入共享最近邻关系来对FKNN-DPC的分配策略进行改进。RN-DPC算法在人工数据集和真实数据集上分别与不同的聚类算法进行了对比,实验结果验证了RN-DPC算法的有效性和合理性。
关键词
聚类
密度峰值
近邻关系
边界点检测
近邻分配
Keywords
cluster
density peaks
nearest neighbor relationship
boundary detection
nearest neighbor assignment
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Python的多线程聚焦网络爬虫设计与实现
王美芝
支学超
刘财辉
《赣南师范大学学报》
2019
3
下载PDF
职称材料
2
基于属性代表的多粒度集成分类算法
张清华
支学超
王国胤
杨帆
薛付忠
《计算机学报》
EI
CAS
CSCD
北大核心
2022
1
下载PDF
职称材料
3
融合相对密度与近邻关系的密度峰值聚类算法
代永杨
张清华
支学超
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2021
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部