-
题名流数据环境下基于k集合覆盖的分布式标签共现算法
被引量:1
- 1
-
-
作者
朱明
李跃新
-
机构
湖北大学计算机与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2016年第2期428-430,434,共4页
-
基金
湖北省重大科技支持项目(2014BAA089)
-
文摘
通过分析集值属性的标签共现频率,可以挖掘频繁模式以及进行异常的检测。为了提高标签共现计算的性能,提出了一种流数据环境下基于k集合覆盖的分布式标签共现算法。采用多集合的容斥原理对标签共现问题进行了分析,并提出了一种分布式标签共现计算流程;通过引入信息检索中的倒排索引对标签及其出处进行索引,基于k集合覆盖的思想将整个倒排索引划分到多个分布式从节点上,并根据流数据的变化动态地更新每个从节点的局部索引,在对所有从节点的结果进行汇聚后得到最终结果。实验表明,提出的基于k集合覆盖的分布式标签共现算法与其他算法相比较,不仅具有较低的平均更新时间,而且使用更少的索引副本,因而更适用于大规模流数据的标签共现计算。
-
关键词
流数据
分布式标签
共现算法
k集合覆盖
-
Keywords
streaming data
distributed tag
co-occurance algorithm
k-set-cover
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Hubness与类加权的k最近邻分类算法
被引量:6
- 2
-
-
作者
李金孟
林亚平
祝团飞
-
机构
湖南大学信息科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第4期248-252,261,共6页
-
文摘
针对高维不平衡数据中维数灾难和类不平衡分布问题,提出一种改进k最近邻(kNN)分类算法HWNN。将样本的k发生分布作为其在预测时对各个类的支持度,以此减少高维数据中hubs对kNN分类带来的潜在负面影响。通过类加权的方式增加少数类在所有样本k发生中的分布比例,以提升对少数类样本的预测精度。在16个不平衡UCI数据集上的实验结果表明,该算法在高维不平衡数据中的分类结果优于典型kNN方法,且在普通维度的不平衡数据中优势同样明显。
-
关键词
Hubness现象
高维不平衡数据
维数灾难
数据分类
k发生
k最近邻分类
-
Keywords
Hubness phenomenon
high-dimensional and unbalanced data
dimensionality curse
data classification
k-occur
k-Nearest Neighbor(kNN)classification
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名湘江衡阳段天然放射性核素水平调查
被引量:2
- 3
-
-
作者
肖峰
肖德涛
丘寿康
刘攀
苏家豪
王环宇
-
机构
南华大学核科学技术学院/氡湖南省重点实验室
-
出处
《辐射防护》
CAS
CSCD
北大核心
2018年第3期206-211,共6页
-
基金
环保部核与辐射安全监督管理技术项目(2016HBB05-2)
-
文摘
为了掌握湘江衡阳段天然放射性核素水平及来源,分别于枯水期(11—12月)、丰水期(4—6月),对湘江衡阳段和该段4条主要支流(舂陵水、蒸水、耒水、洣水)水中的U、Th、^(226)Ra、^(40)K、^(210)Po、^(210)Pb 6种天然放射性元素/核素进行了调查。测量结果表明:与长江水系及洞庭湖水系历年放射性水平均值相比,湘江衡阳段6种天然放射性核素中^(226)Ra、^(210)Po、^(210)Pb明显偏高,说明湘江衡阳段的确受到了放射性污染。4条支流中,舂陵水及蒸水放射性核素浓度异常,明显高于汇入前后的湘江水体的放射性活度浓度。因此,这两条支流区域可能存在放射性污染源头,应对这两条支流区域进行更深入的取样调查,找出其污染源。
-
关键词
湘江
衡阳
天然放射性核素
U
TH
226RA
40K
210Po
210Pb
-
Keywords
Xiangjiang river
Hengyang section
naturally occurring radionuclides
U
Th
226 Ra
40 K
210po
210pb
-
分类号
X832
[环境科学与工程—环境工程]
-
-
题名入室盗窃犯罪时段分布特征分析
被引量:3
- 4
-
-
作者
陈鹏
瞿珂
胡啸峰
曾昭龙
-
机构
中国人民公安大学信息技术与网络安全学院
北京市公安局情报信息中心
-
出处
《中国刑警学院学报》
2018年第2期41-44,共4页
-
基金
国家"十二五"科技支撑计划项目(编号:2015BAK12B03)
-
文摘
在犯罪时间分析中,时段分析由于颗粒度较小,容易受到犯罪时间模糊性的影响。以某市的入室盗窃案件为样本,从报案时间和时段概率两个角度研究犯罪时间的分布特征。从结果来看,基于报案时间和时段概率的犯罪时间分布具有相同的统计分布特征,但在分布的集中度上存在着差别,主要表现为基于报案时间的时段分析容易低估夜间发案的可能性。在案发时间推断方面,基于时段概率的分析方法能够提供一种较为合理的解决方案,为公安部门进行警务工作提供有效的依据。
-
关键词
入室盗窃
犯罪时间
Gini指数
K-S检验
-
Keywords
Residential burglary Crime occurring time Gini index K-S test
-
分类号
D917
[政治法律—法学]
-