-
题名基于时间重定标的人类行为时间特性成因研究
- 1
-
-
作者
卞正宇
杨丹
朱世玲
-
机构
南京邮电大学计算机学院
-
出处
《计算机技术与发展》
2020年第1期179-182,共4页
-
基金
国家“863”高技术发展计划项目(2006AA01Z201)
-
文摘
随着大数据技术的发展,人类社会活动积累了海量的数据。通过这些数据,对人类活动的时空特性进行分析发现人类活动的时间间隔表现出近似幂律分布的特点,并且人类活动的幂律指数随用户活跃性的提高而增长。为了研究这种幂律现象的成因,提出了一种改进的时间重定标算法,选取个体两个相继行为发生的时间间隔内,同一时间其他个体所发生的行为总数与该个体平均时间间隔的乘积作为新的时间度量。新的算法可以消除用户活跃性的周期和波动对实验结果的影响,并且兼顾个体活跃性的作用。最后以该度量重新对个体行为的时间间隔分布进行了分析。实验结果表明,在新的时间度量下,其仍然表现出幂律的分布特点。说明人类活动的幂律特性的成因与用户活跃性的周期和波动无关,而是由个体内禀的特性引起。
-
关键词
人类行为
幂律分布
活跃周期性
时间重定标
人格特性
-
Keywords
human behavior
power law distribution
attractiveness periodicity
redefined interevent time
personality characteristics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
N94
[自然科学总论—系统科学]
-
-
题名基于改进的K-means算法在文本挖掘中的应用
被引量:9
- 2
-
-
作者
杨丹
朱世玲
卞正宇
-
机构
南京邮电大学计算机学院
-
出处
《计算机技术与发展》
2019年第4期68-71,共4页
-
基金
国家"863"高技术发展计划项目(2006AA01Z201)
-
文摘
K-means算法具有简单易于理解的特征,广泛运用于聚类过程中,但是其初始聚类中心是随机确定的,这样极容易导致聚类结果的稳定性很差。针对传统K-means算法对于初始聚类中心选择的敏感性及最大最小距离法容易选取离散点的不足,提出了一种新的聚类中心选择评判函数,依次考察每个点的函数值,选取当前函数值最大的点作为新的聚类中心,直到满足事先确定的聚类中心数。新聚类中心评判函数既可以保证新中心点周围是紧凑的,又可以保证远离其他中心点。最后将该算法运应用于文本聚类之中,根据准确率、召回率及F度量值来衡量算法的聚类质量。实验结果表明,该算法相对于传统算法和最大最小距离算法,准确率更高,聚类质量更好,较适合于文本聚类。
-
关键词
K-MEANS算法
聚类中心
文本聚类
文本距离
稀疏度
-
Keywords
K-means algorithm
clustering center
text clustering
text distance
sparseness
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-