-
题名基于结构相似度的大规模社交网络聚类算法
被引量:15
- 1
-
-
作者
陈季梦
陈佳俊
刘杰
黄亚楼
王嫄
冯霞
-
机构
南开大学计算机与控制工程学院
南开大学软件学院
中国民航大学民航信息技术科研基地
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2015年第2期449-454,共6页
-
基金
国家自然科学基金(61105049
61300166)
+3 种基金
中国民航信息技术科研基地开放课题基金(CAAC-ITRB-201303
CAAC-ITRB-201204)
天津市科技计划项目(13ZCZDGX01098)
天津市自然科学基金(14JCQNJC00600)资助课题
-
文摘
针对社交网络的有向交互性和大规模特性,该文提出一种基于结构相似度的有向网络聚类算法(Dir SCAN),以及相应的分布式并行算法(PDir SCAN)。考虑社交网络中节点间的有向交互性,将行为结构相似的节点聚集起来,并进行节点功能分析。针对社交网络规模巨大的特点,提出Map Reduce框架下的分布式并行聚类算法,在确保聚类结果一致的前提下,提高处理性能。大量真实数据集上的实验结果表明,Dir SCAN比无向网络聚类算法(SCAN)在F1上可提高2.34%的性能,并行算法PDir SCAN比Dir SCAN运行速度提升1.67倍,能够有效处理大规模的有向网络聚类问题。
-
关键词
社交网络
有向网络聚类
并行算法
MAP
REDUCE
-
Keywords
Social networks
Directed network clustering
Parallel algorithm
Map Reduce
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于半监督CRF的缩略词扩展解释识别
被引量:2
- 2
-
-
作者
陈季梦
刘杰
黄亚楼
刘天笔
刘才华
-
机构
南开大学信息技术科学学院
南开大学软件学院
-
出处
《计算机工程》
CAS
CSCD
2013年第4期203-209,共7页
-
基金
国家自然科学基金资助项目(61105049)
高等学校博士学科点专项科研基金资助项目(20100031110096)
中央高校基本科研业务费专项基金资助项目(65010571)
-
文摘
缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习。为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词。使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系。实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法。
-
关键词
扩展解释
半监督
条件随机场
序列熵
序列标注
-
Keywords
expansion interpretation
semi-supervised
conditional random field
sequence entropy
sequence labeling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名善用数字化 驱动财富管理“精耕细作”
- 3
-
-
作者
陈季梦
李雪
-
机构
天津滨海农商银行信息科技部
天津滨海农商银行零售及电子银行部
-
出处
《中国农村金融》
2021年第5期92-93,共2页
-
文摘
近年来,金融科技在金融服务领域扮演着愈发重要的角色.中小银行尤其是农村中小银行纷纷将金融科技列为重要科技战略,借助科技力量在经营区域内完成由传统展业与服务模式向以金融科技与数据运用为核心的智能化展业与服务模式转变,以实现在零售业务财富管理领域的“精耕细作”.
-
关键词
金融服务领域
经营区域
中小银行
零售业务
精耕细作
展业
数据运用
服务模式
-
分类号
F83
[经济管理—金融学]
-