-
题名ELPS:一种高效的微博信息传播轨迹提取算法
被引量:3
- 1
-
-
作者
王悦
黄威靖
-
机构
中央财经大学信息学院计算机系
北京大学信息科学技术学院
-
出处
《计算机科学》
CSCD
北大核心
2014年第4期233-238,255,共7页
-
基金
国家自然科学基金(60970143
61272398)
+1 种基金
北京市教委共建项目
中央财经大学研究生教育改革项目资助
-
文摘
近年来,随着社会性网络服务应用(SNS)的流行与发展,SNS已成为人与人之间重要的交流渠道。SNS中大量用户产生的数据内容包含了社会网络中信息传播的客观知识,由此SNS可用于研究社会网络中公众舆论的变化趋势及信息传播的相关规律。由于SNS服务中节点规模大、其用户间的信息传播通常出现离散而稀疏的情况,需要高效的信息传播观察手段。为解决该问题,提出信息传播轨迹用于研究社会网络中信息传播的基本规律,具体的方法为:(1)提出信息传播轨迹(info-trajectory)模型以记录社会网络中信息传播的具体路径;(2)针对微博社会网络,提出几个高效的信息传播轨迹抽取算法;(3)根据已获取的信息传播轨迹研究用户间转发信息行为的时序规律;(4)提出算法K-advocators-discover用于发现社会网络中促进信息传播的top-k名用户;(5)提供充分的实验测试来将所提方法用于抽取新浪微博上热点话题信息的传播轨迹,并采用K-advocators-discover算法分析新浪微博中促进信息传播的用户。实验结果验证,所提方法能高效地提取微博中信息传播轨迹,挖掘其中促进信息传播的用户。
-
关键词
社会网络
图挖掘
信息传播轨迹
-
Keywords
Social network
Graph mining
Information trajectory
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名面向维吾尔跨文字搜索引擎的统一转换机制设计
被引量:4
- 2
-
-
作者
依不拉音.乌斯曼
王悦
-
机构
新疆财经大学计算机科学与工程学院
中央财经大学信息学院计算机系
-
出处
《计算机科学》
CSCD
北大核心
2016年第S2期77-82,共6页
-
基金
新疆财经大学科研基金:维吾尔语言文字信息化进程研究(2014XYB006)
国家自然科学基金(61503422)
北京市社会科学基金(15JGC150)资助
-
文摘
随着近年互联网技术在新疆地区的发展和普及,大量维语网站如雨后春笋般涌现。由于历史原因,维文呈现老维文、新维文、拉丁维文、西里尔维文等多种字母体系共存的"一语多文"的特点。现有的维文搜索引擎仅支持老维文,然而,目前国际通行的主流维语交流字母体系以拉丁维文及西里尔维文居多。由此,如何设计支持维文"一语多文"特点的维文搜索引擎将是维文信息检索研究领域的重要挑战,其研制成果将对广大维族网民的日常互联网使用及国家的"一带一路"战略产生深远的影响。研究拉丁维文、西里尔维文和老维文之间的转换规则;提出Unicode字符编码体系和Unicode字符编码转换算法,实现在维语搜索引擎系统中通过拉丁维文和西里尔维文来直接检索老维文网页内容,弥补了当前维文搜索引擎系统的空白;通过翔实的实验,验证了所提的LCCU编码转换率达到100%,拉丁维文和西里尔维文的检索效果与老维文完全一致。
-
关键词
维文信息检索
维文搜索引擎
跨文字转换机制
-
Keywords
Uyghur information retrieval
Uyghur search engine
Cross-character converting mechanism
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-