期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
词性对新闻和微博网络话题检测的影响
被引量:
2
1
作者
冀俊忠
贝飞
+2 位作者
吴晨生
柴鹰
宋辰
《北京工业大学学报》
CAS
CSCD
北大核心
2015年第4期526-533,共8页
针对新闻和微博2组有代表性的语料开展实验研究,旨在发现不同词性特征及其组合对2种通用网络平台话题检测的作用及其影响.研究表明:在选择单一词性特征时,名词特征可得到最好的检测结果,命名实体可在保证准确率的情况下大大降低聚类的...
针对新闻和微博2组有代表性的语料开展实验研究,旨在发现不同词性特征及其组合对2种通用网络平台话题检测的作用及其影响.研究表明:在选择单一词性特征时,名词特征可得到最好的检测结果,命名实体可在保证准确率的情况下大大降低聚类的特征维度.在选择词性组合作为特征时,名词或命名实体、数词、时间短语、形容词以及量词的组合特征可提升新闻网络话题检测的准确率,而名词或命名实体、形容词、量词、数词以及特殊符号与网址的组合特征可在微博语料上获得较好的检测结果.
展开更多
关键词
话题检测
词性
文本特征
新闻
微博
下载PDF
职称材料
面向不均衡数据集的在线式异质媒体网络事件发现
被引量:
3
2
作者
赵学武
张新刚
+1 位作者
柴鹰
刘广亮
《科学技术与工程》
北大核心
2016年第16期227-232,共6页
随着互联网的发展,网络数据呈现出异质数据多、文本标签化、数据不均衡等特点,这使得传统的基于长文本在线式网络事件的方法逐渐失效。采用改进的Single Pass方法进行在线式异质媒体网络事件发现:首先,通过分析网络数据中的不均衡性,重...
随着互联网的发展,网络数据呈现出异质数据多、文本标签化、数据不均衡等特点,这使得传统的基于长文本在线式网络事件的方法逐渐失效。采用改进的Single Pass方法进行在线式异质媒体网络事件发现:首先,通过分析网络数据中的不均衡性,重新设计相似度计算公式;其次,设计滑动时间窗口来提高Single Pass的算法效率;最后在Flickr的SED2014数据集上开展实验。实验结果表明,提出的算法具有有效性和实用性。
展开更多
关键词
在线式
网络事件发现
单遍聚类
异质媒体
下载PDF
职称材料
基于时间片划分和多元数据融合的异质媒体网络社会事件发现
被引量:
2
3
作者
冀俊忠
柴鹰
贝飞
《北京工业大学学报》
CAS
CSCD
北大核心
2015年第8期1165-1171,共7页
为了能在大规模、多异质的网络环境下进行网络社会事件的有效检测,提出了一种基于时间片划分和多元数据融合的异质媒体网络社会事件发现方法.该方法首先采用时间片划分的方法,结合用户信息和时间信息来建立用户-时间(user-time,UT)数据...
为了能在大规模、多异质的网络环境下进行网络社会事件的有效检测,提出了一种基于时间片划分和多元数据融合的异质媒体网络社会事件发现方法.该方法首先采用时间片划分的方法,结合用户信息和时间信息来建立用户-时间(user-time,UT)数据模型以减小数据规模;然后通过多元数据线性叠加来整合不同元数据间的相似度并用基于密度的算法以完成社会事件的发现.在最新的SED 2014数据集上进行对比,实验结果表明:该方法与现有方法相比,具有数据处理速度快、事件发现准确率高的优点.
展开更多
关键词
大规模
异质媒体
网络社会事件发现
时间片划分
多元数据融合
下载PDF
职称材料
题名
词性对新闻和微博网络话题检测的影响
被引量:
2
1
作者
冀俊忠
贝飞
吴晨生
柴鹰
宋辰
机构
北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
北京市科学技术情报研究所
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2015年第4期526-533,共8页
基金
国家自然科学基金重点资助项目(613300194)
文摘
针对新闻和微博2组有代表性的语料开展实验研究,旨在发现不同词性特征及其组合对2种通用网络平台话题检测的作用及其影响.研究表明:在选择单一词性特征时,名词特征可得到最好的检测结果,命名实体可在保证准确率的情况下大大降低聚类的特征维度.在选择词性组合作为特征时,名词或命名实体、数词、时间短语、形容词以及量词的组合特征可提升新闻网络话题检测的准确率,而名词或命名实体、形容词、量词、数词以及特殊符号与网址的组合特征可在微博语料上获得较好的检测结果.
关键词
话题检测
词性
文本特征
新闻
微博
Keywords
topic detection
part-of-speeches
text feature
news
micro-blog
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向不均衡数据集的在线式异质媒体网络事件发现
被引量:
3
2
作者
赵学武
张新刚
柴鹰
刘广亮
机构
南阳师范学院软件学院
北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
南阳师范学院计算机与信息技术学院
出处
《科学技术与工程》
北大核心
2016年第16期227-232,共6页
基金
国家自然科学基金项目重点项目(613300194)
河南省科技计划项目(142300410044)
+3 种基金
河南省教育厅科学技术研究重点项目(14A520057
15B520022)
河南省基础与前沿技术研究项目(142300410396)
南阳师范学院校级项目(QN2015025)资助
文摘
随着互联网的发展,网络数据呈现出异质数据多、文本标签化、数据不均衡等特点,这使得传统的基于长文本在线式网络事件的方法逐渐失效。采用改进的Single Pass方法进行在线式异质媒体网络事件发现:首先,通过分析网络数据中的不均衡性,重新设计相似度计算公式;其次,设计滑动时间窗口来提高Single Pass的算法效率;最后在Flickr的SED2014数据集上开展实验。实验结果表明,提出的算法具有有效性和实用性。
关键词
在线式
网络事件发现
单遍聚类
异质媒体
Keywords
online
web events detection
single pass
heterogeneous media
分类号
TP393.02 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于时间片划分和多元数据融合的异质媒体网络社会事件发现
被引量:
2
3
作者
冀俊忠
柴鹰
贝飞
机构
北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2015年第8期1165-1171,共7页
基金
国家自然科学基金资助项目(613300194)
文摘
为了能在大规模、多异质的网络环境下进行网络社会事件的有效检测,提出了一种基于时间片划分和多元数据融合的异质媒体网络社会事件发现方法.该方法首先采用时间片划分的方法,结合用户信息和时间信息来建立用户-时间(user-time,UT)数据模型以减小数据规模;然后通过多元数据线性叠加来整合不同元数据间的相似度并用基于密度的算法以完成社会事件的发现.在最新的SED 2014数据集上进行对比,实验结果表明:该方法与现有方法相比,具有数据处理速度快、事件发现准确率高的优点.
关键词
大规模
异质媒体
网络社会事件发现
时间片划分
多元数据融合
Keywords
big data
heterogeneous media
social event detection
time-slice
multi metadata fusion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
词性对新闻和微博网络话题检测的影响
冀俊忠
贝飞
吴晨生
柴鹰
宋辰
《北京工业大学学报》
CAS
CSCD
北大核心
2015
2
下载PDF
职称材料
2
面向不均衡数据集的在线式异质媒体网络事件发现
赵学武
张新刚
柴鹰
刘广亮
《科学技术与工程》
北大核心
2016
3
下载PDF
职称材料
3
基于时间片划分和多元数据融合的异质媒体网络社会事件发现
冀俊忠
柴鹰
贝飞
《北京工业大学学报》
CAS
CSCD
北大核心
2015
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部