期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于半监督图聚类的项目主题模型构建方法
被引量:
1
1
作者
石林宾
余正涛
+2 位作者
严馨
宋海霞
洪旭东
《计算机科学》
CSCD
北大核心
2015年第5期119-123,共5页
项目文档主题表征的好坏直接影响后续评审专家的推荐效果。为有效利用项目文档片段之间的关联关系进行项目主题分析,提出一种基于半监督图聚类的项目主题模型构建方法。该方法首先分析项目文档的结构特点,提取项目名称、项目关键字等能...
项目文档主题表征的好坏直接影响后续评审专家的推荐效果。为有效利用项目文档片段之间的关联关系进行项目主题分析,提出一种基于半监督图聚类的项目主题模型构建方法。该方法首先分析项目文档的结构特点,提取项目名称、项目关键字等能表征主题的结构信息,结合专家证据文档、专家主题关系网等能表征专家主题的外部资源,定义及提取项目文档片段之间的关联关系特征;然后,利用不同类型的关联关系计算项目文档片段之间的相关性,构建项目文档片段间的无向图模型;最后,利用已标记关联关系特征作为聚类的监督信息,采用半监督图聚类算法对项目文档片段进行聚类,从而实现项目主题的提取。项目主题提取对比实验结果验证了所提方法的有效性,项目文档结构化特征、专家证据文档以及专家主题关系网对项目主题模型的构建具有一定的指导作用。
展开更多
关键词
主题模型
半监督图聚类
关联关系特征
评审专家推荐
下载PDF
职称材料
基于自适应聚类的虚假评论检测
被引量:
33
2
作者
宋海霞
严馨
+2 位作者
余正涛
石林宾
苏斐
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2013年第4期433-438,共6页
借助评论者的行为特性,提出一种基于评论者行为特征的自适应聚类的虚假评论检测方法.首先,根据评论数据定义自身基本特征以及与其他评论之间的关联性特征,并对每维特征进行归一化处理;其次,根据每一条评论的特征构建聚类矩阵,利用F统计...
借助评论者的行为特性,提出一种基于评论者行为特征的自适应聚类的虚假评论检测方法.首先,根据评论数据定义自身基本特征以及与其他评论之间的关联性特征,并对每维特征进行归一化处理;其次,根据每一条评论的特征构建聚类矩阵,利用F统计量对K均值算法进行改进,实现评论数据的自适应聚类;最后,计算每个簇偏离整个评论数据集的程度,根据阈值确定异常簇,从而实现虚假评论检测.利用领域评论数据进行实验,结果表明基于自适应聚类的虚假评论检测方法取得了较好的效果.
展开更多
关键词
虚假评论
自适应聚类
异常簇
F统计量
下载PDF
职称材料
基于特征映射的微博用户标签兴趣聚类方法
被引量:
5
3
作者
秦雨
余正涛
+2 位作者
王炎冰
石林宾
潘华山
《数据采集与处理》
CSCD
北大核心
2015年第6期1246-1252,共7页
针对现有的用户兴趣聚类方法没有考虑用户标签之间存在的语义相关性问题,提出了一种基于特征映射的微博用户标签兴趣聚类方法。首先,获取待分析用户及其所关注用户的用户标签,选取出现频数高于设定阈值的标签构建模糊矩阵的特征维;然后...
针对现有的用户兴趣聚类方法没有考虑用户标签之间存在的语义相关性问题,提出了一种基于特征映射的微博用户标签兴趣聚类方法。首先,获取待分析用户及其所关注用户的用户标签,选取出现频数高于设定阈值的标签构建模糊矩阵的特征维;然后,考虑标签之间的语义相关性,利用特征映射的思想将用户标签根据其与特征维标签之间的语义相似度映射到每个特征维下,计算每个特征维所对应的特征值;最后,利用模糊聚类得到了不同阈值下的用户兴趣聚类结果。实验结果表明,本文提出的基于特征映射的微博用户标签兴趣聚类方法有效地改善了用户兴趣聚类效果。
展开更多
关键词
微博
特征映射
模糊聚类
语义相似度
下载PDF
职称材料
基于半监督主动学习的虚假评论检测
被引量:
2
4
作者
宋海霞
严馨
+2 位作者
余正涛
石林宾
郭剑毅
《昆明理工大学学报(自然科学版)》
CAS
2015年第5期59-65,共7页
基于有监督的虚假评论检测方法受限于标注语料的规模,为了更好地利用未标注评论数据来提高分类器的正确率和泛化能力,本文提出一种基于半监督主动学习的虚假评论检测方法.首先,定义并提取评论内容特征以及评论者行为特征,结合这两类特...
基于有监督的虚假评论检测方法受限于标注语料的规模,为了更好地利用未标注评论数据来提高分类器的正确率和泛化能力,本文提出一种基于半监督主动学习的虚假评论检测方法.首先,定义并提取评论内容特征以及评论者行为特征,结合这两类特征来对虚假评论进行检测.然后,采用基于熵的主动学习算法选择对学习最有帮助的评论样本,获得其类别标注,将其合并到基于Tri-training的半监督学习算法的训练集中,利用大量未标注评论数据进行学习,提升分类器性能.最后,在领域评论数据集上进行实验,结果表明,将半监督学习与主动学习相结合,能够更有效的利用未标注评论数据,从而有效地提高虚假评论检测的效果.
展开更多
关键词
虚假评论
半监督学习
主动学习
TRI-TRAINING
原文传递
题名
基于半监督图聚类的项目主题模型构建方法
被引量:
1
1
作者
石林宾
余正涛
严馨
宋海霞
洪旭东
机构
昆明理工大学信息工程与自动化学院
出处
《计算机科学》
CSCD
北大核心
2015年第5期119-123,共5页
基金
国家自然科学基金(61175068)
国家中小企业创新基金(11C26215305905)
云南省教育厅基金重大专项项目资助
文摘
项目文档主题表征的好坏直接影响后续评审专家的推荐效果。为有效利用项目文档片段之间的关联关系进行项目主题分析,提出一种基于半监督图聚类的项目主题模型构建方法。该方法首先分析项目文档的结构特点,提取项目名称、项目关键字等能表征主题的结构信息,结合专家证据文档、专家主题关系网等能表征专家主题的外部资源,定义及提取项目文档片段之间的关联关系特征;然后,利用不同类型的关联关系计算项目文档片段之间的相关性,构建项目文档片段间的无向图模型;最后,利用已标记关联关系特征作为聚类的监督信息,采用半监督图聚类算法对项目文档片段进行聚类,从而实现项目主题的提取。项目主题提取对比实验结果验证了所提方法的有效性,项目文档结构化特征、专家证据文档以及专家主题关系网对项目主题模型的构建具有一定的指导作用。
关键词
主题模型
半监督图聚类
关联关系特征
评审专家推荐
Keywords
Topic model,Semi-supervised graph clustering, Association relationship features, Evaluation experts recommendation
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于自适应聚类的虚假评论检测
被引量:
33
2
作者
宋海霞
严馨
余正涛
石林宾
苏斐
机构
昆明理工大学信息工程与自动化学院
中国石油信息技术服务中心
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2013年第4期433-438,共6页
基金
国家自然科学基金(61175068)
云南省教育厅基金重大专项项目
教育部回国留学人员启动基金
文摘
借助评论者的行为特性,提出一种基于评论者行为特征的自适应聚类的虚假评论检测方法.首先,根据评论数据定义自身基本特征以及与其他评论之间的关联性特征,并对每维特征进行归一化处理;其次,根据每一条评论的特征构建聚类矩阵,利用F统计量对K均值算法进行改进,实现评论数据的自适应聚类;最后,计算每个簇偏离整个评论数据集的程度,根据阈值确定异常簇,从而实现虚假评论检测.利用领域评论数据进行实验,结果表明基于自适应聚类的虚假评论检测方法取得了较好的效果.
关键词
虚假评论
自适应聚类
异常簇
F统计量
Keywords
fake reviews
adaptive clustering
abnormal clusters
F statistic
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于特征映射的微博用户标签兴趣聚类方法
被引量:
5
3
作者
秦雨
余正涛
王炎冰
石林宾
潘华山
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
出处
《数据采集与处理》
CSCD
北大核心
2015年第6期1246-1252,共7页
基金
国家自然科学基金(61175068)资助项目
文摘
针对现有的用户兴趣聚类方法没有考虑用户标签之间存在的语义相关性问题,提出了一种基于特征映射的微博用户标签兴趣聚类方法。首先,获取待分析用户及其所关注用户的用户标签,选取出现频数高于设定阈值的标签构建模糊矩阵的特征维;然后,考虑标签之间的语义相关性,利用特征映射的思想将用户标签根据其与特征维标签之间的语义相似度映射到每个特征维下,计算每个特征维所对应的特征值;最后,利用模糊聚类得到了不同阈值下的用户兴趣聚类结果。实验结果表明,本文提出的基于特征映射的微博用户标签兴趣聚类方法有效地改善了用户兴趣聚类效果。
关键词
微博
特征映射
模糊聚类
语义相似度
Keywords
micro-blog
feature mapping
fuzzy clustering
semantic similarity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于半监督主动学习的虚假评论检测
被引量:
2
4
作者
宋海霞
严馨
余正涛
石林宾
郭剑毅
机构
昆明理工大学信息工程与自动化学院
云南省计算机技术应用重点实验室
出处
《昆明理工大学学报(自然科学版)》
CAS
2015年第5期59-65,共7页
基金
国家自然科学基金项目(61175068
61462055)
+3 种基金
云南省自然科学基金重点项目(2013FA030)
云南省软件工程重点实验室开放基金(2011SE14)
教育部回国人员基金
云南省教育厅基金重大专项资助
文摘
基于有监督的虚假评论检测方法受限于标注语料的规模,为了更好地利用未标注评论数据来提高分类器的正确率和泛化能力,本文提出一种基于半监督主动学习的虚假评论检测方法.首先,定义并提取评论内容特征以及评论者行为特征,结合这两类特征来对虚假评论进行检测.然后,采用基于熵的主动学习算法选择对学习最有帮助的评论样本,获得其类别标注,将其合并到基于Tri-training的半监督学习算法的训练集中,利用大量未标注评论数据进行学习,提升分类器性能.最后,在领域评论数据集上进行实验,结果表明,将半监督学习与主动学习相结合,能够更有效的利用未标注评论数据,从而有效地提高虚假评论检测的效果.
关键词
虚假评论
半监督学习
主动学习
TRI-TRAINING
Keywords
fake review
semi-supervised learning
active learning
Tri-training
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于半监督图聚类的项目主题模型构建方法
石林宾
余正涛
严馨
宋海霞
洪旭东
《计算机科学》
CSCD
北大核心
2015
1
下载PDF
职称材料
2
基于自适应聚类的虚假评论检测
宋海霞
严馨
余正涛
石林宾
苏斐
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2013
33
下载PDF
职称材料
3
基于特征映射的微博用户标签兴趣聚类方法
秦雨
余正涛
王炎冰
石林宾
潘华山
《数据采集与处理》
CSCD
北大核心
2015
5
下载PDF
职称材料
4
基于半监督主动学习的虚假评论检测
宋海霞
严馨
余正涛
石林宾
郭剑毅
《昆明理工大学学报(自然科学版)》
CAS
2015
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部