期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
融合情感极性和逻辑回归的虚假评论检测方法 被引量:16
1
作者 赵军 王红 《智能系统学报》 CSCD 北大核心 2016年第3期336-342,共7页
在线购物评论为消费者比较商品的质量和其他一些购买特性提供了有用信息,然而却有大量的虚假评论者受利益驱使撰写虚假或者不公正的评论来迷惑消费者。先前的研究一般都是使用文本相似度和评分模式来探测虚假评论,这些算法可以检测特定... 在线购物评论为消费者比较商品的质量和其他一些购买特性提供了有用信息,然而却有大量的虚假评论者受利益驱使撰写虚假或者不公正的评论来迷惑消费者。先前的研究一般都是使用文本相似度和评分模式来探测虚假评论,这些算法可以检测特定类型的攻击者,在现实场景中许多虚假评论者刻意模仿正常用户对商品进行评论,因此先前的算法对检测这类攻击效果不佳。本文通过分析评论文本的感情极性,抽取不同的特征并使用逻辑回归模型来检测虚假评论;首先,借用自然语言处理的相关技术来分析评论文本的情感极性,判断每个用户的情感偏离大众情感的程度,如果偏离越大则说明其是虚假评论者的概率就越大;然后再选取其他几个重要特征结合逻辑回归模型进行虚假检测;通过实验对比,表明了该方法取得了较好的效果。 展开更多
关键词 电子商务 虚假评论 购物行为 情感极性 逻辑回归
下载PDF
一种改进的融合关联词典的微博倾向性分析方法 被引量:1
2
作者 赵军 王红 朱华方 《数据采集与处理》 CSCD 北大核心 2016年第6期1220-1227,共8页
大多数研究者对微博倾向性分析过多关注的是情感词、形容词和否定词,忽略了关联词对其情感倾向的影响。为了提高微博情感倾向性分析的准确率,提出了融合关联词的微博倾向性分析方法,考虑微博文本中形容词、程度副词以及关联词之间的组... 大多数研究者对微博倾向性分析过多关注的是情感词、形容词和否定词,忽略了关联词对其情感倾向的影响。为了提高微博情感倾向性分析的准确率,提出了融合关联词的微博倾向性分析方法,考虑微博文本中形容词、程度副词以及关联词之间的组合关系。本文充分考虑了关联词的结构特点并在已有词典的基础上构建专门用于微博倾向性分析的微博词典、否定词词典和关联词词典,同时考虑到网络新词对微博倾向性的影响,还构建了一个全新的网络新词词典。借助支持向量机(Support vector machine,SVM)将微博文本分为负向、正向和中性3类,通过结合情感词典和SVM的方法提高微博文本倾向性分析的准确率。通过对COASE 2014数据实验可以表明,本文方法对微博倾向性分析取得了较好的效果。 展开更多
关键词 中文微博 倾向分析 支持向量机 关联词
下载PDF
基于语义语法分析的中文语句困惑度评价 被引量:13
3
作者 何天文 王红 《计算机应用研究》 CSCD 北大核心 2017年第12期3538-3542,3546,共6页
目前用来评价机器翻译系统译文质量的方法主要有IBM提出的BLEU、TER和METEOR等方法,分别以词汇的重现率、译文与参考译文之间的编辑距离和语言学知识等特征作为评价依据,在判定中文句子的困惑度方面具有一定局限性。提出在依存语法分析... 目前用来评价机器翻译系统译文质量的方法主要有IBM提出的BLEU、TER和METEOR等方法,分别以词汇的重现率、译文与参考译文之间的编辑距离和语言学知识等特征作为评价依据,在判定中文句子的困惑度方面具有一定局限性。提出在依存语法分析的基础上,通过对中文句子及其句子主干的语法和语义两方面进行分析得出中文句子的困惑度。实验证明这种方法比通过译文加权改进后的BLEU方法准确率高出4%。 展开更多
关键词 困惑度 病句 语法 语义 机器翻译
下载PDF
COPD多维特征提取与集成诊断方法 被引量:5
4
作者 房有丽 王红 +2 位作者 狄瑞彤 王露潼 宋永强 《计算机应用研究》 CSCD 北大核心 2019年第10期2925-2929,共5页
目前对慢性阻塞性肺疾病(COPD)的研究存在局限性,一方面,研究成果只利用数据分析单一特征对疾病的影响;另一方面,研究成果仅通过简单算法模型对病例数据验证,因此提出了COPD多维特征提取与集成诊断方法。首先,提出最大依赖度MDF-RS算法... 目前对慢性阻塞性肺疾病(COPD)的研究存在局限性,一方面,研究成果只利用数据分析单一特征对疾病的影响;另一方面,研究成果仅通过简单算法模型对病例数据验证,因此提出了COPD多维特征提取与集成诊断方法。首先,提出最大依赖度MDF-RS算法,提取多维特征的最优组合;其次,提出DSA-SVM集成模型,构建分类器进行诊断及预测;最后,利用交叉验证方法验证准确率等各项性能指标。通过实验对比验证了提出算法的有效性。 展开更多
关键词 慢性阻塞性肺疾病 多维特征 集成方法 交叉验证
下载PDF
融合评分-评价一致性和多维时间序列的虚假评论识别方法 被引量:5
5
作者 房有丽 王红 《小型微型计算机系统》 CSCD 北大核心 2018年第9期2044-2049,共6页
在线商品评论是指导客户购买行为的重要依据.虚假的评论无疑严重地误导消费者,为营造公平公正的在线购物环境带来巨大挑战.前人的研究主要分别依据评分或评论进行检测,一方面,研究成果没有斟辨评论内容与其评分的一致性,因为很多不真实... 在线商品评论是指导客户购买行为的重要依据.虚假的评论无疑严重地误导消费者,为营造公平公正的在线购物环境带来巨大挑战.前人的研究主要分别依据评分或评论进行检测,一方面,研究成果没有斟辨评论内容与其评分的一致性,因为很多不真实的评论与其评分是不一致的;另一方面,研究成果没有考虑评论时间对识别虚假评论的影响,因为虚假评论使得一段时间内评论数量及评分会出现突变.因此,本文提出融合评分-评价一致性和多维时间序列的虚假评论识别方法.首先,根据在线商品评论的特点,分析评论文本的情感极性,判断与其评分的一致性;其次,考虑时间因素对评分及评论数量的影响,构建基于多维时间序列的虚假评论检测模型;最后,使用将抽取的多个虚假评论特征进行融合,构建出虚假评论检测分类器.通过实验对比验证了本文方法的有效性. 展开更多
关键词 虚假评论 时间序列 情感极性 逻辑回归
下载PDF
基于FT-LSTM模型的临床事件诊断序列预测研究 被引量:4
6
作者 王露潼 王红 +1 位作者 宋永强 王倩 《计算机应用研究》 CSCD 北大核心 2020年第10期2961-2965,2970,共6页
针对不同患者的临床数据信息难以得到合理表示,且事件之间时间间隔不同,从而导致预测困难等问题,提出一种基于词向量表示,并添加时控单元的时控长短期记忆神经网络(FT-LSTM)预测模型。首先通过FastText方法对医学事件进行可解释性的向... 针对不同患者的临床数据信息难以得到合理表示,且事件之间时间间隔不同,从而导致预测困难等问题,提出一种基于词向量表示,并添加时控单元的时控长短期记忆神经网络(FT-LSTM)预测模型。首先通过FastText方法对医学事件进行可解释性的向量表示,用以更有效地捕获富含医学信息的概念关系;然后针对临床数据对时间戳有着强依赖性的现象,在原有LSTM模型的基础上设计时控门,以更好地捕获长短期信息,对事件信息进行建模,从而改善预测表现。在MIMIC-Ⅲ数据集上的实验结果表明,使用FT-LSTM模型预测的召回率、准确率皆高于多种对比模型,证明了该方法的有效性。 展开更多
关键词 电子病历 长短期记忆神经网络 词向量表示 医学概念 可变时间间隔
下载PDF
基于词语相关性的对话系统话题分割 被引量:3
7
作者 何天文 王红 刘海燕 《计算机应用研究》 CSCD 北大核心 2019年第4期1010-1014,共5页
针对开放域对话系统中存在的话题转移问题以及对话内容中存在大量短文本的情况,传统的基于相似性的处理方法存在很大的局限性,创新地提出通过对话系统中前后句子的相关性判断分割点实现话题分割,并比较了相关性与相似性在计算中对句子... 针对开放域对话系统中存在的话题转移问题以及对话内容中存在大量短文本的情况,传统的基于相似性的处理方法存在很大的局限性,创新地提出通过对话系统中前后句子的相关性判断分割点实现话题分割,并比较了相关性与相似性在计算中对句子信息利用的不同之处。提出一种相关性计算方法,并将该方法应用于话题分割,最终实现话题转移检测。通过与现有方法的对比实验,表明了提出的相关性计算方法的有效性。 展开更多
关键词 相关性 话题分割 话题转移 对话系统
下载PDF
基于多模态深度融合模型的广告点击率预估 被引量:2
8
作者 宋永强 王红 王露潼 《小型微型计算机系统》 CSCD 北大核心 2019年第12期2538-2544,共7页
互联网广告效果的研究是网络营销的研究重点,无论是品牌广告或效果广告,合适的互联网广告设计效果将直接影响网络营销商的利益与用户的体验.现阶段,广告运营商的投放策略、广告创意优化、定向人群、媒体选择都以点击率为重要条件,精准... 互联网广告效果的研究是网络营销的研究重点,无论是品牌广告或效果广告,合适的互联网广告设计效果将直接影响网络营销商的利益与用户的体验.现阶段,广告运营商的投放策略、广告创意优化、定向人群、媒体选择都以点击率为重要条件,精准的点击率预估可以精细化权衡和保障用户、广告、平台三方利益.为了更加准确的预估点击率本文定向研究用户行为方式,选择马尔科夫链模型处理用户行为信息,利用频繁序列挖掘用户行为特点消除用户间无差异性假设,基于在线学习方法融合特征构建深度神经网络,获得特征的高阶非线性表达,建立多模态深度融合(Multimodal Depth Integration MDI)模型用于点击率预估.实验结果表明,提出的多模态深度融合模型的表示能力和鲁棒性都优于各基线模型,取得不错的预测效果. 展开更多
关键词 马尔科夫链 无差别假设 深度神经网络 多模态深度融合模型
下载PDF
基于印象空间的互联网广告效果评价 被引量:2
9
作者 宋永强 王红 +1 位作者 王露潼 胡晓红 《计算机应用研究》 CSCD 北大核心 2020年第5期1326-1331,1363,共7页
互联网广告效果评价是网络营销的核心问题,评价方法存在信息源单一、无差别假、全局假设等问题,对互联网广告效果评价提出了巨大挑战。寻找一种全新的衡量互联网广告效果的评价指标成为亟待解决的任务。首先,创新地提出印象空间概念,作... 互联网广告效果评价是网络营销的核心问题,评价方法存在信息源单一、无差别假、全局假设等问题,对互联网广告效果评价提出了巨大挑战。寻找一种全新的衡量互联网广告效果的评价指标成为亟待解决的任务。首先,创新地提出印象空间概念,作为更有效的网页广告效果评价指标,以解决信息源单一问题;其次,分析用户类型、行为方式、行为过程等特征对互联网广告效果评价标准的影响,消除用户无差异假设所造成的评价偏差;再次,引入网页的局部性特征,分析页面布局、广告与页面内容相关性等因素对互联网广告效果的影响,以消除全局性假设;最后,构建基于多模态特征的印象空间模型来预测互联网广告效果。实验结果表明,提出的印象空间对互联网广告质量评价的准确率显著提升,达到92.4%。而且印象空间模型的预测结果不仅更加准确科学,而且具有明显的可解释性。 展开更多
关键词 印象空间 用户行为 兴趣区域 互联网广告效果
下载PDF
融合并行投票决策树和半监督学习的鼠标轨迹识别方法 被引量:2
10
作者 孟广婷 王红 刘海燕 《小型微型计算机系统》 CSCD 北大核心 2018年第9期2050-2055,共6页
本文针对已有鼠标轨迹识别方法存在的问题,提出了一种基于并行投票决策树的半监督鼠标轨迹识别方法.首先,本文对鼠标轨迹进行分析,根据多尺度特征思想提取出包括局部轨迹在内的105个特征,并对鼠标轨迹特征进行了划分.其次,本文提出了鼠... 本文针对已有鼠标轨迹识别方法存在的问题,提出了一种基于并行投票决策树的半监督鼠标轨迹识别方法.首先,本文对鼠标轨迹进行分析,根据多尺度特征思想提取出包括局部轨迹在内的105个特征,并对鼠标轨迹特征进行了划分.其次,本文提出了鼠标轨迹识别的半监督学习方法,避免过拟合和数据噪声的影响.最后,为了提高方法的效率,本文提出并行投票决策树模型,训练多尺度特征,对人的鼠标轨迹和机器鼠标轨迹进行分类.实验结果显示,本文方法具有较好的性能. 展开更多
关键词 鼠标轨迹识别 多尺度 半监督 并行投票决策树
下载PDF
多重因素下基于多模态特征的网页广告效果
11
作者 胡晓红 王红 +1 位作者 任衍具 周莹 《计算机应用》 CSCD 北大核心 2018年第4期987-994,共8页
虽然互联网广告效果的相关研究已取得较好成果,但仍缺乏对网页中各条目与广告间相互作用的深入研究,也缺乏不同因素作用下用户行为和广告效果的透彻分析,广告衡量标准也存在不足。因此,提出一种基于多模态特征融合的方法针对多重因素作... 虽然互联网广告效果的相关研究已取得较好成果,但仍缺乏对网页中各条目与广告间相互作用的深入研究,也缺乏不同因素作用下用户行为和广告效果的透彻分析,广告衡量标准也存在不足。因此,提出一种基于多模态特征融合的方法针对多重因素作用下的互联网广告效果与用户行为模式进行研究。通过对多模态特征进行定量分析,验证广告的吸引力效应,总结不同条件下的注意力效应;针对用户行为信息进行频繁模式挖掘,并结合数据特点提出DFBP算法定向挖掘用户最常见的浏览模式;提出将记忆力作为衡量广告质量的一项新指标,利用频繁模式改进Random Forest算法,融合多模态特征构建广告记忆力模型。实验结果表明,所构建的记忆力模型不仅准确率高达91.64%,且具有良好的鲁棒性。 展开更多
关键词 认知风格 多模态 频繁模式 记忆力 眼动追踪 网页广告
下载PDF
基于多元线性回归的电影票房预测研究 被引量:5
12
作者 胡晓红 王红 《信息技术与信息化》 2018年第2期183-185,共3页
近年来,随着电影行业越来越热门,由此为影院带来了丰厚的票房收入,但传统影院都是依靠人工经验拍片,在电影上映前,凭借历史经验对电影的场次进行排片,由于影片的票房收入受多方因素的影响,拍片多的电影可能最后的票房达不到预期收益,导... 近年来,随着电影行业越来越热门,由此为影院带来了丰厚的票房收入,但传统影院都是依靠人工经验拍片,在电影上映前,凭借历史经验对电影的场次进行排片,由于影片的票房收入受多方因素的影响,拍片多的电影可能最后的票房达不到预期收益,导致影院因安排场次失误而损失很多票房收入。为了有效提高电影拍片收益,本文通过数据分析,利用方差分析原理选择与电影票房相关的特征,并利用多元线性模型预估电影票房,为影院场次拍片提供了指导。同时,本文使用主成分分析方法揭示票房收入和哪些因素更相关,为电影制作方分配资源提供了一定的指导。通过测试数据测验,显示本方法取得了较好的效果。 展开更多
关键词 票房预测 线性回归 方差分析 特征选择 主成分分析
下载PDF
基于时间衰减和用户相似权重的推荐算法
13
作者 刘冬冬 王红 《信息技术与信息化》 2016年第6期53-58,共6页
基于二部图网络结构的推荐算法(NBI)是解决用户-项目推荐一个很好的方式,将用户能够赋予节点的资源值,均匀的分配到与它相邻的对象节点。基于时间衰减和用户相似权重的推荐算法(TUserCF)对原二部图网络结构算法进行了改进,把推荐算法中... 基于二部图网络结构的推荐算法(NBI)是解决用户-项目推荐一个很好的方式,将用户能够赋予节点的资源值,均匀的分配到与它相邻的对象节点。基于时间衰减和用户相似权重的推荐算法(TUserCF)对原二部图网络结构算法进行了改进,把推荐算法中用户选择对象的时间因素考虑进去,在节点之间资源分配过程中,并不是将相邻节点的资源等分给相邻节点,而是根据用户选择对象的时间以及用户与用户间的相似度对分配系数加以调整,最后将拥有更多资源值并且具有时效性的评分更高的对象优先列入推荐列表推荐给用户。通过在数据集上的实验表明,这种基于时间衰减和用户相似权重的推荐算法相比于其他算法,显著提高了平均准确率,降低了召回率。这说明该算法能显著提高推荐列表中被推荐对象的准确性,因此具有很强的应用价值。 展开更多
关键词 二部图网络结构 推荐算法 时间衰减 资源分配 用户相似度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部