期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
面向在线顾客点评的属性依赖情感知识学习 被引量:1
1
作者 徐学可 谭松波 +2 位作者 刘悦 程学旗 吴琼 《中文信息学报》 CSCD 北大核心 2015年第3期121-129,149,共10页
该文研究属性依赖情感知识学习。首先提出了一个新颖的话题模型,属性观点联合模型(Joint Aspect/Opinion model,JAO),来同时抽取评论实体属性及属性相关观点词信息。在此基础上,对于各个属性,构造属性依赖的词关系图,并在该图上应用马... 该文研究属性依赖情感知识学习。首先提出了一个新颖的话题模型,属性观点联合模型(Joint Aspect/Opinion model,JAO),来同时抽取评论实体属性及属性相关观点词信息。在此基础上,对于各个属性,构造属性依赖的词关系图,并在该图上应用马尔科夫随机行走过程来计算观点词到少量褒、贬种子词的游走时间(Hitting Time),进而估计这些词的属性依赖的情感极性分值。在餐馆点评数据上的实验表明所提出的方法能有效抽取属性相关观点词,同时有效估计其属性依赖的情感极性分值。 展开更多
关键词 顾客点评 属性观点联合模型 游走时间 属性依赖情感知识
下载PDF
基于带汇点流形的面向属性抽取式观点摘要
2
作者 徐学可 谭松波 +1 位作者 刘悦 程学旗 《中文信息学报》 CSCD 北大核心 2014年第4期84-91,110,共9页
该文研究面向在线顾客点评的面向属性抽取式观点摘要问题。传统方法主要考虑如何抽取属性相关观点,该文提出进一步考虑观点的富含信息(informativeness)、重要性(salience)及多样性(diversity)这三方面要求。该文提出了一个基于带汇点... 该文研究面向在线顾客点评的面向属性抽取式观点摘要问题。传统方法主要考虑如何抽取属性相关观点,该文提出进一步考虑观点的富含信息(informativeness)、重要性(salience)及多样性(diversity)这三方面要求。该文提出了一个基于带汇点的流形排序的一体化的摘要抽取模型,在一体化的流形排序过程中同时考虑三方面要求。在餐馆点评数据上的实验表明了所提出三方面要求的合理性及摘要抽取模型的有效性。 展开更多
关键词 在线顾客点评 面向属性抽取式观点摘要 带汇点的流形排序 属性观点联合模型
下载PDF
基于情感词向量的微博情感分类 被引量:21
3
作者 杜慧 徐学可 +3 位作者 伍大勇 刘悦 余智华 程学旗 《中文信息学报》 CSCD 北大核心 2017年第3期170-176,共7页
该文提出了一种基于情感词向量的情感分类方法。词向量采用连续实数域上的固定维数向量来表示词汇,能够表达词汇丰富的语义信息。词向量的学习方法,如word2vec,能从大规模语料中通过上下文信息挖掘出潜藏的词语间语义关联。本文在从语... 该文提出了一种基于情感词向量的情感分类方法。词向量采用连续实数域上的固定维数向量来表示词汇,能够表达词汇丰富的语义信息。词向量的学习方法,如word2vec,能从大规模语料中通过上下文信息挖掘出潜藏的词语间语义关联。本文在从语料中学习得到的蕴含语义信息的词向量基础上,对其进行情感调整,得到同时考虑语义和情感倾向的词向量。对于一篇输入文本,基于情感词向量建立文本的特征表示,采用机器学习的方法对文本进行情感分类。该方法与基于词、N-gram及原始word2vec词向量构建文本表示的方法相比,情感分类准确率更高、性能和稳定性更好。 展开更多
关键词 情感分析 情感分类 词向量 机器学习
下载PDF
一种基于超链接引导的主题搜索的主题敏感爬行方法 被引量:9
4
作者 蒋宗礼 徐学可 李帅 《计算机应用》 CSCD 北大核心 2008年第4期942-944,950,共4页
基于主题的信息采集是信息检索领域内一个新兴且实用的方法,通过将下载页面限定在特定的主题领域,来提高搜索引擎的效率和提供信息的质量。其思想是在爬行过程中按预先定义好的主题有选择地收集相关网页,避免下载主题不相关的网页,其目... 基于主题的信息采集是信息检索领域内一个新兴且实用的方法,通过将下载页面限定在特定的主题领域,来提高搜索引擎的效率和提供信息的质量。其思想是在爬行过程中按预先定义好的主题有选择地收集相关网页,避免下载主题不相关的网页,其目标是更准确地找到对用户有用的信息。探讨了主题爬虫的一些关键问题,通过改进主题模型、链接分类模型的学习方法及链接分析方法来提高下载网页的主题相关度及质量。在此基础上设计并实现了一个主题爬虫系统,该系统利用主题敏感HITS来计算网页优先级。实验表明效果良好。 展开更多
关键词 主题爬虫 超链接引导的主题搜索 主题模型
下载PDF
文本分类中基于词条聚合的特征抽取 被引量:4
5
作者 蒋宗礼 徐学可 李帅 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2008年第11期1205-1209,共5页
特征抽取是文本分类的重要研究领域,针对原始特征空间的高维性与稀疏性给分类算法带来"维数灾难"问题,探讨了基于词条聚合的特征抽取方法,设计了一种利用词条聚合进行特征抽取的文本分类的方案.该方案利用改进的树型动态自组... 特征抽取是文本分类的重要研究领域,针对原始特征空间的高维性与稀疏性给分类算法带来"维数灾难"问题,探讨了基于词条聚合的特征抽取方法,设计了一种利用词条聚合进行特征抽取的文本分类的方案.该方案利用改进的树型动态自组织映射(TGSOM)进行词条聚合,并根据聚合特征的特点,考虑所包含的词条的文档频率的不同和区分文档类别属性的能力的不同,提出了一种新权重计算方法,最后利用SPR INT决策树算法进行分类,实验表明该方法比普通方法分类精度提高4.32%. 展开更多
关键词 特征抽取 词条聚合 TGSOM 权重计算
下载PDF
一种基于集成学习与类指示器的文本分类方法 被引量:3
6
作者 蒋宗礼 徐学可 《北京工业大学学报》 EI CAS CSCD 北大核心 2010年第4期546-553,共8页
提出了一种基于集成学习机制与类指示器的文本分类方法.该方法利用AdaBoost.MH算法框架,在每一轮次中,自适应地计算类指示度,通过加权组合所有成员类指示度,获得对理想类指示度的一种逼近.利用最终的类指示度所得到的分类器不仅简单、... 提出了一种基于集成学习机制与类指示器的文本分类方法.该方法利用AdaBoost.MH算法框架,在每一轮次中,自适应地计算类指示度,通过加权组合所有成员类指示度,获得对理想类指示度的一种逼近.利用最终的类指示度所得到的分类器不仅简单、易于更新,而且泛化能力强.在标准语料集TanCorp-12上的实验表明,该方法适用于对分类效率要求较高的实时应用,同时可以利用集成学习进行某些知识的精确学习,并将这些知识用于弱分类器,从而实现简单高效的分类. 展开更多
关键词 机器学习 集成学习 AdaBoost.MH 文本分类 类指示器
下载PDF
文本分类中基于AdaBoost.MR的改进中心法 被引量:2
7
作者 蒋宗礼 徐学可 《计算机工程与设计》 CSCD 北大核心 2009年第1期122-124,131,共4页
文本信息的爆炸式增长提出了对适宜实时应用的简单快速文本分类的需求,中心分类法虽然快速,但它所基于的假设常常与事实相违,导致分类模型偏差。基于集成学习中的AdaBoost.MR算法,通过利用其自适应维护权重分布的特点,用每轮的权重分布... 文本信息的爆炸式增长提出了对适宜实时应用的简单快速文本分类的需求,中心分类法虽然快速,但它所基于的假设常常与事实相违,导致分类模型偏差。基于集成学习中的AdaBoost.MR算法,通过利用其自适应维护权重分布的特点,用每轮的权重分布,修正传统中心法分类器偏差,突出被误分类的文档的影响,降低其误分类概率。在YQ-WEBBENCH-V1.1上的实验表明效果良好。 展开更多
关键词 集成学习 文本分类 中心法 分类器偏差 权重分布
下载PDF
基于主题Hub值的元搜索 被引量:1
8
作者 蒋宗礼 李宪雷 徐学可 《北京工业大学学报》 EI CAS CSCD 北大核心 2009年第3期397-402,共6页
为了提高元搜索引擎排序结果的质量,提出了成员引擎特征的主题Hub值表示和基于主题Hub值的结果排序算法.特征学习算法利用一组主题关联词对成员引擎的特征进行学习,并表示为主题Hub值的形式.排序算法根据主题Hub值计算结果的全局相关度... 为了提高元搜索引擎排序结果的质量,提出了成员引擎特征的主题Hub值表示和基于主题Hub值的结果排序算法.特征学习算法利用一组主题关联词对成员引擎的特征进行学习,并表示为主题Hub值的形式.排序算法根据主题Hub值计算结果的全局相关度对结果进行排序.实验结果表明,该模型取得了更好的排序质量. 展开更多
关键词 搜索引擎 元搜索 排序 主题Hub值
下载PDF
基于WMD距离与近邻传播的新闻评论聚类 被引量:8
9
作者 官赛萍 靳小龙 +4 位作者 徐学可 伍大勇 贾岩涛 王元卓 刘悦 《中文信息学报》 CSCD 北大核心 2017年第5期203-214,共12页
随着新闻网站的快速发展,网络新闻和评论数据激增,给人们带来了大量有价值的信息。新闻让人们了解发生在国内外的时事,而评论则体现了人们对事件的观点和看法,这对舆情分析和新闻评论推荐等应用很重要。然而,新闻评论数据又多又杂,而且... 随着新闻网站的快速发展,网络新闻和评论数据激增,给人们带来了大量有价值的信息。新闻让人们了解发生在国内外的时事,而评论则体现了人们对事件的观点和看法,这对舆情分析和新闻评论推荐等应用很重要。然而,新闻评论数据又多又杂,而且通常比较简短,因此难以快速直观地从中发现评论者的关注点所在。为此,该文提出一种面向新闻评论的聚类方法 EWMD-AP,用以自动挖掘社会大众对事件的关注点。该方法利用强化了权重向量的Word Mover's Distance(WMD)计算评论之间的距离,进而用Affinity Propagation(AP)对评论进行聚类,从杂乱的新闻评论中得到关注点簇及其代表性评论。特别地,该文提出利用强化权重向量替代传统WMD中的词频权重向量。而强化权重由三部分组成,包括结合词性特征与文本表达特征的词重要度系数、新闻正文作为评论背景的去背景化系数和TFIDF系数。在24个新闻评论数据集上的对比实验表明,EWMD-AP相比Kmeans和Mean Shift等传统聚类算法以及Density Peaks等当前最新算法都具有更好的新闻评论聚类效果。 展开更多
关键词 新闻评论聚类 强化权重向量 去背景化 WORD Mover's DISTANCE 近邻传播
下载PDF
面向顾客点评数据的属性层次观点挖掘研究(英文)
10
作者 徐学可 程学旗 +2 位作者 谭松波 刘悦 沈华伟 《China Communications》 SCIE CSCD 2013年第3期25-41,共17页
This paper focuses on how to improve aspect-level opinion mining for online customer reviews. We first propose a novel generative topic model, the Joint Aspect/Sentiment (JAS) model, to jointly extract aspects and asp... This paper focuses on how to improve aspect-level opinion mining for online customer reviews. We first propose a novel generative topic model, the Joint Aspect/Sentiment (JAS) model, to jointly extract aspects and aspect-dependent sentiment lexicons from online customer reviews. An aspect-dependent sentiment lexicon refers to the aspect-specific opinion words along with their aspect-aware sentiment polarities with respect to a specific aspect. We then apply the extracted aspectdependent sentiment lexicons to a series of aspect-level opinion mining tasks, including implicit aspect identification, aspect-based extractive opinion summarization, and aspect-level sentiment classification. Experimental results demonstrate the effectiveness of the JAS model in learning aspectdependent sentiment lexicons and the practical values of the extracted lexicons when applied to these practical tasks. 展开更多
关键词 挖掘 评论 在线 客户 S模型 实用价值 情绪 词典
下载PDF
面向情绪分类的情绪词向量学习 被引量:3
11
作者 杜漫 徐学可 +3 位作者 杜慧 伍大勇 刘悦 程学旗 《山东大学学报(理学版)》 CAS CSCD 北大核心 2017年第7期52-58,65,共8页
提出了一种面向情绪分类的融合词内部信息和情绪标签的词向量学习方法。在CBOW模型的基础上,引入词内部成分和情绪标签信息,以适应微博情绪表达的不规范,同时丰富词向量的情绪语义。对于输入文本,按照词的TF-IDF权重对词向量进行加权求... 提出了一种面向情绪分类的融合词内部信息和情绪标签的词向量学习方法。在CBOW模型的基础上,引入词内部成分和情绪标签信息,以适应微博情绪表达的不规范,同时丰富词向量的情绪语义。对于输入文本,按照词的TF-IDF权重对词向量进行加权求和,以作为文本向量表示。以上述词向量或文本向量作为情绪分类器的输入,采用机器学习的分类方法(LR、SVM、CNN),验证本文情绪词向量在情绪分类任务上的实验效果。实验表明,情绪词向量与原始CBOW词向量相比,在准确率、召回率、F值等各项指标上都有更好的表现。 展开更多
关键词 情绪分类 情绪分析 词向量 词内部信息 情绪标签
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部