期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于上下文重构的短文本情感极性判别研究
被引量:
21
1
作者
杨震
赖英旭
+1 位作者
段立娟
李玉鑑
《自动化学报》
EI
CSCD
北大核心
2012年第1期55-67,共13页
文本对象所固有的多义性,面对短文本特征稀疏和上下文缺失的情况,现有处理方法无法明辨语义,形成了底层特征和高层表达之间巨大的语义鸿沟.本文尝试借由时间、空间、联系等要素挖掘文本间隐含的关联关系,重构文本上下文范畴,提升情感极...
文本对象所固有的多义性,面对短文本特征稀疏和上下文缺失的情况,现有处理方法无法明辨语义,形成了底层特征和高层表达之间巨大的语义鸿沟.本文尝试借由时间、空间、联系等要素挖掘文本间隐含的关联关系,重构文本上下文范畴,提升情感极性分类性能.具体做法对应一个两阶段处理过程:1)基于短文本的内在联系将其初步重组成上下文(领域);2)将待处理短文本归入适合的上下文(领域)进行深入处理.首先给出了基于NaiveBayes分类器的短文本情感极性分类基本框架,揭示出上下文(领域)范畴差异对分类性能的影响.接下来讨论了基于领域归属划分的文本情感极性分类增强方法,并将领域的概念扩展为上下文关系,提出了基于特殊上下文关系的文本情感极性判别方法.同时为了解决由于信息缺失所造成的上下文重组困难,给出基于遗传算法的任意上下文重组方案.理论分析表明,满足限制条件的前提下,基于上下文重构的情感极性判别方法能够同时降低抽样误差(Sample error)和近似误差(Approximation error).真实数据集上的实验结果也验证了理论分析的结论.
展开更多
关键词
舆情分析
短文本处理
情感计算
误差分析
遗传算法
下载PDF
职称材料
基于字符串相似性聚类的网络短文本舆情热点发现技术
被引量:
25
2
作者
杨震
段立娟
赖英旭
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2010年第5期669-673,共5页
将每个短文本文档看成一个由文字、数字和标点构成的字符串,并基于字符串自身的特性直接计算其相似性,在此基础上进行短文本层次化聚类,进而发现网络舆情热点.由于这种方法免去特征提取和文本表示过程,在一定程度上避免了传统方法在短...
将每个短文本文档看成一个由文字、数字和标点构成的字符串,并基于字符串自身的特性直接计算其相似性,在此基础上进行短文本层次化聚类,进而发现网络舆情热点.由于这种方法免去特征提取和文本表示过程,在一定程度上避免了传统方法在短文本表示时特征向量稀疏的不足,有效解决了短文本内容聚类问题.实验结果表明,本文提出方法有效.
展开更多
关键词
舆情分析
短文本处理
层次聚类
下载PDF
职称材料
题名
基于上下文重构的短文本情感极性判别研究
被引量:
21
1
作者
杨震
赖英旭
段立娟
李玉鑑
机构
北京工业大学计算机学院
出处
《自动化学报》
EI
CSCD
北大核心
2012年第1期55-67,共13页
基金
国家自然科学基金(61001178
60905017
+10 种基金
60702031
61002029)
北京市自然科学基金(4102012
4112009
4102013
4123093)
北京市教育委员会科技发展计划面上项目(KM201210005024)
国家软科学研究计划项目(2010GXQ5D317)
北京市高等学校人才强教深化计划"中青年骨干人才培养计划"项目(PHR201108016)
北京工业大学高层人才培养项目
北京工业大学校青基金资助~~
文摘
文本对象所固有的多义性,面对短文本特征稀疏和上下文缺失的情况,现有处理方法无法明辨语义,形成了底层特征和高层表达之间巨大的语义鸿沟.本文尝试借由时间、空间、联系等要素挖掘文本间隐含的关联关系,重构文本上下文范畴,提升情感极性分类性能.具体做法对应一个两阶段处理过程:1)基于短文本的内在联系将其初步重组成上下文(领域);2)将待处理短文本归入适合的上下文(领域)进行深入处理.首先给出了基于NaiveBayes分类器的短文本情感极性分类基本框架,揭示出上下文(领域)范畴差异对分类性能的影响.接下来讨论了基于领域归属划分的文本情感极性分类增强方法,并将领域的概念扩展为上下文关系,提出了基于特殊上下文关系的文本情感极性判别方法.同时为了解决由于信息缺失所造成的上下文重组困难,给出基于遗传算法的任意上下文重组方案.理论分析表明,满足限制条件的前提下,基于上下文重构的情感极性判别方法能够同时降低抽样误差(Sample error)和近似误差(Approximation error).真实数据集上的实验结果也验证了理论分析的结论.
关键词
舆情分析
短文本处理
情感计算
误差分析
遗传算法
Keywords
Public opinion analysis, short text processing, sentiment classification, error analysis, genetic algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于字符串相似性聚类的网络短文本舆情热点发现技术
被引量:
25
2
作者
杨震
段立娟
赖英旭
机构
北京工业大学计算机学院
出处
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2010年第5期669-673,共5页
基金
国家'九七三'计划资助项目(2007CB311100)
北京市自然科学基金资助项目(4102012
+2 种基金
4102013)
北京市教育委员会科技发展计划面上资助项目(KM200810005030)
北京工业大学青年科学基金资助项目
文摘
将每个短文本文档看成一个由文字、数字和标点构成的字符串,并基于字符串自身的特性直接计算其相似性,在此基础上进行短文本层次化聚类,进而发现网络舆情热点.由于这种方法免去特征提取和文本表示过程,在一定程度上避免了传统方法在短文本表示时特征向量稀疏的不足,有效解决了短文本内容聚类问题.实验结果表明,本文提出方法有效.
关键词
舆情分析
短文本处理
层次聚类
Keywords
public opinion analysis
short text processing
hierarchical clustering
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于上下文重构的短文本情感极性判别研究
杨震
赖英旭
段立娟
李玉鑑
《自动化学报》
EI
CSCD
北大核心
2012
21
下载PDF
职称材料
2
基于字符串相似性聚类的网络短文本舆情热点发现技术
杨震
段立娟
赖英旭
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2010
25
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部