期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于词向量的微博事件追踪方法
被引量:
11
1
作者
张佳明
席耀一
+2 位作者
王波
唐浩浩
李天彩
《计算机工程与应用》
CSCD
北大核心
2016年第17期73-78,117,共7页
微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算的准确率。该方法首先...
微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算的准确率。该方法首先使用Skip-gram模型在大规模数据集上训练得到词向量;然后通过提取关键词建立初始事件和微博表示模型;最后利用词向量计算微博和初始事件之间的语义相似度,并依据设定阈值进行判决,完成事件追踪。实验结果表明,相比传统方法,该方法能够充分利用词向量引入的语义信息,有效提高微博事件追踪的性能。
展开更多
关键词
微博
事件追踪
短文本
Skip-gram模型
词向量
语义信息
下载PDF
职称材料
基于Biterm主题模型的无监督微博情感倾向性分析
被引量:
13
2
作者
张佳明
王波
+1 位作者
唐浩浩
李天彩
《计算机工程》
CAS
CSCD
北大核心
2015年第7期219-223,229,共6页
基于传统主题模型的无监督情感倾向性分析方法不能较好地解决微博语料特征稀疏的问题。为此,提出一种新的无监督微博情感倾向性分析方法。对语料进行预处理并统计语料中的共现词对,利用BTM模型挖掘文档中的隐含主题,通过已有情感词典分...
基于传统主题模型的无监督情感倾向性分析方法不能较好地解决微博语料特征稀疏的问题。为此,提出一种新的无监督微博情感倾向性分析方法。对语料进行预处理并统计语料中的共现词对,利用BTM模型挖掘文档中的隐含主题,通过已有情感词典分析隐含主题的情感分布,并实现整条微博的情感倾向性分析。在NLP&CC2012语料上进行测试,结果表明,该方法能够有效识别微博的情感倾向,平均F1值比传统主题模型方法提高15%。
展开更多
关键词
微博
短文本
情感倾向性分析
无监督
Biterm主题模型
下载PDF
职称材料
基于Skip-gram模型的微博情感倾向性分析
被引量:
4
3
作者
李天彩
王波
+1 位作者
毛二松
席耀一
《计算机应用与软件》
CSCD
2016年第7期114-117,133,共5页
为了更好地对微博进行表示,提高微博情感倾向性识别的准确度,提出一种基于Skip-gram模型的微博情感倾向性分析方法。首先,使用Skip-gram模型在中文数据上进行训练得到词向量;然后,利用词向量在词语表示上的优势,以及一定程度上满足加法...
为了更好地对微博进行表示,提高微博情感倾向性识别的准确度,提出一种基于Skip-gram模型的微博情感倾向性分析方法。首先,使用Skip-gram模型在中文数据上进行训练得到词向量;然后,利用词向量在词语表示上的优势,以及一定程度上满足加法组合运算的特性,通过向量相加获得微博的向量表示以及正负情感向量;最后,通过计算微博向量和正负情感向量的相似度判断微博的情感倾向。在NLP&CC2012数据上进行实验,结果表明,该方法能够有效识别微博的情感倾向,较传统的JST(Joint Sentiment/Topic model)和ASUM(Aspect and Sentiment Unication Model)平均F1值分别提高了23%和26%。
展开更多
关键词
微博
情感分析
Skip-gram
模型
词向量
微博向量
下载PDF
职称材料
基于词语对狄利克雷过程的时序摘要
被引量:
3
4
作者
席耀一
李弼程
+1 位作者
李天彩
黄山奇
《自动化学报》
EI
CSCD
北大核心
2015年第8期1452-1460,共9页
是按照时间顺序生成摘要,对话题的演化发展进行概括.已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息.针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法.首先通过模...
是按照时间顺序生成摘要,对话题的演化发展进行概括.已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息.针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法.首先通过模型推理得到句子的子话题分布;然后利用该分布计算句子的相关度和新颖度;最后按时间顺序抽取与话题相关且新颖度高的句子组成时序摘要.实验结果表明,本文方法较目前的代表性研究方法生成了更高质量的时序摘要.
展开更多
关键词
时序摘要
狄利克雷过程
词语对
主题模型
下载PDF
职称材料
基于分层狄利克雷过程模型的文本分割
被引量:
2
5
作者
李天彩
王波
+1 位作者
席耀一
张佳明
《数据采集与处理》
CSCD
北大核心
2017年第2期408-416,共9页
文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置。针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process...
文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置。针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process,HDP)模型的文本分割方法。首先使用HDP模型获取文本在主题空间的向量表示,然后将主题向量用于C99分割算法实现文本分割,最后使用两种优化策略对结果进行优化。实验结果表明,基于HDP模型的方法能够摆脱对人工设置主题个数的依赖,有效提高了文本分割的性能。
展开更多
关键词
主题模型
文本分割
分层狄利克雷过程
CRF构造
下载PDF
职称材料
一种改进的短文本层次聚类算法
被引量:
5
6
作者
李天彩
席耀一
+1 位作者
王波
张佳明
《信息工程大学学报》
2015年第6期743-748,752,共7页
互联网上存在着海量蕴含丰富信息的短文本数据,由于短文本存在特征稀疏、用语不规范的特点,使用传统的聚类算法效果较差。提出了一种使用词向量表示特征并结合关键词提取的短文本聚类算法:定义特征权重计算公式,计算类簇中特征的权重,...
互联网上存在着海量蕴含丰富信息的短文本数据,由于短文本存在特征稀疏、用语不规范的特点,使用传统的聚类算法效果较差。提出了一种使用词向量表示特征并结合关键词提取的短文本聚类算法:定义特征权重计算公式,计算类簇中特征的权重,得到类簇的关键词;使用Skip-gram模型训练得到的词向量计算关键词之间的语义相似度进而得到类簇的相似度实现聚类。在4个数据集上进行的实验结果表明文章的方法效果优于传统的聚类算法,宏平均较次优结果分别提高了22.3%、24.9%、2.9%和34.4%。
展开更多
关键词
短文本
聚类
词向量
关键词提取
下载PDF
职称材料
基于多策略的短文本信息流会话抽取
被引量:
2
7
作者
李天彩
王波
席耀一
《计算机应用研究》
CSCD
北大核心
2016年第4期997-1002,共6页
互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了一种基于多策略的会话抽取算法。首先,基于内容、时间和用户关...
互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了一种基于多策略的会话抽取算法。首先,基于内容、时间和用户关系进行会话分割得到会话片段;然后,利用词向量计算内容语义相似度,并结合时间信息计算会话片段间的相关度,对其进行聚类,实现会话抽取。在三个来源于真实聊天记录的数据集上进行实验的结果表明,本方法优于传统方法,综合F值分别提高了38.5%、15.7%和26.8%。
展开更多
关键词
会话抽取
短文本
短文本信息流
词向量
聊天记录
下载PDF
职称材料
短文本信息流中的用户建模与应用
被引量:
1
8
作者
李天彩
刘欣
+2 位作者
王波
席耀一
王晓雯
《信息工程大学学报》
2016年第2期225-230,共6页
社交媒体中存在着大量的短文本信息流,包含着丰富的用户信息。针对短文本信息流的特点,提出一种新的用户建模的方法。首先将用户发表的内容进行合并得到用户数据;然后将用户数据分割为固定长度的词链,在分割处添加用户名构造上下文关系...
社交媒体中存在着大量的短文本信息流,包含着丰富的用户信息。针对短文本信息流的特点,提出一种新的用户建模的方法。首先将用户发表的内容进行合并得到用户数据;然后将用户数据分割为固定长度的词链,在分割处添加用户名构造上下文关系;最后结合外部数据,使用Skip-gram模型进行训练得到用户的向量表示。基于用户向量的用户标签推荐和用户聚类方法在真实聊天记录语料进行实验中都取得了优于传统方法的结果。
展开更多
关键词
用户建模
用户向量
Skip-gram模型
用户标签推荐
用户聚类
下载PDF
职称材料
浅谈如何提高拖拉机驾驶员培训质量
被引量:
1
9
作者
李天彩
《云南农业》
2009年第2期47-48,共2页
通过对拖拉机驾驶培训学员的一些特点的分析,从教练员教学的角度,就如何改善培训质量,从而提高拖拉机驾驶员综合技能提出了一些看法。
关键词
拖拉机
驾驶员培训
培训质量
下载PDF
职称材料
柴油发动机排气管排火原因
10
作者
李天彩
《云南农业》
2004年第2期24-24,共1页
关键词
柴油发动机
排气管排火现象
原因分析
调速器
磨损
喷油器
喷射质量
曲柄连杆机构
配气机构
空气滤清器
供油提前角
下载PDF
职称材料
如何判断发动机供油时间不正常
11
作者
李天彩
《云南农业》
2002年第7期24-24,共1页
关键词
判断
发动机
供油时间
下载PDF
职称材料
题名
基于词向量的微博事件追踪方法
被引量:
11
1
作者
张佳明
席耀一
王波
唐浩浩
李天彩
机构
解放军信息工程大学信息系统工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2016年第17期73-78,117,共7页
基金
国家高技术研究发展计划(863)(No.2011AA7032030D)
全军军事研究生课题资助项目(No.2011JY002-158)
国家社会科学基金项目(No.14BXW028)
文摘
微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算的准确率。该方法首先使用Skip-gram模型在大规模数据集上训练得到词向量;然后通过提取关键词建立初始事件和微博表示模型;最后利用词向量计算微博和初始事件之间的语义相似度,并依据设定阈值进行判决,完成事件追踪。实验结果表明,相比传统方法,该方法能够充分利用词向量引入的语义信息,有效提高微博事件追踪的性能。
关键词
微博
事件追踪
短文本
Skip-gram模型
词向量
语义信息
Keywords
micro-blog
event tracking
short text
Skip-gram model
word vector
semantic information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Biterm主题模型的无监督微博情感倾向性分析
被引量:
13
2
作者
张佳明
王波
唐浩浩
李天彩
机构
解放军信息工程大学信息系统工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第7期219-223,229,共6页
基金
国家"863"计划基金资助项目(2011AA7032030D)
国家部委基金资助项目
文摘
基于传统主题模型的无监督情感倾向性分析方法不能较好地解决微博语料特征稀疏的问题。为此,提出一种新的无监督微博情感倾向性分析方法。对语料进行预处理并统计语料中的共现词对,利用BTM模型挖掘文档中的隐含主题,通过已有情感词典分析隐含主题的情感分布,并实现整条微博的情感倾向性分析。在NLP&CC2012语料上进行测试,结果表明,该方法能够有效识别微博的情感倾向,平均F1值比传统主题模型方法提高15%。
关键词
微博
短文本
情感倾向性分析
无监督
Biterm主题模型
Keywords
microblog
short text
sentiment orientation analysis
unsupervised
Biterm Topic Model ( BTM )
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于Skip-gram模型的微博情感倾向性分析
被引量:
4
3
作者
李天彩
王波
毛二松
席耀一
机构
解放军信息工程大学
出处
《计算机应用与软件》
CSCD
2016年第7期114-117,133,共5页
文摘
为了更好地对微博进行表示,提高微博情感倾向性识别的准确度,提出一种基于Skip-gram模型的微博情感倾向性分析方法。首先,使用Skip-gram模型在中文数据上进行训练得到词向量;然后,利用词向量在词语表示上的优势,以及一定程度上满足加法组合运算的特性,通过向量相加获得微博的向量表示以及正负情感向量;最后,通过计算微博向量和正负情感向量的相似度判断微博的情感倾向。在NLP&CC2012数据上进行实验,结果表明,该方法能够有效识别微博的情感倾向,较传统的JST(Joint Sentiment/Topic model)和ASUM(Aspect and Sentiment Unication Model)平均F1值分别提高了23%和26%。
关键词
微博
情感分析
Skip-gram
模型
词向量
微博向量
Keywords
Microblogging
Sentiment analysis
Skip-gram model
Word vector
Microblogging vector
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于词语对狄利克雷过程的时序摘要
被引量:
3
4
作者
席耀一
李弼程
李天彩
黄山奇
机构
解放军信息工程大学信息系统工程学院
[
出处
《自动化学报》
EI
CSCD
北大核心
2015年第8期1452-1460,共9页
基金
国家社会科学基金(14BXW028)资助~~
文摘
是按照时间顺序生成摘要,对话题的演化发展进行概括.已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息.针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法.首先通过模型推理得到句子的子话题分布;然后利用该分布计算句子的相关度和新颖度;最后按时间顺序抽取与话题相关且新颖度高的句子组成时序摘要.实验结果表明,本文方法较目前的代表性研究方法生成了更高质量的时序摘要.
关键词
时序摘要
狄利克雷过程
词语对
主题模型
Keywords
Temporal summarization, Dirichlet process, biterm, topic model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于分层狄利克雷过程模型的文本分割
被引量:
2
5
作者
李天彩
王波
席耀一
张佳明
机构
解放军信息工程大学信息系统工程学院
出处
《数据采集与处理》
CSCD
北大核心
2017年第2期408-416,共9页
基金
国家高技术研究发展计划("八六三"计划)(2011AA7032030D)资助项目
全军军事研究生课题(2011JY002-158)资助项目
文摘
文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置。针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process,HDP)模型的文本分割方法。首先使用HDP模型获取文本在主题空间的向量表示,然后将主题向量用于C99分割算法实现文本分割,最后使用两种优化策略对结果进行优化。实验结果表明,基于HDP模型的方法能够摆脱对人工设置主题个数的依赖,有效提高了文本分割的性能。
关键词
主题模型
文本分割
分层狄利克雷过程
CRF构造
Keywords
topic model
text segmentation
hierarchical Dirichlet process
Chinese restaurant franchise(CRF) process
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种改进的短文本层次聚类算法
被引量:
5
6
作者
李天彩
席耀一
王波
张佳明
机构
信息工程大学
出处
《信息工程大学学报》
2015年第6期743-748,752,共7页
基金
国家社会科学基金资助项目(4BXW028)
文摘
互联网上存在着海量蕴含丰富信息的短文本数据,由于短文本存在特征稀疏、用语不规范的特点,使用传统的聚类算法效果较差。提出了一种使用词向量表示特征并结合关键词提取的短文本聚类算法:定义特征权重计算公式,计算类簇中特征的权重,得到类簇的关键词;使用Skip-gram模型训练得到的词向量计算关键词之间的语义相似度进而得到类簇的相似度实现聚类。在4个数据集上进行的实验结果表明文章的方法效果优于传统的聚类算法,宏平均较次优结果分别提高了22.3%、24.9%、2.9%和34.4%。
关键词
短文本
聚类
词向量
关键词提取
Keywords
short texts
clustering
word vector
keyword extraction
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多策略的短文本信息流会话抽取
被引量:
2
7
作者
李天彩
王波
席耀一
机构
解放军信息工程大学信息系统工程学院
出处
《计算机应用研究》
CSCD
北大核心
2016年第4期997-1002,共6页
基金
国家"863"计划资助项目(2011AA7032030D)
国家社会科学基金资助项目(14BXW028)
文摘
互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了一种基于多策略的会话抽取算法。首先,基于内容、时间和用户关系进行会话分割得到会话片段;然后,利用词向量计算内容语义相似度,并结合时间信息计算会话片段间的相关度,对其进行聚类,实现会话抽取。在三个来源于真实聊天记录的数据集上进行实验的结果表明,本方法优于传统方法,综合F值分别提高了38.5%、15.7%和26.8%。
关键词
会话抽取
短文本
短文本信息流
词向量
聊天记录
Keywords
conversation extraction
short text message
short text message stream
word vectors
chart log
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
短文本信息流中的用户建模与应用
被引量:
1
8
作者
李天彩
刘欣
王波
席耀一
王晓雯
机构
信息工程大学
[
出处
《信息工程大学学报》
2016年第2期225-230,共6页
基金
国家社会科学基金资助项目(14BXW028)
文摘
社交媒体中存在着大量的短文本信息流,包含着丰富的用户信息。针对短文本信息流的特点,提出一种新的用户建模的方法。首先将用户发表的内容进行合并得到用户数据;然后将用户数据分割为固定长度的词链,在分割处添加用户名构造上下文关系;最后结合外部数据,使用Skip-gram模型进行训练得到用户的向量表示。基于用户向量的用户标签推荐和用户聚类方法在真实聊天记录语料进行实验中都取得了优于传统方法的结果。
关键词
用户建模
用户向量
Skip-gram模型
用户标签推荐
用户聚类
Keywords
user modeling
user vector
Skip-gram model
user tag recommendation
user clustering
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
浅谈如何提高拖拉机驾驶员培训质量
被引量:
1
9
作者
李天彩
机构
永仁县农机化学校
出处
《云南农业》
2009年第2期47-48,共2页
文摘
通过对拖拉机驾驶培训学员的一些特点的分析,从教练员教学的角度,就如何改善培训质量,从而提高拖拉机驾驶员综合技能提出了一些看法。
关键词
拖拉机
驾驶员培训
培训质量
分类号
U471.3 [机械工程—车辆工程]
TB53 [理学—声学]
下载PDF
职称材料
题名
柴油发动机排气管排火原因
10
作者
李天彩
机构
永仁县农机化学校
出处
《云南农业》
2004年第2期24-24,共1页
关键词
柴油发动机
排气管排火现象
原因分析
调速器
磨损
喷油器
喷射质量
曲柄连杆机构
配气机构
空气滤清器
供油提前角
分类号
TK428 [动力工程及工程热物理—动力机械及工程]
下载PDF
职称材料
题名
如何判断发动机供油时间不正常
11
作者
李天彩
机构
永仁县农机化学校
出处
《云南农业》
2002年第7期24-24,共1页
关键词
判断
发动机
供油时间
分类号
TK407 [动力工程及工程热物理—动力机械及工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于词向量的微博事件追踪方法
张佳明
席耀一
王波
唐浩浩
李天彩
《计算机工程与应用》
CSCD
北大核心
2016
11
下载PDF
职称材料
2
基于Biterm主题模型的无监督微博情感倾向性分析
张佳明
王波
唐浩浩
李天彩
《计算机工程》
CAS
CSCD
北大核心
2015
13
下载PDF
职称材料
3
基于Skip-gram模型的微博情感倾向性分析
李天彩
王波
毛二松
席耀一
《计算机应用与软件》
CSCD
2016
4
下载PDF
职称材料
4
基于词语对狄利克雷过程的时序摘要
席耀一
李弼程
李天彩
黄山奇
《自动化学报》
EI
CSCD
北大核心
2015
3
下载PDF
职称材料
5
基于分层狄利克雷过程模型的文本分割
李天彩
王波
席耀一
张佳明
《数据采集与处理》
CSCD
北大核心
2017
2
下载PDF
职称材料
6
一种改进的短文本层次聚类算法
李天彩
席耀一
王波
张佳明
《信息工程大学学报》
2015
5
下载PDF
职称材料
7
基于多策略的短文本信息流会话抽取
李天彩
王波
席耀一
《计算机应用研究》
CSCD
北大核心
2016
2
下载PDF
职称材料
8
短文本信息流中的用户建模与应用
李天彩
刘欣
王波
席耀一
王晓雯
《信息工程大学学报》
2016
1
下载PDF
职称材料
9
浅谈如何提高拖拉机驾驶员培训质量
李天彩
《云南农业》
2009
1
下载PDF
职称材料
10
柴油发动机排气管排火原因
李天彩
《云南农业》
2004
0
下载PDF
职称材料
11
如何判断发动机供油时间不正常
李天彩
《云南农业》
2002
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部