期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种面向多文本集的部分比较性LDA模型
被引量:
5
1
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1943-1953,共11页
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparati...
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
展开更多
关键词
比较性文本挖掘
部分比较性
部分比较性跨文本集LDA模型
话题模型
GIBBS抽样
下载PDF
职称材料
一种面向多文本集的部分比较性混合模型
被引量:
2
2
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第11期101-107,共7页
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化...
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.
展开更多
关键词
概率分布
比较性文本挖掘
部分可比性
pccmix
模型
混合模型
下载PDF
职称材料
题名
一种面向多文本集的部分比较性LDA模型
被引量:
5
1
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科学技术大学信息系统工程重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1943-1953,共11页
基金
国家自然科学基金项目(60903225)
湖南省自然科学基金项目(11JJ5044)
国防科学技术大学优秀研究生创新基金项目(S100502)
文摘
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
关键词
比较性文本挖掘
部分比较性
部分比较性跨文本集LDA模型
话题模型
GIBBS抽样
Keywords
comparative
text mining~
partial
comparative
~
partial
comparative
cross
collections
LDA
model
(PCCLDA) ~ topic
model
~ Gibbs sampling
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种面向多文本集的部分比较性混合模型
被引量:
2
2
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科学技术大学信息系统工程重点实验室
出处
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第11期101-107,共7页
基金
国家自然科学基金资助项目(60903225)
湖南省自然科学基金资助项目(11JJ5044)
国防科学技术大学优秀研究生创新基金资助项目(S100502)
文摘
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.
关键词
概率分布
比较性文本挖掘
部分可比性
pccmix
模型
混合模型
Keywords
probability distributions
comparative
text mining
partial
comparative
pccmix(partial comparative cross collections mixture)model
mixture
model
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种面向多文本集的部分比较性LDA模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《计算机研究与发展》
EI
CSCD
北大核心
2013
5
下载PDF
职称材料
2
一种面向多文本集的部分比较性混合模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部