期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度学习的多语言跨领域主题对齐模型
被引量:
1
1
作者
余传明
原赛
+1 位作者
胡莎莎
安璐
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2020年第5期430-439,共10页
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨...
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。
展开更多
关键词
跨语言
主题对齐
跨领域
主题对齐
深度学习
双语词嵌入
知识
对齐
原文传递
基于跨语言神经主题模型的汉越新闻话题发现方法
被引量:
6
2
作者
杨威亚
余正涛
+1 位作者
高盛祥
宋燃
《计算机应用》
CSCD
北大核心
2021年第10期2879-2884,共6页
针对汉越跨语言新闻话题发现任务中汉越平行语料稀缺,训练高质量的双语词嵌入较为困难,而且新闻文本一般较长导致双语词嵌入的方法难以很好地表征文本的问题,提出一种基于跨语言神经主题模型(CL-NTM)的汉越新闻话题发现方法,利用新闻的...
针对汉越跨语言新闻话题发现任务中汉越平行语料稀缺,训练高质量的双语词嵌入较为困难,而且新闻文本一般较长导致双语词嵌入的方法难以很好地表征文本的问题,提出一种基于跨语言神经主题模型(CL-NTM)的汉越新闻话题发现方法,利用新闻的主题信息对新闻文本进行表征,将双语语义对齐转化为双语主题对齐任务。首先,针对汉语和越南语分别训练基于变分自编码器的神经主题模型,从而得到单语的主题抽象表征;然后,利用小规模的平行语料将双语主题映射到同一语义空间;最后,使用K-means方法对双语主题表征进行聚类,从而发现新闻事件簇的话题。实验结果表明,所提方法相较于面向中英文的隐狄利克雷分配主题改进模型(ICE-LDA)在Macro-F1值与主题一致性上分别提升了4个百分点与7个百分点,可见所提方法可有效提升新闻话题的聚类效果与话题可解释性。
展开更多
关键词
跨语言
主题对齐
神经
主题
模型
K-MEANS聚类
话题发现
下载PDF
职称材料
题名
基于深度学习的多语言跨领域主题对齐模型
被引量:
1
1
作者
余传明
原赛
胡莎莎
安璐
机构
中南财经政法大学信息与安全工程学院
中南财经政法大学统计与数学学院
武汉大学信息管理学院
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2020年第5期430-439,共10页
基金
国家自然科学基金面上项目(71974202)
国家自然科学基金重大课题(71790612)。
文摘
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。
关键词
跨语言
主题对齐
跨领域
主题对齐
深度学习
双语词嵌入
知识
对齐
Keywords
cross-lingual topic alignment
cross-domain topic alignment
deep learning
bilingual word embedding
knowledge alignment
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于跨语言神经主题模型的汉越新闻话题发现方法
被引量:
6
2
作者
杨威亚
余正涛
高盛祥
宋燃
机构
昆明理工大学信息工程与自动化学院
云南省人工智能重点实验室(昆明理工大学)
出处
《计算机应用》
CSCD
北大核心
2021年第10期2879-2884,共6页
基金
国家自然科学基金资助项目(61972196,61762056,61472168)
云南省重大科技专项(202002AD080001)
云南省高新技术产业专项(201606)。
文摘
针对汉越跨语言新闻话题发现任务中汉越平行语料稀缺,训练高质量的双语词嵌入较为困难,而且新闻文本一般较长导致双语词嵌入的方法难以很好地表征文本的问题,提出一种基于跨语言神经主题模型(CL-NTM)的汉越新闻话题发现方法,利用新闻的主题信息对新闻文本进行表征,将双语语义对齐转化为双语主题对齐任务。首先,针对汉语和越南语分别训练基于变分自编码器的神经主题模型,从而得到单语的主题抽象表征;然后,利用小规模的平行语料将双语主题映射到同一语义空间;最后,使用K-means方法对双语主题表征进行聚类,从而发现新闻事件簇的话题。实验结果表明,所提方法相较于面向中英文的隐狄利克雷分配主题改进模型(ICE-LDA)在Macro-F1值与主题一致性上分别提升了4个百分点与7个百分点,可见所提方法可有效提升新闻话题的聚类效果与话题可解释性。
关键词
跨语言
主题对齐
神经
主题
模型
K-MEANS聚类
话题发现
Keywords
cross-language
topic alignment
Neural Topic Model(NTM)
K-means clustering
topic discovery
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度学习的多语言跨领域主题对齐模型
余传明
原赛
胡莎莎
安璐
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2020
1
原文传递
2
基于跨语言神经主题模型的汉越新闻话题发现方法
杨威亚
余正涛
高盛祥
宋燃
《计算机应用》
CSCD
北大核心
2021
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部