期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
藏汉跨语言话题模型构建及对齐方法研究 被引量:1
1
作者 孙媛 赵倩 《中文信息学报》 CSCD 北大核心 2017年第1期102-111,共10页
如何获取藏文话题在其他语种中的相关信息,对于促进少数民族地区的社会管理科学化水平、维护民族团结和国家统一、构建和谐社会具有重要意义。目前大多数研究集中在英汉跨语言信息处理方面,针对藏汉跨语言研究较少。如何根据藏语、汉语... 如何获取藏文话题在其他语种中的相关信息,对于促进少数民族地区的社会管理科学化水平、维护民族团结和国家统一、构建和谐社会具有重要意义。目前大多数研究集中在英汉跨语言信息处理方面,针对藏汉跨语言研究较少。如何根据藏语、汉语的特点,并结合目前藏语信息处理的研究现状,实现藏汉多角度的社会网络关系关联,同步发现关注话题并进行数据比较,是迫切需要解决的问题。该文在藏汉可比语料的基础上,利用词向量对文本词语进行语义扩展,进而构建LDA话题模型,并利用Gibbs sampling进行模型参数的估计,抽取出藏语和汉语话题。在LDA话题模型生成的文档-话题分布的基础上,提出一种基于余弦相似度、欧氏距离、Hellinger距离和KL距离四种相似度算法的投票方法,来实现藏汉话题的对齐。 展开更多
关键词 藏汉跨语言 话题抽取 LDA 话题对齐
下载PDF
四连杆式独立悬架性能分析 被引量:4
2
作者 梁骏 吴光强 +1 位作者 李文辉 魏宏 《汽车技术》 北大核心 2002年第8期24-27,共4页
四连杆式悬架是技术比较先进的悬架形式,可以从设计上保证车辆良好的直线行驶性能并最大程度减轻载荷的影响。通过对一般结构悬架的力学分析,总结了车辆在纵向与侧向运动特性要求下的悬架设计规则,同时建立了四连杆式悬架多刚体系统模... 四连杆式悬架是技术比较先进的悬架形式,可以从设计上保证车辆良好的直线行驶性能并最大程度减轻载荷的影响。通过对一般结构悬架的力学分析,总结了车辆在纵向与侧向运动特性要求下的悬架设计规则,同时建立了四连杆式悬架多刚体系统模型并对杆件位置姿态和车轮定位参数等特性进行了仿真,经过数值处理获得了四连杆悬架的各项性能。最后还通过对比麦弗逊式悬架,说明了前者的优势所在。 展开更多
关键词 四连杆式独立悬架 性能分析 车轮定位参数 汽车 力学分析 杆件位置姿态
下载PDF
基于跨语言神经主题模型的汉越新闻话题发现方法 被引量:6
3
作者 杨威亚 余正涛 +1 位作者 高盛祥 宋燃 《计算机应用》 CSCD 北大核心 2021年第10期2879-2884,共6页
针对汉越跨语言新闻话题发现任务中汉越平行语料稀缺,训练高质量的双语词嵌入较为困难,而且新闻文本一般较长导致双语词嵌入的方法难以很好地表征文本的问题,提出一种基于跨语言神经主题模型(CL-NTM)的汉越新闻话题发现方法,利用新闻的... 针对汉越跨语言新闻话题发现任务中汉越平行语料稀缺,训练高质量的双语词嵌入较为困难,而且新闻文本一般较长导致双语词嵌入的方法难以很好地表征文本的问题,提出一种基于跨语言神经主题模型(CL-NTM)的汉越新闻话题发现方法,利用新闻的主题信息对新闻文本进行表征,将双语语义对齐转化为双语主题对齐任务。首先,针对汉语和越南语分别训练基于变分自编码器的神经主题模型,从而得到单语的主题抽象表征;然后,利用小规模的平行语料将双语主题映射到同一语义空间;最后,使用K-means方法对双语主题表征进行聚类,从而发现新闻事件簇的话题。实验结果表明,所提方法相较于面向中英文的隐狄利克雷分配主题改进模型(ICE-LDA)在Macro-F1值与主题一致性上分别提升了4个百分点与7个百分点,可见所提方法可有效提升新闻话题的聚类效果与话题可解释性。 展开更多
关键词 跨语言 主题对齐 神经主题模型 K-MEANS聚类 话题发现
下载PDF
中文异构百科知识库实体对齐 被引量:7
4
作者 黄峻福 李天瑞 +2 位作者 贾真 景运革 张涛 《计算机应用》 CSCD 北大核心 2016年第7期1881-1886,1898,共7页
针对传统实体对齐方法在中文异构网络百科实体对齐任务中效果不够显著的问题,提出一种基于实体属性与上下文主题特征相结合的实体对齐方法。首先,基于百度百科及互动百科数据构造中文异构百科知识库,通过统计方法构造资源描述框架模式(R... 针对传统实体对齐方法在中文异构网络百科实体对齐任务中效果不够显著的问题,提出一种基于实体属性与上下文主题特征相结合的实体对齐方法。首先,基于百度百科及互动百科数据构造中文异构百科知识库,通过统计方法构造资源描述框架模式(RDFS)词表,对实体属性进行规范化;其次,抽取实体上下文信息,对其进行中文分词后,利用主题模型对上下文建模并通过吉布斯采样法求解模型参数,计算出主题-单词概率矩阵,提取特征词集合及对应特征矩阵;然后,利用最长公共子序列(LCS)算法判定实体属性相似度,当相似度位于下界与上界之间时,进一步结合百科类实体上下文主题特征进行判定;最后,依据标准方法构造了一个异构中文百科实体对齐数据集进行仿真实验。实验结果表明,与经典的属性相似度算法、属性加权算法、上下文词频特征模型及主题模型算法进行比较,所提出的实体对齐算法在人物领域和影视领域的准确率、召回率与综合指标F值分别达到97.8%、88.0%、92.6%和98.6%、73.0%、83.9%,比其他方法均有较大的提高。实验结果验证了在构建中文异构百科知识库场景中,所提算法可以有效提升中文百科实体对齐效果,可应用到具有上下文信息的实体对齐任务中。 展开更多
关键词 知识库 实体对齐 主题模型 资源描述框架模式 最长公共子序列算法
下载PDF
用于短文本关键词抽取的主题翻译模型 被引量:1
5
作者 王瑞 秦永彬 +1 位作者 张丽 闫盈盈 《计算机工程与设计》 北大核心 2018年第6期1633-1638,共6页
为进一步改善短文本关键词抽取的效果,提出一种TTKE(topical translation for keyphrase extraction)主题翻译模型。结合主题模型与统计机器翻译模型的优势,通过长文本辅助短文本进行主题发现,学习特定主题下词语与关键词的对齐概率,为... 为进一步改善短文本关键词抽取的效果,提出一种TTKE(topical translation for keyphrase extraction)主题翻译模型。结合主题模型与统计机器翻译模型的优势,通过长文本辅助短文本进行主题发现,学习特定主题下词语与关键词的对齐概率,为给定短文本进行关键词抽取。在真实数据集上进行实验,实验结果表明,该模型能够有效提高短文本关键词抽取的效果。 展开更多
关键词 关键词抽取 短文本 长文本 主题翻译模型 主题发现 对齐概率
下载PDF
基于深度学习的多语言跨领域主题对齐模型 被引量:1
6
作者 余传明 原赛 +1 位作者 胡莎莎 安璐 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第5期430-439,共10页
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨... 在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。 展开更多
关键词 跨语言主题对齐 跨领域主题对齐 深度学习 双语词嵌入 知识对齐
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部