期刊文献+
共找到635篇文章
< 1 2 32 >
每页显示 20 50 100
狄利克雷原理历史探源
1
作者 耿锦铭 李威 《广西民族大学学报(自然科学版)》 CAS 2024年第1期59-65,73,共8页
狄利克雷原理起源于物理问题,是研究偏微分方程论和变分法的重要工具,数学和物理中的许多重要定理都是在此原理的基础上建立的。文章在“为什么数学”的研究范式下,采用路线图的研究方法,在原始文献和研究文献的基础上,整理和分析黎曼... 狄利克雷原理起源于物理问题,是研究偏微分方程论和变分法的重要工具,数学和物理中的许多重要定理都是在此原理的基础上建立的。文章在“为什么数学”的研究范式下,采用路线图的研究方法,在原始文献和研究文献的基础上,整理和分析黎曼提出狄利克雷原理的物理动因和函数论思想动因,探究了黎曼两篇论文中关于狄利克雷原理的提出及证明过程,探寻狄利克雷原理来源中的思想传承脉络,推出黎曼提出狄利克雷原理是受到了多位数学家的启发和影响,有助于我们更为清晰地理解黎曼函数理论的基础核心问题。 展开更多
关键词 黎曼 狄利克雷原理 狄利克雷积分
下载PDF
基于隐含狄利克雷分配模型的企业创新测量方法研究
2
作者 叶琴 蔡建峰 张秋韵 《科技进步与对策》 北大核心 2024年第2期90-98,共9页
如何准确测量企业创新是国家创新驱动发展战略背景下学界和业界亟待解决的关键问题。近年来,专利和研发支出作为当前主流企业创新代理指标备受质疑。为此,基于上市公司分析师报告文本,引入机器学习领域非监督学习方法,通过构建隐含狄利... 如何准确测量企业创新是国家创新驱动发展战略背景下学界和业界亟待解决的关键问题。近年来,专利和研发支出作为当前主流企业创新代理指标备受质疑。为此,基于上市公司分析师报告文本,引入机器学习领域非监督学习方法,通过构建隐含狄利克雷分配主题模型,开发一种新的测量企业创新的方法,并与当前主流方法进行比较。研究发现:①基于文本的企业创新测量方法既适用于专利和研发企业,也适用于非专利和非研发企业;②对于专利和研发企业而言,基于文本的企业创新与企业专利申请和研发支出显著相关;对于非专利和非研发企业而言,新测量方法能够有效识别企业利用新技术、开辟新市场等创新实践;③时间序列分析表明,基于文本分析的企业创新能够准确反映样本区间企业创新活动宏观趋势。 展开更多
关键词 隐含狄利克雷分配模型 企业创新 文本分析 主题模型 分析师报告
下载PDF
基于狄利克雷多项式过程模型与K-means结合的菌群分析
3
作者 彭显 贺建峰 《生物信息学》 2024年第1期47-57,共11页
群体分型是一种有助于更好的理解人类身心健康等复杂生物学问题的有效方法,聚类是一种为了对样本分组来降低复杂性的定义肠型的方法,而传统K-means聚类算法的K值选取无法确定,本文在传统K-means聚类算法的基础上进行了改进,并公开数据... 群体分型是一种有助于更好的理解人类身心健康等复杂生物学问题的有效方法,聚类是一种为了对样本分组来降低复杂性的定义肠型的方法,而传统K-means聚类算法的K值选取无法确定,本文在传统K-means聚类算法的基础上进行了改进,并公开数据集上进行了验证,实验表明改进算法能够解决K值选取无法确定的问题,且聚类结果的稳定性、准确性和聚类质量都得到显著提高。将改进后的模型运用于肠道菌群OTUs数据,发现不仅能够有效地区分2-型糖尿病患者样本间的相似性,而且能鉴定出影响菌群结构异质性最大的OTUs菌,为临床解决2-型糖尿病问题提供了一种新的思路。 展开更多
关键词 K-MEANS算法 狄利克雷过程混合模型 菌群分析 群体分型 聚类
下载PDF
狄利克雷——科研教学两不误的数学家
4
作者 孟祥蕊 王淑红 《科学》 CAS 2023年第5期57-62,共6页
德国著名数学家黎曼认为,约翰·狄利克雷(Johann P.G.L. Dirichlet,1805—1859)是当时除了高斯之外最伟大的数学家。和人们通常认为不喜教学的高斯不同,狄利克雷一生热爱从教,不仅培养了一大批优秀的数学家,而且在提升德国数学教育... 德国著名数学家黎曼认为,约翰·狄利克雷(Johann P.G.L. Dirichlet,1805—1859)是当时除了高斯之外最伟大的数学家。和人们通常认为不喜教学的高斯不同,狄利克雷一生热爱从教,不仅培养了一大批优秀的数学家,而且在提升德国数学教育水平方面也做出了重要贡献。然而,忙碌的教书生活并没有阻碍他的科研进程,狄利克雷的研究成果不仅推动了德国数学的发展,更是在整个数学发展史上都留下了不可磨灭的印记。 展开更多
关键词 狄利克雷 高斯 狄利克雷单位定理 数论
下载PDF
基于数据挖掘与隐含狄利克雷分布的肿瘤化疗相关性口腔溃疡的中医用药规律
5
作者 李奕 罗富锟 +4 位作者 张曦元 恩格尔 庞博 花宝金 朴炳奎 《世界中医药》 CAS 2023年第9期1292-1297,共6页
目的:研究近20年恶性肿瘤化疗相关性口腔溃疡中医临床常用治疗方法及遣方用药规律。方法:通过人工与计算机检索相结合的方式,收集2001—2021年国家知识基础设施数据库(CNKI)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)中发表... 目的:研究近20年恶性肿瘤化疗相关性口腔溃疡中医临床常用治疗方法及遣方用药规律。方法:通过人工与计算机检索相结合的方式,收集2001—2021年国家知识基础设施数据库(CNKI)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)中发表主题为“化疗性口腔溃疡”“化疗性口腔黏膜炎”“中医药”等相关文献,通过阅读摘要及NoteExpress自动筛选核对建立所需数据库。用频次统计、关联分析和隐含狄利克雷分布(LDA)的统计方法,分析中医临床治疗化疗相关性口腔溃疡的给药方式、用药频次、药物性味归经、常用药对及核心药物组合。结果:纳入临床研究文献93篇,涉及方剂96首,中药141味。给药方式以汤剂口服、药液漱口为主,用药以清热药、补虚药为总纲,具体以甘草、黄连、生地黄为多,药性多为甘、苦、寒,归肺、胃、心、脾经。结论:本研究综合分析了中医临床文献中治疗化疗相关性口腔溃疡的给药方式与用药规律,发现气虚、阴虚火旺是本病的主要病机,治疗上应以补气清热、养阴增液为主要治疗方法。 展开更多
关键词 化疗相关性口腔溃疡 中医药 数据挖掘 隐含狄利克雷分布 用药规律 补气清热 养阴增液 临床文献
下载PDF
基于狄利克雷过程聚类的机器人演示学习研究 被引量:2
6
作者 吴晓敏 贺苗 +2 位作者 刘暾东 张馨月 邵桂芳 《仪器仪表学报》 EI CAS CSCD 北大核心 2023年第1期265-274,共10页
针对演示学习中高斯混合模型参数估计效率低,泛化能力不足的问题,提出一种基于狄利克雷过程聚类和高斯混合模型的复合动态运动基元算法。为实现高斯混合模型参数的实时估计,使用基于距离阈值的狄利克雷聚类算法进行演示轨迹点在线聚类,... 针对演示学习中高斯混合模型参数估计效率低,泛化能力不足的问题,提出一种基于狄利克雷过程聚类和高斯混合模型的复合动态运动基元算法。为实现高斯混合模型参数的实时估计,使用基于距离阈值的狄利克雷聚类算法进行演示轨迹点在线聚类,并引入Welford公式更新参数以提高参数估计效率。获得轨迹分布特征后,使用动态运动基元进行高斯混合回归轨迹的编码,以提高轨迹泛化能力。为了验证算法的有效性,引入了轨迹可达性和相似性指标评价算法的学习泛化能力,设计了基于手写体字母轨迹和机器人动觉示教的演示学习实验。实验结果表明,所提复合动态运动基元算法参数估计平均时间仅0.052 ms,具备快速轨迹复现和泛化能力。 展开更多
关键词 演示学习 狄利克雷过程 高斯混合模型 动态运动基元
下载PDF
零膨胀模型与狄利克雷过程结合在药品上市后不良反应信号检测中的应用
7
作者 陈晨鑫 张朋朋 +2 位作者 刘永梅 叶小飞 贺佳 《中国药物警戒》 2023年第6期651-654,共4页
目的探索零膨胀模型与狄利克雷过程2种方法结合,在优化药品上市后安全性信号检测结果中的可能性。方法通过文献检索,对零膨胀模型和狄利克雷过程的原理进行综述,分别总结2种方法的研究现状及优点,并提出二者结合以扩展信号检测方法的假... 目的探索零膨胀模型与狄利克雷过程2种方法结合,在优化药品上市后安全性信号检测结果中的可能性。方法通过文献检索,对零膨胀模型和狄利克雷过程的原理进行综述,分别总结2种方法的研究现状及优点,并提出二者结合以扩展信号检测方法的假设。结果零膨胀模型能够校正超额“零计数”问题,减少信号检测结果的偏倚;狄利克雷过程通过丰富药品不良反应报告率先验分布的选择空间,能有效控制假阳性信号的产生。结论将零膨胀模型与狄利克雷过程相结合,用于扩展现有贝叶斯信号检测方法存在一定可能,值得进一步研究。 展开更多
关键词 零膨胀模型 狄利克雷过程 上市后药品监测 信号检测 药品不良反应
下载PDF
利用并行GPU对分层分布式狄利克雷分布算法加速 被引量:2
8
作者 温腊 芮建武 +1 位作者 何婷婷 郭亮 《计算机应用》 CSCD 北大核心 2013年第12期3313-3316,3330,共5页
分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的LDA算法相比,可以运行在分布式框架下,进行分布式并行处理。Mahout在Hadoop框架下实现了HD-LDA算法,... 分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的LDA算法相比,可以运行在分布式框架下,进行分布式并行处理。Mahout在Hadoop框架下实现了HD-LDA算法,但是因为单节点算法的计算量大,仍然存在对大数据分类运行时间太长的问题。而大规模文本集合分散到多个节点上迭代推导,单个节点上文档集合的推导仍是顺序进行的,所以处理大规模文本集合时仍然需要很长时间才能完成全部文本的分类。为此,提出将Hadoop与图形处理器(GPU)相结合,将单节点文本集合的推导过程转移到GPU上运行,实现单节点多个文档并行推导,利用多台并行的GPU对HD-LDA算法进行加速。应用结果表明,使用该方法能使分布式框架下的HD-LDA算法对大规模文本集合处理达到7倍的加速比。 展开更多
关键词 分层分布式狄利克雷分布 潜在狄利克雷分布 文本分类 分布式框架 并行图形处理器
下载PDF
基于狄利克雷模型的分布鲁棒机组组合 被引量:26
9
作者 张玉敏 韩学山 +4 位作者 杨明 王明强 张利 叶平峰 徐波 《中国电机工程学报》 EI CSCD 北大核心 2019年第17期5074-5084,共11页
在应对风电不确定性电源发电的机组组合决策中,针对风电随机过程难以表达为确切概率密度与分布的问题,提出基于非精确狄利克雷模型的分布鲁棒机组组合优化模型与求解方法。其核心体现在:首先,依据历史信息,采用非精确狄利克雷模型(impre... 在应对风电不确定性电源发电的机组组合决策中,针对风电随机过程难以表达为确切概率密度与分布的问题,提出基于非精确狄利克雷模型的分布鲁棒机组组合优化模型与求解方法。其核心体现在:首先,依据历史信息,采用非精确狄利克雷模型(imprecise Dirichlet model,IDM)构造包含风电输出功率所有可能概率分布的模糊集;其次,依据该模糊集,在满足一定置信水平下,推演风电输出功率不确定性区间的表达,从而使其与传统自适应鲁棒优化模型相衔接;由此,构建了分布鲁棒优化决策模型,同时采用列约束生成(column and constraint generation,C&CG)算法对其求解;最后,通过IEEE118节点系统算例,验证模型和方法的有效性。 展开更多
关键词 非精确狄利克雷模型 模糊集 C&CG算法 概率分布不确定性 自适应鲁棒机组组合
下载PDF
基于潜在狄利克雷分布模型的多文档情感摘要 被引量:9
10
作者 荀静 刘培玉 +1 位作者 杨玉珍 张艳辉 《计算机应用》 CSCD 北大核心 2014年第6期1636-1640,共5页
针对当前方法难以获取评论文本全局情感倾向性的问题,提出一种基于潜在狄利克雷分布(LDA)模型的多文档情感摘要方法。该方法首先对给定的句子进行情感分析,抽取带有主观性评价的句子;然后,应用LDA模型表示已抽取的句子,并通过词汇的重... 针对当前方法难以获取评论文本全局情感倾向性的问题,提出一种基于潜在狄利克雷分布(LDA)模型的多文档情感摘要方法。该方法首先对给定的句子进行情感分析,抽取带有主观性评价的句子;然后,应用LDA模型表示已抽取的句子,并通过词汇的重要度和句子的特征计算句子的权重;最终提取情感文摘。实验结果表明,该方法能够有效地识别情感关键句,在准确率、召回率和F值上均有不错的效果。 展开更多
关键词 潜在狄利克雷分布模型 主观句子 情感分析 多文档摘要
下载PDF
基于加权隐含狄利克雷分配模型的新闻话题挖掘方法 被引量:14
11
作者 李湘东 巴志超 黄莉 《计算机应用》 CSCD 北大核心 2014年第5期1354-1359,共6页
针对传统新闻话题挖掘准确率不高、话题可解释性差等问题,结合新闻报道的体例结构特点,提出一种基于加权隐含狄利克雷分配(LDA)模型的新闻话题挖掘方法。首先从不同角度改进词汇权重并构造复合权值,扩展LDA模型生成特征词的过程,以获取... 针对传统新闻话题挖掘准确率不高、话题可解释性差等问题,结合新闻报道的体例结构特点,提出一种基于加权隐含狄利克雷分配(LDA)模型的新闻话题挖掘方法。首先从不同角度改进词汇权重并构造复合权值,扩展LDA模型生成特征词的过程,以获取表意性较强的词汇;其次,将类别区分词(CDW)方法应用于建模结果的词序优化上,以消除话题歧义和噪声、提高话题的可解释性;最后,依据模型话题概率分布的数学特性,从文档对话题的贡献度以及话题权值概率角度对话题进行量化计算,以获取热门话题。仿真实验表明:与传统LDA模型相比,改进方法的漏报率、误报率分别平均降低1.43%、0.16%,最小标准代价平均降低2.68%,验证了该方法的可行性和有效性。 展开更多
关键词 新闻报道 话题挖掘 加权隐含狄利克雷分配模型 类别区分词 词序优化
下载PDF
融合纹理结构的潜在狄利克雷分布铁路扣件检测模型 被引量:8
12
作者 罗建桥 刘甲甲 +1 位作者 李柏林 狄仕磊 《计算机应用》 CSCD 北大核心 2016年第2期574-579,共6页
针对潜在狄利克雷分布(LDA)模型忽略图像结构的问题,提出一种融合图像纹理结构信息的LDA扣件检测模型TS_LDA。首先,设计一种单通道局部二值模式(LBP)方法获得图像纹理结构,将单词的纹理信息作为标注,用单词和标注的联合分布反映了... 针对潜在狄利克雷分布(LDA)模型忽略图像结构的问题,提出一种融合图像纹理结构信息的LDA扣件检测模型TS_LDA。首先,设计一种单通道局部二值模式(LBP)方法获得图像纹理结构,将单词的纹理信息作为标注,用单词和标注的联合分布反映了图像的结构特点;然后,将标注信息嵌入LDA,由单词和标注共同推导图像主题,改进之后的主题分布考虑了图像结构;最后,以该主题分布训练分类器,检测扣件状态。相比LDA方法,正常扣件与失效扣件在TS_LDA主题空间中的区分度增加了5%~35%,平均漏检率降低了1.8%~2.4%。实验结果表明,TS_LDA能够提高扣件图像建模精度,从而更加准确地检测扣件状态。 展开更多
关键词 纹理结构 视觉单词 单词标注 潜在狄利克雷分布模型 铁路扣件检测
下载PDF
基于隐含狄利克雷分配模型的消费者在线评论复杂网络构建及其应用 被引量:10
13
作者 刘晓君 那日萨 崔雪莲 《系统工程学报》 CSCD 北大核心 2017年第3期305-312,共8页
为研究消费者在线评论的相互关系及整体演化发展,以隐含狄利克雷分配模型对消费者在线评论进行话题挖掘为基础,通过Pearson相似度确定评论间话题关系,构建了以评论为节点的复杂网络模型.以京东等平台上的手机评论语料库为例,对相应复杂... 为研究消费者在线评论的相互关系及整体演化发展,以隐含狄利克雷分配模型对消费者在线评论进行话题挖掘为基础,通过Pearson相似度确定评论间话题关系,构建了以评论为节点的复杂网络模型.以京东等平台上的手机评论语料库为例,对相应复杂网络的拓扑特性进行分析.研究表明,相同产品相同规模的评论网络统计特性相近;而相同平台上同一产品不同规模的评论网络性质差异明显,即小规模评论(产品销售初期)构成的网络是一个无标度网络,大规模评论(产品销售中后期)构成的网络演化为一个度分布为钟形分布的小世界网络.揭示了消费者发表在线评论行为之间相互作用,会影响整体评论网络的拓扑性质和演化规律,并为市场营销和管理实践提出了指导性建议. 展开更多
关键词 在线评论 隐含狄利克雷分配模型 复杂网络 皮尔森相似度 度分布
下载PDF
基于狄利克雷混合模型的刀具磨损量在线估计 被引量:6
14
作者 于劲松 时祎瑜 +1 位作者 梁爽 唐荻音 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第3期689-694,共6页
提出了一种基于狄利克雷混合模型的刀具磨损状态监测和磨损量估计的新方法。该方法将刀具磨损过程描述为磨损量的累积过程,通过对磨损增量的连续估计获得刀具当前的磨损量估计。首先对原始力信号进行特征提取,接着在不确定磨损增量状态... 提出了一种基于狄利克雷混合模型的刀具磨损状态监测和磨损量估计的新方法。该方法将刀具磨损过程描述为磨损量的累积过程,通过对磨损增量的连续估计获得刀具当前的磨损量估计。首先对原始力信号进行特征提取,接着在不确定磨损增量状态数量的前提下采用狄利克雷混合模型对特征自动分类,然后利用吉布斯采样方法确定模型参数,最终得到描述力信号特征与磨损增量映射关系的刀具磨损状态混合模型。根据该混合模型以及当前的力信号信息即可完成刀具磨损量的在线估计。真实应用案例证明了该方法能自适应学习磨损状态并有效估计刀具的连续磨损值。 展开更多
关键词 刀具健康状态监测 刀具磨损 狄利克雷混合模型 吉布斯采样
下载PDF
基于潜在狄利克雷分配模型预测克隆代码不一致变化的可能性 被引量:3
15
作者 尹丽丽 张丽萍 +2 位作者 王春晖 涂颖 刘东升 《计算机应用》 CSCD 北大核心 2014年第6期1788-1791,1811,共5页
程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量的克隆代码,而在版本的进化过程中,克隆代码的不一致变化是引起程序错误的主要原因,同时会增加维护成本。为了解决该问题,提出一种新的研究方法:首先构建版本间克隆群的映射关... 程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量的克隆代码,而在版本的进化过程中,克隆代码的不一致变化是引起程序错误的主要原因,同时会增加维护成本。为了解决该问题,提出一种新的研究方法:首先构建版本间克隆群的映射关系,其次借助潜在狄利克雷分配(LDA)模型提取直系克隆群集主题,最后预测克隆代码不一致变化的可能性。对一款软件的8个版本进行了实验,实验结果的区分度明显,可以有效地预测不一致变化的可能性,评估软件质量和可信性。 展开更多
关键词 预测 克隆代码 不一致变化 潜在狄利克雷分配模型 进化
下载PDF
基于隐含狄利克雷分配模型的图像分类算法 被引量:9
16
作者 杨赛 赵春霞 《计算机工程》 CAS CSCD 2012年第14期181-183,共3页
概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对... 概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对图像进行分类。实验结果表明,与基于概率隐含语义分析模型的分类算法相比,该算法的分类性能较优。 展开更多
关键词 BOF模型 中层语义特征 隐含狄利克雷分配模型 隐含主题分布特征 K近邻算法 图像分类
下载PDF
一种基于狄利克雷过程混合模型的文本聚类算法 被引量:10
17
作者 高悦 王文贤 杨淑贤 《信息网络安全》 2015年第11期60-65,共6页
随着互联网的普及,论坛、微博、微信等新媒体已经成为人们获取和发布信息的重要渠道,而网络中的这些文本数据,由于文本数目和内容的不确定性,给网络舆情聚类分析工作带来了很大的挑战。在文本聚类分析中,选择合适的聚类数目一直是一个... 随着互联网的普及,论坛、微博、微信等新媒体已经成为人们获取和发布信息的重要渠道,而网络中的这些文本数据,由于文本数目和内容的不确定性,给网络舆情聚类分析工作带来了很大的挑战。在文本聚类分析中,选择合适的聚类数目一直是一个难点。文章提出了一种基于狄利克雷过程混合模型的文本聚类算法,该算法基于非参数贝叶斯框架,可以将有限混合模型扩展成无限混合分量的混合模型,使用狄利克雷过程中的中国餐馆过程构造方式,实现了基于中国餐馆过程的狄利克雷混合模型,然后采用吉布斯采样算法近似求解模型,能够在不断的迭代过程中确定文本的聚类数目。实验结果表明,文章提出的聚类算法,和经典的K-means聚类算法相比,不仅能更好的动态确定文本主题聚类数目,而且该算法的聚类质量(纯度、F-score和轮廓系数)明显好于K-means聚类算法。 展开更多
关键词 文本聚类 狄利克雷过程混合模型 非参数贝叶斯 吉布斯采样
下载PDF
基于潜在狄利克雷分配模型和互信息的无监督特征选取法 被引量:3
18
作者 董元元 陈基漓 唐小侠 《计算机应用》 CSCD 北大核心 2012年第8期2250-2252,2257,共4页
为解决互信息(MI)在特征选取中的类别缺失和倾向低频词问题,提出LDA-σ方法。该方法使用潜在狄利克雷分配模型(LDA)提取潜在主题,以"词—主题"间互信息的标准差作为特征评估函数。在Reuters-21578语料集上提取特征词并进行分... 为解决互信息(MI)在特征选取中的类别缺失和倾向低频词问题,提出LDA-σ方法。该方法使用潜在狄利克雷分配模型(LDA)提取潜在主题,以"词—主题"间互信息的标准差作为特征评估函数。在Reuters-21578语料集上提取特征词并进行分类,LDA-σ方法的微平均F1最高达0.9096;宏平均F1优于其他算法,最高达0.7823。实验表明,LDA-σ方法可用于文本特征选取。 展开更多
关键词 潜在狄利克雷分配模型 互信息 评价函数
下载PDF
基于词语对狄利克雷过程的时序摘要 被引量:3
19
作者 席耀一 李弼程 +1 位作者 李天彩 黄山奇 《自动化学报》 EI CSCD 北大核心 2015年第8期1452-1460,共9页
是按照时间顺序生成摘要,对话题的演化发展进行概括.已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息.针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法.首先通过模... 是按照时间顺序生成摘要,对话题的演化发展进行概括.已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息.针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法.首先通过模型推理得到句子的子话题分布;然后利用该分布计算句子的相关度和新颖度;最后按时间顺序抽取与话题相关且新颖度高的句子组成时序摘要.实验结果表明,本文方法较目前的代表性研究方法生成了更高质量的时序摘要. 展开更多
关键词 时序摘要 狄利克雷过程 词语对 主题模型
下载PDF
基于隐狄利克雷分配的情感分析 被引量:1
20
作者 王建芳 刘峰 《计算机工程与设计》 CSCD 北大核心 2014年第6期2179-2182,2213,共5页
提出了一种用于中文情感分析的词典资源生成方法,在此基础上,提出了一种基于LDA模型的情感分析算法LDASA。采用了一种自动翻译的方法将已有的英文情感词典翻译为中文;迭代地纠正在上步中翻译的错误,生成基于主题的情感词集合。使用分类... 提出了一种用于中文情感分析的词典资源生成方法,在此基础上,提出了一种基于LDA模型的情感分析算法LDASA。采用了一种自动翻译的方法将已有的英文情感词典翻译为中文;迭代地纠正在上步中翻译的错误,生成基于主题的情感词集合。使用分类算法,对文本表达的情感进行分类。在电子商务网站上抓取的宾馆、手机以及电子相机的数据集上的实验结果表明,该文所提的算法优于使用一元语法特征的支持向量机分类算法,平均的情感识别准确率提高了10百分点。 展开更多
关键词 情感分析 中文情感词典 狄利克雷分配 主题词 分类算法
下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部