期刊文献+
共找到116篇文章
< 1 2 6 >
每页显示 20 50 100
基于标幺化三阈值事件检测与LDA分类器的工商业负荷辨识方法
1
作者 陈霄 马云龙 +3 位作者 李新家 方磊 严永辉 喻伟 《电力需求侧管理》 2024年第3期112-118,共7页
非侵入式负荷辨识技术能够低成本的获取用户各类设备使用情况,实现电力负荷的在线监测与分析,对支撑负荷预测、需求响应等应用开展有着重要意义。针对一般工商业用户类型多样、负荷种类繁多、设备运行特性复杂的特点,提出了一种基于标... 非侵入式负荷辨识技术能够低成本的获取用户各类设备使用情况,实现电力负荷的在线监测与分析,对支撑负荷预测、需求响应等应用开展有着重要意义。针对一般工商业用户类型多样、负荷种类繁多、设备运行特性复杂的特点,提出了一种基于标幺化三阈值事件检测与LDA分类器的工商业负荷辨识方案。首先针对不同能耗级别、不同启停特性的设备设计了参数可调的统一负荷事件检测框架,提升了缓变型、分段型、震荡型负荷事件的检出准确度。随后提出了基于多元特征与LDA线性判别的设备类型判断算法,在兼顾边缘端计算效率的同时取得了与随机森林等非线性分类器相同的辨识性能。 展开更多
关键词 非侵入式负荷辨识 一般工商业用户 事件检测 改进三阈值算法 lda线性判别
下载PDF
基于LDA主题模型的协同过滤推荐算法
2
作者 张宇 吴静 《智能计算机与应用》 2024年第2期190-194,共5页
传统的协同过滤推荐算法直接根据用户对物品的评分进行推荐,忽略了评论文本中隐含的重要信息,当用户对物品的评论较少时,由于数据的稀疏性会造成推荐效果的不准确和单一。本文提出了一种基于LDA主题模型的协同过滤推荐算法LDA-CF(Latent... 传统的协同过滤推荐算法直接根据用户对物品的评分进行推荐,忽略了评论文本中隐含的重要信息,当用户对物品的评论较少时,由于数据的稀疏性会造成推荐效果的不准确和单一。本文提出了一种基于LDA主题模型的协同过滤推荐算法LDA-CF(Latent Dirichlet Allocation model-LDA-Collaborative Filtering),在传统的协同过滤算法基础上,通过LDA模型对评论文本中的主题进行分类,从各个主题层面挖掘用户的情感偏好,计算用户之间的相似度,进而向目标用户推荐商品。对京东平台牙膏的评论数据集的实验结果表明,该算法不仅可以缓解由于评分数据较少造成的稀疏性问题,推荐的精确度也有所提高。 展开更多
关键词 协同过滤 推荐算法 lda 评论文本
下载PDF
基于LDA和TF-IDF的关键词提取算法研究 被引量:1
3
作者 苏婧琼 苏艳琼 《长江信息通信》 2024年第1期78-80,共3页
在自然语言处理领域,对于海量的文本文件,让用户在最短的时间找到到自己感兴趣的文档,最关键的工作是要每篇文档的关键词提取出来。而不管是针对一篇长文章或是一篇短文章,通常能够直接通过这几个关键字去窥探出整篇文章背后的主题思想... 在自然语言处理领域,对于海量的文本文件,让用户在最短的时间找到到自己感兴趣的文档,最关键的工作是要每篇文档的关键词提取出来。而不管是针对一篇长文章或是一篇短文章,通常能够直接通过这几个关键字去窥探出整篇文章背后的主题思想。文章分别介绍了LDA主题模型和TFIDF算法在关键词提取中的应用,并进行了对比,结果表明在关键词提取方面都可以取得较好的效果。 展开更多
关键词 lda主题模型 TFIDF算法 关键词提取
下载PDF
融合LDA⁃LSTM算法的微博档案关注度和情感分析
4
作者 孙思怡 王家强 罗子江 《现代计算机》 2024年第7期70-75,共6页
为了解析《档案法》实施三年后社会公众对档案的关注度与情感态度,利用Python工具和LDA模型对数据进行提取和主题聚类,获得不同时间下档案热点主题;采用LSTM模型得到各档案主题的情感倾向,分析用户产生不同情感倾向的原因。根据各主题... 为了解析《档案法》实施三年后社会公众对档案的关注度与情感态度,利用Python工具和LDA模型对数据进行提取和主题聚类,获得不同时间下档案热点主题;采用LSTM模型得到各档案主题的情感倾向,分析用户产生不同情感倾向的原因。根据各主题间的联系,得到档案项目、影视娱乐档案、学生-学校档案以及专项档案四类主题。各类档案主题具有较高的积极倾向,说明公众对档案事业的发展比较支持和理解,对于消极倾向较高的学生-学校档案类别,有关部门应加强档案宣传教育,从根本上保障公众利用档案的权利,增强全社会的档案意识。 展开更多
关键词 档案关注度 lda⁃LSTM算法 情感分析 新浪微博
下载PDF
改进LDA模型在影视作品推荐中的应用研究
5
作者 申菲 《微型电脑应用》 2024年第6期61-64,共4页
为了解决影视资源推荐精度问题,引入隐含狄利克雷分布(LDA)完成对影视作品影评数据分析。考虑LDA无法体现各特征词重要性,将注意力机制嵌入网络,提高模型精度。结果显示,在推荐准确率测试中,以MoviesLens-1M数据进行测试,所提出模型准... 为了解决影视资源推荐精度问题,引入隐含狄利克雷分布(LDA)完成对影视作品影评数据分析。考虑LDA无法体现各特征词重要性,将注意力机制嵌入网络,提高模型精度。结果显示,在推荐准确率测试中,以MoviesLens-1M数据进行测试,所提出模型准确率为0.936,相对同类推荐技术精度最好。由此可见,所提出推荐模型在系统稳定性、推荐效果上均有出色效果。 展开更多
关键词 推荐算法 影视作品 lda 注意力机制
下载PDF
基于LDA模型融合Catboost算法的文本自动分类系统设计与实现 被引量:2
6
作者 刘爱琴 郭少鹏 张卓星 《国家图书馆学刊》 北大核心 2023年第5期84-92,共9页
互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost... 互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost算法获得文档在主题上的概率分布,然后利用训练集提取出的隐含主题-文本矩阵进行分类器训练,最终构建文本分类系统。研究结果显示,该系统能够有效完成文本混合自动分类,分类误差率较低,分类性能明显优于传统的文本分类方法。 展开更多
关键词 隐含狄利克雷分布(lda) 文本自动分类 SVM算法 Catboost算法
下载PDF
基于ICEEMDAN和IMWPE-LDA-BOA-SVM的齿轮箱损伤识别模型 被引量:2
7
作者 王洪 张锐丽 吴凯 《机电工程》 CAS 北大核心 2023年第11期1709-1717,共9页
针对齿轮箱振动信号中的背景噪声过大影响故障特征质量,进而降低故障识别准确率的问题,提出了一种基于改进自适应噪声完备集成经验模态分解(ICEEMDAN)、改进多尺度加权排列熵(IMWPE)、利用线性判别分析(LDA)、蝴蝶优化算法(BOA)优化支... 针对齿轮箱振动信号中的背景噪声过大影响故障特征质量,进而降低故障识别准确率的问题,提出了一种基于改进自适应噪声完备集成经验模态分解(ICEEMDAN)、改进多尺度加权排列熵(IMWPE)、利用线性判别分析(LDA)、蝴蝶优化算法(BOA)优化支持向量机(SVM)的齿轮箱故障诊断方法(ICEEMDAN-IMWPE-LDA-BOA-SVM)。首先,采用ICEEMDAN对齿轮箱振动信号进行了分解,生成了一系列从低频到高频分布的本征模态函数分量;接着,基于相关系数筛选出包含主要故障信息的本征模态函数分量,进行了信号重构,降低了信号的噪声;随后,提出了改进多尺度加权排列熵的非线性动力学指标,并利用其提取了重构信号的故障特征,以构建反映齿轮箱故障特性的故障特征;然后,利用线性判别分析(LDA)对原始故障特征进行了压缩,以构建低维的故障特征向量;最后,采用蝴蝶优化算法(BOA)对支持向量机(SVM)的惩罚系数和核函数参数进行了优化,以构建参数最优的故障分类器,对齿轮箱的故障进行了识别;基于齿轮箱复合故障数据集对ICEEMDAN-IMWPE-BOA-SVM方法进行了实验和对比分析。研究结果表明:该方法能够较为准确地识别齿轮箱的不同故障类型,准确率达到了99.33%,诊断时间只需5.31 s,在多个方面都优于其他对比方法,在齿轮箱的故障诊断中更具有应用潜力。 展开更多
关键词 故障特征提取 信号分解及信号重构 特征降维 改进自适应噪声完备集成经验模态分解 改进多尺度加权排列熵 线性判别分析 蝴蝶优化算法 支持向量机
下载PDF
基于LDA-SVM算法模型对唐宋诗词分词及特征的计量分析 被引量:2
8
作者 欧阳文涛 朱家明 戴定华 《黑龙江大学自然科学学报》 CAS 2023年第4期394-400,共7页
基于统计量化分析法对我国唐宋诗词的用词进行研究,综合运用数理统计数据处理方法和其他方法,建立了余弦相似度算法模型和隐含狄利克雷分布(Latent dirichlet allocation, LDA)模型,验证了字词能够很好地代表不同诗词的风格和主题,进一... 基于统计量化分析法对我国唐宋诗词的用词进行研究,综合运用数理统计数据处理方法和其他方法,建立了余弦相似度算法模型和隐含狄利克雷分布(Latent dirichlet allocation, LDA)模型,验证了字词能够很好地代表不同诗词的风格和主题,进一步根据LDA模型分别选取了唐宋时期各3个主题和30个关键词,证明主题和关键词对唐宋诗词分类有显著的相关性,并取得了很好的分类效果,最后运用支持向量机(Support vector machines, SVM)算法模型验证了题目、风格和用词等变量对题材分类产生影响的假设,进一步验证了LDA模型结果,也为唐宋诗词的分类和本体研究提供了科学依据。 展开更多
关键词 唐宋诗词 诗人风格 lda模型 SVM算法 余弦相似度
下载PDF
基于改进的LDA主题模型群体情感影响因素研究 被引量:1
9
作者 史伟 王晓飞 《情报探索》 2023年第1期80-86,共7页
[目的/意义]探究社交网络中影响群体情感行为的影响因素,旨在为舆情引导提供参考。[方法/过程]首先,获取微博数据集,进行预处理后,使用结合AP算法及TF-IDF算法的LDA主题模型对用户文本进行聚类,挖掘用户兴趣主题;然后,人工识别结合接口... [目的/意义]探究社交网络中影响群体情感行为的影响因素,旨在为舆情引导提供参考。[方法/过程]首先,获取微博数据集,进行预处理后,使用结合AP算法及TF-IDF算法的LDA主题模型对用户文本进行聚类,挖掘用户兴趣主题;然后,人工识别结合接口调用对用户文本进行情感标注;最后,利用二元逻辑回归模型对假设的群体情感影响因素进行验证。[结果/结论]性别、主题及活跃度对于群体情感倾向有显著影响;男性群体普遍比女性群体消极;不同主题的情感主旋律不同。该结果对于网络舆情的控制以及个性化新闻推荐具有很好的借鉴作用。 展开更多
关键词 群体情感 影响因素 结合AP算法及TF-IDF算法的lda主题模型 二元逻辑回归模型
下载PDF
PCA-LDA算法在性别鉴别中的应用 被引量:19
10
作者 何国辉 甘俊英 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期208-210,213,共4页
结合主元分析(Principal Components Analysis,PCA)与线性鉴别分析(Linear Discriminant Analysis,LDA)的特点,提出用于性别鉴别的PCA-LDA算法。该算法通过PCA算法求得训练样本的特征子空间,并在此基础上计算LDA算法的特征子空间。将PC... 结合主元分析(Principal Components Analysis,PCA)与线性鉴别分析(Linear Discriminant Analysis,LDA)的特点,提出用于性别鉴别的PCA-LDA算法。该算法通过PCA算法求得训练样本的特征子空间,并在此基础上计算LDA算法的特征子空间。将PCA算法与LDA算法的特征子空间进行融合,获得PCA-LDA算法的融合特征空间。训练样本与测试样本分别朝融合特征空间投影,从而得到识别特征。利用最近邻准则即可完成性别鉴别。基于ORL(Olivetti Research Laboratory)人脸数据库的实验结果表明,PCA-LDA算法比PCA算法识别性能好,在性别鉴别中是一种有效的方法。 展开更多
关键词 性别鉴别 PCA-lda算法 融合算法
下载PDF
基于粒子群算法的LDA实现方法研究 被引量:7
11
作者 钟伟 黄元亮 +1 位作者 郝真真 姜甜甜 《计算机工程与应用》 CSCD 北大核心 2017年第1期39-43,共5页
针对传统线性判别分析方法存在的问题,在研究现有理论成果的基础上,提出一种新的LDA实现方法。该方法首先对原有的Fisher准则进行修正,然后通过迭代搜寻最佳鉴别矢量,最后对获取的鉴别矢量进行比较分析。在标准的JAFFE人脸库上的表情识... 针对传统线性判别分析方法存在的问题,在研究现有理论成果的基础上,提出一种新的LDA实现方法。该方法首先对原有的Fisher准则进行修正,然后通过迭代搜寻最佳鉴别矢量,最后对获取的鉴别矢量进行比较分析。在标准的JAFFE人脸库上的表情识别和地区综合消费水平的评价中的实验结果表明,此算法不仅具有良好的识别效果而且还可以突破样本维数的限制;与其他LDA算法相比,该算法更具灵活性且更易于实现。 展开更多
关键词 线性判别式分析 投影矢量 离散度矩阵 粒子群算法 PSO-lda算法
下载PDF
基于词加权LDA算法的无监督情感分类 被引量:5
12
作者 郝洁 谢珺 +2 位作者 苏婧琼 续欣莹 韩晓霞 《智能系统学报》 CSCD 北大核心 2016年第4期539-545,共7页
主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和... 主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和情感分析。通过计算语料中词汇与情感种子词的距离,在吉布斯采样中对不同词汇赋予不同权重,利用每个主题下的关键词判断主题的情感倾向,进而得到每篇文档的情感分布。这种方法增强了具有情感倾向的词汇在采样过程中的影响,从而改善了主题间的区分性。实验表明,与JST(Joint Sentiment/Topic model)模型相比,WLDA不仅在采样中迭代速度快,也能够更好地实现主题提取和情感分类。 展开更多
关键词 情感分类 主题情感混合模型 主题模型 lda 加权算法
下载PDF
基于LDA的煤矿安全隐患主题发现研究 被引量:17
13
作者 谭章禄 王泽 陈晓 《中国安全科学学报》 CAS CSCD 北大核心 2016年第6期123-128,共6页
为提高安全管理者对安全隐患数据的理解和认知水平,增强其隐患排查和治理能力,以潞安集团司马煤业有限公司2014年安全隐患记录为数据源,基于潜在狄利克雷分配模型(LDA)挖掘煤矿安全隐患主题。利用R软件进行主题模型参数估计、模型计算,... 为提高安全管理者对安全隐患数据的理解和认知水平,增强其隐患排查和治理能力,以潞安集团司马煤业有限公司2014年安全隐患记录为数据源,基于潜在狄利克雷分配模型(LDA)挖掘煤矿安全隐患主题。利用R软件进行主题模型参数估计、模型计算,最终优选出14个安全隐患主题;采用桑基图揭示隐患主题与责任主体、隐患致因之间的关系。结果表明:LDA主题模型能较好揭示煤矿安全隐患数据中的潜在规律,为煤矿隐患排查、隐患治理以及安全管理决策提供重要信息。 展开更多
关键词 煤矿隐患 潜在狄利克雷分配模型(lda) Gibbs抽样算法 词云 桑基图
下载PDF
基于应用场景的未来技术识别
14
作者 谢俊杰 孙希科 +2 位作者 王智琦 韩盟 陈悦 《情报杂志》 北大核心 2024年第5期97-105,共9页
[研究目的]未来技术作为传统产业的转型动力及未来产业的形成基础,从技术的应用及其产业化视角出发,进行未来技术的识别与预测,对我国布局未来产业、增强发展优势具有重要意义。[研究方法]从技术单元与技术方案出发,构建基于应用场景的... [研究目的]未来技术作为传统产业的转型动力及未来产业的形成基础,从技术的应用及其产业化视角出发,进行未来技术的识别与预测,对我国布局未来产业、增强发展优势具有重要意义。[研究方法]从技术单元与技术方案出发,构建基于应用场景的未来技术识别模型。首先,利用LDA主题模型对专利的用途进行主题聚类,识别技术的主要应用场景;其次,利用KeyBERT算法从专利的标题和新颖性文本中提取技术方案关键词,从技术方案的新颖性、关联性和重要性出发,筛选前沿技术方案;最后,定义产生前沿技术方案的技术单元为潜在未来技术,构建“技术影响力-技术生长力”坐标图,进行未来技术识别。[研究结论]以固体氧化物燃料电池领域为例进行实证研究,识别出13项未来技术,主要为SOFC批量化制造、可控性运行和实际化应用的技术,揭示了识别方法的有效性。 展开更多
关键词 应用场景 未来技术 技术识别 技术方案 专利文本 固体氧化物燃料电池 KeyBERT算法 lda
下载PDF
基于LDA模型的多角度个性化微博推荐算法 被引量:10
15
作者 孙玉洁 秦永彬 《计算机工程》 CAS CSCD 北大核心 2017年第4期177-182,共6页
通过基于概率的主题挖掘模型隐含狄利克雷分布(LDA)挖掘用户兴趣主题,是目前最常用的用户兴趣主题挖掘方法。为进一步改善用户体验,推荐其感兴趣且质量好、新鲜度高的微博,提出一种新的多角度个性化微博推荐算法。通过微博发布时间、转... 通过基于概率的主题挖掘模型隐含狄利克雷分布(LDA)挖掘用户兴趣主题,是目前最常用的用户兴趣主题挖掘方法。为进一步改善用户体验,推荐其感兴趣且质量好、新鲜度高的微博,提出一种新的多角度个性化微博推荐算法。通过微博发布时间、转发数、评论数等特征计算微博重要度,利用LDA模型生成的用户-主题矩阵以及主题-词汇矩阵计算用户对微博的兴趣度,综合考虑微博本身的重要度以及用户对微博的兴趣度对微博进行评分,根据评分结果推荐微博。实验结果表明,该算法与主题模型相结合可有效够提高微博推荐的精准度。 展开更多
关键词 微博 个性化推荐 隐含狄利克雷分布模型 推荐算法 评分预测 Top-N推荐
下载PDF
基于LDA与混沌粒子群算法的车道线识别方法研究 被引量:4
16
作者 黄新 刘璋 《液晶与显示》 CAS CSCD 北大核心 2017年第6期491-498,共8页
与传统的车道线检测算法不同,本文采用LDA算法对道路图像进行针对性灰度化处理。加大车道线与道路的差异,然后使用抛物线模型对车道线进行拟合,采用混沌粒子群算法对抛物线参数进行优化,以车道线的灰度特征和梯度特征作为混沌粒子群的... 与传统的车道线检测算法不同,本文采用LDA算法对道路图像进行针对性灰度化处理。加大车道线与道路的差异,然后使用抛物线模型对车道线进行拟合,采用混沌粒子群算法对抛物线参数进行优化,以车道线的灰度特征和梯度特征作为混沌粒子群的适应度函数,经过多次的迭代得到抛物线拟合车道线的参数最优值,进而识别出车道线。实验结果表明,本文算法能在复杂环境下识别出车道线,对视频帧序列中的车道线连续追踪具有良好效果。 展开更多
关键词 车道线检测 lda 混沌粒子群算法 抛物线拟合
下载PDF
基于LDA模型和AP聚类的主题演化分析 被引量:7
17
作者 倪丽萍 刘小军 马驰宇 《计算机技术与发展》 2016年第12期6-11,共6页
随着互联网的高速发展,网络信息呈现爆炸性增长态势,主题演化分析能够帮助人们从海量的互联网数据中获取更有价值的信息。分析主题的演化发展轨迹有利于人们了解主题事件发生的前因后果,并对主题事件发展趋势进行更好地预测,进而辅助管... 随着互联网的高速发展,网络信息呈现爆炸性增长态势,主题演化分析能够帮助人们从海量的互联网数据中获取更有价值的信息。分析主题的演化发展轨迹有利于人们了解主题事件发生的前因后果,并对主题事件发展趋势进行更好地预测,进而辅助管控。针对单个主题演化分析方法中阈值设定和主题漂移的问题,提出一种LDA-AP主题演化模型。该方法利用LDA模型对不同时间窗口内的新闻文本分别进行建模,得到相应的主题。利用AP聚类算法对不同时间窗口内的多个主题进行聚类,其中计算主题相似度采用加入时间衰减因子的JS散度来度量。最后对多个主题内容进行演化分析。通过相关的实验分析和对比,结果表明该方法可以改善主题演化的性能,并能较好地分析多个新闻主题事件随时间的演化趋势。 展开更多
关键词 多主题演化 时间窗口 lda模型 AP聚类算法 JS散度
下载PDF
一种新的基于LDA-MURE模型的音乐个性化推荐算法 被引量:4
18
作者 李艳 李葆华 王金环 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2017年第2期371-375,共5页
针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音... 针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音乐作品需求者的协同过滤算法和基于音乐属性项目的协同过滤算法相比,LDA-MURE算法可更高效地向音乐作品需求者推荐感兴趣的音乐作品. 展开更多
关键词 协同过滤 lda模型 GIBBS抽样 lda-MURE模型 推荐算法
下载PDF
基于改进LDA和K-means算法的主题句聚类 被引量:4
19
作者 刘子平 李学明 《计算机应用》 CSCD 北大核心 2016年第A02期239-241,250,共4页
针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集... 针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集聚类簇,采用最小描述长度(MDL)剪枝算法来确定最佳聚类数n个,然后将n作为隐含狄利克雷分布的主题数目的先验参数,计算n个主题所在维度上的重要句子作为初始聚类中心,最终完成隐含主题句聚类。实验结果表明改进后聚类算法克服了噪声数据的干扰,避免了主题数的经验误差,聚类结果更精确。 展开更多
关键词 潜在狄立克雷分布 K-MEANS算法 最小描述长度算法 句子聚类
下载PDF
基于LDA模型的专利信息聚类技术 被引量:21
20
作者 范宇 符红光 文奕 《计算机应用》 CSCD 北大核心 2013年第A01期87-89,93,共4页
针对传统专利情报采集的方式不能适应专利信息快速增加的问题,通过研究适用于专利信息聚类的主题模型和聚类算法,提出了将潜在狄利克雷分配(LDA)主题模型和OPTICS算法相结合的解决方案。该方案采用LDA主题模型将专利信息在词汇空间的高... 针对传统专利情报采集的方式不能适应专利信息快速增加的问题,通过研究适用于专利信息聚类的主题模型和聚类算法,提出了将潜在狄利克雷分配(LDA)主题模型和OPTICS算法相结合的解决方案。该方案采用LDA主题模型将专利信息在词汇空间的高维表达转换到在主题空间的低维表达,高效地实现了对专利信息的降维,进而采用OPTICS算法及k近邻准则对专利信息进行聚类分析,达到收集感兴趣的专利情报信息的目的。理论分析和实验验证表明,提出的解决方案不仅能通过降维,提高专利聚类效率,而且能对专利信息分析提供帮助。 展开更多
关键词 潜在狄利克雷分配主题模型 聚类分析 OPTICS算法 专利信息聚类 专利分析
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部