期刊文献+
共找到283篇文章
< 1 2 15 >
每页显示 20 50 100
基于词嵌入的科研主题排序研究
1
作者 何东彬 陶莎 +1 位作者 任延昭 朱艳红 《北方工业大学学报》 2024年第1期136-149,共14页
为准确把握科研领域内文献主题的发展变化,常利用隐式语义特征提取科研主题分布。但由于主题挖掘技术本身的限制,并非所有主题都具有同等重要性或意义。有些主题可能包含太多背景词,信息空泛,或者主题词之间缺乏连贯性,导致主题缺乏实... 为准确把握科研领域内文献主题的发展变化,常利用隐式语义特征提取科研主题分布。但由于主题挖掘技术本身的限制,并非所有主题都具有同等重要性或意义。有些主题可能包含太多背景词,信息空泛,或者主题词之间缺乏连贯性,导致主题缺乏实际意义。针对上述问题,在已有研究基础上,基于词嵌入,提出一种新的多维度评估主题质量算法;针对科研文档的特点,利用语料库的统计特征对无意义主题距离评估方法进行优化,并最终将二者融合到一个统一的主题排序框架中。实验结果表明,本文提出的方法可以有效提高主题排序整体效果,能够识别出非重要和质量差的主题,主题排序的整体效果优于现有方法。 展开更多
关键词 主题模型 潜在狄利克雷分配(LDA) 主题排序 科研主题 词嵌入
下载PDF
考虑竞品信息的顾客满意度研究
2
作者 董亚男 秦思奇 +5 位作者 相宇晗 王喆 唐维 祖丽胡玛尔 张娜 李玉鹏 《计算机集成制造系统》 EI CSCD 北大核心 2024年第9期3274-3287,共14页
产品研发的根本驱动力是实现顾客满意,少有研究结合竞品信息探究产品的顾客满意度。综合“比较问答”和“在线评论”等在线用户生成信息,提出一种考虑竞品信息的综合顾客满意度建模方法。首先,通过挖掘在线问答中的比较问题识别竞品,基... 产品研发的根本驱动力是实现顾客满意,少有研究结合竞品信息探究产品的顾客满意度。综合“比较问答”和“在线评论”等在线用户生成信息,提出一种考虑竞品信息的综合顾客满意度建模方法。首先,通过挖掘在线问答中的比较问题识别竞品,基于比较回答的情感分析计算产品间的比较得分,构建比较网络,利用PageRank算法计算竞争顾客满意度。其次,运用LDA主题提取和情感分析从在线评论中提取基础顾客满意度。最后,结合竞争满意度和基础满意度获得综合顾客满意度。以红米K50的顾客满意度测度为例进行了案例分析,结果表明,综合顾客满意度结果与销量数据高度一致,可为产品改进提供决策依据。 展开更多
关键词 顾客满意度 竞品 在线用户生成信息 情感分析 LDA主题提取
下载PDF
一种新的目标检测方法:Latent Dirichlet classification 被引量:3
3
作者 丁轶 郭乔进 李宁 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第2期214-220,共7页
图像目标检测的任务是通过对图像分块或者分区域提取特征,进行学习和分类,从而检测出目标在图像中的位置.基于潜在迪利克雷分布模型,提出一种应用于目标检测的主题模型latentDirichlet classification(LDC),结合图像连续值局部特征和共... 图像目标检测的任务是通过对图像分块或者分区域提取特征,进行学习和分类,从而检测出目标在图像中的位置.基于潜在迪利克雷分布模型,提出一种应用于目标检测的主题模型latentDirichlet classification(LDC),结合图像连续值局部特征和共生关系来进行目标检测.LDC模型将latentDirichlet allocation(LDA)生成的主题信息作为权重赋予样本,生成多份样本,然后利用多份样本训练多个分类器进行集成分类.实验结果表明利用LDC模型能有效提高检测精度. 展开更多
关键词 潜在迪利克雷分布 目标检测 变分推理 主题模型
下载PDF
基于隐含狄利克雷分配模型的企业创新测量方法研究
4
作者 叶琴 蔡建峰 张秋韵 《科技进步与对策》 北大核心 2024年第2期90-98,共9页
如何准确测量企业创新是国家创新驱动发展战略背景下学界和业界亟待解决的关键问题。近年来,专利和研发支出作为当前主流企业创新代理指标备受质疑。为此,基于上市公司分析师报告文本,引入机器学习领域非监督学习方法,通过构建隐含狄利... 如何准确测量企业创新是国家创新驱动发展战略背景下学界和业界亟待解决的关键问题。近年来,专利和研发支出作为当前主流企业创新代理指标备受质疑。为此,基于上市公司分析师报告文本,引入机器学习领域非监督学习方法,通过构建隐含狄利克雷分配主题模型,开发一种新的测量企业创新的方法,并与当前主流方法进行比较。研究发现:①基于文本的企业创新测量方法既适用于专利和研发企业,也适用于非专利和非研发企业;②对于专利和研发企业而言,基于文本的企业创新与企业专利申请和研发支出显著相关;对于非专利和非研发企业而言,新测量方法能够有效识别企业利用新技术、开辟新市场等创新实践;③时间序列分析表明,基于文本分析的企业创新能够准确反映样本区间企业创新活动宏观趋势。 展开更多
关键词 隐含狄利克雷分配模型 企业创新 文本分析 主题模型 分析师报告
下载PDF
国外智慧旅游政策和理论的主题建模及趋势研究
5
作者 陈秋英 宋姗姗 《科技和产业》 2024年第5期56-64,共9页
为理清国外智慧旅游政策和理论的研究热点及趋势,通过LDA(隐含狄利克雷分布)主题模型得出4个政策主题、8个理论主题。分析发现“digital travel(数字旅游)”“intelligent travel(智能旅游)”“smart tourism standards(智慧旅游标准)... 为理清国外智慧旅游政策和理论的研究热点及趋势,通过LDA(隐含狄利克雷分布)主题模型得出4个政策主题、8个理论主题。分析发现“digital travel(数字旅游)”“intelligent travel(智能旅游)”“smart tourism standards(智慧旅游标准)”是政策文本重点内容。通过主题模型和知识图谱分析学术文本发现,智慧旅游“data mining (数据挖掘)”“smart tourism system(智慧旅游系统)”信息推荐功能日渐显著,游客行为满意度与智慧旅游城市的选择两者之间关系密切。针对研究结论提出强化智慧旅游工作绩效评估机制、完善标准化政策体系、加大政策扶持新力度等建议。 展开更多
关键词 智慧旅游 LDA(隐含狄利克雷分布)主题建模 CITESPACE 研究趋势
下载PDF
监督主题模型的临床文本挖掘和药效预测
6
作者 谢新平 裴洋洋 +1 位作者 姜晓东 王红强 《信息与电脑》 2024年第6期200-205,共6页
患者的临床文本隐含着个体与药效之间的密切联系。针对临床上抗癌药效精准性问题,基于有监督隐含狄利克雷分布(Supervised Latent Dirichlet Allocation,SLDA)构建了一种用于药效二分类预测新方法——伯努利-监督隐含狄利克雷分布(Berno... 患者的临床文本隐含着个体与药效之间的密切联系。针对临床上抗癌药效精准性问题,基于有监督隐含狄利克雷分布(Supervised Latent Dirichlet Allocation,SLDA)构建了一种用于药效二分类预测新方法——伯努利-监督隐含狄利克雷分布(Bernoulli-SLDA,B-SLDA),该模型获得患者临床文本的特征表示,学习到与对应药效标签的映射关系。实验结果表明,对比传统的特征提取方法,所提方法提高了抗肿瘤药物药效预测性能。 展开更多
关键词 监督主题模型 监督隐含狄利克雷分布(SLDA) 药效预测 文本分类
下载PDF
基于深度学习模型的煤矿安全隐患数据主题挖掘
7
作者 肖琪耀 贾宝山 +2 位作者 徐以诺 张茂薇 梁明辉 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第4期49-55,共7页
为了提高煤矿安全风险排查能力和监督能力,提出1种基于双向长短期记忆网络(BiLSTM)、条件随机场(CRF)和隐含狄利克雷分布(LDA)的模型。训练BiLSTM-CRF模型分词,采用困惑度-主题方差(perplexity-var)计算LDA模型最优主题数,构建BiLSTM-CR... 为了提高煤矿安全风险排查能力和监督能力,提出1种基于双向长短期记忆网络(BiLSTM)、条件随机场(CRF)和隐含狄利克雷分布(LDA)的模型。训练BiLSTM-CRF模型分词,采用困惑度-主题方差(perplexity-var)计算LDA模型最优主题数,构建BiLSTM-CRF-LDA模型挖掘内蒙古某煤矿安全隐患数据。研究结果表明:困惑度-主题方差指标能更准确地确定主题数;BiLSTM-CRF模型分词结果比jieba库更准确;BiLSTM-CRF-LDA模型能准确地挖掘出煤矿安全隐患类型、安全隐患空间分布和安全责任划分。研究结果可为煤矿安全风险排查与监督提供参考。 展开更多
关键词 煤矿安全隐患 BiLSTM CRF LDA 困惑度-主题方差
下载PDF
基于LDA与双向GRU的借阅主题热度预测
8
作者 陈志辉 吴克晴 +1 位作者 陈嘉超 秦泽豪 《软件导刊》 2024年第7期51-57,共7页
图书借阅主题分析能够挖掘读者借阅喜好和阅读规律,通过使用借阅主题热度预测模型能够预测读者借阅主题热度变化趋势,对图书馆开展阅读推广活动具有重要意义。为了解决图书借阅主题提取、主题热度预测问题,提出基于LDA与双向GRU神经网... 图书借阅主题分析能够挖掘读者借阅喜好和阅读规律,通过使用借阅主题热度预测模型能够预测读者借阅主题热度变化趋势,对图书馆开展阅读推广活动具有重要意义。为了解决图书借阅主题提取、主题热度预测问题,提出基于LDA与双向GRU神经网络的借阅主题热度预测模型。该算法通过LDA算法提取读者不同时间段中的借阅图书特征和借阅主题,在计算不同时间段借阅主题热度、构建借阅主题热度序列数据集的基础上,构造基于双向GRU神经网络的主题热度预测模型以预测未来主题热度变化趋势,并在厦门大学图书馆纸质文献借阅记录数据集上进行实验评估。实验结果表明,模型能准确获得借阅主题与关键词之间的关系,与机器学习等算法比较可知,该模型能有效降低借阅主题热度预测误差。 展开更多
关键词 热度预测 借阅主题发现 深度学习 双向门控循环单元 潜在狄利克雷分配
下载PDF
Self-Adaptive Topic Model: A Solution to the Problem of "Rich Topics Get Richer" 被引量:1
9
作者 FANG Ying 《China Communications》 SCIE CSCD 2014年第12期35-43,共9页
The problem of "rich topics get richer"(RTGR) is popular to the topic models,which will bring the wrong topic distribution if the distributing process has not been intervened.In standard LDA(Latent Dirichlet... The problem of "rich topics get richer"(RTGR) is popular to the topic models,which will bring the wrong topic distribution if the distributing process has not been intervened.In standard LDA(Latent Dirichlet Allocation) model,each word in all the documents has the same statistical ability.In fact,the words have different impact towards different topics.Under the guidance of this thought,we extend ILDA(Infinite LDA) by considering the bias role of words to divide the topics.We propose a self-adaptive topic model to overcome the RTGR problem specifically.The model proposed in this paper is adapted to three questions:(1) the topic number is changeable with the collection of the documents,which is suitable for the dynamic data;(2) the words have discriminating attributes to topic distribution;(3) a selfadaptive method is used to realize the automatic re-sampling.To verify our model,we design a topic evolution analysis system which can realize the following functions:the topic classification in each cycle,the topic correlation in the adjacent cycles and the strength calculation of the sub topics in the order.The experiment both on NIPS corpus and our self-built news collections showed that the system could meet the given demand,the result was feasible. 展开更多
关键词 topic model infinite latent Dirichlet Allocation Dirichlet process topic evolution
下载PDF
Unsupervised Feature Selection for Latent Dirichlet Allocation 被引量:1
10
作者 徐蔚然 杜刚 +2 位作者 陈光 郭军 杨洁 《China Communications》 SCIE CSCD 2011年第5期54-62,共9页
As a generative model,Latent Dirichlet Allocation Model,which lacks optimization of topics' discrimination capability focuses on how to generate data,This paper aims to improve the discrimination capability throug... As a generative model,Latent Dirichlet Allocation Model,which lacks optimization of topics' discrimination capability focuses on how to generate data,This paper aims to improve the discrimination capability through unsupervised feature selection.Theoretical analysis shows that the discrimination capability of a topic is limited by the discrimination capability of its representative words.The discrimination capability of a word is approximated by the Information Gain of the word for topics,which is used to distinguish between "general word" and "special word" in LDA topics.Therefore,we add a constraint to the LDA objective function to let the "general words" only happen in "general topics" other than "special topics".Then a heuristic algorithm is presented to get the solution.Experiments show that this method can not only improve the information gain of topics,but also make the topics easier to understand by human. 展开更多
关键词 pattern recognition unsupervised feature selection latent Dirichlet Allocation general topic special topic
下载PDF
基于无监督LDA的水电工程施工安全事故致因分析 被引量:1
11
作者 陈述 孙孟文 +3 位作者 陈云 聂本武 李智 刘文濯 《中国安全科学学报》 CAS CSCD 北大核心 2023年第10期79-85,共7页
为实现水电工程施工安全事故报告中致因的智能挖掘,首先,利用Jieba库分词处理1206条事故分析报告,提出事故分析文本词频-逆文档频率(TF-IDF)关键词处理算法,确定词频权重并构建事故文本词向量;然后,基于TF-IDF特征,训练无监督隐含狄利... 为实现水电工程施工安全事故报告中致因的智能挖掘,首先,利用Jieba库分词处理1206条事故分析报告,提出事故分析文本词频-逆文档频率(TF-IDF)关键词处理算法,确定词频权重并构建事故文本词向量;然后,基于TF-IDF特征,训练无监督隐含狄利克雷分布(LDA)主题模型,提取事故主题及主题词;最后,对主题词进行社会网络分析,揭示事故要素间的潜在关系,智能输出水电工程施工安全事故成因。结果表明:LDA主题模型能快速挖掘出大量有效事故数据信息,并计算出安全意识、事故隐患、违章行为等5个事故主题。致因自动分析结果显示,违规违章操作、未掌握安全操作技术、材料设备问题、违反施工程序、作业环境条件不良是导致水电工程施工安全事故的最主要原因。加强施工人员的行为监管,提高事故主要致因的预防能力,有助于提升水电工程施工安全管控水平。 展开更多
关键词 水电工程 施工安全事故 无监督隐含狄利克雷分布(LDA)主题模型 事故致因 社会网络分析 因子分析
下载PDF
主题模型自动标记方法研究综述
12
作者 何东彬 陶莎 +2 位作者 朱艳红 任延昭 褚云霞 《计算机科学与探索》 CSCD 北大核心 2023年第12期2861-2879,共19页
主题模型常用于非结构化语料库和离散数据建模,抽取隐含主题分布。由于主题发现结果采用词列表形式,理解其含义较为困难。尽管通过人工标记可生成更具解释性和易理解的主题标签,但成本巨大缺乏可行性,而自动主题标记的研究为解决该问题... 主题模型常用于非结构化语料库和离散数据建模,抽取隐含主题分布。由于主题发现结果采用词列表形式,理解其含义较为困难。尽管通过人工标记可生成更具解释性和易理解的主题标签,但成本巨大缺乏可行性,而自动主题标记的研究为解决该问题提供了方法和思路。首先对当前最为流行的狄利克雷分配主题模型进行阐述与分析,并根据主题标签三种不同表现形式,基于短语、摘要和图片,将主题标记方法分为三种类型;之后围绕提高主题的可解释性,以生成的不同类型主题标签为线索,对近年来的相关研究成果进行梳理、分析和总结,并对不同标签的适用情境和可用性进行探讨;同时根据不同方法的特点进一步分类,重点对基于词法、子模优化和图排序方法生成摘要主题标签进行定量和定性分析,从学习类型、使用技术和数据来源出发,对比不同方法的差异;最后对主题自动标记研究存在的问题和趋势发展进行讨论,基于深度学习、与情感分析结合并不断拓展主题标记应用的场景,将是未来发展的重点和方向。 展开更多
关键词 主题模型 潜在狄利克雷分配(LDA) 主题标记 主题标签
下载PDF
基于密度Canopy的评论文本主题识别方法 被引量:1
13
作者 刘滨 詹世源 +7 位作者 刘宇 雷晓雨 杨雨宽 陈伯轩 刘格格 高歆 皇甫佳悦 陈莉 《河北科技大学学报》 CAS 北大核心 2023年第5期493-501,共9页
融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进... 融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进Kmeans算法。实验结果表明,提出的方法在一致性指标上要优于使用K-means以及K-means++对特征向量聚类的同类方法;与SBERT-LDA方法相比,在1852条戏剧评论数据集上,一致性指标值提高了22.9%。因此,所提出的SBERT-LDA-DC方法是有效的,对产品或服务提供者更好地了解用户意见、完善自身产品或提升服务水平提供了新方法,具有较强的实际应用价值。 展开更多
关键词 自然语言处理 主题识别 评论文本 Sentence-BERT LDA
下载PDF
基于LDA模型的专利文本主题分析——以国内元宇宙领域为例 被引量:2
14
作者 陆振昇 马超 《科技和产业》 2023年第11期85-88,共4页
为了探究元宇宙作为新兴产业的热点,解决国内元宇宙领域研究重点不明确的问题,提出使用LDA主题模型的专利文本分析方法。将LDA主题模型运用到国内元宇宙领域相关专利文本分析中,结合人为判断和主题困惑度的方法,实现了对专利技术主题的... 为了探究元宇宙作为新兴产业的热点,解决国内元宇宙领域研究重点不明确的问题,提出使用LDA主题模型的专利文本分析方法。将LDA主题模型运用到国内元宇宙领域相关专利文本分析中,结合人为判断和主题困惑度的方法,实现了对专利技术主题的识别和划分。通过实验分析得出结论:人工智能、区块链、云计算等是当前中国元宇宙产业应用专利的热点技术;通过LDA主题模型分析国内元宇宙的专利文本,可以实现其技术热点主题的分类和细分判别,可以为未来的行业发展提供建议。 展开更多
关键词 LDA主题模型 元宇宙 专利文本分析
下载PDF
抖音电商平台助农产品在线评论主题挖掘及扩展分析
15
作者 邵婷 杨佩婷 姜红波 《厦门理工学院学报》 2023年第4期55-64,共10页
基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型,引入高频词分析、共现网络分析、情感分析等方法,对抖音电商平台上助农产品在线评论的主题进行挖掘和扩展分析表明,消费者对助农产品的关注点主要包括产品质量和价格、商家... 基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型,引入高频词分析、共现网络分析、情感分析等方法,对抖音电商平台上助农产品在线评论的主题进行挖掘和扩展分析表明,消费者对助农产品的关注点主要包括产品质量和价格、商家服务和物流服务、消费者感知价值、助农活动和县长支持等。通过共现网络分析和情感分析均发现消费者对抖音平台助农产品总体是满意的,但仍有改善空间。建议抖音电商平台通过挖掘消费者需求、保证助农产品性价比、把握“电商助农”宣传方向、加强主播培训等方式来提升消费者的购物体验和满意度。 展开更多
关键词 抖音电商平台 助农产品 在线评论 主题挖掘 扩展分析 LDA模型
下载PDF
基于主题模型和情感分析的进口跨境电商顾客满意度评价研究 被引量:2
16
作者 邢丹 屈仁均 《科技和产业》 2023年第1期58-65,共8页
进口跨境电商已成为驱动国内消费增量的新业态,而顾客满意度的高低则是进口跨境电商提高留存率和转换率的关键。与此同时,海量的在线评论为商家提供了极具价值的信息,对其进行情感挖掘将有助于商家优化产品供给。为此,选择京东全球购个... 进口跨境电商已成为驱动国内消费增量的新业态,而顾客满意度的高低则是进口跨境电商提高留存率和转换率的关键。与此同时,海量的在线评论为商家提供了极具价值的信息,对其进行情感挖掘将有助于商家优化产品供给。为此,选择京东全球购个人护理产品作为研究对象,通过构建进口跨境电商顾客满意度综合评价模型,运用TF-IDF算法和文本聚类LDA主题模型等对评论文本内容进行分析和主题特征提取,并建立情感词典依次对顾客满意度各影响因素匹配赋值打分,以此来确定各项用户需求的重要度和产品及服务改进的优先级顺序。最终研究表明影响顾客满意度的各个因素综合得分排序从高到低为产品质量、物流服务质量、品牌信誉、感知价值、商家服务质量。 展开更多
关键词 进口跨境电商 潜在狄利克雷分布(LDA)主题模型 情感分析 顾客满意度评价 文本挖掘
下载PDF
应对百年未有之大变局的中国经济研究热点及合作网络分析
17
作者 王正芳 张军亮 +2 位作者 刘喜文 李小倩 杜文豪 《科技和产业》 2023年第21期21-30,共10页
运用潜在狄利克雷分配(LDA)模型对中国知网“百年未有之大变局的中国经济”专题库里的文献摘要进行主题挖掘,同时借助社会网络分析对发文机构合作网络的关系特征与位置特征进行分析。结果表明:研究主题丰富,研究内容与时俱进,研究方法... 运用潜在狄利克雷分配(LDA)模型对中国知网“百年未有之大变局的中国经济”专题库里的文献摘要进行主题挖掘,同时借助社会网络分析对发文机构合作网络的关系特征与位置特征进行分析。结果表明:研究主题丰富,研究内容与时俱进,研究方法多采用客观数据开展影响因素、作用效应及发展路径等内容的实证分析;存有5个核心机构,机构合作不足且相对封闭,产学政研合作不够深入,整体呈现出“小聚集、大分散”特点。基于此,未来中国经济研究可以从开展前瞻性研究、均衡研究注意力以及加强多元主体合作3方面进行展望。 展开更多
关键词 主题挖掘 潜在狄利克雷分配(LDA)主题模型 社会网络分析 热点趋势
下载PDF
基于主题模型的科技文献主题演化及优化方法研究综述
18
作者 于诗睿 李爱花 +2 位作者 林紫洛 陈逸菲 唐小利 《医学信息学杂志》 CAS 2023年第8期31-36,共6页
目的/意义梳理主题演化分析方法研究进展,改善科技文献主题识别和趋势研判效果,支撑文献信息服务,为未来深入研究和实践应用指明方向。方法/过程根据隐含狄利克雷分布主题模型的缺陷归纳其衍生模型,针对现有科技文献主题演化分析方法存... 目的/意义梳理主题演化分析方法研究进展,改善科技文献主题识别和趋势研判效果,支撑文献信息服务,为未来深入研究和实践应用指明方向。方法/过程根据隐含狄利克雷分布主题模型的缺陷归纳其衍生模型,针对现有科技文献主题演化分析方法存在的不足对相应改善方案进行总结,最后结合现有研究局限性提出展望。结果/结论通过全面调研,为主题演化研究提供启示和借鉴。 展开更多
关键词 主题模型 主题识别 主题演化 隐含狄利克雷分布主题模型 文本挖掘
下载PDF
基于公众关注主题及情感视角的我国罕见病医药保障策略研究——以诺西那生钠为例
19
作者 邰杨芳 郭樱 +5 位作者 王紫琼 王君慧 华国旻 杨慧丽 王晓洁 贺培风 《中国药房》 CAS 北大核心 2023年第7期774-779,共6页
目的挖掘网络大众关于罕见病的关注焦点和情感态度,为相关部门对罕见病医药保障相关政策、制度及策略的制定与实施提供决策参考。方法利用潜在狄利克雷分布(LDA)主题模型和情感分析方法分析Bilibili网站上与“天价药”诺西那生钠纳入医... 目的挖掘网络大众关于罕见病的关注焦点和情感态度,为相关部门对罕见病医药保障相关政策、制度及策略的制定与实施提供决策参考。方法利用潜在狄利克雷分布(LDA)主题模型和情感分析方法分析Bilibili网站上与“天价药”诺西那生钠纳入医保事件相关的高播放量短视频的评论文本,挖掘文本的主题和情感倾向,并提出相应策略建议。结果共获得8个播放量上万的视频,获得7109条文本数据。根据LDA分析提取出网络公众关注罕见病相关的9个主题(罕见病药的价格、罕见病药入医保、罕见病药的研发现状、医保范围与医疗保障体系、罕见病患者群体的困境、罕见病的预防与筛查、罕见病药入医保的价值、罕见病的中西医疗法、罕见病药的供需现状),按关注对象概括为4大类(罕见病药物类、罕见病医疗保险类、罕见病医疗卫生服务类和罕见病患者群体类)。公众对各主题的情感总体呈现出低积极性和高消极性的倾向。结论公众对罕见病药的价格、研发和供需问题关注度最高,并对我国当前罕见病的医疗现状深感担忧。建议加强和完善对罕见病患者的医药保障,如积极开展罕见病公共卫生服务,加强罕见病诊疗合作与罕见病药的研究;我国医药卫生相关部门可从医疗卫生服务、药品供应保障、医疗保障和其他社会保障等方面协同努力。 展开更多
关键词 罕见病 潜在狄利克雷分布主题模型 情感分析 诺西那生钠 医药保障
下载PDF
基于LDA主题模型的杭州市公园季节性公共服务价值
20
作者 侯力丹 卢群 林帅君 《中国城市林业》 2023年第3期109-116,132,共9页
季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游... 季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游客的关注度进行研究,并利用SnowNLP对评价文本中游客的情感变化进行分析。结果表明:春季和秋季游客主要关注以自然风光为主的游赏价值,夏季游客对公园的功能服务价值具有最高的关注度,冬季公园的休闲娱乐价值是游客最在意的方面,此外,游客对于不同季节的公园的公共服务价值普遍给予较为积极的评价,其中游赏价值、功能服务价值和休闲娱乐价值对游客的情感具有显著的影响。因此,公园的建设与发展应充分考虑公共服务价值随季节的变化,并根据游客诉求进行灵活调整。 展开更多
关键词 潜在狄利克雷分布主题模型 网络文本 简体中文文本处理 季节性公共服务价值 杭州市公园
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部