期刊文献+
共找到2,229篇文章
< 1 2 112 >
每页显示 20 50 100
基于BERT和TextCNN的智能制造成熟度评估方法 被引量:1
1
作者 张淦 袁堂晓 +1 位作者 汪惠芬 柳林燕 《计算机集成制造系统》 EI CSCD 北大核心 2024年第3期852-863,共12页
随着智能制造2025目标的临近,企业为了解自身能力水平纷纷加入到智能制造成熟度评估的行列中。然而,由于智能制造成熟度评估标准的复杂性,企业缺乏其对行业水平的了解,导致企业贸然申请,浪费自身时间的同时又占用大量评估资源。鉴于此,... 随着智能制造2025目标的临近,企业为了解自身能力水平纷纷加入到智能制造成熟度评估的行列中。然而,由于智能制造成熟度评估标准的复杂性,企业缺乏其对行业水平的了解,导致企业贸然申请,浪费自身时间的同时又占用大量评估资源。鉴于此,设计了一种新的评估流程,采用文本处理算法对整个评估过程进行了重构,通过利用国标文件中智能制造成熟度评估标准,将其作为训练集,采用基于预训练语言模型与文本神经网络(BERT+TextCNN)相结合的智能评估算法代替人工评估。在真实的企业智能制造数据集上的验证表明,当BERT+TextCNN评估模型在卷积核为[2,3,4]、迭代次数为6次、学习率为3e-5时,对智能制造成熟度进行评估,准确率达到85.32%。这表明所设计的评估方法能够较准确地帮助企业完成智能制造成熟度自评估,有助于企业了解自身智能制造能力水平,制定正确的发展方向。 展开更多
关键词 智能制造成熟度模型 BERT预训练语言模型 文本卷积神经网络 评估过程重构
下载PDF
基于语义增强模式链接的Text-to-SQL模型
2
作者 吴相岚 肖洋 +1 位作者 刘梦莹 刘明铭 《计算机应用》 CSCD 北大核心 2024年第9期2689-2695,共7页
为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加... 为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化;最后,使用改良的关系图注意力网络(RGAT)图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码,并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言(SQL)语句解码。在Spider数据集上的实验结果表明,使用ELECTRA-large预训练模型时,SELSQL模型比最佳基线模型的准确率提升了2.5个百分点,对于复杂SQL语句生成的提升效果很大。 展开更多
关键词 模式链接 图结构学习 预训练语言模型 text-to-SQL 异构图
下载PDF
HybridGAD: Identification of AI-Generated Radiology Abstracts Based on a Novel Hybrid Model with Attention Mechanism
3
作者 TugbaÇelikten Aytug Onan 《Computers, Materials & Continua》 SCIE EI 2024年第8期3351-3377,共27页
Class Title:Radiological imaging method a comprehensive overview purpose.This GPT paper provides an overview of the different forms of radiological imaging and the potential diagnosis capabilities they offer as well a... Class Title:Radiological imaging method a comprehensive overview purpose.This GPT paper provides an overview of the different forms of radiological imaging and the potential diagnosis capabilities they offer as well as recent advances in the field.Materials and Methods:This paper provides an overview of conventional radiography digital radiography panoramic radiography computed tomography and cone-beam computed tomography.Additionally recent advances in radiological imaging are discussed such as imaging diagnosis and modern computer-aided diagnosis systems.Results:This paper details the differences between the imaging techniques the benefits of each and the current advances in the field to aid in the diagnosis of medical conditions.Conclusion:Radiological imaging is an extremely important tool in modern medicine to assist in medical diagnosis.This work provides an overview of the types of imaging techniques used the recent advances made and their potential applications. 展开更多
关键词 Generative artificial intelligence AI-generated text detection attention mechanism hybrid model for text classification
下载PDF
CINO-TextGCN:融合CINO与TextGCN的藏文文本分类模型研究
4
作者 李果 杨进 陈晨 《高原科学研究》 CSCD 2024年第1期121-129,共9页
为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型(Chinese Minority Pr-etrained Language Model,CINO)和图卷积神经网络模型(Text Graph Convolutional Networks,TextGCN)的方法,即CINO-TextGCN模型。为有效评... 为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型(Chinese Minority Pr-etrained Language Model,CINO)和图卷积神经网络模型(Text Graph Convolutional Networks,TextGCN)的方法,即CINO-TextGCN模型。为有效评测该模型对藏文文本的分类性能,自建了较大规模和较高质量的藏文新闻文本公开数据集TNEWS(https://github.com/LG2016/CINO-TextGCN),通过实验发现,CINO-Text-GCN在公开数据集TNCC上的准确率为74.20%,在TNEWS上为83.96%。因此,该融合模型能够较好地捕捉到藏文文本语义,提升藏文文本分类性能。 展开更多
关键词 藏文 图卷积神经网络 融合模型 新闻文本 文本分类
下载PDF
基于Bert-TextCNN的开源威胁情报文本的多标签分类方法
5
作者 陆佳丽 《信息安全研究》 CSCD 北大核心 2024年第8期760-768,共9页
开源威胁情报对网络安全防护十分重要,但其存在着分布广、形式多、噪声大的特点.所以如何能对收集到的海量开源威胁情报进行高效的整理和分析就成为亟需解决的问题.因此,探索了一种以Bert-TextCNN模型为基础且同时考虑标题、正文和正则... 开源威胁情报对网络安全防护十分重要,但其存在着分布广、形式多、噪声大的特点.所以如何能对收集到的海量开源威胁情报进行高效的整理和分析就成为亟需解决的问题.因此,探索了一种以Bert-TextCNN模型为基础且同时考虑标题、正文和正则判断的多标签分类方法.根据情报源发布文本的特点,设置正则判断规则,以弥补模型的欠缺;为更全面反映开源威胁情报文本所涉及的威胁主题,针对标题和正文分别设置了Bert-TextCNN多标签分类模型,并将2部分标签整理去重以得到文本的最终威胁类别.通过与只依据正文建立的Bert-TextCNN多标签分类模型进行对比,所设置的模型在性能上有所提升,且召回率提升明显,能为开源威胁情报分类工作提供有价值的参考. 展开更多
关键词 开源威胁情报 多标签分类 文本分类 Bert模型 textCNN模型
下载PDF
TextRail:复杂自然场景下的不规则文本检测算法
6
作者 马静 薛浩 郭小宇 《计算机工程与应用》 CSCD 北大核心 2023年第21期112-122,共11页
文本检测是文本识别的前提和基础。复杂自然场景下,受透视、遮挡、变形等因素影响,图像质量难以保证,同时图像中的文字形式丰富多样,多呈不规则形状,加上复杂背景的干扰,致使文本检测难度大、精确度低。针对文本形状不规则的场景,提出... 文本检测是文本识别的前提和基础。复杂自然场景下,受透视、遮挡、变形等因素影响,图像质量难以保证,同时图像中的文字形式丰富多样,多呈不规则形状,加上复杂背景的干扰,致使文本检测难度大、精确度低。针对文本形状不规则的场景,提出了一种文本边轨模型(TextRail),该模型基于文本上、下边界基准点表示文本区域的思想,实现对任意形状文本的高效检测。TextRail使用全卷积网络(full convolutional network,FCN)及特征金字塔网络(feature pyramid network,FPN)提取文本图像特征;将特征送入检测头网络,实现文本区域上下边界基准点的预测,将预测结果通过位置感知非极大抑制(locality-aware non-maximum suppression,LNMS)合并,得到最终的上下边界基准点;采用薄板样条插值(thin plate spline,TPS)的方法实现对不规则文本的自动矫正。通过大量的实验验证,TextRail在F1分值上优于其他文本检测模型。同时TextRail模型可以准确表示出文字的朝向、弯曲和变形情况,有效提升了不规则文本检测的准确率和鲁棒性。 展开更多
关键词 复杂自然场景 不规则文本检测 文本矫正 基准点 textRail模型
下载PDF
BURST-LDA: A NEW TOPIC MODEL FOR DETECTING BURSTY TOPICS FROM STREAM TEXT 被引量:3
7
作者 Qi Xiang Huang Yu +4 位作者 Chen Ziyan Liu Xiaoyan Tian Jing Huang Tinglei Wang Hongqi 《Journal of Electronics(China)》 2014年第6期565-575,共11页
Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty... Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty topics that experience a sudden increase during a period of time. In this paper, we propose a new topic model named Burst-LDA, which simultaneously discovers topics and reveals their burstiness through explicitly modeling each topic's burst states with a first order Markov chain and using the chain to generate the topic proportion of documents in a Logistic Normal fashion. A Gibbs sampling algorithm is developed for the posterior inference of the proposed model. Experimental results on a news data set show our model can efficiently discover bursty topics, outperforming the state-of-the-art method. 展开更多
关键词 text mining Burst detection Topic model Graphical model Bayesian inference
下载PDF
生成式人工智能大模型在设计领域的应用 被引量:2
8
作者 孙守迁 曹磊磊 +4 位作者 王松 刘杰汉 于卓玉 殷敏 柴春雷 《家具与室内装饰》 北大核心 2024年第4期1-8,I0005,共9页
近些年来,随着ChatGPT,Midjourney,Stable Diffusion,Gemini等大模型的横空出世,生成式人工智能大模型取得了飞速发展,各行各业迎来了新一轮的技术变革。旨在探讨这一前沿技术在设计领域的应用,特别是在设计创新和创意产出方面的影响。... 近些年来,随着ChatGPT,Midjourney,Stable Diffusion,Gemini等大模型的横空出世,生成式人工智能大模型取得了飞速发展,各行各业迎来了新一轮的技术变革。旨在探讨这一前沿技术在设计领域的应用,特别是在设计创新和创意产出方面的影响。首先,我们介绍了生成式人工智能大模型的基本原理,着重阐述其在文本生成、图像生成等任务上的成功应用。其次,我们深入研究了生成式人工智能大模型在设计领域的具体应用,主要包括服装设计、平面设计、漫画设计、机器人设计、工艺品设计、游戏设计等方面。此外,还探讨了生成式人工智能大模型在设计领域可能面临的挑战以及相应的解决策略。最后,我们强调了在设计领域使用生成式人工智能大模型的潜在益处,以及在设计过程中应扮演的角色。 展开更多
关键词 生成式人工智能 大模型 文本生成 图像生成 设计 创新
下载PDF
Statistical Language Model for Chinese Text Proofreading
9
作者 张仰森 曹元大 《Journal of Beijing Institute of Technology》 EI CAS 2003年第4期441-445,共5页
Statistical language modeling techniques are investigated so as to construct a language model for Chinese text proofreading. After the defects of n-gram model are analyzed, a novel statistical language model for Chine... Statistical language modeling techniques are investigated so as to construct a language model for Chinese text proofreading. After the defects of n-gram model are analyzed, a novel statistical language model for Chinese text proofreading is proposed. This model takes full account of the information located before and after the target word wi, and the relationship between un-neighboring words w_i and w_j in linguistic environment(LE). First, the word association degree between w_i and w_j is defined by using the distance-weighted factor, w_j is l words apart from w_i in the LE, then Bayes formula is used to calculate the LE related degree of word w_i, and lastly, the LE related degree is taken as criterion to predict the reasonability of word w_i that appears in context. Comparing the proposed model with the traditional n-gram in a Chinese text automatic error detection system, the experiments results show that the error detection recall rate and precision rate of the system have been improved. 展开更多
关键词 statistical language model N-GRAM linguistic environment text proofreading
下载PDF
“助”与“替”:生成式AI对学术研究的双重效应 被引量:1
10
作者 黄时进 《上海师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2024年第2期65-74,共10页
生成式AI应用于学术研究,揭开了知识生产的新篇章,它可以通过“助”读、“助”知、“助”写和“助”思来助力人的学术研究,自动化一些准备性或辅助性的工作,减轻人的认知负荷,使人将主要精力集中学术创新的关键环节,提高学术知识生产的... 生成式AI应用于学术研究,揭开了知识生产的新篇章,它可以通过“助”读、“助”知、“助”写和“助”思来助力人的学术研究,自动化一些准备性或辅助性的工作,减轻人的认知负荷,使人将主要精力集中学术创新的关键环节,提高学术知识生产的效率。但对于生成式AI辅助功能的过度使用,可能导致“替”读、“替”知、“替”写、“替”思等负面效应,带来人的学术能力多向度退化。如何“助而不替”地合理使用生成式AI,是智能时代人机合作进行学术知识生产的新课题。 展开更多
关键词 生成式AI 大模型 文本生成 学术研究 知识生产 人机结合
下载PDF
基于RoBERTa和图增强Transformer的序列推荐方法 被引量:2
11
作者 王明虎 石智奎 +1 位作者 苏佳 张新生 《计算机工程》 CAS CSCD 北大核心 2024年第4期121-131,共11页
自推荐系统出现以来,有限的数据信息就一直制约着推荐算法的进一步发展。为降低数据稀疏性的影响,增强非评分数据的利用率,基于神经网络的文本推荐模型相继被提出,但主流的卷积或循环神经网络在文本语义理解和长距离关系捕捉方面存在明... 自推荐系统出现以来,有限的数据信息就一直制约着推荐算法的进一步发展。为降低数据稀疏性的影响,增强非评分数据的利用率,基于神经网络的文本推荐模型相继被提出,但主流的卷积或循环神经网络在文本语义理解和长距离关系捕捉方面存在明显劣势。为了更好地挖掘用户与商品之间的深层潜在特征,进一步提高推荐质量,提出一种基于Ro BERTa和图增强Transformer的序列推荐(RGT)模型。引入评论文本数据,首先利用预训练的Ro BERTa模型捕获评论文本中的字词语义特征,初步建模用户的个性化兴趣,然后根据用户与商品的历史交互信息,构建具有时序特性的商品关联图注意力机制网络模型,通过图增强Transformer的方法将图模型学习到的各个商品的特征表示以序列的形式输入Transformer编码层,最后将得到的输出向量与之前捕获的语义表征以及计算得到的商品关联图的全图表征输入全连接层,以捕获用户全局的兴趣偏好,实现用户对商品的预测评分。在3组真实亚马逊公开数据集上的实验结果表明,与Deep FM、Conv MF等经典文本推荐模型相比,RGT模型在均方根误差(RMSE)和平均绝对误差(MAE)2种指标上有显著提升,相较于最优对比模型最高分别提升4.7%和5.3%。 展开更多
关键词 推荐算法 评论文本 RoBERTa模型 图注意力机制 Transformer机制
下载PDF
基于关键视图的文本驱动3D场景编辑方法
12
作者 张冀 崔文帅 +2 位作者 张荣华 王文彬 李亚琦 《图学学报》 CSCD 北大核心 2024年第4期834-844,共11页
基于去噪扩散模型的零样本图像编辑方法取得了瞩目的成就,将之应用于3D场景编辑可实现零样本的文本驱动3D场景编辑。然而,其3D编辑效果容易受扩散模型的3D连续性与过度编辑等问题影响,产生错误的编辑结果。针对这些问题,提出了一种新的... 基于去噪扩散模型的零样本图像编辑方法取得了瞩目的成就,将之应用于3D场景编辑可实现零样本的文本驱动3D场景编辑。然而,其3D编辑效果容易受扩散模型的3D连续性与过度编辑等问题影响,产生错误的编辑结果。针对这些问题,提出了一种新的文本驱动3D编辑方法,该方法从数据端着手,提出了基于关键视图的数据迭代方法与基于像素点的异常数据掩码模块。关键视图数据可以引导一个3D区域的编辑以减少3D不一致数据的影响,而数据掩码模块则可以过滤掉2D输入数据中的异常点。使用该方法,可以实现生动的照片级文本驱动3D场景编辑效果。实验证明,相较于一些目前先进的文本驱动3D场景编辑方法,可以大大减少3D场景中错误的编辑,实现更加生动的、更具真实感的3D编辑效果。此外,使用该方法生成的编辑结果更具多样性、编辑效率也更高。 展开更多
关键词 扩散模型 文本驱动 3D场景编辑 关键视图 数据掩码
下载PDF
大模型驱动的学术文本挖掘--推理端指令策略构建及能力评测
13
作者 陆伟 刘寅鹏 +4 位作者 石湘 刘家伟 程齐凯 黄永 汪磊 《情报学报》 CSSCI CSCD 北大核心 2024年第8期946-959,共14页
大型语言模型突出的任务理解和指令遵循能力,使用户可以通过简单的指令交互完成复杂的信息处理任务。科技文献分析领域正在积极探索大模型的应用,但尚未形成对指令工程技术和模型能力边界的系统性研究。本文以学术文本挖掘任务为切入点... 大型语言模型突出的任务理解和指令遵循能力,使用户可以通过简单的指令交互完成复杂的信息处理任务。科技文献分析领域正在积极探索大模型的应用,但尚未形成对指令工程技术和模型能力边界的系统性研究。本文以学术文本挖掘任务为切入点,从上下文学习、思维链推理等角度设计推理端指令策略,构建了涵盖文本分类、信息抽取、文本推理和文本生成4个能力维度共6项任务的大模型学术文本挖掘专业能力评测框架,并选取了7个国内外主流的指令调优模型进行实验,对比了不同指令策略的适用范围和不同参数模型的专业能力。实验结果表明,少样本、思维链等复杂指令策略在分类任务上的应用效果并不显著,而在抽取、生成等难度较高的任务上表现良好。千亿级参数规模的大模型经过指令引导,能够取得与充分训练的深度学习模型相近的效果,但对于十亿级或百亿级规模大模型,推理端的指令策略存在明显上限。为了实现大模型向科技情报领域的深层嵌入,现阶段仍需在调优端对模型参数进行领域化适配。 展开更多
关键词 大模型 学术文本挖掘 指令工程 能力评测
下载PDF
基于米特-霍恩模型的高校实验室安全管理制度执行困境及路径优化
14
作者 阳富强 刘海丰 陶菁 《实验室研究与探索》 CAS 北大核心 2024年第8期263-268,共6页
为提高高校实验室安全管理规范相关文件的执行效果,以国家教育部、省教育厅、某高校发布的实验室安全管理相关制度为对象,引入米特-霍恩模型分析高校实验室安全管理制度的执行路径,并运用文本分析法寻找文件中与其作用因素相关的关键词... 为提高高校实验室安全管理规范相关文件的执行效果,以国家教育部、省教育厅、某高校发布的实验室安全管理相关制度为对象,引入米特-霍恩模型分析高校实验室安全管理制度的执行路径,并运用文本分析法寻找文件中与其作用因素相关的关键词,进行制度执行过程中的困境分析。研究结果表明,在实验室安全管理方面,高校可能会面临多重困境,包括实验室危险因素的多样化、实验室安全经费的不足、制度执行主体之间的交流分层化、职能重叠、制度执行者缺乏足够的实施驱动力等问题。文章对实验室安全管理制度执行进行了路径优化,旨在健全我国高校实验室安全监管机制,降低高校实验室事故发生率。 展开更多
关键词 高校实验室 米特-霍恩模型 文本分析 安全管理制度 执行路径
下载PDF
Probabilistic Language Modelling for Context-Sensitive Opinion Mining
15
《信息工程期刊(中英文版)》 2015年第5期7-11,共5页
关键词 上下文相关 采矿方法 建模方法 语言 概率 机器学习 指示物 分析学
下载PDF
面向短文本的增强上下文神经主题模型
16
作者 刘刚 王同礼 +2 位作者 唐宏伟 战凯 杨雯莉 《计算机工程与应用》 CSCD 北大核心 2024年第1期154-164,共11页
目前的主题模型大多数基于自身文本的词共现信息进行建模,并没有引入主题的稀疏约束来提升模型的主题抽取能力,此外短文本本身存在词共现稀疏的问题,该问题严重影响了短文本主题建模的准确性。针对以上问题,提出了一种增强上下文神经主... 目前的主题模型大多数基于自身文本的词共现信息进行建模,并没有引入主题的稀疏约束来提升模型的主题抽取能力,此外短文本本身存在词共现稀疏的问题,该问题严重影响了短文本主题建模的准确性。针对以上问题,提出了一种增强上下文神经主题模型(enhanced context neural topic model,ECNTM)。ECNTM基于主题控制器对主题进行稀疏性约束,过滤掉不相关的主题,同时模型的输入变成BOW向量和SBERT句子嵌入的拼接,在高斯解码器中,通过在嵌入空间中将单词上的主题分布处理为多元高斯分布或高斯混合分布,显式地丰富了短文本有限的上下文信息,解决了短文本词共现特征稀疏问题。在WS、Reuters、KOS、20 NewsGroups四个公开数据集上的实验结果表明,该模型在困惑度、主题一致性以及文本分类准确率上相较基准模型均有明显提升,证明了引入主题稀疏约束特性以及丰富的上下文信息到短文本主题建模的有效性。 展开更多
关键词 神经主题模型 短文本 稀疏约束 变分自编码器 主题建模
下载PDF
基于招聘大数据的IT人才能力模型构建研究 被引量:1
17
作者 徐倩 黄雨薇 +2 位作者 符传山 王含 李顺仕 《软件导刊》 2024年第1期209-214,共6页
随着信息技术的快速发展,企业对IT人才的需求在逐年加大。为提高IT类人才培养质量并促进其供需平衡,从智联招聘采集13 638条招聘数据对企业的真实人才需求进行调研,挖掘企业人才需求特征并据此构建冰山胜任力模型,从而建立IT类专业人才... 随着信息技术的快速发展,企业对IT人才的需求在逐年加大。为提高IT类人才培养质量并促进其供需平衡,从智联招聘采集13 638条招聘数据对企业的真实人才需求进行调研,挖掘企业人才需求特征并据此构建冰山胜任力模型,从而建立IT类专业人才培养体系。研究表明,从知识、技能、综合素养、意识与态度4个维度构建的冰山胜任力模型,能够提高IT人才培养质量,并为毕业生就业提供指导和参考。 展开更多
关键词 IT类人才培养 冰山胜任力模型 文本挖掘 人才需求特征
下载PDF
增强提示学习的少样本文本分类方法 被引量:2
18
作者 李睿凡 魏志宇 +2 位作者 范元涛 叶书勤 张光卫 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期1-12,共12页
针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中... 针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中含有的类别信息,采用三元组损失联合优化方法,并引入掩码语言模型任务作为正则项,提升模型的泛化能力。在公开的4个中文文本和3个英文文本分类数据集上进行实验评估,结果表明EPL4FTC方法的准确度明显优于所对比的基线方法。 展开更多
关键词 预训练语言模型 少样本学习 文本分类 提示学习 三元组损失
下载PDF
基于PMC指数模型的铁路绿色施工政策研究
19
作者 李占平 魏强 +2 位作者 陈艳春 王辉 牛衍亮 《铁道工程学报》 EI CSCD 北大核心 2024年第3期124-129,共6页
研究目的:铁路绿色施工政策是落地铁路可持续发展,打造生态铁路的方向引领与实施保障。铁路绿色施工政策的量化研究可以为政策的制定、修订、完善与优化提供重要的数据决策依据。本文借助ROSTCM6.0文本挖掘工具及PMC指数模型,旨在科学... 研究目的:铁路绿色施工政策是落地铁路可持续发展,打造生态铁路的方向引领与实施保障。铁路绿色施工政策的量化研究可以为政策的制定、修订、完善与优化提供重要的数据决策依据。本文借助ROSTCM6.0文本挖掘工具及PMC指数模型,旨在科学合理地评价我国当前铁路绿色施工相关政策的效果与优劣,为铁路绿色施工政策的高质量制定提供决策支持。研究结论:(1)选取7项铁路绿色施工政策作为研究样本,验证了PMC指数模型在评价铁路绿色施工政策的实用性与可靠性,结果与实际情况符合度较高,表明该模型可为铁路绿色施工政策评价提供借鉴价值;(2)各项政策的PMC指数等级可以有效判断该项政策的优劣,明确政策现状及优化方向;(3)本研究结果可为相关部委及公司制定、优化铁路绿色施工政策提供参考和借鉴。 展开更多
关键词 铁路绿色施工政策 PMC指数模型 政策评价 文本挖掘
下载PDF
基于文本挖掘的跑鞋用户评价及情感分析 被引量:1
20
作者 罗向东 强威 +1 位作者 张希莹 吴梦 《丝绸》 CAS CSCD 北大核心 2024年第6期108-119,共12页
为了挖掘消费者在线购买跑鞋时的关注信息,文章用大数据分析视角,以“京东商城”为例按照销量排序分析了前600款跑鞋品牌定位、价格分布、优惠信息、标签占比,使用LDA模型对10万条跑鞋在线评论进行文本挖掘,对商品评论数据进行词频共现... 为了挖掘消费者在线购买跑鞋时的关注信息,文章用大数据分析视角,以“京东商城”为例按照销量排序分析了前600款跑鞋品牌定位、价格分布、优惠信息、标签占比,使用LDA模型对10万条跑鞋在线评论进行文本挖掘,对商品评论数据进行词频共现分析、主题聚类与情感分析,从品牌、技术和售后服务的维度分析了问题的原因并提出相关建议。研究表明:国产品牌跑鞋在各价位段布局完整,销量高的跑鞋多使用满减和商品券,自营和优惠券标签对跑鞋购买具较为显著的促进作用;消费者购买跑鞋时主要关注外观细节、功能属性、性价比、穿着感受、服务优惠等方面。 展开更多
关键词 跑鞋 文本挖掘 LDA模型 聚类分析 情感分析
下载PDF
上一页 1 2 112 下一页 到第
使用帮助 返回顶部