期刊文献+
共找到12,741篇文章
< 1 2 250 >
每页显示 20 50 100
The Wording Techniques in Poetry Translation
1
作者 林佳 《海外英语》 2013年第12X期133-134,共2页
All times, there have been translators who endeavored to convey the original meaning of the poet by their own understandings and ways of expression. Therefore, different translators might have different translation fo... All times, there have been translators who endeavored to convey the original meaning of the poet by their own understandings and ways of expression. Therefore, different translators might have different translation for the same poem. Some pay more attention to the form while others to the meaning. 展开更多
关键词 POETRY TRANSLATION wording TECHNIQUES ORIGINAL mea
下载PDF
我国数据安全政策文本主题挖掘及其演化分析
2
作者 马海群 崔文波 张涛 《现代情报》 CSSCI 北大核心 2024年第8期28-38,共11页
[目的/意义]揭示数据安全政策主题的演化规律,对完善数据安全政策体系具有重要意义。[方法/过程]本文选取我国547部数据安全政策文本,利用NMF主题模型进行主题挖掘并结合Word2Vec词向量模型,从主题内容演化和主题强度演化两个视角进行... [目的/意义]揭示数据安全政策主题的演化规律,对完善数据安全政策体系具有重要意义。[方法/过程]本文选取我国547部数据安全政策文本,利用NMF主题模型进行主题挖掘并结合Word2Vec词向量模型,从主题内容演化和主题强度演化两个视角进行可视化处理与分析。[结果/结论]识别出网络安全、应急处置、安全保障、个人隐私等主题,而主题演化内容呈现聚集性,演化领域呈现扩散性;数据开放、公共数据等核心主题整体演化强度趋势不断提高,但个人隐私、安全可控、监测预警相关主题政策占比失衡。针对主题挖掘及演化分析结果,并结合我国数据安全治理现状提出4点建议:持续加强数据开放与安全的协同;加强全流程的数据安全治理;完善技术与政策融合的数据安全治理机制;平衡政策主题演化注意力分配。 展开更多
关键词 数据安全政策 数据治理 数据开放 数据安全 NMF Word2Vec 主题挖掘 主题演化
下载PDF
基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析
3
作者 王孟 苏进城 陈志德 《福建师范大学学报(自然科学版)》 CAS 北大核心 2024年第5期41-51,共11页
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将... 选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将评阅意见转化为主题分布向量;其次,结合Word2Vec模型将评阅意见的关键词转化为向量表达;最后,采用TextRank方法提取关键词,以揭示评阅专家的关注核心主题。实验结果表明,所提方法能为高校管理人员提供切实有效的分析工具,有助于他们更好地分析总结评阅意见,同时也为硕士研究生撰写高质量学位论文提供有益借鉴。 展开更多
关键词 硕士学位论文 自然语言处理 LDA模型 Word2Vec模型 TextRank方法
下载PDF
主体异质性下矿工不安全行为传播机理研究
4
作者 李新春 邱尊相 +2 位作者 刘全龙 张晓霖 张悦倩 《运筹与管理》 CSSCI CSCD 北大核心 2024年第6期220-226,共7页
群体不安全行为极易导致严重的生产事故,探究个体到群体的不安全行为传播机理对于预防煤矿事故发生尤为重要。为此,本文首先通过Word2Vec方法辨识350起煤矿事故报告中各类生产主体的不安全行为特征;进而结合关联规则和复杂网络理论,构... 群体不安全行为极易导致严重的生产事故,探究个体到群体的不安全行为传播机理对于预防煤矿事故发生尤为重要。为此,本文首先通过Word2Vec方法辨识350起煤矿事故报告中各类生产主体的不安全行为特征;进而结合关联规则和复杂网络理论,构建主体异质性下矿工不安全行为传播网络;最后通过网络中心性分析和事故路径分析明确了8项核心不安全行为及其关联集合、6种事故不安全行为传播关键链路。研究表明:现场监督人员是不安全行为传播过程中最具影响力的主体类型,监督人员安全检查不到位、未及时督促消除隐患是造成群体性不安全行为发生的关键原因。机电事故是不安全行为传播最易触发的事故类型,安全管理工作检查督促不力→安全教育培训不到位→现场安全确认走过场→作业人员安全意识淡薄→现场违章作业是机电事故中不安全行为传播的关键链路。 展开更多
关键词 不安全行为 传播机理 Word2Vec 复杂网络 关联规则
下载PDF
基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究
5
作者 高娜 东梅 《网络安全与数据治理》 2024年第7期47-55,共9页
运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、... 运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、技术应用等方面随时间推移呈现不同演化趋势;四大区域受经济发展水平、文化资源禀赋、政策导向影响,在企业角色强调程度、地区特色旅游发展以及国家级项目和竞争力方面存在地域差异。 展开更多
关键词 LDA主题模型 Word2Vec 五年规划 文化政策 文本分析
下载PDF
融合LDA和CNN的施工触电事故原因识别和预判
6
作者 李珏 潘悦 吴畅 《安全与环境学报》 CAS CSCD 北大核心 2024年第10期3973-3981,共9页
鉴于施工触电事故具有突发性强、致死率高的特点,为了有效辅助事故原因的调查,首先,对318份施工触电事故进行预处理,运用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)关键词处理算法和可视化技术提取关键信息。... 鉴于施工触电事故具有突发性强、致死率高的特点,为了有效辅助事故原因的调查,首先,对318份施工触电事故进行预处理,运用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)关键词处理算法和可视化技术提取关键信息。其次,通过狄利克雷主题模型(Latent Dirichlet Allocation,LDA)提取原因主题词条,并根据关键信息构建相应的原因主题标签。随后,运用Word2Vec模型将“事故经过”和“主题标签”转化为词向量矩阵,并输入卷积神经网络(Convolutional Neural Networks,CNN)模型中,利用CNN模型数据预测的特征,实现事故原因的预判。最后,对比分析CNN模型与其他两种经典模型的预判效果。试验结果表明,该方法能够在事故调查完成前,较准确地预判事故可能原因。该模型构建的事故原因库,可以为事故预防提供一定参考,模型可以作为辅助事故实际调查的有效手段。 展开更多
关键词 安全工程 施工触电事故 事故原因 狄利克雷主题模型(LDA) Word2Vec模型 卷积神经网络(CNN)
下载PDF
英语word的字词之辨
7
作者 高斐 《海外英语》 2024年第20期65-67,共3页
将所有的English words统称为“英语单词”或“英语单字”都是片面的。这种字词不分的观念是导致中国学生学习和记忆英语单词困难的一个主要原因。英语和汉语一样,也应当区分字和词。英语中的词根(基本单词和黏附词根)应被视为“字”,... 将所有的English words统称为“英语单词”或“英语单字”都是片面的。这种字词不分的观念是导致中国学生学习和记忆英语单词困难的一个主要原因。英语和汉语一样,也应当区分字和词。英语中的词根(基本单词和黏附词根)应被视为“字”,而由词根派生出来的大量较复杂的单词才是“词”。将英语中少量的“字”与大量的“词”区分开,从认识英语词根开始,以字带词的方式学习,有助于快速识记大量英语词汇。 展开更多
关键词 英语单词 WORD
下载PDF
Python实现Excel文档转换到Word文档的自动化方法
8
作者 刘易 《电脑编程技巧与维护》 2024年第5期45-47,共3页
通过研究开发了一种基于Python语言,实现Excel数据自动转换成Word文档并实现排版功能的方法,为科研工作者、数据分析师或报告撰写人员提供一个方便快捷的工具,帮助他们更高效地完成Excel数据转换成Word并实现排版的任务。
关键词 PYTHON语言 Python-docx库 EXCEL文档 WORD排版
下载PDF
编委对期刊研究主题的影响研究——以信息科学领域为例 被引量:1
9
作者 余颖 罗奕初 +1 位作者 石进 李明 《现代情报》 CSSCI 北大核心 2024年第4期142-153,共12页
[目的/意义]学术期刊是学术交流的重要载体之一,期刊编委团队承担着把握期刊方向的重要职责,并对期刊发文内容和发文质量进行把关。期刊编委的研究主题能够体现编委对本领域学术动态的觉察和感知,本文旨在探究编委的研究主题对期刊收录... [目的/意义]学术期刊是学术交流的重要载体之一,期刊编委团队承担着把握期刊方向的重要职责,并对期刊发文内容和发文质量进行把关。期刊编委的研究主题能够体现编委对本领域学术动态的觉察和感知,本文旨在探究编委的研究主题对期刊收录文章主题的影响情况。[方法/过程]以信息科学领域一流期刊为研究对象,构建编委数据集和非编委数据集,通过数据集信息挖掘期刊收录文章主题,利用Word2Vec模型和Kmeans聚类方法探究期刊内的主题分布特征,探究编委的主题影响情况。[结果/结论]研究发现编委对冷门主题的影响高于热门主题,编委能够通过在新兴主题集中性发文引导期刊的研究主题发生变化,引导学者对有价值的主题进行研究。 展开更多
关键词 期刊编委 学术期刊 研究主题 信息科学领域 学术影响力 主题分布 Word2Vec
下载PDF
基于谱聚类的轨道电路故障文本主题聚类研究 被引量:1
10
作者 姚新文 侯通 +1 位作者 郑启明 王小敏 《兰州交通大学学报》 CAS 2024年第1期64-72,共9页
轨道电路故障日志是现场日常运维工作中的重要数据记录。针对轨道电路故障日志在现场工作中未能充分挖掘利用且人工分析效率较低的问题,提出基于谱聚类算法的轨道电路故障文本主题聚类挖掘分析方法。首先,分析轨道电路故障文本数据特征... 轨道电路故障日志是现场日常运维工作中的重要数据记录。针对轨道电路故障日志在现场工作中未能充分挖掘利用且人工分析效率较低的问题,提出基于谱聚类算法的轨道电路故障文本主题聚类挖掘分析方法。首先,分析轨道电路故障文本数据特征并进行文本预处理,采用Word2vec模型训练获取字符级特征向量,实现在语义空间上的轨道电路故障文本数据特征表示;然后,依据Laplacian矩阵的图谱聚类特性,将高维故障文本特征数据聚类转换为谱图切分问题,分别对电务、工务及供电故障因素文本数据求解规范化后Laplacian矩阵的特征向量,并构建低维故障文本特征矩阵,再通过K-Means聚类算法实现3种故障因素文本数据集下故障文本主题聚类分析,获取电务、工务及供电故障因素文本数据中蕴含的轨道电路故障主题类型及频率信息,并基于t分布随机邻域嵌入算法实现聚类结果的可视化分析;最后,采用不同聚类模型在3种故障因素文本数据集上进行对比实验。实验结果表明:基于谱聚类算法的聚类模型在保证故障文本聚类准确率的情况下,其收敛性能更优;聚类可视化分析结果验证了获取的不同故障主题类别具有较高的语义区分度。通过该方法对轨道电路故障文本数据进行自动化聚类挖掘及统计分析,可为现场轨道电路综合维修及故障预防提供辅助支持。 展开更多
关键词 轨道电路 谱聚类 文本聚类 Word2vec 故障主题
下载PDF
基于Word2Vec和决策树的故障定位技术 被引量:1
11
作者 王露露 陈军华 《上海师范大学学报(自然科学版中英文)》 2024年第2期223-227,共5页
利用Word2Vec方法对Java源代码进行深层语义编码,生成文件级和行级的语义向量,并将其用作输入数据来训练决策树模型,以实现精确的文件级别和行级别故障定位,优化故障检测过程,构建一个综合文件级别与行级别分析的高效故障定位框架.实验... 利用Word2Vec方法对Java源代码进行深层语义编码,生成文件级和行级的语义向量,并将其用作输入数据来训练决策树模型,以实现精确的文件级别和行级别故障定位,优化故障检测过程,构建一个综合文件级别与行级别分析的高效故障定位框架.实验结果表明:该模型在各项目中的故障定位准确率均高于83%. 展开更多
关键词 故障定位 语义表示 Word2Vec 决策树
下载PDF
融合多特征和表情情感词典的性别对立言论识别方法
12
作者 马子晨 张顺香 +1 位作者 刘云朵 朱广丽 《数据采集与处理》 CSCD 北大核心 2024年第3期699-709,共11页
为识别相关极端言论,提出了一种融合多特征和表情情感词典的性别对立言论识别方法。首先,使用BERT(Bidirectional encoder representation from transformer)提取输入文本的字符特征,并使用Word2Vec提取输入文本中五笔、郑码以及拼音3... 为识别相关极端言论,提出了一种融合多特征和表情情感词典的性别对立言论识别方法。首先,使用BERT(Bidirectional encoder representation from transformer)提取输入文本的字符特征,并使用Word2Vec提取输入文本中五笔、郑码以及拼音3个方面的特征;然后,将这4个方面的特征进行融合,再输入到Bi-GRU(Bi-directional gated recurrent unit)网络中学习更深层次的语义信息;最后,通过全连接层加SoftMax函数计算出情感极性概率,并融合表情情感词典判别输入文本是否为性别对立言论。通过在自行收集的中文性别对立数据集上进行实验,与未加入特征和表情情感词典的方法相比,在F1值上有5.19%的提升。同时,在公开中文情感分析数据集Weibo_senti_100k上进行验证,证明了本方法的泛化性。 展开更多
关键词 性别对立 表情情感词典 多特征 BERT Bi-GRU Word2Vec
下载PDF
基于神经网络词嵌入的大数据关注热点和词嵌入概貌比较研究
13
作者 周爱霞 严亚兰 查先进 《现代情报》 CSSCI 北大核心 2024年第1期37-47,共11页
[目的/意义]大数据对社会和经济发展产生了重大影响,本研究结合我国学术平台和社会化问答平台对大数据关注热点和词嵌入概貌进行比较,旨在推动我国大数据研究和实践。[方法/过程]Word2vec是新兴的神经网络词嵌入算法,具有计算成本低、... [目的/意义]大数据对社会和经济发展产生了重大影响,本研究结合我国学术平台和社会化问答平台对大数据关注热点和词嵌入概貌进行比较,旨在推动我国大数据研究和实践。[方法/过程]Word2vec是新兴的神经网络词嵌入算法,具有计算成本低、准确度高等特点,能够同时在语义层面和语法层面有效测度词语的相似度。首先,结合中国知网和知乎平台分别搜集了数据,构建出学术平台和社会化问答平台的语料库,再基于这两个语料库分别训练了Word2vec模型;其次,结合最相似词语分析对学术平台和社会化问答平台的大数据关注热点进行了比较;最后,利用降维技术和数据可视化方法对两个平台词语的词嵌入概貌进行了比较。[结果/结论]研究结果显示了我国学术平台和社会化问答平台在大数据方面的差异。本研究创新地利用Word2vec神经网络词嵌入算法,结合我国学术平台和社会化问答平台对大数据进行了比较分析,为大数据研究提供了新的视角。 展开更多
关键词 大数据 比较研究 学术平台 社会化问答平台 Word2vec
下载PDF
一种基于停留点和位置语义的隐私保护算法
14
作者 陆佳瑜 张琳 +1 位作者 雷诚 王汝传 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2500-2507,共8页
目前的隐私保护算法尚未充分考虑位置的语义信息,这极大影响了个人隐私安全.针对该问题,提出一种基于停留点和位置语义的TPSS算法来保护用户的真实位置数据,切断隐私信息泄露的源头.首先过滤掉异常位置并提取出具有代表性的停留位置点,... 目前的隐私保护算法尚未充分考虑位置的语义信息,这极大影响了个人隐私安全.针对该问题,提出一种基于停留点和位置语义的TPSS算法来保护用户的真实位置数据,切断隐私信息泄露的源头.首先过滤掉异常位置并提取出具有代表性的停留位置点,从而有效降低数据处理量,缓解服务器的性能瓶颈.然后通过地理信息和中文维基百科语料库预训练Word2Vec词向量模型,计算出位置间的语义相似度.再利用多属性决策模型评估各位置在地理距离、位置语义和服务请求概率方面的表现以生成安全匿名集.最后,为停留点轨迹添加基于指数分布的噪声以进一步混淆真实数据.实验结果证明,该算法有效提高了位置语义的使用效果,在位置熵、语义、轨迹相似度等方面具有竞争力. 展开更多
关键词 位置隐私 Word2Vec 多属性决策 轨迹隐私 差分隐私
下载PDF
基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别 被引量:4
15
作者 胡泽文 韩雅蓉 王梦雅 《现代情报》 CSSCI 北大核心 2024年第4期154-167,共14页
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以... [目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。 展开更多
关键词 机器学习 LDA模型 Word2vec 主题演化 热点主题 主题影响力 主题关注度
下载PDF
结合Word2vec和BiLSTM的民航非计划事件分析方法
16
作者 王捷 周迪 +1 位作者 左洪福 黄维 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第7期917-924,共8页
安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采... 安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采用Word2vec模型针对事件文本语料进行词向量训练,缩小空间向量维度;然后通过BiLSTM模型自动提取特征,获取事件文本的完整序列信息和上下文特征向量;最后采用softmax函数对民航非计划事件进行分类。实验结果表明,所提出的方法分类效果更好,能达到更优的准确率和F 1值,对不平衡数据样本同样具有较稳定的分类性能,证明了该方法在民航非计划事件分析上的适用性和有效性。 展开更多
关键词 民航安全 文本分析 非计划事件 Word2vec 双向长短期记忆(BiLSTM)神经网络
下载PDF
融合反讽语言特征的反讽语句识别模型
17
作者 韦斯羽 朱广丽 +1 位作者 谈光璞 张顺香 《智能系统学报》 CSCD 北大核心 2024年第3期689-696,共8页
反讽是采用内隐的形式来表达情感的一种方法,反讽语句在文字和所想表达的情感上存在着不同,这使得对反讽语句进行情感分类变得更加困难。针对这一现象,提出一种融合反讽语言特征的反讽语句识别模型,通过加入反讽语言特征来提高反讽语句... 反讽是采用内隐的形式来表达情感的一种方法,反讽语句在文字和所想表达的情感上存在着不同,这使得对反讽语句进行情感分类变得更加困难。针对这一现象,提出一种融合反讽语言特征的反讽语句识别模型,通过加入反讽语言特征来提高反讽语句的识别准确率。首先,采用卡方检验算法对反讽语言进行分析并获取语言特征;然后,利用Word2Vec对语言特征进行训练获取语言特征的特征表示,同时使用注意力机制与Bi-GRU(双向门控循环神经单元)模型获取句子的特征表示;最后,将语言特征的特征表示与句子的特征表示进行融合并作为情感分类层的输入,对反讽语句进行识别。与CNN-AT、CNN-Adv、EPSN等3种模型进行对比,实验结果表明,该模型可以有效提高对于反讽语句的识别准确率。 展开更多
关键词 反讽语句识别 语言特征 卡方检验算法 Word2Vec 双向门控循环神经单元 注意力机制 深度学习 智能信息处理
下载PDF
基于字词向量的BiLSTM-CRF水利工程巡检文本实体识别模型 被引量:2
18
作者 刘雪梅 程彭圣男 +3 位作者 李海瑞 曹闯 高英 崔培 《华北水利水电大学学报(自然科学版)》 北大核心 2024年第3期9-17,共9页
命名实体识别是构建水利知识图谱的核心技术。水利工程巡检文本是水利工程最为常见的数据类型,以文本形式记录,没有固定格式与结构,但其包含水利工程安全潜在风险信息,具有价值密度高的特点。针对水利工程巡检文本命名实体识别问题,提... 命名实体识别是构建水利知识图谱的核心技术。水利工程巡检文本是水利工程最为常见的数据类型,以文本形式记录,没有固定格式与结构,但其包含水利工程安全潜在风险信息,具有价值密度高的特点。针对水利工程巡检文本命名实体识别问题,提出字词向量融合的BiLSTM-CRF模型,首先将巡检文本分别在字维度和词维度进行向量化处理,合并字词向量获取字词向量特征;然后利用BiLSTM神经网络获取序列化后的上下文特征;最后通过CRF进行解码并提取相应实体。以南水北调中线工程巡检文本为例,实验结果表明:字词向量结合之后的方法能有效提高识别性能,对实体边界的识别效果更优,模型准确率、召回率和F1值分别可以达到93.79%、93.06%、93.42%;时间效率较BERT-BiLSTM-CRF模型的时间效率提高82.86%。基于字词向量的BiLSTM-CRF模型可为水利工程知识图谱的快速构建提供技术支撑。 展开更多
关键词 巡检文本 实体识别 双向长短期记忆神经网络 Word2Vec 条件向量场
下载PDF
融合语义特征的高校专利质量预测研究
19
作者 张唯玮 张武军 《知识产权》 CSSCI 北大核心 2024年第10期114-126,共13页
分析国内外高校专利质量评价的理论与实践研究发现:高校专利申请量剧增,但专利产业化率较低;专利质量预测研究较少,且仅停留在理论层面,对高校专利质量预测更少。因此,建立实用的、易操作的专利质量预测模型对于提高专利质量尤为重要。... 分析国内外高校专利质量评价的理论与实践研究发现:高校专利申请量剧增,但专利产业化率较低;专利质量预测研究较少,且仅停留在理论层面,对高校专利质量预测更少。因此,建立实用的、易操作的专利质量预测模型对于提高专利质量尤为重要。选取说明书摘要等文本型专利指标和权利要求数量等数字型指标,建立高校专利质量预测指标体系,运用词向量转换理论,深入挖掘文本信息,将文本指标转化为可用的数值参数,在此基础上创新地提出专利质量预测模型--Word2Vec-XGB预测模型。构建的融合语义特征专利质量预测模型,其预测平均准确率为90%以上,适合高校专利申请前预评估,实现高质量专利预测,有助于进一步提高专利质量。 展开更多
关键词 高校专利 专利预测 Word2Vec-XGB预测模型 高质量专利
下载PDF
基于LSTM+Word2vec的微博评论情感分析 被引量:1
20
作者 王剑辉 闫芳序 《沈阳师范大学学报(自然科学版)》 CAS 2024年第2期138-144,共7页
微博作为当今热门的社交平台,其中蕴含着许多具有强烈主观性的用户评论文本。为挖掘微博评论文本中潜在的信息,针对传统的情感分析模型中存在的语义缺失以及过度依赖人工标注等问题,提出一种基于LSTM+Word2vec的深度学习情感分析模型。... 微博作为当今热门的社交平台,其中蕴含着许多具有强烈主观性的用户评论文本。为挖掘微博评论文本中潜在的信息,针对传统的情感分析模型中存在的语义缺失以及过度依赖人工标注等问题,提出一种基于LSTM+Word2vec的深度学习情感分析模型。采用Word2vec中的连续词袋模型(continuous bag of words,CBOW),利用语境的上下文结构及语义关系将每个词语映射为向量空间,增强词向量之间的稠密度;采用长短时记忆神经网络模型实现对文本上下文序列的线性抓取,最后输出分类预测的结果。实验结果的准确率可达95.9%,通过对照实验得到情感词典、RNN、SVM三种模型的准确率分别为52.3%、92.7%、85.7%,对比发现基于LSTM+Word2vec的深度学习情感分析模型的准确率更高,具有一定的鲁棒性和泛化性,对用户个性化推送和网络舆情监控具有重要意义。 展开更多
关键词 情感分析 Word2vec 长短时记忆神经网络 社交平台 微博
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部