期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于CBOW模型的链路预测方法 被引量:1
1
作者 赵宇红 张政 《小型微型计算机系统》 CSCD 北大核心 2020年第11期2392-2398,共7页
为了有效、准确地挖掘节点自身的属性与网络结构的关系信息并将其联合应用于链路预测,受概率语言检索研究的启发,提出基于CBOW模型的链路预测方法.通过使用包含节点邻居信息和网络连通信息的节点序列库训练CBOW模型产生节点向量,结合节... 为了有效、准确地挖掘节点自身的属性与网络结构的关系信息并将其联合应用于链路预测,受概率语言检索研究的启发,提出基于CBOW模型的链路预测方法.通过使用包含节点邻居信息和网络连通信息的节点序列库训练CBOW模型产生节点向量,结合节点向量自身属性和节点对之间的趋向程度提出一种新的相似性评价指标—向量自量趋向性(SMTV),使用此相似性指标进行网络链路预测.在PPI-Yeast、Facebook和Power Grid三个真实数据集上进行实验,分别对比CN,AA,LP和Node2vec-Hadamard四种方法的AUC值,CBOW-SMTV相比其中AUC最低的方法,分别有5.3109%、14.4955%、41.9747%的提高;相比AUC最高的方法也有0.2497%、0.6921%、9.5714%的提高.因此基于CBOW-SMTV的链路预测方法能有效结合节点属性和网络结构信息,提高链路预测有效性. 展开更多
关键词 复杂网络 信息挖掘 cbow模型 链路预测 相似性指标 AUC
下载PDF
改进的CBOW情感信息获取研究 被引量:5
2
作者 曹军博 叶霞 +1 位作者 许飞翔 尹列东 《计算机工程与应用》 CSCD 北大核心 2020年第9期142-147,共6页
大数据时代,文本的情感倾向对于文本潜在价值挖掘具有重要意义,然而人工方法很难有效挖掘网络上评论文本的潜在价值,随着计算机技术的快速发展,这一问题得到了有效解决。在文本情感分析中,获取词语的情感信息对于情感分析至关重要,词向... 大数据时代,文本的情感倾向对于文本潜在价值挖掘具有重要意义,然而人工方法很难有效挖掘网络上评论文本的潜在价值,随着计算机技术的快速发展,这一问题得到了有效解决。在文本情感分析中,获取词语的情感信息对于情感分析至关重要,词向量方法一般仅对词语的语法语义进行建模,但是忽略了词语的情感信息,无法更好地进行情感分析。通过TF-IDF算法模型获得赋权矩阵,构建停用词表,同时根据赋权矩阵生成Huffman树作为改进的CBOW算法的输入,引入情感词典生成情感标签辅助词向量生成,使词向量具有情感信息。实验结果表明,提出的方法对评论文本中获得的词向量能够较好地表达情感信息,情感分类结果优于传统模型。因此,该模型在评论文本情感分析中可以有效提升文本情感分类效果。 展开更多
关键词 词向量 cbow模型 TF-IDF模型 情感分析
下载PDF
基于改进的CBOW与ABiGRU的文本分类研究 被引量:6
3
作者 张宇艺 左亚尧 陈小帮 《计算机工程与应用》 CSCD 北大核心 2019年第24期135-140,170,共7页
文本的表示与文本的特征提取是文本分类需要解决的核心问题,基于此,提出了基于改进的连续词袋模型(CBOW)与ABiGRU的文本分类模型。该分类模型把改进的CBOW模型所训练的词向量作为词嵌入层,然后经过卷积神经网络的卷积层和池化层,以及结... 文本的表示与文本的特征提取是文本分类需要解决的核心问题,基于此,提出了基于改进的连续词袋模型(CBOW)与ABiGRU的文本分类模型。该分类模型把改进的CBOW模型所训练的词向量作为词嵌入层,然后经过卷积神经网络的卷积层和池化层,以及结合了注意力(Attention)机制的双向门限循环单元(BiGRU)神经网络充分提取了文本的特征。将文本特征向量输入到softmax分类器进行分类。在三个语料集中进行的文本分类实验结果表明,相较于其他文本分类算法,提出的方法有更优越的性能。 展开更多
关键词 深度学习 连续词袋模型(cbow) 注意力机制 神经网络 文本分类
下载PDF
采用连续词袋模型(CBOW)的领域术语自动抽取研究 被引量:20
4
作者 姜霖 王东波 《现代图书情报技术》 CSSCI 2016年第2期9-15,共7页
【目的】更准确便捷地完成术语词汇的自动抽取。【方法】利用CBOW模型计算构成术语的各个词部件的向量空间模型。通过词向量之间的余弦相似度衡量术语词汇内部各个词部件的关联度。利用Page Rank算法计算候选词汇的领域代表性并排序,通... 【目的】更准确便捷地完成术语词汇的自动抽取。【方法】利用CBOW模型计算构成术语的各个词部件的向量空间模型。通过词向量之间的余弦相似度衡量术语词汇内部各个词部件的关联度。利用Page Rank算法计算候选词汇的领域代表性并排序,通过阈值的设定,抽取出更为具有领域代表性的术语词汇。【结果】在以自然语言处理领域内的论文摘要作为数据集的实验中取得较高的准确率和召回率。【局限】测试的数据训练集偏小,而数据集的训练效果直接影响实验的效果。【结论】实验结果表明利用CBOW模型完成术语的抽取工作是一个较为合理、可行的方法。 展开更多
关键词 术语抽取 神经网络 cbow模型
原文传递
改进词向量和kNN的中文文本分类算法 被引量:6
5
作者 丁正生 马春洁 《现代电子技术》 2022年第1期100-103,共4页
为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBO... 为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBOW模型实现中文文本向量化;其次基于大数据的背景,针对传统的kNN算法分类速度慢的缺点,提出一种基于LSC聚类和多目标数据筛选的快速kNN分类算法;最后运用快速kNN算法对文本数据转化的特征词向量数据进行分类。实验结果表明,改进后的中文文本分类算法增加了算法的使用范围,能够更精确地处理中文文本数据,更快地处理大数据问题,在分类速率和效果上都有一定程度的提升。 展开更多
关键词 中文文本分类 文本向量化 快速kNN算法 词向量 双通道cbow模型 特征向量 数据分类
下载PDF
基于元路径加权融合的异构网络相似性度量
6
作者 赵宇红 薛维佳 《计算机工程与设计》 北大核心 2021年第2期309-315,共7页
针对PathSim算法只能度量异构网络同类节点和预设元路径的问题,提出可度量任意类型节点的加权融合元路径的相似性度量算法Multi-WPathSim。基于随机游走与CBOW模型进行元路径的表示学习,获得路径集合及权重,在元路径融合算法的基础上进... 针对PathSim算法只能度量异构网络同类节点和预设元路径的问题,提出可度量任意类型节点的加权融合元路径的相似性度量算法Multi-WPathSim。基于随机游走与CBOW模型进行元路径的表示学习,获得路径集合及权重,在元路径融合算法的基础上进行相似性度量,解决PathSim算法需要预设元路径的不足,通过双向游走克服PathSim算法只能度量同类节点相似性的局限性。在真实数据集中进行Top-K查询、相似性度量和聚类实验对比,Multi-WPathSim算法在对称和非对称元路径上,相似度准确率和聚类精度都有明显提升。 展开更多
关键词 异构信息网络 元路径 相似性度量 cbow模型 PathSim算法
下载PDF
智能变电站继电保护智能运维系统自动配置技术研究 被引量:35
7
作者 许尧 马欢 +3 位作者 许旵鹏 于和林 杨经超 毛玉荣 《电力系统保护与控制》 EI CSCD 北大核心 2022年第11期160-168,共9页
为提高继电保护智能运维信息采集配置的效率及正确性,提出一种基于知识图谱的智能运维系统信息采集自动配置技术。基于继电保护相关规范建立继电保护装置数据输出端口的标准化模型,依据专家知识按照IED类型建立智能运维系统信息采集点... 为提高继电保护智能运维信息采集配置的效率及正确性,提出一种基于知识图谱的智能运维系统信息采集自动配置技术。基于继电保护相关规范建立继电保护装置数据输出端口的标准化模型,依据专家知识按照IED类型建立智能运维系统信息采集点与继电保护装置标准化数据输出端口的关联关系,形成智能运维系统信息采集配置知识图谱本体。结合智能运维系统的历史配置数据进行知识学习,建立智能运维系统信息采集配置知识图谱。基于二次设备数据输出端口地址信息与继电保护装置数据输出端口的标准化模型的相似性计算,自动将二次设备数据输出端口地址匹配到标准信息端口地址实现知识融合,并引入CBOW模型增强语义理解,提高实体相似性算法的精度。实例验证结果表明,基于知识图谱的智能运维系统信息采集自动配置技术可有效提高智能运维系统配置效率,保证配置的正确性。 展开更多
关键词 智能运维 信息采集 自动配置 知识图谱 编辑距离 cbow模型
下载PDF
基于深度学习LSTM算法的社会网络的舆情监测 被引量:1
8
作者 王民昆 王浩 苏博 《现代计算机》 2020年第33期20-24,共5页
互联网正在成为舆论的传播平台。重要的是要尽可能准确地模拟互联网舆论活动。对谣言、假新闻、误导的信息与不正确的信息等网络舆情的监测,是解决当今网络安全问题的关键,因为上述信息的传播可能会对我们的社会稳定发展产生严重的后果... 互联网正在成为舆论的传播平台。重要的是要尽可能准确地模拟互联网舆论活动。对谣言、假新闻、误导的信息与不正确的信息等网络舆情的监测,是解决当今网络安全问题的关键,因为上述信息的传播可能会对我们的社会稳定发展产生严重的后果。为了解决该问题,提出一种基于LSTM(长短期记忆)的深度学习的社会网络舆情监测。该模型使用Word2Vec算法中的CBOW模型,该模型能将单词序列转换为向量序列,然后将向量序列输入到LSTM模型中。最后,在LSTM模型的最后一个时间输出的预测类作为舆情监测的判断依据。实验结果表明,本文在舆情监测上提出的模型在精准度、召回率和F1分数等方面优于其他先进的网络舆情监测方法。本文方法的准确率较本实验中表现最好的方法提升10%,且时效性大大增加。 展开更多
关键词 舆情监测 长短期记忆 Word2Vec cbow模型 向量序列 深度学习
下载PDF
蒙古语词向量评测研究 被引量:1
9
作者 乌云塔那 王斯日古楞 《广西科学院学报》 2018年第1期68-71,共4页
词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相... 词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量。研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高。 展开更多
关键词 词向量 cbow模型 Skip-gram模型 词向量质量 语义语法相似度
下载PDF
基于社交网络分析的学生异常轨迹检测方法研究
10
作者 梁庆伟 马健 林泽东 《信息与电脑》 2021年第10期30-33,共4页
随着智能终端的普及,校园网已成为一个庞大的信息承载体,包含了高校学生的各种行为轨迹,也能够准确反映出学生的日程行为规律。在这样的背景下,笔者以校园大数据为核心,首先构建每个学生的轨迹序列,利用CBOW(Continuous Bag-of-Word Mod... 随着智能终端的普及,校园网已成为一个庞大的信息承载体,包含了高校学生的各种行为轨迹,也能够准确反映出学生的日程行为规律。在这样的背景下,笔者以校园大数据为核心,首先构建每个学生的轨迹序列,利用CBOW(Continuous Bag-of-Word Model)模型得到学生轨迹向量,使用Louvain算法搭建社交网络,在此基础上构建基于社交网络分析的学生异常轨迹监测预警方法。实验结果表明,本文提出的方法能有效检测出异常的学生轨迹。 展开更多
关键词 社交网络 cbow模型 Louvain算法 轨迹检测
下载PDF
智能变电站继电保护智能运维系统自动配置技术分析 被引量:4
11
作者 李项 《电子技术与软件工程》 2022年第21期107-110,共4页
本文为实现智能变电站继电保护智能运维信息采集配置的科学、合理,提出了一种全新的智能运维系统自动配置技术,该技术是以知识图谱为基础,通过打造数据输出端的标准化模型,结合IED类型信息采集点与数据输出端的关系,建立信息采集配置知... 本文为实现智能变电站继电保护智能运维信息采集配置的科学、合理,提出了一种全新的智能运维系统自动配置技术,该技术是以知识图谱为基础,通过打造数据输出端的标准化模型,结合IED类型信息采集点与数据输出端的关系,建立信息采集配置知识图谱,利用系统的历史配置数据完成知识学习。并完成设备数据输出端地址信息,与继电保护设备数据输出端的标准化模型相似性计算,实现两者知识的自动融合,通过引入CBOW模型进一步强化语义理解,加强相似性计算的精确性。最终根据实例验证可知,本文提出的自动配置技术能够提升系统的配置效率,确保配置准确。 展开更多
关键词 智能变电站 自动配置技术 cbow模型
下载PDF
基于深度学习的甲骨文分类算法研究 被引量:1
12
作者 涂淳宁 王贵 +2 位作者 田吉 李汇嘉 李婷 《现代计算机》 2021年第26期67-72,共6页
传统的甲骨文识别由学者人工识别效率较低。为对未识别甲骨文字符进行预测,基于深度学习对甲骨文图像及语料进行研究。按照造字“六书”原则对字符图像分类,图像分类基于迁移学习及InceptionV3模型,实验综合分类准确度为77.3%。基于CBO... 传统的甲骨文识别由学者人工识别效率较低。为对未识别甲骨文字符进行预测,基于深度学习对甲骨文图像及语料进行研究。按照造字“六书”原则对字符图像分类,图像分类基于迁移学习及InceptionV3模型,实验综合分类准确度为77.3%。基于CBOW模型进行甲骨文语料分析,即利用语料特征词的前后两个词对特征词作预测并计算词向量间的余弦距离得到特征词的相似词。将图像与语料预测结果结合后根据数据库中的字符属性对未识别字符的词性及其它特征作预测。 展开更多
关键词 甲骨文 深度学习 图像分类 cbow模型
下载PDF
中文领域情感词典自适应学习方法 被引量:11
13
作者 叶霞 曹军博 +2 位作者 许飞翔 郭鸿燕 尹列东 《计算机工程与设计》 北大核心 2020年第8期2231-2237,共7页
针对领域情感词典的局限性,提出一种中文领域情感词典自适应学习方法。从中文基础情感词典中选取少量种子词,采用基于CBOW模型和基于句法规则两种抽取方法,对领域语料库进行候选情感词的抽取,通过改进的SO_PMI算法对得到的候选情感词进... 针对领域情感词典的局限性,提出一种中文领域情感词典自适应学习方法。从中文基础情感词典中选取少量种子词,采用基于CBOW模型和基于句法规则两种抽取方法,对领域语料库进行候选情感词的抽取,通过改进的SO_PMI算法对得到的候选情感词进行情感极性判定,形成领域正负情感词典。实验结果表明,该方法能够自适应生成领域情感词典,情感词识别准确率较高,该模型在中文情感分析应用中取得了较好的效果。 展开更多
关键词 情感分析 领域情感词典 情感极性 cbow连续词袋模型 PMI算法
下载PDF
word2vec基础上的配电网恶意控制指令检测
14
作者 李静 戴越 《单片机与嵌入式系统应用》 2019年第10期22-24,36,共4页
提出了一种根据上下文数据关系建立的word2vec算法。针对大量访问数据来建立白名单模型,通过对配电网上下文测量信息和控制信息的挖掘和数据驱动实现恶意控制指令的快速检测,获得白名单模型中的不符合项作为异常。利用孤立森林算法建立... 提出了一种根据上下文数据关系建立的word2vec算法。针对大量访问数据来建立白名单模型,通过对配电网上下文测量信息和控制信息的挖掘和数据驱动实现恶意控制指令的快速检测,获得白名单模型中的不符合项作为异常。利用孤立森林算法建立上下文关系的孤立树,从而实现对各测试样本的分类和训练,采用CBOW神经网络模型将中心词汇后验概率作为输出层,获得不同样本集下的监测精确度和准确率。最后在建立的配电网仿真平台上对word2vec进行了数据挖掘和计算,验证了算法具有高准确率和低误警率。 展开更多
关键词 word2vec 配电网 恶意控制指令 cbow神经网络模型
下载PDF
基于在线文本情感分析的“唐文化”目的地形象挖掘研究 被引量:1
15
作者 张成元 刘云珂 +2 位作者 赵炳清 柴建 姜福鑫 《计量经济学报》 CSCD 2023年第2期387-407,共21页
如何挖掘历史文化资源促进精准营销以高效吸引游客,是我国诸多文化旅游资源富集的景区亟需解决的问题.本文以西安“唐文化”旅游目的地形象挖掘为研究对象,通过15,683条在线文本评论的高频词提取、语义网络分析、主题词挖掘和情感分析,... 如何挖掘历史文化资源促进精准营销以高效吸引游客,是我国诸多文化旅游资源富集的景区亟需解决的问题.本文以西安“唐文化”旅游目的地形象挖掘为研究对象,通过15,683条在线文本评论的高频词提取、语义网络分析、主题词挖掘和情感分析,识别出消费者“唐文化”目的地形象的关注点.研究结果表明,首先,前100个高频词可分为遗产资源、旅游活动和游客情绪三类;其次,游客较为关注西安著名景区、建筑、文化及“大唐盛世”文化氛围;再次,通过文本评论情感分析获取负面情感高频词,并挖掘负面评论出现的原因;最后,通过隐含狄利克雷分布(latent Dirichlet allocation,LDA)模型确定评论主题,同时,利用K近邻算法验证LDA主题分类.本文的研究结果可为西安市旅游目的地形象改进和潜在“唐文化”旅游创意策划提供有力支撑,同时也可为其他历史文化名城提高旅游吸引力提供借鉴. 展开更多
关键词 文本挖掘 情感分析 连续词袋(cbow)模型 隐含狄利克雷分布(LDA)模型
原文传递
基于Item2Vec负采样优化的专题地图产品个性化推荐方法研究 被引量:6
16
作者 毛文山 赵红莉 +3 位作者 孙凤娇 蒋云钟 姜倩 朱彦儒 《地球信息科学学报》 CSCD 北大核心 2020年第11期2128-2139,共12页
建立适用于专题地图产品检索的用户偏好推荐模型是提高专题地图质量的有效方式之一,在专题地图产品推荐场景中,存在严重的内容冷启动和评论数据稀疏问题,现有的推荐算法无法为特定类用户推荐不同特征的专题地图产品,导致用户从专题地图... 建立适用于专题地图产品检索的用户偏好推荐模型是提高专题地图质量的有效方式之一,在专题地图产品推荐场景中,存在严重的内容冷启动和评论数据稀疏问题,现有的推荐算法无法为特定类用户推荐不同特征的专题地图产品,导致用户从专题地图中获取偏好信息受到限制。因此,本文构建基于负采样的连续词袋模型和基于Word2Vec的Item2Vec相结合的用户偏好推荐方法,用于专题地图产品推荐。①计算用户行为日志文件中交互行为数据的隐性评分,以代替专题地图推荐信息流场景中稀疏的用户评论数据;②基于负采样的连续词袋模型提取目标专题地图的前后地图序列感知特征信息,通过控制正负样本比例为1:2,提升目标专题地图潜在评分的预测精度;③通过Item2Vec将带有用户行为特征信息的专题地图映射到向量空间,计算用户对专题地图的相似度矩阵,根据用户偏好程度完成推荐。在构建的专题地图评分实验数据集Thematic CMaps和4个公开验证数据集MovieLens上的测试结果表明:与LFM、Personal Rank、Content Based和SVD 4种传统推荐算法相比,本文所提方法可有效提高潜在评分的预测精度,推荐性能最高达到27.85%;与以霍夫曼采样方式的Item2Vec基础方法和YouTubeNet 2种神经网络推荐算法相比,评分预测精度有一定提高,且推荐性能不断提升,最高达到2.97%和5.78%。以经典算法奇异值分解(SVD)为例,将MovieLens-20M数据集切分后,在数据量不断增大的数据子集中,本文所用方法的评分预测精度和性能均优于SVD方法。 展开更多
关键词 地图个性化推荐 专题地图产品检索 深度学习 负采样 Item2Vec cbow模型 用户事件行为 隐性评分
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部