-
题名基于自监督对比学习与方面级情感分析的联合微调模型
- 1
-
-
作者
狄广义
陈见飞
杨世军
高军
王耀坤
余本功
-
机构
国能数智科技开发(北京)有限公司
合肥工业大学管理学院
-
出处
《科学技术与工程》
北大核心
2024年第21期9033-9042,共10页
-
基金
国家自然科学基金(71671057)。
-
文摘
方面级情感分析是自然语言处理领域中一项具有挑战性的细粒度情感分析任务。以微调预训练语言模型的方式广泛应用于方面级情感分析任务,并取得了明显的效果提升。然而,现有多数研究设计的下游结构较为复杂,甚至与预训练模型部分隐藏层结构重合,从而限制了整体模型性能。由于对比学习方法有助于改善预训练语言模型在词语级别和句子级别的表示,设计了一种结合自监督对比学习与方面级情感分析的联合微调模型(self-supervised contrastive learning aspect-based sentiment analysis,SSCL-ABSA)。该模型以简洁的下游结构联合两种学习任务,实现从不同角度微调预训练基于Transformer的双向编码器(bidirectional encoder representations from Transformers,BERT)模型,有效促进了方面级情感分析效果的提升。具体地,首先在BERT编码阶段,将评论文本与方面词拼接成两个片段输入BERT编码器,得到各词特征表示。之后根据下游结构需求,对不同的词特征采用池化操作。一方面池化所有词特征用于方面级情感分析,另一方面池化两个片段的方面词特征用于自监督对比学习。最终结合两种任务以联合学习的方式微调BERT编码器。在3个公开数据集上进行实验评估,结果表明SSCL-ABSA方法优于其他同类对比方法。借助t-分布随机近邻嵌入(t-distributed stochastic neighbor embedding,t-SNE)方法,形象地可视化了SSCL-ABSA有效改善了BERT模型的实体表示效果。
-
关键词
方面级情感分析
自监督对比学习
预训练语言模型
BERT编码器
联合微调
-
Keywords
aspect-based sentiment analysis
self-supervised contrastive learning
pre-trained model
BERT encoder
joint fine-tuning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于卷积神经网络的仓储评论数据分类系统研究
- 2
-
-
作者
陈见飞
高军
杨世军
马越
狄广义
-
机构
国能数智科技开发(北京)有限公司
山东诚信工程建设监理有限公司
-
出处
《信息与电脑》
2024年第2期112-114,118,共4页
-
文摘
为了解用户对仓储产品或服务的意见和满意度,提高仓储运营的效率和竞争力,提出基于卷积神经网络(Convolutional Neural Networks,CNN)的仓储评论数据分类系统。首先,爬取仓储评论数据,并进行处理;其次,构建改进的结合字符和词的双输入卷积神经网络模型(Improved Char and Phrase Convolutional Neural Networks,ICP-CNN),并对文本进行正负向情感分类;最后,利用Flask框架构建Web系统,实现界面的可视化展示。
-
关键词
卷积神经网络(CNN)
仓储评论数据
分类
-
Keywords
Convolutional Neural Networks(CNN)
warehouse review data
classification
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于半监督协同训练的多标签文本分类模型
- 3
-
-
作者
高军
陈见飞
杨世军
王耀坤
狄广义
-
机构
国能数智科技开发(北京)有限公司
-
出处
《信息与电脑》
2023年第22期170-174,共5页
-
文摘
为降低数据标注的成本并提高投诉文本分类的准确率,本文提出基于半监督协同训练的多标签文本分类模型。该模型通过构建多个基分类器组的方式进行训练,其中每个基分类器组都由随机森林和支持向量机组成,并通过打伪标签的方式扩充有标签数据集进行循环训练至模型收敛,最终整合分类结果,充分发挥各学习器在不同特征上的分类优势,并在实验中验证该模型的有效性。
-
关键词
半监督学习
多标签分类
协同训练
投诉文本
-
Keywords
semi-supervised learning
multi-label classification
collaborative training
text of complaint
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名能源云平台绿色数据中心的构建
被引量:2
- 4
-
-
作者
狄广义
-
机构
国能网信科技(北京)有限公司
-
出处
《中国新技术新产品》
2021年第17期25-27,共3页
-
文摘
为提升能源云平台的综合服务能力,实现云平台的绿色发展,同时提升云平台的综合抗灾能力,该文分析了构建能源云平台的政策支持背景,进一步阐述了集团能源云平台的整体结构组成以及系统组成,并利用关系树的方法进行分类建模,实现对突发灾难场景的应对能力,并分析了已有的集团能源云平台的建设及利用情况,供相关人员参考。
-
关键词
能源云平台
绿色数据
关系树
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名数据中心灾备系统建设研究
被引量:3
- 5
-
-
作者
狄广义
-
机构
神华和利时信息技术有限公司
-
出处
《通讯世界》
2017年第23期47-49,共3页
-
文摘
随着社会的发展和科技的进步,各个企业之间的竞争日益激烈,对于企业而言,大数据技术的应用在很大程度上可以提高企业的竞争能力。为保证数据中心数据存储和使用的安全,必须要建立一套完整的稳定的数据中心灾备系统。容灾系统将保证用户数据的安全性即数据容灾,一个更加完善的容灾系统,还能提供不间断的应用服务。基于此,本文就数据中心灾备系统建设进行简要分析,希望可以提供一个有效的借鉴。
-
关键词
数据中心
灾备系统
建设措施
-
分类号
TP308
[自动化与计算机技术—计算机系统结构]
TP309.3
[自动化与计算机技术—计算机系统结构]
-
-
题名基于“互联网+”的分布式能源智慧云平台构建
被引量:2
- 6
-
-
作者
狄广义
-
机构
国能信息技术有限公司
-
出处
《电子技术与软件工程》
2021年第14期9-10,共2页
-
文摘
本文研究了基于"互联网+"的分布式能源智慧云平台构建。大数据时代的到来,"云大物移智"的信息化变革,同时"互联网+"也正步入正轨,分布式能源作为现在世界能源发展的主要方向,受到了业内众多人的重视,其研究得到了广泛的关注,主要借助对"互联网+"的进行研究,本文就基于"互联网+"的分布式能源智慧云平台的总体方案设计、平台架构等几方面做了分析,希望能对之后的研究有所帮助。
-
关键词
“互联网+”
分布式能源
智慧云平台
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-
-
题名关于人工智能技术的发展探究
- 7
-
-
作者
狄广义
-
机构
神华和利时信息技术有限公司
-
出处
《中国新通信》
2018年第11期65-67,共3页
-
文摘
随着社会的不断发展,人工智能以其优势已经被广泛的应用于生活的各个方面,进一步加强人工智能技术的研究非常有必要。因此在未来的发展中需要不断加强人工智能的研究,不断地进行智能化优化,从而能够促进其向更高更深的方向发展,为人们提供更多的方便。基于此本文分析了人工智能技术的发展。
-
关键词
人工智能技术
发展
措施
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名计算资源虚拟化在神华集团新一代数据中心的应用实践
被引量:1
- 8
-
-
作者
孟君
张延生
狄广义
-
机构
神华集团信息管理部
-
出处
《神华科技》
2014年第4期3-7,共5页
-
文摘
以神华集团新一代企业级数据中心建设为背景,全面梳理、分析和论证了传统数据中心在计算资源部署方面存在的突出问题,进一步继承并完善了以虚拟化技术为内核的计算资源池概念,并依此为基础,分别规划、设计和构建了基于VMware vSphere的应用资源池和基于Oracle Exadata一体机的数据库资源池,作为承载神华集团包括ERP、CRM、SRM等50多个企业级关键业务的基础运行平台。运营实践证明,引入计算资源池之后,集团数据中心在服务器整合比、资源交付模式、"五高"指标、架构弹性,甚至在IT成本控制和节能减排等方面,均取得良好效果,完全符合设计预期。
-
关键词
虚拟化
云计算
一体机
资源池
新一代数据中心
-
Keywords
Virtualization
Cloud Computing
All-in-one Machine
Resource Pool
Next Generation Data Center
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-