期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于语境增强的新能源汽车投诉文本方面-观点对抽取
1
作者 汪才钦 周渝皓 +2 位作者 张顺香 王琰慧 王小龙 《计算机应用》 CSCD 北大核心 2024年第8期2430-2436,共7页
挖掘新能源汽车投诉文本中用户对产品多维度的意见,能为产品的设计决策提供参考。因投诉文本具有实体密度高、句式冗长等特点,导致当前方面-观点对抽取(AOPE)方法感知方面项与观点项间的关联性不强。针对这一问题,提出一种基于语境增强... 挖掘新能源汽车投诉文本中用户对产品多维度的意见,能为产品的设计决策提供参考。因投诉文本具有实体密度高、句式冗长等特点,导致当前方面-观点对抽取(AOPE)方法感知方面项与观点项间的关联性不强。针对这一问题,提出一种基于语境增强的AOPE模型(AOE-CE),通过融合主题特征与文本特征作为语境表示增强实体间的关联关系。模型由实体识别和关系检测2个模块组成:首先,实体识别通过预训练模型和词性标注工具编码文本,再利用双向长短期记忆(Bi-LSTM)网络结合多头注意力捕获上下文信息得到文本特征,并将文本特征输入至条件随机场(CRF)得到实体集合;关系检测通过BERT(Bidirectional Encoder Representations from Transformers)获取主题特征,并将主题特征与文本特征融合获得增强的语境表示,再利用三仿射机制以语境表示为辅助增强实体间的关联关系,最后通过Sigmoid得到抽取结果。实验结果表明,AOE-CE的精准率、召回率和F1值比SDRN(Synchronous Doublechannel Recurrent Network)模型分别提升了2.19、1.08和1.60个百分点,表明所提模型具有更好的AOPE效果。 展开更多
关键词 方面-观点对抽取 新能源汽车 投诉文本 语境增强 三仿射机制 多头注意力
下载PDF
基于MacBERT和联合注意力增强网络的物业服务投诉分类方法
2
作者 湛志宏 覃开贤 +1 位作者 彭凌华 湛铖 《广西科学》 CAS 北大核心 2024年第1期110-118,共9页
基于人工的物业投诉文件分类处理方法已经无法满足社会需求,并且已有投诉相关的自动分类方法在物业投诉分类问题上的性能较不足。因此,本研究提出一个基于MacBERT和联合注意力增强网络的物业服务投诉分类方法JAE BERT4Com。JAE BERT4Co... 基于人工的物业投诉文件分类处理方法已经无法满足社会需求,并且已有投诉相关的自动分类方法在物业投诉分类问题上的性能较不足。因此,本研究提出一个基于MacBERT和联合注意力增强网络的物业服务投诉分类方法JAE BERT4Com。JAE BERT4Com使用基于近义词替换与合成少数过采样技术结合的样本增强策略解决类不平衡的问题,以及基于MacBERT的分层注意力、Transformers的多头注意力和关键词注意力等多重注意力联合增强的网络进行文本特征学习和分类。实验结果表明,JAE BERT4Com能够获得比现有模型更高的准确率、F1分数和召回率,比现有较先进模型的性能更优。 展开更多
关键词 物业投诉 投诉分类 文本分类 注意力增强 深度学习
下载PDF
基于BERT的民生问题文本分类模型——以浙江省政务热线数据为例 被引量:1
3
作者 孔祥夫 董波 +1 位作者 徐可 陶永亮 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第3期456-466,共11页
基于2017—2021年浙江省12345政务热线数据,从居民视角构建细粒度的民生问题三级分类体系,并利用BERT预训练模型来构建文本分类模型,将居民诉求文本转化为民生问题标签。研究结果表明,在政务热线数据中加入30%的人工生成诉求样本,可以... 基于2017—2021年浙江省12345政务热线数据,从居民视角构建细粒度的民生问题三级分类体系,并利用BERT预训练模型来构建文本分类模型,将居民诉求文本转化为民生问题标签。研究结果表明,在政务热线数据中加入30%的人工生成诉求样本,可以使模型的分类准确率提升约10个百分点,准确率最高可达84.59%。对浙江省各类民生问题占比的分析结果表明,环境保护、违规经营和市政服务等诉求的比例呈现下降趋势,而公共服务、交通问题、购房问题和新兴消费模式的诉求比例呈上升趋势。研究结果有助于加强政府对于民情民意的了解,提升数据驱动的社会治理能力。 展开更多
关键词 民生问题文本分类 BERT 政务热线数据 数据治理
下载PDF
基于对抗迁移学习模型的环境类虚假投诉检测
4
作者 范青武 韩华政 孙晓宁 《北京工业大学学报》 CAS CSCD 北大核心 2023年第9期999-1006,共8页
为实现环境类虚假投诉举报检测,提出一种基于对抗迁移学习方法的虚假投诉举报检测模型。首先,以长短期记忆(long-short term memory,LSTM)网络为特征抽取器抽取微博谣言(源域)和投诉举报文本(目标域)的共享特征;然后,使用对抗学习方法... 为实现环境类虚假投诉举报检测,提出一种基于对抗迁移学习方法的虚假投诉举报检测模型。首先,以长短期记忆(long-short term memory,LSTM)网络为特征抽取器抽取微博谣言(源域)和投诉举报文本(目标域)的共享特征;然后,使用对抗学习方法进行领域适配,将源域特征和目标域特征进行特征对齐;最后,由分类器输出分类结果,并由分类损失和领域适配损失共同更新网络参数。通过模型对比实验和消融实验可知,模型的F_(1)达到了79.61%。结果表明,对抗迁移学习模型具有较好的性能,适合应用在环境类虚假投诉举报检测任务中。 展开更多
关键词 投诉举报 文本分类 迁移学习 生成对抗网络 深度学习 长短期记忆(long-short term memory LSTM)网络
下载PDF
基于NLP的文本挖掘技术在提升电信客户满意度中的应用 被引量:1
5
作者 关志广 程乔 《无线互联科技》 2023年第5期117-119,共3页
为了充分挖掘非结构化数据蕴含的信息价值,文章介绍了基于自然语言处理的文本挖掘技术,从原理到实践进行了探究。以电信运营商移动网络客户的体验与口碑为导向,利用文本挖掘技术在互联网舆情分析和客服部门投诉工单分析等方面进行探索,... 为了充分挖掘非结构化数据蕴含的信息价值,文章介绍了基于自然语言处理的文本挖掘技术,从原理到实践进行了探究。以电信运营商移动网络客户的体验与口碑为导向,利用文本挖掘技术在互联网舆情分析和客服部门投诉工单分析等方面进行探索,给出了基于非结构化文本数据的信息分类与呈现的方法,从而更好地聚焦客户需求和网络问题,支撑网络维护与优化工作,提升客户满意度。 展开更多
关键词 文本挖掘 自然语言处理 结构化数据 舆情 投诉
下载PDF
基于半监督协同训练的多标签文本分类模型
6
作者 高军 陈见飞 +2 位作者 杨世军 王耀坤 狄广义 《信息与电脑》 2023年第22期170-174,共5页
为降低数据标注的成本并提高投诉文本分类的准确率,本文提出基于半监督协同训练的多标签文本分类模型。该模型通过构建多个基分类器组的方式进行训练,其中每个基分类器组都由随机森林和支持向量机组成,并通过打伪标签的方式扩充有标签... 为降低数据标注的成本并提高投诉文本分类的准确率,本文提出基于半监督协同训练的多标签文本分类模型。该模型通过构建多个基分类器组的方式进行训练,其中每个基分类器组都由随机森林和支持向量机组成,并通过打伪标签的方式扩充有标签数据集进行循环训练至模型收敛,最终整合分类结果,充分发挥各学习器在不同特征上的分类优势,并在实验中验证该模型的有效性。 展开更多
关键词 半监督学习 多标签分类 协同训练 投诉文本
下载PDF
基于旅游者视角的旅游投诉特征与影响因素分析——以云南省为例 被引量:3
7
作者 吕宛青 张冬 +1 位作者 李露露 杜靖川 《资源开发与市场》 CAS CSSCI 2017年第11期1403-1408,共6页
从旅游者视角对旅游投诉进行研究,对旅游产业可持续发展有着重要意义。以2014—2016年人民网旅游3·15投诉平台为数据来源,以云南省的投诉案例作为研究样本,借助网络文本分析方法,从旅游者视角对旅游投诉的特征、内容及影响因素进... 从旅游者视角对旅游投诉进行研究,对旅游产业可持续发展有着重要意义。以2014—2016年人民网旅游3·15投诉平台为数据来源,以云南省的投诉案例作为研究样本,借助网络文本分析方法,从旅游者视角对旅游投诉的特征、内容及影响因素进行分析。结果表明:旅游投诉逐年增长,呈现出时间和空间的集聚趋势,时间主要集中在第三季度,空间主要集中在昆明、大理、丽江;导游、旅行社和景区是主要投诉对象,旅游购物是投诉重点,严重损害了目的地的旅游形象。根据研究结果,从旅游投诉机制、导游管理、旅游购物、游客教育、旅游目的地形象维护五个方面提出相应的建议。 展开更多
关键词 旅游者 旅游投诉 网络文本 云南省
下载PDF
面向特定主题的客户抱怨文本分类识别方法 被引量:5
8
作者 何建民 刘明星 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第12期1884-1888,共5页
客户抱怨的自动识别是企业支持和维系客户的关键问题。文章将文本挖掘与支持向量机理论相结合,提出一种网络客户抱怨文本的分类识别方法。该方法通过2次分类识别客户抱怨文本和客户抱怨的类型,主要是通过构建情感词典,选取特征词汇,以... 客户抱怨的自动识别是企业支持和维系客户的关键问题。文章将文本挖掘与支持向量机理论相结合,提出一种网络客户抱怨文本的分类识别方法。该方法通过2次分类识别客户抱怨文本和客户抱怨的类型,主要是通过构建情感词典,选取特征词汇,以特征向量表示客户抱怨文本,以支持向量机的方法分类抱怨文本,并识别抱怨文本类型;用实验方法验证了其合理性和有效性,对企业网上客户抱怨识别和服务质量提高具有重要意义和实用价值。 展开更多
关键词 客户抱怨 抱怨文本识别 文本挖掘 支持向量机
下载PDF
电力企业投诉工单文本挖掘模型 被引量:14
9
作者 刘兴平 章晓明 +5 位作者 沈然 林少娃 章琛敏 张维 朱斌 何韵 《电力需求侧管理》 2016年第2期57-60,共4页
以客户投诉工单和回访不满意工单为样本,引入LDA文档主题生成模型对文本信息进行中文自然语言处理和数据挖掘,发现问题属性类别,通过大数据对文本挖掘结果进行分析和监控,构建适合电力公司的投诉工单文本挖掘模型,实现对工单进行分类筛... 以客户投诉工单和回访不满意工单为样本,引入LDA文档主题生成模型对文本信息进行中文自然语言处理和数据挖掘,发现问题属性类别,通过大数据对文本挖掘结果进行分析和监控,构建适合电力公司的投诉工单文本挖掘模型,实现对工单进行分类筛选、便签判断和初步归因。 展开更多
关键词 客户满意度 诉投工单 文本挖掘 大数据分析
下载PDF
基于改进的CHI统计方法在文本分类中的应用 被引量:13
10
作者 黄章树 叶志龙 《计算机系统应用》 2016年第11期136-140,共5页
随着文本分类技术的发展与成熟,越来越多的企业将其应用到客户投诉分类系统中,并获得了一定的效果.针对传统卡方统计方法偏向于选择出负相关低频噪音词,将改进的CHI统计方法运用到文本特征选择,通过降低负相关低频词在特征选择算法中的... 随着文本分类技术的发展与成熟,越来越多的企业将其应用到客户投诉分类系统中,并获得了一定的效果.针对传统卡方统计方法偏向于选择出负相关低频噪音词,将改进的CHI统计方法运用到文本特征选择,通过降低负相关低频词在特征选择算法中的权重,减小其对模型的影响.最后,对某省通信公司的业务投诉文本进行实验,结果表明该模型和方法是有效的,能更准确地对业务投诉工单进行分类,从而为后续问题的分析提供数据支持. 展开更多
关键词 业务投诉 文本分类 特征选择 卡方统计方法
下载PDF
基于文本挖掘的投诉热点智能分类 被引量:9
11
作者 夏海峰 陈军华 《上海师范大学学报(自然科学版)》 2013年第5期470-475,共6页
投诉识别系统在保证热点投诉正确分类、提高电信行业的服务质量中起到很重要的作用.由于电信行业的客户投诉有其特殊性,所有的投诉必须在很短的时间内分类完成,从而往往会发生导航分类错误的现象.提出了一套基于文本挖掘的模型,该模型... 投诉识别系统在保证热点投诉正确分类、提高电信行业的服务质量中起到很重要的作用.由于电信行业的客户投诉有其特殊性,所有的投诉必须在很短的时间内分类完成,从而往往会发生导航分类错误的现象.提出了一套基于文本挖掘的模型,该模型能够智能地将热点投诉分类到正确的投诉导航上去.实验表明:该模型能够有效地进行投诉文本分类. 展开更多
关键词 文本挖掘 智能分类 投诉
下载PDF
一种基于文本相似度矩阵运算的非结构化海量投诉数据分类算法 被引量:5
12
作者 李青 陈阳 +1 位作者 谢浩然 蒙圣光 《计算机工程与科学》 CSCD 北大核心 2012年第1期103-107,共5页
随着互联网和信息技术的日新月异,非结构化数据量有呈几何级数增长的趋势。尤其是Web2.0网络社区的流行与火爆,使得增长趋势得到了进一步的加速。因此,面对海量的非结构化数据,如何有效地管理和组织它们,以便于终端用户进行信息存取,成... 随着互联网和信息技术的日新月异,非结构化数据量有呈几何级数增长的趋势。尤其是Web2.0网络社区的流行与火爆,使得增长趋势得到了进一步的加速。因此,面对海量的非结构化数据,如何有效地管理和组织它们,以便于终端用户进行信息存取,成为了一个迫在眉睫的重要研究课题。本文通过对非结构化数据的文本的建模和文本相似度比较,对于大规模非结构化数据的分类算法进行了讨论和研究,并将此算法应用到了中国移动的投诉数据分类系统中。在系统实施后,非常有效地提高了投诉数据的处理效率,从而印证所提出分类算法及系统框架的有效性。 展开更多
关键词 文本相似度 非结构化数据 投诉数据分类系统
下载PDF
解析网络空间的公众环境诉求:议题、策略及影响 被引量:6
13
作者 贾哲敏 于晓虹 《武汉大学学报(人文科学版)》 CSSCI 北大核心 2016年第6期125-133,共9页
网络问政平台是我国公众环境投诉的重要平台,也是我国环境问题集中展示的窗口。本研究采集了2008年到2014年人民网地方政府留言板中35169条公众环境诉求,利用自动文本分析法解析。研究发现,生活环境破坏是目前最受关注的环境问题,主要... 网络问政平台是我国公众环境投诉的重要平台,也是我国环境问题集中展示的窗口。本研究采集了2008年到2014年人民网地方政府留言板中35169条公众环境诉求,利用自动文本分析法解析。研究发现,生活环境破坏是目前最受关注的环境问题,主要由城市居民投诉。经济发达、资源丰富的地区在水污染、空气污染和生态破坏方面的诉求明显高于中西部地区。生存困境已经取代健康风险成为环境污染首要的社会经济后果,呼吁/请愿则取代政府调查,成为公众最主要的政策诉求。身份属性、诉求类型会显著影响环境投诉中的社会经济后果与政策诉求偏好,可见公众具有主动性,能强化投诉策略以增强政府回应意愿。 展开更多
关键词 公众环境诉求 网络问政平台 自动文本分析法
下载PDF
面向电信客户投诉和建议的智能分析模型 被引量:3
14
作者 李济汉 陈博 《现代电信科技》 2013年第5期4-7,共4页
文中提出了一个面向电信客户投诉和建议的自动快速分析模型,通过网络爬虫采集互联网上客户的投诉和建议,通过客服录入获取客户的电话投诉和建议信息,然后对这些投诉和建议文本进行预处理,包括中文分词、消去停用词、构建向量空间模型等... 文中提出了一个面向电信客户投诉和建议的自动快速分析模型,通过网络爬虫采集互联网上客户的投诉和建议,通过客服录入获取客户的电话投诉和建议信息,然后对这些投诉和建议文本进行预处理,包括中文分词、消去停用词、构建向量空间模型等。最后使用结合了人工信息和统计信息的自动识别算法对客户的投诉和建议进行分析、识别,把它们转交给相应的部门处理。 展开更多
关键词 投诉分析 文本处理 机器学习
下载PDF
基于文本分析的运营商潜在升级投诉客户挖掘 被引量:1
15
作者 张爱华 于涵 陈超雨 《北京邮电大学学报(社会科学版)》 2022年第5期32-38,57,共8页
爬取新浪微博中国移动官方账号评论区的1560条投诉文本作为普通投诉数据,以及黑猫投诉平台对中国移动的4600条投诉文本作为升级投诉数据,对数据进行预处理。采用word2vec技术,将预处理后的投诉文本数据转化为数值数据,通过计算向量余弦... 爬取新浪微博中国移动官方账号评论区的1560条投诉文本作为普通投诉数据,以及黑猫投诉平台对中国移动的4600条投诉文本作为升级投诉数据,对数据进行预处理。采用word2vec技术,将预处理后的投诉文本数据转化为数值数据,通过计算向量余弦相似度,获取容易上升为升级投诉的普通投诉数据,即潜在升级投诉数据,并对其主题进行总结。通过对升级投诉文本进行LDA主题分析,获取升级投诉的主题,从而分析客户进行升级投诉的原因,为运营商准确挖掘潜在升级投诉客户提供新思路,对运营商的客户投诉管理提出切实可行的建议。 展开更多
关键词 升级投诉 客户挖掘 文本分析
下载PDF
起诉文本的形成及在基层司法纠纷成案中的功能
16
作者 牟军 薛鸿 《思想战线》 CSSCI 北大核心 2021年第3期144-151,共8页
起诉文本是纠纷诉诸法院的规范表达形式,它的生成对于纠纷成案具有重要的指向意义。从起诉人的角度看,通过对起诉文本中的“诉讼请求”“纠纷事实”“事实依据”等法律要素的构建,以实现纠纷成案的客观功能;通过对纠纷的法律属性进行分... 起诉文本是纠纷诉诸法院的规范表达形式,它的生成对于纠纷成案具有重要的指向意义。从起诉人的角度看,通过对起诉文本中的“诉讼请求”“纠纷事实”“事实依据”等法律要素的构建,以实现纠纷成案的客观功能;通过对纠纷的法律属性进行分类和归纳,将纠纷纳入具体的法律关系之中。而法官通过起诉文本对纠纷成案有着规制、交涉引导和抑制的作用。基层司法中纠纷成案正当化路径的调适,需要解决基层司法中起诉文本生成的一些基本问题,发挥地方性知识在纠纷成案中的作用,以及法官对纠纷成案的社会政策及伦理的坚持。 展开更多
关键词 基层司法 起诉文本 纠纷成案 作用机理 路径调适
下载PDF
基于网络内容分析法的在线旅游网站投诉研究 被引量:2
17
作者 郭志彦 王荣成 +3 位作者 王昱 程利莎 王园园 郭冠华 《科技与经济》 2017年第4期76-80,共5页
随着旅游网站的发展,人们大多会选择在线搜索获取旅游信息,通过网络交易来购买旅游产品的行为更为常态化。然而在线旅游交易给人们带来便利的同时,在线旅游网站的产品质量、消费者的不满等问题也层出不穷,因此在线旅游投诉的研究极为必... 随着旅游网站的发展,人们大多会选择在线搜索获取旅游信息,通过网络交易来购买旅游产品的行为更为常态化。然而在线旅游交易给人们带来便利的同时,在线旅游网站的产品质量、消费者的不满等问题也层出不穷,因此在线旅游投诉的研究极为必要。同时,学界关于在线旅游网站投诉的研究仍相对少见,基于此,研究对质量万里行网站中有关旅游投诉资料进行整理,以游客对去哪儿网、携程两大网站的投诉案例为研究对象,运用内容分析法,筛选了403例在线旅游投诉进行分布特征分析、高频特征词分析及网络语义分析,研究结果显示:北京、上海、广东、浙江、四川、江苏等省市的消费者投诉量最多;对机票预和酒店预订两大方面的投诉比重大;员工不专业、退票费用/手续费高等5种类型的投诉量大。 展开更多
关键词 内容分析法 在线旅游网站 投诉 网络文本
下载PDF
基于改进CFSFDP算法的电信投诉文本聚类方法 被引量:3
18
作者 张天宇 谌志群 +1 位作者 黄孝喜 王荣波 《电子科技》 2017年第10期93-96,共4页
为了提高电信服务质量,增强企业竞争力,对电信投诉文本进行聚类,方便电信运营商分析投诉原因,文中提出了基于改进CFSFDP算法对电信投诉文本进行聚类的方法。通过差分进化算法寻找CFSFDP算法中最优密度阈值和距离阈值,降低密度及距离阈... 为了提高电信服务质量,增强企业竞争力,对电信投诉文本进行聚类,方便电信运营商分析投诉原因,文中提出了基于改进CFSFDP算法对电信投诉文本进行聚类的方法。通过差分进化算法寻找CFSFDP算法中最优密度阈值和距离阈值,降低密度及距离阈值的随机性选取对聚类准确率造成的影响。该算法使用Gaussian Kernel计算数据点密度,降低参数对密度计算的影响。在电信投诉文本数据集上的实验结果显示,改进CFSFDP算法聚类结果达到了与KMeans算法、CFSFDP算法、Agglomerative Clustering算法更好或者相当的效果,证明了算法的有效性。 展开更多
关键词 CFSFDP算法 文本聚类 电信投诉 密度 距离 差分进化
下载PDF
基于Filter模型和随机森林的电信客户投诉分类方法 被引量:3
19
作者 岳丹阳 方帅 《计算机应用与软件》 北大核心 2020年第7期221-226,共6页
电信客户投诉记录中包含大量非结构化文本信息和客户通信行为信息。为了进行客户投诉的自动分析和精准分类,针对这些具有高维混合特征的数据,提出一种基于Filter模型和随机森林的客户投诉分类方法。采用Filter模型进行特征选择,以信息... 电信客户投诉记录中包含大量非结构化文本信息和客户通信行为信息。为了进行客户投诉的自动分析和精准分类,针对这些具有高维混合特征的数据,提出一种基于Filter模型和随机森林的客户投诉分类方法。采用Filter模型进行特征选择,以信息增益比来衡量特征的重要性,从而删除无关冗余的特征,降低维数;构建基于随机森林的客户投诉分类模型。采用某电信运营商3个月的投诉数据进行实验,结果表明:该方法相比其他集成学习方法,能够显著提高投诉处理的准确性,从而验证了其有效性。 展开更多
关键词 客户投诉处理 文本分类 随机森林 特征选择
下载PDF
针对民生热线文本的热点挖掘系统设计 被引量:1
20
作者 薛彬 陶海军 王加强 《中国计量大学学报》 2017年第3期371-379,共9页
随着城市智能化的发展,12345民生服务热线成为广大市民表达诉求的重要渠道之一.民生服务热线所收集的数据蕴含了丰富的当地社会热点,这些文本数据往往具有长度不一、信息量大等特点,而城市诉求管理需要一种高效的分类方法来处理这些热... 随着城市智能化的发展,12345民生服务热线成为广大市民表达诉求的重要渠道之一.民生服务热线所收集的数据蕴含了丰富的当地社会热点,这些文本数据往往具有长度不一、信息量大等特点,而城市诉求管理需要一种高效的分类方法来处理这些热点问题.在此首先阐述文本挖掘中的关键技术,在此基础上研究开发一个针对民生服务热线文本的民生热点挖掘系统,系统主要分为文本预处理、文本智能分类、民生热点挖掘三个功能模块,并借助可视化技术快速准确地分析出群众当前关心的热点,及时处理群众的诉求,使之有助于政府对社会民生建设的管理. 展开更多
关键词 投诉文本 特征选择 文本分类 民生热点挖掘系统
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部