期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于UGC数据的旅游数据挖掘研究进展
1
作者 俸亚特 徐正丽 文益民 《广西科学》 CAS 北大核心 2024年第1期87-99,共13页
随着互联网和社交媒体的蓬勃发展,用户生成内容(User Generated Content,UGC)数据逐渐成为旅游大数据的重要组成部分。UGC数据能够体现游客旅游行为,数据类型丰富、真实性强、噪声大。本文回顾了过去几年旅游UGC数据研究的发展,分别从... 随着互联网和社交媒体的蓬勃发展,用户生成内容(User Generated Content,UGC)数据逐渐成为旅游大数据的重要组成部分。UGC数据能够体现游客旅游行为,数据类型丰富、真实性强、噪声大。本文回顾了过去几年旅游UGC数据研究的发展,分别从文本、照片、多模态3种数据类型角度进行综述,总结了近年来旅游UGC数据挖掘研究取得的成果,并探讨了未来研究的方向。 展开更多
关键词 UGC 多模态 数据挖掘 旅游大数据
下载PDF
基于粒子群优化BP神经网络的汽车4S店客户流失预警
2
作者 赵颖 秦睿 +1 位作者 林翠波 俸亚特 《时代汽车》 2024年第11期142-145,共4页
客户流失预警作为防止汽车4S店客户流失的重要手段,不仅为当代车企提供了有效的经济效益保证,也为车企对未来决策带来了新的研究依据。为建立汽车4S店客户流失预警分级标准,该文从客户基本信息、车龄、车辆销售价格、贷款金额、维修保... 客户流失预警作为防止汽车4S店客户流失的重要手段,不仅为当代车企提供了有效的经济效益保证,也为车企对未来决策带来了新的研究依据。为建立汽车4S店客户流失预警分级标准,该文从客户基本信息、车龄、车辆销售价格、贷款金额、维修保养次数、维修保养时间等29个指标着手,基于粒子群优化BP神经网络算法,建立汽车4S店客户流失预警分级标准模型。该模型首先预测出客户流失概率,然后根据值为0-1之间的概率大小分为1-5共5个等级,其中1表流失可能性很小,5表示流失可能性很大。最终得到测试集客户流失预警从1到5等级的比例分别为71.39%、3.75%、3.50%、5.86%和15.50%。同时,通过训练集中有78.65%的客户未流失作为先验概率,判定预测概率小于等于先验概率为客户未流失,大于先验概率为客户流失,得到该模型总体的准确率为91.71%。 展开更多
关键词 粒子群优化算法 BP神经网络 客户流失预警 分级标准 主成分分析
下载PDF
基于改进DAN的自然场景下越南文字的识别
3
作者 王利兵 俸亚特 文益民 《数据采集与处理》 CSCD 北大核心 2023年第5期1058-1068,共11页
越南语字符由拉丁字符结合变音符号组成,由于变音符号的存在易导致注意力漂移,并且越南语文字字符类别较多,字符间差异性较小,部分字符仅为变音符号的差异,使得越南文字的识别具有挑战性。本文在解耦注意力网络(Decoupled attention net... 越南语字符由拉丁字符结合变音符号组成,由于变音符号的存在易导致注意力漂移,并且越南语文字字符类别较多,字符间差异性较小,部分字符仅为变音符号的差异,使得越南文字的识别具有挑战性。本文在解耦注意力网络(Decoupled attention network, DAN)的基础上,设计了视觉特征与序列特征融合模块(Visual feature and sequence feature fusion module, VSFM),分别利用双向门控循环单元(Bidirectional gated recurrent unit, Bi-GRU)在水平方向和竖直方向进行序列建模,进一步缓解注意力漂移,增强变音符号与拉丁字符间的关联性。然后设计了增强型解耦文本解码器模块(Enhanced decoupled text decoder module, ETDM),在解码器中分类时结合了更多的特征信息,可以更加有效地识别相似字符。一系列的实验验证了本文提出方法的有效性。 展开更多
关键词 声调语言文字 越南语文字 变音符号 注意力漂移 场景文本识别
下载PDF
基于改进Mask R-CNN的越南场景文字检测
4
作者 俸亚特 文益民 《计算机应用》 CSCD 北大核心 2021年第12期3551-3557,共7页
针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络MaskR-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并... 针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络MaskR-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并将文字区域的掩码矩阵大小从14×14调整为14×28以更好地适应文字区域。针对用常规非极大值抑制(NMS)算法不能剔除重复文字检测框的问题,设计了一个针对文字区域的文本区域过滤模块并添加在检测模块之后,以有效地剔除冗余检测框。使用模型联合训练的方法训练网络,训练过程包含两部分:第一部分为特征金字塔网络(FPN)和区域生成网络(RPN)的训练,训练使用的数据集为大规模公开的拉丁文字数据,目的是增强模型在不同场景下提取文字的泛化能力;第二部分为候选框坐标回归模块和区域分割模块的训练,此部分模型参数使用像素级标注的越南场景文字数据进行训练,使模型能对包括声调符号的越南文字区域进行分割。大量交叉验证实验和对比实验结果表明,与MaskR-CNN相比,所提算法在不同的交并比(IoU)阈值下都具有更好的准确率与召回率。 展开更多
关键词 MaskR-CNN 越南场景文字检测 声调符号 模型联合训练 分割模型 重复检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部