期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
大数据环境下多模态融合的大学生异常行为预警 被引量:1
1
作者 王玉标 陶八梅 +1 位作者 李珩 陶志红 《计算机系统应用》 2024年第1期167-176,共10页
针对“校园大数据”累积的海量数据呈现出离散性、稀疏性等问题,如何从基数大、活动广、个性强的校园学生群体中检测出潜在的、有异常行为的学生,已成为学生异常行为分析亟需解决的问题.本文提出了一种大数据环境下基于多模态融合的大... 针对“校园大数据”累积的海量数据呈现出离散性、稀疏性等问题,如何从基数大、活动广、个性强的校园学生群体中检测出潜在的、有异常行为的学生,已成为学生异常行为分析亟需解决的问题.本文提出了一种大数据环境下基于多模态融合的大学生异常行为预警方法(early warning method for abnormal behavior of college students based on multi-modal fusion in big data environment,EWMAB).首先,针对学生行为画像的表征不够丰富,行为标签存在时效性、动态性等问题,建立一种基于多模态特征深度学习的跨模态学生行为画像模型;其次,针对学生异常行为预测、预警的时效性和后置性问题,在学生行为画像和学生行为分类预测基础上,提出了一种基于多模态融合的学生异常行为预警方法,通过长短期记忆神经网络(long and short term memory networks,LSTM),结合学生行为多指标数据和文本信息来解决学生异常行为预警问题;最后,本文通过应用实例验证模型以学生学习成绩异常预警为例,与其他预警算法相比,EWMAB方法可以提高预警的准确性,实现学生异常行为预警的时效性和前置性,从而使学生教育工作更具有针对性、个性化和预测性. 展开更多
关键词 教育大数据 学生行为画像 多模态融合 异常行为预警 分类预测
下载PDF
基于多维能力和知识图谱-多层感知机的变压器运行状态画像构建方法 被引量:1
2
作者 舒胜文 陈阳阳 +3 位作者 张梓奇 方舒绮 王国彬 曾静岚 《电网技术》 EI CSCD 北大核心 2024年第2期750-759,共10页
利用大数据和画像技术对电力变压器运行状态进行准确评价有利于保障电力系统的安全稳定运行。针对电力变压器运行状态传统评价方法存在的评价维度过于单一、主观性较强等不足,提出了一种基于多维能力和知识图谱-多层感知机的变压器运行... 利用大数据和画像技术对电力变压器运行状态进行准确评价有利于保障电力系统的安全稳定运行。针对电力变压器运行状态传统评价方法存在的评价维度过于单一、主观性较强等不足,提出了一种基于多维能力和知识图谱-多层感知机的变压器运行状态画像构建方法。首先,构建了由绝缘水平、负载能力、抗短路能力、能效等级和调压能力五个能力构成的变压器运行状态画像体系;然后,融合知识图谱(knowledge graph,KG)与多层感知机(multilayer perceptron,MLP),建立了一种变压器运行状态画像分析模型;最后,基于某地区1368台110kV变压器的实际运行数据,开展了变压器运行状态画像的实例分析,并与随机森林(random forest,RF)和支持向量机(support vector machine,SVM)方法的画像分析结果进行对比。研究结果表明,所提方法对变压器运行状态画像的准确率达到96.35%,优于RF算法(准确率89%)和SVM算法(准确率77%),为电力变压器的运行状态评价提供了一种新思路。 展开更多
关键词 电力变压器 运行状态 画像构建 多维能力 知识图谱 多层感知机
下载PDF
多源数据融合下医护科研人员科研能力提升策略研究
3
作者 杨晓雯 季汉珍 《医学信息学杂志》 CAS 2024年第7期26-32,共7页
目的/意义探讨医护科研人员用户画像构建方法和科研能力提升策略。方法/过程根据用户画像理论提出医护科研人员用户画像的构建模型;使用Python语言、ETL和Echarts工具对构建用户画像所需的多源异构数据进行采集、预处理、存储和挖掘,提... 目的/意义探讨医护科研人员用户画像构建方法和科研能力提升策略。方法/过程根据用户画像理论提出医护科研人员用户画像的构建模型;使用Python语言、ETL和Echarts工具对构建用户画像所需的多源异构数据进行采集、预处理、存储和挖掘,提取标签进行用户画像可视化并进行实证研究。结果/结论医护科研人员可分为具备科研潜质的护理人员、科研新手、科研提升型群体和科研领域资深专家,根据不同类型特征提出医护科研人员科研能力提升策略。 展开更多
关键词 多源数据 医护科研人员 用户画像 科研能力提升
下载PDF
融合角色心理画像的心理健康文本匹配模型
4
作者 赵芸 刘德喜 +2 位作者 万常选 刘喜平 廖国琼 《计算机研究与发展》 EI CSCD 北大核心 2024年第7期1812-1824,共13页
全球心理健康问题形势严峻,由于心理健康服务的从业人员不足,遭受心理健康困扰的人并不总是能获得专业的心理健康服务.检索式心理健康社区自动问答可以快速地为需要心理健康服务的人提供相应的信息自助服务.与传统检索式社区问答中的文... 全球心理健康问题形势严峻,由于心理健康服务的从业人员不足,遭受心理健康困扰的人并不总是能获得专业的心理健康服务.检索式心理健康社区自动问答可以快速地为需要心理健康服务的人提供相应的信息自助服务.与传统检索式社区问答中的文本匹配不同,在匹配支持帖和求助帖时,需要考虑2种不同层面的匹配准则:语义层面和心理层面.为了解决该问题,提出融合角色心理画像的2阶段文本匹配模型(two-stage text matching model integrating characters’mental portrait,T2CMP),该模型引入心理特征用于构建角色心理画像,从而辅助模型理解文本心理层面的内容和匹配关系.同时为了提升检索效率以及减少大量负样例带来的噪声问题,将文本匹配任务拆分为2阶段的序列型子任务.首先针对每条求助帖,使用基于语义的筛选模型甄别出候选支持帖;然后依据用户的角色心理画像,使用多层注意力机制将其与语义信息有效融合,提高模型的总体效果.在MHCQA数据集上的实验结果显示,T2CMP比现有优秀算法拥有更高的F1值. 展开更多
关键词 文本匹配 2阶段模型 角色心理健康画像 多层注意力机制 心理健康信息自助服务
下载PDF
基于语义引导的人像自动抠图模型
5
作者 程艳 严志航 +2 位作者 赖建明 王桂喜 钟林辉 《图学学报》 CSCD 北大核心 2024年第4期683-695,共13页
为解决现有人像抠图方法中存在的语义判别错误和抠图细节模糊问题,提出一种基于语义引导的人像自动抠图模型。首先引入CNN-Transformer混合架构EMO进行特征编码。接着,在语义分割解码分支利用多尺度混合注意力模块处理最高层编码特征,... 为解决现有人像抠图方法中存在的语义判别错误和抠图细节模糊问题,提出一种基于语义引导的人像自动抠图模型。首先引入CNN-Transformer混合架构EMO进行特征编码。接着,在语义分割解码分支利用多尺度混合注意力模块处理最高层编码特征,以增强多尺度表征和像素级判别能力。然后,使用特征增强模块融合高层次特征,促使高层语义信息在浅层网络的流动。同时,细节抠取解码分支中的聚合以引导来自模块不同分支的特征聚合,利用聚合特征更好地引导网络提取浅层特征,提高了边缘细节抠取精度。在3个数据集上的实验表明,该方法与所比较方法相比性能达到了最优,并显著降低了参数量和计算复杂度,具有较高的竞争力。 展开更多
关键词 人像抠图 语义引导 多尺度 特征增强 聚合引导
下载PDF
基于数据抓取的开放教育教师多维度画像构建策略
6
作者 李雨朦 隋皓辰 《成人教育》 北大核心 2024年第7期50-60,共11页
新时代教师队伍建设是教育现代化的重要内容和前提。考虑到开放教育教师的丰富内涵,基于大数据分析对其进行适应性的、多元的、发展的教师数字画像时必须结合职责定位。研究以探索开放教育教师多维度画像实现路径为目的,从画像目标确立... 新时代教师队伍建设是教育现代化的重要内容和前提。考虑到开放教育教师的丰富内涵,基于大数据分析对其进行适应性的、多元的、发展的教师数字画像时必须结合职责定位。研究以探索开放教育教师多维度画像实现路径为目的,从画像目标确立、数据采集与预处理、模型构建、标签体系构建、画像输出与评估、精准应用七个环节系统探讨了开放教育教师画像的必要性、可行性与实施构想,构建了双维个体标签体系,并提出教师画像在职业生涯规划、考核评价、循证管理、专业发展规划等场景下的应用设想。研究旨在帮助构建符合高质量开放教育教师成长规律的多维度教师画像,为新时代教师评价和发展支持体系的建立提供参考。 展开更多
关键词 教师画像 开放教育 多维度画像 应用场景 数据抓取
下载PDF
基于PAM聚类的轨道交通站点画像分析
7
作者 洪英 李喆康 李旭 《现代城市研究》 北大核心 2024年第2期62-65,共4页
文章基于多源数据融合方法,从客流水平、居民需求、接驳特性、周边设施4个维度对轨道站点特征进行提取与构建。采用PAM算法对站点进行聚类研究,最终形成6类站点画像的标签。在此基础上探索站点功能定位、客流模式之间的内在关系,梳理不... 文章基于多源数据融合方法,从客流水平、居民需求、接驳特性、周边设施4个维度对轨道站点特征进行提取与构建。采用PAM算法对站点进行聚类研究,最终形成6类站点画像的标签。在此基础上探索站点功能定位、客流模式之间的内在关系,梳理不同类型站点在城市化进程中面临的阶段性矛盾,指导客流预测任务、引流策略制定等后续工作。 展开更多
关键词 多源数据 轨道站点画像 PAM聚类
下载PDF
基于汽车驾驶行为的多维客户画像精准构建方法
8
作者 张文 《无线互联科技》 2024年第8期87-89,共3页
传统多维客户画像精准构建方法构建效果差,因此文章提出基于汽车驾驶行为的多维客户画像精准构建方法。文章建立了多维客户多源特征体系,构建多视角融合模型,基于汽车驾驶行为进行多维客户画像精准构建。实验结果表明,该研究方法用户画... 传统多维客户画像精准构建方法构建效果差,因此文章提出基于汽车驾驶行为的多维客户画像精准构建方法。文章建立了多维客户多源特征体系,构建多视角融合模型,基于汽车驾驶行为进行多维客户画像精准构建。实验结果表明,该研究方法用户画像构建效果更好,有一定的应用价值。 展开更多
关键词 汽车驾驶行为 多维客户 画像构建 构建方法
下载PDF
基于多注意力机制的多粒度读者画像分析 被引量:1
9
作者 贺海玉 《微型电脑应用》 2023年第12期143-146,共4页
在计算机信息时代,传统的图书馆管理服务已经不能满足大学生多变的阅读需求。为了帮助高校更全面地了解读者需求,提供精准化的阅读服务,研究利用卷积和图卷积网络分别提取读者内部与读者之间的特征,利用自注意力机制对数据信息降噪处理... 在计算机信息时代,传统的图书馆管理服务已经不能满足大学生多变的阅读需求。为了帮助高校更全面地了解读者需求,提供精准化的阅读服务,研究利用卷积和图卷积网络分别提取读者内部与读者之间的特征,利用自注意力机制对数据信息降噪处理,并计算特征权重大小,融合所有特征构建基于多层注意力网络的联合读者画像预测模型。结果显示,该模型将读者群体分为四类,分别占比45.28%、23.14%、15.09%、16.49%。联合模型学习耗时71.06 s,较比较模型分别低72.23 s、68.94 s;最高准确率值为91.09%,最大F 1值为89.23%,综合性能良好。该模型可以帮助图书馆改进图书管理工作并提供精准化服务。 展开更多
关键词 读者画像 注意力机制 多粒度 日志 高校图书馆
下载PDF
基于校企融合的系统分析与设计课程教学创新 被引量:1
10
作者 马瑞新 原旭 赵亮 《软件导刊》 2023年第6期53-56,共4页
针对系统分析与设计课程理论性强、知识碎片多、学生学习能力差异大、课程思政融入难、高阶性不足等教学痛点问题,以面向新工科的人才培养为目标,以校企融合为建设思路,采用线上线下混合式教学模式,并以完形填空、闯关、华山论剑为教学... 针对系统分析与设计课程理论性强、知识碎片多、学生学习能力差异大、课程思政融入难、高阶性不足等教学痛点问题,以面向新工科的人才培养为目标,以校企融合为建设思路,采用线上线下混合式教学模式,并以完形填空、闯关、华山论剑为教学创新方法,将工程伦理融入教学中进行课程思政建设。以企业实际需求为高阶性内容,以可量化、双闭环、多维度进行学习画像,实现了校企融合的新模式,更好地诠释了混合教学的精髓,全面推动学生由旁观者向实践者、课堂内向课堂外、知识学习向企业实践的三大转变。通过理论和实践双管齐下,打破了高校—企业边界,加速了软件工程学科建设,培育具有高阶性、创新性的软件IT人才。 展开更多
关键词 校企融合 系统分析与设计 课程思政 混合式教学 多维度学习画像
下载PDF
阅读推广视角下图书馆领读人服务策略研究 被引量:2
11
作者 范新美 《新世纪图书馆》 2023年第3期23-27,34,共6页
随着全民阅读推广的深入开展,民众阅读的视界和媒介发生了很大的变化,领读人在阅读推广中的作用愈发凸显,这对领读人服务提出了更高的要求。论文基于这些变化提出了精准领读人服务策略,从“精”与“准”角度诠释了精准领读人的涵义与职... 随着全民阅读推广的深入开展,民众阅读的视界和媒介发生了很大的变化,领读人在阅读推广中的作用愈发凸显,这对领读人服务提出了更高的要求。论文基于这些变化提出了精准领读人服务策略,从“精”与“准”角度诠释了精准领读人的涵义与职责,分析了精准领读人的三大服务路径:书目推荐、导读体验、价值升华,并从阅读动机、内容IP化、细分阅读、意见领袖、读者画像五个方面提炼出精准领读人提升服务的关键要素,充分发挥多媒介下精准领读人多方位的服务驱动力,从而提高读者的阅读成效与质量。 展开更多
关键词 阅读推广 精准领读人 多媒介 用户画像
下载PDF
电力客户准确定位与立体画像多维构建研究 被引量:1
12
作者 王岩 黄莹 +1 位作者 王文瑾 郭威 《武汉理工大学学报(信息与管理工程版)》 2023年第1期156-159,共4页
针对传统供电企业电网用户画像构建存在信息覆盖少、准确率低的问题,提出基于电力大数据的电网用户立体画像构建方法,通过IV值特征筛选法甄选电力用户的特征指标,应用多尺度逐层分析法提取指标特征量,根据聚类中心距离进行信息分析,构... 针对传统供电企业电网用户画像构建存在信息覆盖少、准确率低的问题,提出基于电力大数据的电网用户立体画像构建方法,通过IV值特征筛选法甄选电力用户的特征指标,应用多尺度逐层分析法提取指标特征量,根据聚类中心距离进行信息分析,构建电力用户立体画像特征域的分类结构模型,提升画像特征定位精度,实现准确营销和个性化服务。仿真结果表明电力用户立体画像构建方式能有效提高电力用户多维特征分类精度,有利于向电力用户提供个性化服务。 展开更多
关键词 智慧电网 电力用户 立体画像 多维构建 电力大数据
下载PDF
基于电力大数据挖掘的供应商精准画像研究
13
作者 孟贤 刘吉成 +2 位作者 陈曦 李深山 毛烨华 《信息技术》 2023年第12期102-109,115,共9页
随着现代智慧供应链转型升级,建立完善的电力供应商精准画像系统已是大势所趋,为此提出基于电力大数据挖掘的供应商精准画像研究。根据数据中台汇聚的大量供应商数据,设计了供应商精准画像的总体架构及功能架构;提出了供应商精准画像的... 随着现代智慧供应链转型升级,建立完善的电力供应商精准画像系统已是大势所趋,为此提出基于电力大数据挖掘的供应商精准画像研究。根据数据中台汇聚的大量供应商数据,设计了供应商精准画像的总体架构及功能架构;提出了供应商精准画像的关键技术需求,主要分为构建供应商全息数据库、设计供应商标签体系和搭建多准则决策模型。供应商精准画像场景应用结果表明,供应商精准画像在质量管控辅助、供应商优选、供应链金融三个业务场景下的功能应用均取得较好效果。 展开更多
关键词 供应商精准画像 全息数据库 标签体系 多准则决策 电力大数据
下载PDF
基于知识图谱的多特征教师教学画像的研究
14
作者 常兵 《自动化应用》 2023年第12期205-207,210,共4页
针对教师教学画像的研究及技术方法不够深入的问题,本文在高校教务系统、人力资源教职工管理系统、学工系统、官方网站等多方数据源的基础上提出了基于知识图谱技术的多特征教师教学画像的研究方法。首先,提出了总体模型构建的流程;其次... 针对教师教学画像的研究及技术方法不够深入的问题,本文在高校教务系统、人力资源教职工管理系统、学工系统、官方网站等多方数据源的基础上提出了基于知识图谱技术的多特征教师教学画像的研究方法。首先,提出了总体模型构建的流程;其次,进行了数据的采集与分析、特征实体与关系的提取与生成、画像模型的生成;最后,基于知识图谱和Neo4j开发环境完成了整个实验的设计与实现,通过真实教学数据集完成教师教学画像的分析与应用。 展开更多
关键词 知识图谱 教师教学画像 多特征 精准教学
下载PDF
多模态数据下的学习投入特征画像研究
15
作者 吴彦文 邵风华 +4 位作者 葛迪 韩园 熊栩捷 陈美依 杜昱铭 《软件导刊》 2023年第1期1-5,共5页
学习投入是教师研判学习活动的重要指标,为后续教学诊断奠定了基础。随着AI与教学深度融合不断推进,各种教学数据媒介日益增长,使多模态数据表征学习投入画像逐步成为教学领域的技术趋势。针对以往研究中数据高低特征互补性不足的现状,... 学习投入是教师研判学习活动的重要指标,为后续教学诊断奠定了基础。随着AI与教学深度融合不断推进,各种教学数据媒介日益增长,使多模态数据表征学习投入画像逐步成为教学领域的技术趋势。针对以往研究中数据高低特征互补性不足的现状,提出一种融合文本数据与图像数据的多模态学习投入特征画像构建方法,提升了多维学习投入的表征效果。具体的,采用transformer模型提取文本语义特征,联合FasterRCNN模型提取视觉特征,通过Attention特征融合得到不同维度学习投入的预测分类结果,最后借助可视化技术呈现学习投入画像。研究表明,该模型有效表征了学习群体在各维度的不均衡投入状态,有助于开展教学诊断与协作分组,有效辅助教师教学诊断,提高了协作分组活动的教学效率。 展开更多
关键词 学生画像 教学诊断 协作分组 多模态数据 学习投入特征
下载PDF
融合多源数据的企业竞争对手画像构建 被引量:18
16
作者 黄晓斌 张明鑫 《现代情报》 CSSCI 2020年第11期13-21,33,共10页
[目的/意义]融合多源数据,从大量真实具体的企业竞争对手中抽取出竞争对手的画像,为解决海量竞争对手无限性和企业竞争情报资源有限性之间的矛盾提供启发。[方法/过程]从画像指标体系、数据采集、数据融合、数据分析、画像构建和画像应... [目的/意义]融合多源数据,从大量真实具体的企业竞争对手中抽取出竞争对手的画像,为解决海量竞争对手无限性和企业竞争情报资源有限性之间的矛盾提供启发。[方法/过程]从画像指标体系、数据采集、数据融合、数据分析、画像构建和画像应用等环节出发,提出了一套融合多源数据的企业竞争对手画像构建模式,然后以H公司为例开展了实证研究。[结果/结论]基于所提出的竞争对手画像构建模式,构建了H公司的主要竞争对手画像,从而为企业的竞争对手画像构建实践以及为后续相关理论研究和实证研究提供参考。 展开更多
关键词 企业竞争对手 多源数据 多源信息 数据融合 画像研究
下载PDF
城市交通拥堵地区人群数字画像解析与空间规划应对 被引量:6
17
作者 杨俊宴 何国枫 +1 位作者 陈代俊 史宜 《规划师》 CSSCI 北大核心 2021年第19期26-34,共9页
数字经济的快速发展极大提升地了人流、物流和信息流的空间流动性,但城市交通拥堵阻碍了城市中各种要素的流动,进而影响城市经济发展,而造成交通拥堵的根本原因在于城市功能结构与居民出行需求的错配。通过数字化技术和方法可以监测城... 数字经济的快速发展极大提升地了人流、物流和信息流的空间流动性,但城市交通拥堵阻碍了城市中各种要素的流动,进而影响城市经济发展,而造成交通拥堵的根本原因在于城市功能结构与居民出行需求的错配。通过数字化技术和方法可以监测城市中不同时段的人流分布,并结合空间、经济和社会等信息分析不同类型人群的出行规律及其内在机制,从根本上解决城市交通拥堵问题。文章在梳理城市交通拥堵地区人群数字画像理论的基础上,以大连梭鱼湾交通拥堵地区为例,基于用地数据、POI业态数据和LBS定位数据等多源大数据对地区人群进行精准刻画,共识别出144类人群和8类典型人群,并从出发锚点、出行廊道和活动锚点方面对其中4类典型人群的时空特征进行深入解析,剖析其交通拥堵产生的内在机理,从而根据不同类型人群的出行特征与需求提出构建“快道”“慢区”的多元出行体系,建立高效的复合交通体系,并根据功能疏解优化梭鱼湾单一中心结构的空间规划方法,以期实现城市的精细化管理,疏解城市交通拥堵地区的人流。 展开更多
关键词 人群数字画像 交通拥堵 多源大数据 空间规划 大连梭鱼湾
下载PDF
往复式泥浆泵故障征兆提取的多参量分析 被引量:1
18
作者 刘岩 李西兵 +1 位作者 王金东 郭建华 《机床与液压》 北大核心 2013年第23期154-156,共3页
在采用G_P算法识别往复机械故障征兆过程中,嵌入维数、降噪方法、延迟时间等参数对算法的影响至关重要。通过仿真分析单变量算法的弊端,提出基于经验模态分解(EMD)与伪相图技术结合的多变量融合算法,采用归一化的小波降噪技术,将此法应... 在采用G_P算法识别往复机械故障征兆过程中,嵌入维数、降噪方法、延迟时间等参数对算法的影响至关重要。通过仿真分析单变量算法的弊端,提出基于经验模态分解(EMD)与伪相图技术结合的多变量融合算法,采用归一化的小波降噪技术,将此法应用在矿用泥浆泵故障征兆提取中,诊断效果较好。 展开更多
关键词 泥浆泵 故障诊断 多变量融合算法 关联维数 经验模态分解 伪相图
下载PDF
武汉市旧城核心区多要素画像与评价研究 被引量:1
19
作者 程琦 杨杰 +2 位作者 罗名海 刘炜 徐涛 《地理空间信息》 2020年第12期14-18,I0005,共6页
从社会、空间、经济、环境等多方面构建旧城社区尺度评价指标体系,利用多源大数据对武汉市旧城核心区进行多要素画像,定量评价旧城核心区在土地利用、吸纳人口和产业发展方面的作用,为城市更新规划制定、社会经济政策研究和精细化城市... 从社会、空间、经济、环境等多方面构建旧城社区尺度评价指标体系,利用多源大数据对武汉市旧城核心区进行多要素画像,定量评价旧城核心区在土地利用、吸纳人口和产业发展方面的作用,为城市更新规划制定、社会经济政策研究和精细化城市治理等提出建议。 展开更多
关键词 旧城 核心区 多要素画像 评价
下载PDF
一种用于构建用户画像的二级融合算法框架 被引量:30
20
作者 李恒超 林鸿飞 +4 位作者 杨亮 徐博 魏晓聪 张绍武 古丽孜热.艾尼外 《计算机科学》 CSCD 北大核心 2018年第1期157-161,共5页
用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴"标签"。基于用户的查询词历史记录,提出一种用于预测用户多维标签的二级融合算法框架。在第一级... 用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴"标签"。基于用户的查询词历史记录,提出一种用于预测用户多维标签的二级融合算法框架。在第一级模型中,分别在各个标签预测子任务上建立多种模型,使用传统机器学习方法与Trigram特征相结合来抽取用户用词习惯的差异,使用doc2vec浅层神经网络模型来抽取查询词的语义关联信息,使用卷积神经网络模型来抽取查询词之间的深层语义关联信息。实验表明,doc2vec在处理用户查询这样的短文本相关任务时有着相对较好的预测准确性。在第二级模型中,针对用户画像这样的多标签预测任务,使用XGBTree模型及Stacking多模型相融合的方法提取出用户各标签属性之间的关联信息,使得平均预测准确率进一步提高了2%左右。在2016年中国计算机学会(CCF)组织的大数据竞赛《大数据精准营销中搜狗用户画像挖掘》中,所提二级融合算法框架在894支队伍中夺得了冠军。 展开更多
关键词 用户画像 标签预测 短文本分类 多模型融合
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部