期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于多行为特征嵌入记忆网络的知识追踪模型 被引量:1
1
作者 贺步贵 董永权 +1 位作者 贾瑞 金家永 《太原理工大学学报》 北大核心 2024年第1期184-194,共11页
【目的】为了充分利用交互记录中的学习和遗忘特征,提出了一种基于多行为特征嵌入记忆网络的知识追踪模型(MFKT).该模型考虑了学习过程中的学习和遗忘两种行为。【方法】首先,从交互记录中提取学习和遗忘两大特征,然后将提取到的学习特... 【目的】为了充分利用交互记录中的学习和遗忘特征,提出了一种基于多行为特征嵌入记忆网络的知识追踪模型(MFKT).该模型考虑了学习过程中的学习和遗忘两种行为。【方法】首先,从交互记录中提取学习和遗忘两大特征,然后将提取到的学习特征通过标量交叉方式嵌入记忆网络,同时将遗忘特征通过向量组合的方式嵌入,用于增强其对于学生答题序列的学习能力。此外,还考虑到了不同学生回答完成后的知识增长差异,在原先记忆网络的基础上增加了一个知识增长层,用于计算学生答题得到的知识增长。【结果】通过在公开数据集上的实验表明,MFKT更加符合学生的真实学习规律,能够实现对学生知识状态更加精准的追踪。 展开更多
关键词 智慧教育 知识追踪 特征提取 动态键值记忆网络 学习与遗忘
下载PDF
融合热点与长短期兴趣的图神经网络课程推荐模型
2
作者 刘源 董永权 +2 位作者 陈成 贾瑞 印婵 《计算机科学与探索》 CSCD 北大核心 2024年第6期1600-1612,共13页
近年来大规模在线开放课程(MOOCs)平台为用户提供了海量的学习资源,亟需一种有效的个性化课程推荐方法帮助用户解决信息过载问题。现有的课程推荐方法忽略了课程间的时序性且无法较好地捕获课程间的长距离依赖关系,同时面临用户学习兴... 近年来大规模在线开放课程(MOOCs)平台为用户提供了海量的学习资源,亟需一种有效的个性化课程推荐方法帮助用户解决信息过载问题。现有的课程推荐方法忽略了课程间的时序性且无法较好地捕获课程间的长距离依赖关系,同时面临用户学习兴趣表示和冷启动两个关键问题。基于此,提出一种融合热点与长短期兴趣的图神经网络课程推荐模型(GHLS4CR)。该模型设计无环时序图和无环快捷图两种会话图构建方法来缓解现有方法存在的时序信息丢失和不善于捕获长距离依赖的问题;将用户长短期兴趣进行图级表示,并与热门课程信息进行融合实现个性化推荐,同时缓解冷启动问题。通过在学堂在线(XuetangX)公开数据集MOOCCourse上的大量实验表明,GHLS4CR在个性化课程推荐领域优于FISSA和LESSR等主流推荐模型。与次好的LESSR模型相比,Recall@5提高了13.28%,MRR@5提高了15.50%。 展开更多
关键词 课程推荐 基于会话的推荐 图神经网络 长短期兴趣 冷启动
下载PDF
FKA-DKT:融合知识与能力的深度知识追踪模型
3
作者 陈成 董永权 +1 位作者 贾瑞 刘源 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第2期129-139,共11页
知识追踪(KT)是智能教育中的一个重要研究问题,其通过分析学生的历史交互来预测其未来的答题情况.现有的主流KT模型仅根据学生的知识掌握情况对学生进行建模,忽视了学生的个人能力在答题中的作用.因此,本文提出了一种融合知识和能力的... 知识追踪(KT)是智能教育中的一个重要研究问题,其通过分析学生的历史交互来预测其未来的答题情况.现有的主流KT模型仅根据学生的知识掌握情况对学生进行建模,忽视了学生的个人能力在答题中的作用.因此,本文提出了一种融合知识和能力的深度知识追踪模型(FKA-DKT).首先利用DKT模型构建基于知识的答题预测网络(KAPN),从知识层面预测学生答案的正确性.然后提出基于能力的答案预测(AAPN)网络对学生的能力进行建模,从能力层面预测学生答案的正确性.最后,将KAPN和AAPN的预测结果进行线性组合,使模型能够融合知识和能力两个方面的信息来预测学生的作答结果.在4个公开的数据集上的实验结果表明,相较于现有的主流方法,FKA-DKT在AUC指标上取得了显著的性能提升. 展开更多
关键词 知识追踪 深度知识追踪 个人能力建模
下载PDF
面向个性化课程推荐的分层分期注意力网络模型 被引量:2
4
作者 刘源 董永权 +1 位作者 贾瑞 杨昊霖 《计算机应用》 CSCD 北大核心 2023年第8期2358-2363,共6页
随着大规模在线开放课程(MOOC)平台的广泛使用,需要一种有效的方法为用户推荐个性化课程。针对现有的课程推荐方法通常利用课程学习记录为用户的学习兴趣建立整体的静态表示,但忽略了学习兴趣动态变化与用户短期学习兴趣的问题,提出一... 随着大规模在线开放课程(MOOC)平台的广泛使用,需要一种有效的方法为用户推荐个性化课程。针对现有的课程推荐方法通常利用课程学习记录为用户的学习兴趣建立整体的静态表示,但忽略了学习兴趣动态变化与用户短期学习兴趣的问题,提出一种分层分期的注意力网络(HPAN)进行个性化课程推荐。该网络的第1层利用注意力网络得到用户的长短期学习兴趣,第2层将用户的长短期学习兴趣和短期交互序列相结合并通过注意力网络得到用户的兴趣向量;然后计算用户兴趣向量与每个课程向量的偏好值,据此为用户进行课程推荐。在XuetangX(学堂在线)公开数据集上的实验结果表明,与次优的序列分层注意力网络(SHAN)模型相比,HPAN模型的Recall@5提高了12.7%,与FPMC(Factorizing Personalized Markov Chains)模型相比,它的MRR@20提高了15.6%。HPAN模型的推荐效果优于对比模型,可解决实际的个性化课程推荐。 展开更多
关键词 推荐系统 课程推荐 注意力机制 个性化推荐 长短期兴趣
下载PDF
基于多特征融合的无监督真值发现方法 被引量:1
5
作者 陈华凤 董永权 +1 位作者 杨昊霖 张国玺 《数据采集与处理》 CSCD 北大核心 2023年第3期629-642,共14页
真值发现是数据集成领域具有挑战性的研究热点之一。传统的方法利用数据源与观测值之间的交互关系推断真值,缺乏足够的特征信息;基于深度学习的方法可以有效地进行特征抽取,但其性能依赖于大量手工标注,而在实际应用中很难获取到大量高... 真值发现是数据集成领域具有挑战性的研究热点之一。传统的方法利用数据源与观测值之间的交互关系推断真值,缺乏足够的特征信息;基于深度学习的方法可以有效地进行特征抽取,但其性能依赖于大量手工标注,而在实际应用中很难获取到大量高质量的真值标签。为克服以上问题,本文提出一种基于多特征融合的无监督真值发现方法(Unsupervised truth discovery method based on multi-feature fusion,MFOTD)。首先,利用集成学习无监督标注“真值”标签;然后,分别使用预训练模型Bert和独热编码获取观测值的语义特征和交互特征;最后,融合观测值多种特征并使用其“真值”标签构建初始训练集,通过自训练方式训练真值预测模型。在两个真实数据集上的实验结果表明,与已有方法相比,本文所提出的方法具有更高的真值发现准确性。 展开更多
关键词 WEB数据集成 半监督学习 数据清洗 真值发现 数据源质量
下载PDF
基于复杂理论的MOOC用户留存意愿组态分析 被引量:2
6
作者 和文斌 董永权 +1 位作者 滕希 王惠惠 《数字教育》 2023年第4期29-36,共8页
MOOC用户留存意愿聚集了个体、外部环境、内容质量等多因素的互动规律,但已有的研究偏向单一因素或系列因素对结果变量的影响,忽略了因素之间的关联性与协同性。定性比较分析能够通过考察促生结果的前因变量及变量之间的相互作用、可能... MOOC用户留存意愿聚集了个体、外部环境、内容质量等多因素的互动规律,但已有的研究偏向单一因素或系列因素对结果变量的影响,忽略了因素之间的关联性与协同性。定性比较分析能够通过考察促生结果的前因变量及变量之间的相互作用、可能的变量组合,有效揭示促成事件发生的组态路径和作用机制。文章从复杂理论的角度出发,结合社会认知理论和技术接受度模型,采用模糊集定性比较分析对291个MOOC学习用户的相关数据进行分析,以探索MOOC用户留存意愿的形成机制。研究结果发现,MOOC用户留存意愿受9种构型影响,依据路径特征将其分为4种模式,其中游戏化、自我效能感等关键因素对MOOC用户留存意愿具有积极影响。研究结论为MOOC平台的重构与优化、在线教学内容的设计等提供了借鉴与参考。 展开更多
关键词 复杂理论 社会认知理论 组态 用户留存意愿
下载PDF
SSM:基于孪生网络的糖尿病视网膜眼底图像分类模型
7
作者 谭嘉辰 董永权 张国玺 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期425-434,共10页
糖尿病视网膜病变是由糖尿病引起的一种重要眼部疾病,不及时治疗可能会导致失明,现有的诊断方法主要依靠医生手动分类,但这种方法耗时耗力.随着深度学习的发展,越来越多的自动分类技术被应用到医学领域.针对糖尿病视网膜病变严重程度的... 糖尿病视网膜病变是由糖尿病引起的一种重要眼部疾病,不及时治疗可能会导致失明,现有的诊断方法主要依靠医生手动分类,但这种方法耗时耗力.随着深度学习的发展,越来越多的自动分类技术被应用到医学领域.针对糖尿病视网膜病变严重程度的分类问题,样本图像十分稀缺,传统的单支模型很难达到较高的分类性能,提出一种孪生结构的分类模型Siamese Model with Swin-Transformer and MLP-Based U-Net(SSM),并利用数据扩增来解决此问题.首先,利用直方图均衡化、高斯滤波和增强对比度等方法预处理图像;然后,将预训练的Swin-Transformer作为SSM模型的特征提取分支网络来获得层次化的特征表示;此外,还设计了一个含有跳跃连接结构的MLP-Based U-Net(MU-Net)作为SSM模型的分类器来对提取的特征进行分类.在Messidor数据集上进行训练和测试,与现有最先进的模型相比,SSM模型性能更优,在测试集上的精确率达0.976,召回率达0.975,F1达0.976,准确率达0.975,Kappa系数达0.967. 展开更多
关键词 糖尿病视网膜病变分类 深度学习 孪生网络 TRANSFORMER
下载PDF
结构化支持向量机研究综述 被引量:22
8
作者 王霞 董永权 +1 位作者 于巧 耿娜 《计算机工程与应用》 CSCD 北大核心 2020年第17期24-32,共9页
结构化支持向量机(Structural Support Vector Machine,SSVM)是支持向量机(Support Vector Machine,SVM)的变体算法,被广泛应用于多个领域。阐述了SSVM的发展过程,详细分析了SSVM各种具体实现算法的思想及表现上的优劣;并通过实验的对... 结构化支持向量机(Structural Support Vector Machine,SSVM)是支持向量机(Support Vector Machine,SVM)的变体算法,被广泛应用于多个领域。阐述了SSVM的发展过程,详细分析了SSVM各种具体实现算法的思想及表现上的优劣;并通过实验的对比讨论,发现了SSVM的各种具体实现算法在分类性能和分类效率上优于其他SVM算法,而在稳定性上则逊于后者;基于此,给出了SSVM的后续研究方向。 展开更多
关键词 结构化支持向量机 结构粒度 聚类技术 结构化孪生支持向量机 结构化非平行支持向量机
下载PDF
基于ISM的翻转课堂学习满意度影响因素研究 被引量:8
9
作者 王维 董永权 吴丛丛 《中国医学教育技术》 2020年第3期281-286,317,共7页
翻转课堂是教学研究中的热点问题,一直被众多教育研究者和实践者所接受和倡导。该研究在文献梳理和访谈调查的基础上,确定了影响翻转课堂学习满意度的15个因素及其相互影响关系,采用解释结构模型(ISM)方法对各因素之间的关系进行量化处... 翻转课堂是教学研究中的热点问题,一直被众多教育研究者和实践者所接受和倡导。该研究在文献梳理和访谈调查的基础上,确定了影响翻转课堂学习满意度的15个因素及其相互影响关系,采用解释结构模型(ISM)方法对各因素之间的关系进行量化处理,得到翻转课堂学习满意度影响因素的解释结构模型。研究发现,学习动机、自我效能感、交互行为是影响翻转课堂学习满意度的直接因素,课程内容、教学风格、教学能力、自主学习能力和平台性能是根本因素,学习氛围、学习参与度、协作学习、学习资源、考核方式、学习任务和助学服务作为间接因素发挥作用。最后,根据模型进行相关分析,从平台、教师、学生及课程的角度提出改善学习满意度的策略,以期为后续的研究提供借鉴与参考。 展开更多
关键词 解释结构模型 翻转课堂 满意度 影响因素
下载PDF
膜曝气/膜生物反应器耦合工艺处理模拟生活污水的研究 被引量:7
10
作者 陈芬梅 董永全 +2 位作者 徐洁 钟荣 梁静宜 《水处理技术》 CAS CSCD 北大核心 2022年第10期131-135,共5页
封装和加工了膜曝气/膜生物反应器(MA/MBR)耦合工艺的膜组件和实验装置。以模拟生活污水为处理对象,分别在MABR池和MBR池中培养和驯化了生物膜和活性污泥。考察了耦合工艺对模拟生活污水中COD、氨氮和总磷的去除效果。研究结果发现:MAB... 封装和加工了膜曝气/膜生物反应器(MA/MBR)耦合工艺的膜组件和实验装置。以模拟生活污水为处理对象,分别在MABR池和MBR池中培养和驯化了生物膜和活性污泥。考察了耦合工艺对模拟生活污水中COD、氨氮和总磷的去除效果。研究结果发现:MABR采用无泡膜曝气,曝气量仅需30 L/min,MBR膜出水运行条件为8:2(开8 min停2 min)时,MA/MBR耦合工艺对污水中的COD、氨氮和TP的去除率分别达到95%、87.5%和74.1%,出水COD与氨氮浓度均达到国家一级A排放标准。MA/MBR耦合工艺对总磷的去除受MA/MBR系统排泥时间的影响,对总磷的去除效果有限,但通过缩短MABR系统的排泥时间,将可以大大提高污水中总磷的去除。耦合工艺采用无泡曝气、能耗低、污染物去除效率高、易于自动化运行,呈现出很好的商业前景。 展开更多
关键词 膜曝气 膜生物反应器 耦合工艺 污染物去除
下载PDF
基于学科知识图谱的教育知识服务模型构建研究 被引量:4
11
作者 和文斌 董永权 +1 位作者 赵成杰 王惠惠 《数字教育》 2022年第6期21-28,共8页
人工智能技术的不断提升使得教育知识服务向智能化发展。而学科知识图谱作为人工智能重要技术之一,既能优化教育知识的生产方式,又能为多种智能化的知识服务开展提供支撑。为满足当今教育用户多样化、个性化、精准化的需求,本文在分析... 人工智能技术的不断提升使得教育知识服务向智能化发展。而学科知识图谱作为人工智能重要技术之一,既能优化教育知识的生产方式,又能为多种智能化的知识服务开展提供支撑。为满足当今教育用户多样化、个性化、精准化的需求,本文在分析学科知识图谱的内涵、构建框架基础上,从助力教育知识库形成、辅助智能化知识发现、支撑多项智能教育知识服务开展三个方面讨论了学科知识图谱与教育知识服务的适切性。随后分析了教育知识服务的构成要素,在此基础上构建了基于学科知识图谱的智能化教育知识服务模型,并从需求采集、服务构建、服务应用、服务评估四个阶段对模型进行了阐释,最后提出了模型的相关实施建议。 展开更多
关键词 学科知识图谱 智能化 教育知识服务
下载PDF
基于学习者建模和数据挖掘的个性化学习路径推荐研究 被引量:6
12
作者 杨淼 董永权 胡玥 《上海教育评估研究》 2019年第5期58-61,共4页
在线学习作为一种新型的学习方式,能够为学习者提供个性化的学习支持。有效推荐个性化学习路径是学习服务研究中的重点问题。文章结合大数据背景下个性化学习的特征,建立学习者模型,通过数据挖掘技术深入分析学习者的学习行为信息以及... 在线学习作为一种新型的学习方式,能够为学习者提供个性化的学习支持。有效推荐个性化学习路径是学习服务研究中的重点问题。文章结合大数据背景下个性化学习的特征,建立学习者模型,通过数据挖掘技术深入分析学习者的学习行为信息以及知识之间的关系,结合基于内容的推荐和协同过滤的推荐方式,设计个性化学习路径推荐的具体方案,为解决在线学习过程中学习者面临的“信息过载”和“知识迷航”问题提供参考和借鉴。 展开更多
关键词 学习者模型 数据挖掘 个性化 学习路径推荐
下载PDF
基于聚类集成的学生群体画像构建 被引量:3
13
作者 王惠惠 董永权 +1 位作者 和文斌 范斐然 《江苏师范大学学报(自然科学版)》 CAS 2022年第3期46-50,共5页
学生群体画像能自动挖掘学生的行为数据,构建不同特征群体,辅助教师快速把握学生群体的全貌,进行差异化教学.提出一种基于聚类集成的学生群体画像方法.首先,分析学生的基础数据和行为数据,建立学生群体画像的特征标签;其次,运用KMeans、... 学生群体画像能自动挖掘学生的行为数据,构建不同特征群体,辅助教师快速把握学生群体的全貌,进行差异化教学.提出一种基于聚类集成的学生群体画像方法.首先,分析学生的基础数据和行为数据,建立学生群体画像的特征标签;其次,运用KMeans、KModes和GMM 3种聚类方法构建基聚类器;最后,通过投票法对基聚类器的结果进行集成处理.实验结果表明,相对于KMeans、KModes和GMM 3种聚类方法,本文提出的方法能显著提高聚类结果的精确性和鲁棒性;可将学生分为3类不同特征的群体.教师可根据不同群体的画像,制定更科学的分类教学策略,实现个性化教学. 展开更多
关键词 聚类集成 学生群体画像 分类教学
下载PDF
相似重复记录检测研究与发展动态的知识图谱分析
14
作者 顾晴 董永权 胡杨 《计算机应用与软件》 北大核心 2022年第3期1-7,95,共8页
在大数据环境下,数据库中的记录数量呈指数上升,如何高效率地检测出相似重复记录是数据清洗的关键点和提高数据质量的首要任务。近十年国内外相似重复记录检测方法又涌现出相当多的高水平成果,迫切需要对新的文献加以归纳梳理。以2008—... 在大数据环境下,数据库中的记录数量呈指数上升,如何高效率地检测出相似重复记录是数据清洗的关键点和提高数据质量的首要任务。近十年国内外相似重复记录检测方法又涌现出相当多的高水平成果,迫切需要对新的文献加以归纳梳理。以2008—2019年的国内外相似重复记录检测相关文献为研究样本,结合社会网络和知识图谱对其发文量、核心机构、作者合作群、研究热点和研究趋势进行分析。分析发现,作者合作结构整体上较松散,相似重复记录各类检测方式的集成、应用领域的扩展和通用框架的研究成为热点,缺失数据值的处理、多数据源的识别、大数据量的分块处理成为相似重复记录领域的挑战。 展开更多
关键词 相似重复记录检测 知识合作 研究热点 研究趋势
下载PDF
工程教育认证中离散数学教学改革探讨 被引量:5
15
作者 梁银 董永权 郭小荟 《计算机时代》 2019年第12期91-94,共4页
离散数学是软件工程专业的主干课程之一,为了满足离散数学在软件工程专业工程教育认证中的教学目标,针对离散数学课程教学中存在的问题,从教学内容、教学模式、教学方法、考核方式等方面进行了改革。教学实践表明,学生的学习兴趣,自学... 离散数学是软件工程专业的主干课程之一,为了满足离散数学在软件工程专业工程教育认证中的教学目标,针对离散数学课程教学中存在的问题,从教学内容、教学模式、教学方法、考核方式等方面进行了改革。教学实践表明,学生的学习兴趣,自学能力以及对知识点的理解和掌握程度都有很大的提高。 展开更多
关键词 离散数学 工程教育认证 教学改革 教学模式 软件工程
下载PDF
基于交互序列特征相关性的可解释知识追踪 被引量:1
16
作者 陈成 董永权 +1 位作者 贾瑞 刘源 《山东大学学报(工学版)》 CAS CSCD 北大核心 2024年第1期100-108,共9页
为提高知识追踪(knowledge tracing,KT)模型的可解释性,提出适用于KT事后可解释性的Shapley Value和ISP算法以及可解释性评价指标和谐度,以KT领域经典的深度学习模型DKT为例,计算历史交互与预测结果之间的相关性分数,解释DKT的预测结果... 为提高知识追踪(knowledge tracing,KT)模型的可解释性,提出适用于KT事后可解释性的Shapley Value和ISP算法以及可解释性评价指标和谐度,以KT领域经典的深度学习模型DKT为例,计算历史交互与预测结果之间的相关性分数,解释DKT的预测结果。Shapley Value算法计算每次交互对预测结果的贡献,将贡献视为相关性分数;ISP算法基于原序列和模型自身的推理能力构造伪标签,实现对原序列的扰动,计算相关性分数;基于解释方法计算出的相关性分数,使用和谐度指标评价各方法的解释效果。在试验层面,5个公开数据集上的试验结果表明,相对于最优的基线方法,本研究提出的方法取得显著的可解释性效果提升;在具体应用层面,利用可解释性挖掘知识点之间的偏序关系,帮助学生探究更加合理的学习顺序。 展开更多
关键词 机器学习 深度学习 知识追踪 可解释性 特征相关性
原文传递
合作学习对学生学习效果的影响——基于48项实验或准实验研究的元分析 被引量:28
17
作者 王维 董永权 杨淼 《上海教育科研》 北大核心 2020年第7期34-40,59,共8页
本研究采用元分析方法对国内外有关合作学习对学生学习效果影响的48项实验或准实验研究进行综合梳理、分析和评价。研究发现:从整体来看,合作学习有助于提升学生的学习效果,且对非认知维度的影响要大于认知维度;从学段来看,合作学习对... 本研究采用元分析方法对国内外有关合作学习对学生学习效果影响的48项实验或准实验研究进行综合梳理、分析和评价。研究发现:从整体来看,合作学习有助于提升学生的学习效果,且对非认知维度的影响要大于认知维度;从学段来看,合作学习对中小学生的影响较大,大学、高中次之;从班级规模来看,合作学习在小班规模实施效果更佳,中班、大班依次递减;从教学周期来看,合作学习持续1~3个月效果更佳,并随着时间延长,对学生学习的促进效果逐渐减弱;从知识类型来看,合作学习对实践类知识的促进作用比理论类知识更大;从分组原则来看,合作学习采取异质分组更有利于提升学生的学习效果;从小组人数来看,合作小组人数在4~6人之间对学生学习效果的影响更为显著。 展开更多
关键词 合作学习 元分析 学习效果 教育应用
原文传递
A bargaining game theoretic method for virtual resource allocation in LTE-based cellular networks 被引量:4
18
作者 ZHANG GuoPeng YANG Kun +1 位作者 XU Ke dong yongquan 《Science China Chemistry》 SCIE EI CAS CSCD 2015年第12期1-9,共9页
In this paper, we study the virtual resource(VR) allocation problem in LTE-based wireless network virtualization(WNV). A practical network scenario, where multiple virtual wireless service providers(WSPs)request the V... In this paper, we study the virtual resource(VR) allocation problem in LTE-based wireless network virtualization(WNV). A practical network scenario, where multiple virtual wireless service providers(WSPs)request the VR from a unique mobile network operator(MNO) is considered. Our objective is two folds. The first is to guarantee the minimum rate requirements of the MNO and the WSPs. The second is to distribute the system rate among the MNO and the WSPs in the Pareto optimal manner. To this end, an efficient VR allocation scheme based on bargaining game theory is proposed, and the Nash bargaining solution(NBS) method is used to solve the proposed game problem. The proposed game problem is proved to be a convex optimization problem. By using standard convex optimization method, the global optimal NBS of the game is obtained in closed form. The effectiveness of the proposed VR allocation game is testified through numerical results. 展开更多
关键词 wireless network virtualization spectrum resource allocation cooperative game theory Nash bar-gaining solution Pareto optimality
原文传递
基于属性融合的多真值发现方法
19
作者 杨昊霖 董永权 +1 位作者 陈华凤 张国玺 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期52-60,共9页
【目的】解决现有方法多数只侧重于多真值属性自身,缺少考虑辅助属性影响的问题,提高多真值发现的效果。【方法】利用辅助属性计算数据源专业度和共识度,结合多真值属性值的活跃度得到数据源对冲突数据的支持度。通过调用已有真值发现... 【目的】解决现有方法多数只侧重于多真值属性自身,缺少考虑辅助属性影响的问题,提高多真值发现的效果。【方法】利用辅助属性计算数据源专业度和共识度,结合多真值属性值的活跃度得到数据源对冲突数据的支持度。通过调用已有真值发现方法获取真值伪标签,使用神经网络捕获数据源和冲突数据的复杂关系,最终推理出全部真值。【结果】实验结果表明,与次优方法相比,在图书数据集上F1值提升2.25%,在电影数据集上F1值提升5.42%。【局限】所提方法融合了反映对象特征的辅助属性,尚未探索其余辅助属性对多真值发现的影响。【结论】基于多真值属性与辅助属性融合的方法提高了多真值发现的准确性。 展开更多
关键词 多真值发现 数据冲突 信息质量 多真值属性 辅助属性
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部