期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
社交知识图谱研究综述 被引量:6
1
作者 江旭晖 沈英汉 +3 位作者 李子健 王元卓 尹芷仪 沈华伟 《计算机学报》 EI CAS CSCD 北大核心 2023年第2期304-330,共27页
作为通用的知识结构化表示形式,知识图谱被成功应用于医疗、金融、安全等领域.社交知识图谱是一种以人为中心的知识图谱,其融合了动态演化的社交知识.作为知识图谱概念的延伸,社交知识图谱涵盖人、物、事、地等异质信息及其复杂关联;由... 作为通用的知识结构化表示形式,知识图谱被成功应用于医疗、金融、安全等领域.社交知识图谱是一种以人为中心的知识图谱,其融合了动态演化的社交知识.作为知识图谱概念的延伸,社交知识图谱涵盖人、物、事、地等异质信息及其复杂关联;由于其融入了来自社交网络的强时效性知识,能够准确地描述人员的即时状态及其演化趋势,被广泛应用于推荐系统、社交分析等以人为中心的应用中.当前,社交知识图谱的相关工作不断涌现,但缺乏统一的形式化定义以及系统性的分析.基于此,本文首先梳理了社交知识图谱的相关概念,并给出了社交知识图谱的形式化定义.然后从社交知识图谱的定义出发,对其动态性、异质性、情感性、互演化性等性质进行分析.接下来围绕社交知识图谱的生命周期,梳理了社交知识图谱的构建、融合、表示和推理的相关代表性工作.最后介绍了社交知识图谱的相关应用,并展望了社交知识图谱的未来发展蓝图. 展开更多
关键词 社交知识图谱 社交网络 知识图谱 知识推理 图表示学习 知识抽取 网络融合
下载PDF
时态知识图谱的推理研究综述 被引量:5
2
作者 沈英汉 江旭晖 +4 位作者 王元卓 李紫宣 李子健 谭鹤翔 沈华伟 《计算机学报》 EI CAS CSCD 北大核心 2023年第6期1272-1301,共30页
随着社交网络、物端感知等技术快速发展,网络空间中涌现了大量的交互、话题、事件、新闻等数据,蕴含大量动态演化、强时效性的知识.较于忽略知识中时间信息的传统知识图谱,时态知识图谱通过建模知识的时效性以描述动态变化的现实世界,... 随着社交网络、物端感知等技术快速发展,网络空间中涌现了大量的交互、话题、事件、新闻等数据,蕴含大量动态演化、强时效性的知识.较于忽略知识中时间信息的传统知识图谱,时态知识图谱通过建模知识的时效性以描述动态变化的现实世界,为时间紧耦合的应用提供有效支持.然而,时态知识图谱无法确保涵盖全量知识,知识的缺失严重影响应用性能,需要推理模型自动挖掘新的知识,以解释事物的历史状态,预测未来发展趋势并描述演化规律.由于实际应用的迫切需要,近年来,时态知识图谱的推理研究工作层出不穷,逐渐引起学术界和工业界的广泛关注.本文对近年来时态知识图谱的推理工作进行全面介绍和总结.首先,介绍了时态知识图谱的推理相关概念与问题描述;其次,介绍了面向补全任务的推理模型与面向预测任务的推理模型,对其进行比较分析;之后总结了时态知识图谱推理的数据集、推理任务、相关指标以及应用场景;最后展望时态知识图谱推理的未来研究趋势.综上,本文致力于为时态知识图谱的推理领域研究人员提供具有价值的参考,以推动该领域进一步发展. 展开更多
关键词 时态知识图谱 时态知识推理 知识补全 知识预测 知识图谱
下载PDF
图分类研究综述 被引量:14
3
作者 王兆慧 沈华伟 +1 位作者 曹婍 程学旗 《软件学报》 EI CSCD 北大核心 2022年第1期171-192,共22页
图数据广泛存在于现实世界中,可以自然地表示复合对象及其元素之间的复杂关联.对图数据的分类是一个非常重要且极具挑战的问题,在生物/化学信息学等领域有许多关键应用,如分子属性判断,新药发现等.但目前尚缺乏对于图分类研究的完整综述... 图数据广泛存在于现实世界中,可以自然地表示复合对象及其元素之间的复杂关联.对图数据的分类是一个非常重要且极具挑战的问题,在生物/化学信息学等领域有许多关键应用,如分子属性判断,新药发现等.但目前尚缺乏对于图分类研究的完整综述.首先给出图分类问题的定义和该领域的挑战;然后梳理分析了两类图分类方法—基于图相似度计算的图分类方法和基于图神经网络的图分类方法;接着给出了图分类方法的评价指标、常用数据集和实验结果对比;最后介绍了图分类常见的实际应用场景,展望了图分类领域的未来研究方向并对全文进行总结. 展开更多
关键词 图分类 图核 图卷积 图池化 图神经网络
下载PDF
面向知识库问答的问句语义解析研究综述 被引量:4
4
作者 仇韫琦 王元卓 +3 位作者 白龙 尹芷仪 沈华伟 白硕 《电子学报》 EI CAS CSCD 北大核心 2022年第9期2242-2264,共23页
知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的... 知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的问句映射为结构化的语义表征,再将其改写为知识库查询获取答案.目前,面向知识库问答的语义解析方法主要面临三个挑战:首先是如何选择合适的语义表征形式以表达问句的语义,然后是如何解析问句的复杂语义并输出相应的语义表征,最后是如何应对特定领域中数据标注成本高昂、高质量数据匮乏的问题.本文从上述挑战出发,分析了知识库问答中常用的语义表征的特点与不足,然后梳理现有方法并总结分析其如何应对问句的复杂语义,接着介绍了当前方法在标注数据匮乏的低资源场景下的尝试,最后展望并讨论了面向知识库问答的语义解析的未来发展方向. 展开更多
关键词 知识库 问答 语义表征 语义解析 低资源
下载PDF
基于全局对抗负样本的图对比学习方法
5
作者 岑科廷 沈华伟 +2 位作者 曹婍 徐冰冰 程学旗 《中文信息学报》 CSCD 北大核心 2024年第1期65-73,85,共10页
图对比学习在无监督节点表示方面取得了巨大成功。该类模型旨在通过拉近同一节点对应的不同增强节点的表示(正样本),推远不同节点的表示(负样本)的方式为每个节点学习表示。其中负样本的选择是图对比学习的一个关键。现有的方法通过随... 图对比学习在无监督节点表示方面取得了巨大成功。该类模型旨在通过拉近同一节点对应的不同增强节点的表示(正样本),推远不同节点的表示(负样本)的方式为每个节点学习表示。其中负样本的选择是图对比学习的一个关键。现有的方法通过随机采样或者根据一些启发式的重要性度量标准为每个节点选择对应的负样本。然而上述方法并不能准确地找到对模型关键的负样本。同时,由于需要为每一个节点选取其对应的负样本,导致高昂的时间开销。为了解决上述问题,该文提出通过对抗学习的方式,为所有节点学习一个全局共享的关键的负样本。在多个基准数据集上的实验结果证明了该方法的效率和有效性。 展开更多
关键词 图表示学习 图对比学习 对抗负样本 全局负样本
下载PDF
平台经济中的数据与算法安全 被引量:12
6
作者 郑婷一 庞亮 靳小龙 《大数据》 2022年第4期56-66,共11页
人工智能、大数据技术正快速推动着平台经济的发展。互联网平台在以“数据+算法”双轮机制为用户提供个性化、精准化信息服务的同时,也因平台的“生态垄断”、算法的应用不规范等行为对国家网络安全、市场公平竞争和用户合法利益等造成... 人工智能、大数据技术正快速推动着平台经济的发展。互联网平台在以“数据+算法”双轮机制为用户提供个性化、精准化信息服务的同时,也因平台的“生态垄断”、算法的应用不规范等行为对国家网络安全、市场公平竞争和用户合法利益等造成了威胁,给政府监管和平台治理带来了严峻挑战。在此背景下,探讨了平台经济中数据和算法安全的内涵、外延和研究现状,梳理了在保障安全的前提下影响平台创新发展的关键问题,并从体系架构构建、监管体系完善、核心技术突破、平台模式创新4个方面给出了促进平台经济生态创新发展的建议。 展开更多
关键词 平台经济 生态垄断 平台创新 平台治理 数据安全 算法安全
下载PDF
因果机器学习的前沿进展综述 被引量:14
7
作者 李家宁 熊睿彬 +3 位作者 兰艳艳 庞亮 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2023年第1期59-84,共26页
机器学习是实现人工智能的重要技术手段之一,在计算机视觉、自然语言处理、搜索引擎与推荐系统等领域有着重要应用.现有的机器学习方法往往注重数据中的相关关系而忽视其中的因果关系,而随着应用需求的提高,其弊端也逐渐开始显现,在可... 机器学习是实现人工智能的重要技术手段之一,在计算机视觉、自然语言处理、搜索引擎与推荐系统等领域有着重要应用.现有的机器学习方法往往注重数据中的相关关系而忽视其中的因果关系,而随着应用需求的提高,其弊端也逐渐开始显现,在可解释性、可迁移性、鲁棒性和公平性等方面面临一系列亟待解决的问题.为了解决这些问题,研究者们开始重新审视因果关系建模的必要性,相关方法也成为近期的研究热点之一.在此对近年来在机器学习领域中应用因果技术和思想解决实际问题的工作进行整理和总结,梳理出这一新兴研究方向的发展脉络.首先对与机器学习紧密相关的因果理论做简要介绍;然后以机器学习中的不同问题需求为划分依据对各工作进行分类介绍,从求解思路和技术手段的视角阐释其区别与联系;最后对因果机器学习的现状进行总结,并对未来发展趋势做出预测和展望. 展开更多
关键词 因果关系 伪相关关系 因果推断 机器学习 深度学习 人工智能
下载PDF
图对比学习综述 被引量:1
8
作者 岑科廷 沈华伟 +1 位作者 曹婍 程学旗 《中文信息学报》 CSCD 北大核心 2023年第5期1-21,共21页
对比学习作为一种自监督式的深度学习范式,在计算机视觉、自然语言处理等领域取得了瞩目的成绩。受这些成功的对比学习模型的启发,近年来大量研究者尝试将其拓展到图数据上,这为推动图对比学习的发展提供了坚实的基础。该领域现有的综... 对比学习作为一种自监督式的深度学习范式,在计算机视觉、自然语言处理等领域取得了瞩目的成绩。受这些成功的对比学习模型的启发,近年来大量研究者尝试将其拓展到图数据上,这为推动图对比学习的发展提供了坚实的基础。该领域现有的综述主要关注于传统的图自监督学习任务,而缺少对图对比学习方法的梳理和归纳。为了更好地帮助相关领域的研究者,该文梳理了近些年来的图对比学习模型,通过将现有工作归纳到一个统一的框架下,突出其发展脉络。最后该文总结了图对比学习常用的数据集和评价指标,并展望了该领域未来的发展方向。 展开更多
关键词 自监督学习 图对比学习 图表示学习 预训练
下载PDF
标题与正文语义融合的新闻向量表示方法
9
作者 连晓颖 薛源海 +1 位作者 刘悦 沈华伟 《计算机工程与应用》 CSCD 北大核心 2023年第4期89-96,共8页
针对新闻正文文本长度大、语义信息复杂的问题,提出了一种标题与正文语义融合的新闻向量表示方法(NRTA模型)。以新闻标题为查询,从正文的多个区域中挖掘标题的补充信息,关注前文语义的同时也关注后文语义,减少对新闻正文理解的偏差。在... 针对新闻正文文本长度大、语义信息复杂的问题,提出了一种标题与正文语义融合的新闻向量表示方法(NRTA模型)。以新闻标题为查询,从正文的多个区域中挖掘标题的补充信息,关注前文语义的同时也关注后文语义,减少对新闻正文理解的偏差。在两个真实新闻推荐数据集MIND和Adressa上的实验表明,该方法较基线方法在各评价指标上的提升幅度在0.86%到3.95%之间,验证了正文后文语义信息的重要性,进一步丰富了新闻向量表示。 展开更多
关键词 新闻推荐 正文语义信息 向量表示 注意力机制
下载PDF
融合上下文信息的篇章级事件时序关系抽取方法 被引量:5
10
作者 王俊 史存会 +3 位作者 张瑾 俞晓明 刘悦 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2021年第11期2475-2484,共10页
事件时序关系抽取是一项重要的自然语言理解任务,可以广泛应用于诸如知识图谱构建、问答系统等任务.已有事件时序关系抽取方法往往将该任务视为句子级事件对的分类问题,而基于有限的局部句子信息导致其抽取的事件时序关系的精度较低,且... 事件时序关系抽取是一项重要的自然语言理解任务,可以广泛应用于诸如知识图谱构建、问答系统等任务.已有事件时序关系抽取方法往往将该任务视为句子级事件对的分类问题,而基于有限的局部句子信息导致其抽取的事件时序关系的精度较低,且无法保证整体时序关系的全局一致性.针对此问题,提出一种融合上下文信息的篇章级事件时序关系抽取方法,使用基于双向长短期记忆(bidirectional long short-term memory,Bi-LSTM)的神经网络模型学习文章中事件对的时序关系表示,再利用自注意力机制融入上下文中其他事件对信息,从而得到更丰富的事件对时序关系表示用于时序关系分类.通过TB-Dense(timebank dense)和MATRES(multi-axis temporal relations for start-points)数据集的实验表明:此方法能够取得比当前主流的句子级方法更佳的抽取效果. 展开更多
关键词 事件时序关系抽取 时序关系分类 事件关系识别 自注意力 双向长短期记忆
下载PDF
舆情场景下基于层次知识的话题推荐方法 被引量:5
11
作者 史存会 胡耀康 +4 位作者 冯彬 张瑾 俞晓明 刘悦 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2021年第8期1811-1819,共9页
随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.... 随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.对于舆情场景下用户交互信息稀疏导致的兴趣难以刻画的问题,提出了一种基于层次知识的话题推荐模型.模型通过引入层次知识来扩充语义增加话题之间的潜在信息关联,分别对层次知识、话题和用户建模得到对应的嵌入向量表示,再结合多层感知机匹配模型预测用户点击率.实验结果表明,该模型在与多个基线算法的对比中,在F1(the balanced F score)和AUC(the area under curve)指标的平均值上分别提升了6.7%和4.9%. 展开更多
关键词 话题推荐 层次知识 舆情场景 推荐系统 知识嵌入
下载PDF
基于相关修正的无偏排序学习方法 被引量:2
12
作者 王奕婷 兰艳艳 +2 位作者 庞亮 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2022年第12期2867-2877,共11页
用户点击数据较文档的相关标签更易被获取且能反映用户兴趣,将其作为标签能够有效降低人工标注成本并且模型能随数据实时更新.但用户点击含有偏差和噪声,因此需设计有效的无偏排序方法.针对无偏排序中对偶学习方法收敛得到次优解从而无... 用户点击数据较文档的相关标签更易被获取且能反映用户兴趣,将其作为标签能够有效降低人工标注成本并且模型能随数据实时更新.但用户点击含有偏差和噪声,因此需设计有效的无偏排序方法.针对无偏排序中对偶学习方法收敛得到次优解从而无法完全消除偏差的问题,提出一种基于相关修正的无偏排序学习方法.首先,利用现有小规模相关标注数据训练排序模型,对候选文档进行较精准的相关得分预测;再基于用户点击和文档相关得分训练点击倾向模型;最后,将得到的模型参数设为对偶去偏初始值并联合训练.该方法不影响模型上线的计算速度,可用于在线学习场景,模拟不同程度偏差噪声并在真实点击场景下进行测试,结果表明该方案能够有效提升现有无偏排序学习方法表现. 展开更多
关键词 无偏排序学习 点击数据 相关修正 偏差去除 逆倾向加权
下载PDF
语言模型攻击性的自动评价方法 被引量:2
13
作者 侯丹阳 庞亮 +2 位作者 丁汉星 兰艳艳 程学旗 《中文信息学报》 CSCD 北大核心 2022年第1期12-20,共9页
基于大规模语料训练的语言模型,在文本生成任务上取得了突出性能表现。然而研究发现,这类语言模型在受到扰动时可能会产生攻击性的文本。这种不确定的攻击性给语言模型的研究和实际使用带来了困难,为了避免风险,研究人员不得不选择不公... 基于大规模语料训练的语言模型,在文本生成任务上取得了突出性能表现。然而研究发现,这类语言模型在受到扰动时可能会产生攻击性的文本。这种不确定的攻击性给语言模型的研究和实际使用带来了困难,为了避免风险,研究人员不得不选择不公开论文的语言模型。因此,如何自动评价语言模型的攻击性成为一项亟待解决的问题。针对该问题,该文提出了一种语言模型攻击性的自动评估方法。它分为诱导和评估两个阶段。在诱导阶段,基于即插即用可控文本生成技术,利用训练好的文本分类模型提供的梯度方向更新语言模型的激活层参数,增加生成的文本具有攻击性的可能性。在评估阶段,利用训练好的文本分类模型的判别能力,估计诱导产生的攻击性文本的占比,用以评估语言模型的攻击性。实验评估了不同设置下的预训练模型的攻击性水平,结果表明该方法能够自动且有效地评估语言模型的攻击性,并进一步分析了语言模型的攻击性与模型参数规模、训练语料以及前置单词之间的关系。 展开更多
关键词 文本生成 语言模型 自动评价
下载PDF
基于自增强泊松过程的COVID-19疫情预测 被引量:2
14
作者 刘元浩 曹婍 +2 位作者 沈华伟 黄俊杰 程学旗 《中国传媒大学学报(自然科学版)》 2021年第6期1-8,共8页
在COVID-19疫情的防控工作中,对疫情传播过程中确诊人数的预测工作具有重要意义。在现有疫情传播预测工作中,以SEIR(Susceptible-Exposed-Infected-Recovered)模型为代表的传染病模型能反映疫情相关人群人数变化,但由于其人群均匀接触... 在COVID-19疫情的防控工作中,对疫情传播过程中确诊人数的预测工作具有重要意义。在现有疫情传播预测工作中,以SEIR(Susceptible-Exposed-Infected-Recovered)模型为代表的传染病模型能反映疫情相关人群人数变化,但由于其人群均匀接触的前提假设,模型的应用具有局限性。基于时间序列分析的模型可以通过简单建模历史确诊人数的时间序列对当前确诊人数进行预测,但缺乏对传染病传播的传染性、爆发性、衰减性等固有性质的认识,对疫情发展趋势变化的预测能力受到制约。为解决上述问题,该文采用基于自增强泊松过程(Reinforced Poisson Process, RPP)的模型对疫情确诊人数进行预测,考虑病毒传染性、级联传染的自增强效应和病毒传播的时效性等三个关键因子,对疫情传播的动态过程进行建模,从而对确诊人数做出预测。实验证明,相较SEIR模型,使用RPP模型进行疫情预测不依赖人群均匀混合假设,在各尺度的地理区域都有稳定且准确的预测结果,也解决了SEIR模型在后期预测值过高的问题;对比时间序列分析模型,RPP模型能够掌握疫情发展的内在规律,对疫情发展前、中、后期的发展趋势预测误差分别减小5.29%、5.04%,0.47%,并且能准确把握疫情发展的重要阶段性变化。该文方法已应用于线上平台实时疫情预测,平均误差率小于0.5%。 展开更多
关键词 COVID-19 自增强泊松过程模型 传播关键因子建模 疫情预测
下载PDF
基于演化模式的推特话题流行度预测方法
15
作者 解伟凡 郭岩 +3 位作者 匡广生 余智华 薛源海 沈华伟 《计算机应用》 CSCD 北大核心 2022年第11期3364-3370,共7页
针对以往流行度预测方法未利用演化模式之间的差异和忽略预测时效性的问题,提出了一种基于演化模式的推特话题流行度预测方法。首先,基于K⁃SC算法对大量历史话题的流行度序列进行聚类,并得到6类演化模式;然后,使用各类演化模式下的历史... 针对以往流行度预测方法未利用演化模式之间的差异和忽略预测时效性的问题,提出了一种基于演化模式的推特话题流行度预测方法。首先,基于K⁃SC算法对大量历史话题的流行度序列进行聚类,并得到6类演化模式;然后,使用各类演化模式下的历史话题数据分别训练全连接网络(FCN)作为预测模型;最后,为选择待预测话题的预测模型,提出幅度对齐的动态时间规整(AADTW)算法来计算待预测话题的已知流行度序列与各演化模式的相似度,并选取相似度最高的演化模式的预测模型进行流行度预测。在根据已知前20 h的流行度预测后5 h的流行度的任务中,与差分整合移动平均自回归(ARIMA)方法以及使用单一的全连接网络进行预测的方法相比,所提方法的预测结果的平均绝对百分比误差(MAPE)分别降低了58.2%和31.0%。实验结果表明,基于演化模式得到的模型群相较于单一模型能更加准确地预测推特话题流行度。 展开更多
关键词 推特话题 演化模式 流行度预测 社交网络 时间序列
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部