少样本学习是目前机器学习研究领域的热点和难点.针对现有的少样本学习模型不能有效捕捉数据特征与数据标签之间的联系,造成分类模型泛化能力弱的问题,提出一种基于元学习的原型空间图卷积网络少样本学习模型FSL-GCNPS(Few-Shot Learnin...少样本学习是目前机器学习研究领域的热点和难点.针对现有的少样本学习模型不能有效捕捉数据特征与数据标签之间的联系,造成分类模型泛化能力弱的问题,提出一种基于元学习的原型空间图卷积网络少样本学习模型FSL-GCNPS(Few-Shot Learning of Graph Convolutional Network on Prototype Space).首先,利用卷积神经网络提取多任务数据的特征向量;其次,为了将特征向量映射到原型空间中,根据元学习的训练策略得到特征向量的类原型表达;然后,通过类原型向量和类向量之间的嵌入表示,构建图结构数据,并进行图卷积网络训练、推理.实验结果表明,相较于经典少样本学习方法,FSL-GCNPS模型拥有更好的分类准确率和分类稳定性.同时,在医学图像领域数据集上实验表明,FSL-GCNPS具有很好的跨域适应性.展开更多
学术全文本中包含了多种知识元,对这些知识元进行挖掘与组织,可以有效提升学术资源的利用效率。通过学术知识图谱的构建,将论文中各类隐性“知识元”串联起来,不但可以节省研究者获取知识点的时间,还可以通过知识图谱内的网络社区进行...学术全文本中包含了多种知识元,对这些知识元进行挖掘与组织,可以有效提升学术资源的利用效率。通过学术知识图谱的构建,将论文中各类隐性“知识元”串联起来,不但可以节省研究者获取知识点的时间,还可以通过知识图谱内的网络社区进行知识点的扩充。通过系统而全面的文献调研,本文从宏观、中观和微观3个维度出发,确定了18种学术论文中的关键知识元,并将学术全文本中的描述信息作为知识元对象,设计出学术知识图谱概念框架。然后,选取Journal of the Association for Information Science and Technology(JASIST)期刊的515篇学术全文本,对每篇论文中的关键知识元进行人工标注与基于深度学习的知识元抽取研究。研究内容包括该类知识元在人工标注过程中是否会遇到问题、在自动抽取时是否会达到预期值,从而对参与图谱构建的知识元进行筛选。最终筛选出9种知识元,包括数学公式、软件工具、数据源、具体模型、表、图、研究展望、研究问题和研究结果,与题录数据中的知识元共同生成由头知识元、关系、尾知识元组成的三元组,存入图数据库。最后,对该图谱进行可视化的评估与知识元检索研究,证明了其可行性与可扩展性。研究结果表明,学术全文本中的部分知识元适合大规模的自动化标注,而且各类知识元可以通过互相链接形成密集的知识社区,并具备知识元搜索等功能。展开更多
异构信息网络(Heterogeneous Information Network,HIN)包含了丰富的语义信息,利用其进行评分预测已成为缓解推荐系统数据稀疏性问题的一个重要途径。然而,传统采用元路径来提取HIN语义信息的方法忽略了元路径中的评分信息,从而导致元...异构信息网络(Heterogeneous Information Network,HIN)包含了丰富的语义信息,利用其进行评分预测已成为缓解推荐系统数据稀疏性问题的一个重要途径。然而,传统采用元路径来提取HIN语义信息的方法忽略了元路径中的评分信息,从而导致元路径无法精确捕获用户和推荐项目之间的语义相似性,同时也未能良好区分不同元路径的重要性。为了解决这两个问题,首先提出了一种带有评分限制的元路径以获取更准确的HIN语义信息,利用这些信息构建用户和项目多层网络;然后结合图卷积网络和注意力机制设计了一个用于评分预测的神经网络,通过多通道图卷积有效地表示了HIN的多种语义信息,采用注意力机制区分不同元路径的重要性,弥补了传统方法的不足;最后融合了用户和项目的属性信息,进一步提高了评分预测的准确性。在Douban Book和Yelp数据集上的实验结果表明所提模型明显优于对比的基线模型,尤其在数据稀疏的情况下,均方根误差比基线模型最多减少了50%,从而验证了所提模型的优越性。展开更多
文摘少样本学习是目前机器学习研究领域的热点和难点.针对现有的少样本学习模型不能有效捕捉数据特征与数据标签之间的联系,造成分类模型泛化能力弱的问题,提出一种基于元学习的原型空间图卷积网络少样本学习模型FSL-GCNPS(Few-Shot Learning of Graph Convolutional Network on Prototype Space).首先,利用卷积神经网络提取多任务数据的特征向量;其次,为了将特征向量映射到原型空间中,根据元学习的训练策略得到特征向量的类原型表达;然后,通过类原型向量和类向量之间的嵌入表示,构建图结构数据,并进行图卷积网络训练、推理.实验结果表明,相较于经典少样本学习方法,FSL-GCNPS模型拥有更好的分类准确率和分类稳定性.同时,在医学图像领域数据集上实验表明,FSL-GCNPS具有很好的跨域适应性.
文摘学术全文本中包含了多种知识元,对这些知识元进行挖掘与组织,可以有效提升学术资源的利用效率。通过学术知识图谱的构建,将论文中各类隐性“知识元”串联起来,不但可以节省研究者获取知识点的时间,还可以通过知识图谱内的网络社区进行知识点的扩充。通过系统而全面的文献调研,本文从宏观、中观和微观3个维度出发,确定了18种学术论文中的关键知识元,并将学术全文本中的描述信息作为知识元对象,设计出学术知识图谱概念框架。然后,选取Journal of the Association for Information Science and Technology(JASIST)期刊的515篇学术全文本,对每篇论文中的关键知识元进行人工标注与基于深度学习的知识元抽取研究。研究内容包括该类知识元在人工标注过程中是否会遇到问题、在自动抽取时是否会达到预期值,从而对参与图谱构建的知识元进行筛选。最终筛选出9种知识元,包括数学公式、软件工具、数据源、具体模型、表、图、研究展望、研究问题和研究结果,与题录数据中的知识元共同生成由头知识元、关系、尾知识元组成的三元组,存入图数据库。最后,对该图谱进行可视化的评估与知识元检索研究,证明了其可行性与可扩展性。研究结果表明,学术全文本中的部分知识元适合大规模的自动化标注,而且各类知识元可以通过互相链接形成密集的知识社区,并具备知识元搜索等功能。
文摘异构信息网络(Heterogeneous Information Network,HIN)包含了丰富的语义信息,利用其进行评分预测已成为缓解推荐系统数据稀疏性问题的一个重要途径。然而,传统采用元路径来提取HIN语义信息的方法忽略了元路径中的评分信息,从而导致元路径无法精确捕获用户和推荐项目之间的语义相似性,同时也未能良好区分不同元路径的重要性。为了解决这两个问题,首先提出了一种带有评分限制的元路径以获取更准确的HIN语义信息,利用这些信息构建用户和项目多层网络;然后结合图卷积网络和注意力机制设计了一个用于评分预测的神经网络,通过多通道图卷积有效地表示了HIN的多种语义信息,采用注意力机制区分不同元路径的重要性,弥补了传统方法的不足;最后融合了用户和项目的属性信息,进一步提高了评分预测的准确性。在Douban Book和Yelp数据集上的实验结果表明所提模型明显优于对比的基线模型,尤其在数据稀疏的情况下,均方根误差比基线模型最多减少了50%,从而验证了所提模型的优越性。