期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
通过挖掘示例中的概念来解决多示例学习问题 被引量:3
1
作者 甘睿 印鉴 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期73-78,共6页
在多示例学习问题中,训练数据集里面的每一个带标记的样本都是由多个示例组成的包,其最终目的是利用这一数据集去训练一个分类器,使得可以利用该分类器去预测还没有被标记的包.在以往的关于多示例学习问题的研究中,有的是通过修改现有... 在多示例学习问题中,训练数据集里面的每一个带标记的样本都是由多个示例组成的包,其最终目的是利用这一数据集去训练一个分类器,使得可以利用该分类器去预测还没有被标记的包.在以往的关于多示例学习问题的研究中,有的是通过修改现有的单示例学习算法来迎合多示例的需要,有的则是通过提出新的方法来挖掘示例与包之间的关系并利用挖掘的结果来解决问题.以改变包的表现形式为出发点,提出了一个解决多示例学习问题的算法———概念挖掘算法.该算法利用原本用于文本过滤的R-模式发现法将包表示成一个d维向量———概念向量.经过重新表示后,原有的多示例数据集已经不再"多示例",以至于一些现有的单示例学习算法能够被用来高效地解决多示例学习问题. 展开更多
关键词 多示例学习 重新表示 单示例学习
下载PDF
通过评估示例中概念的重要性来解决多示例学习问题
2
作者 甘睿 印鉴 《计算机科学》 CSCD 北大核心 2012年第7期144-147,共4页
在多示例学习问题中,训练数据集里面的每一个带标记的样本都是由多个示例组成的包,其最终目的是利用这一数据集去训练一个分类器,使得可以利用该分类器去预测还没有被标记的包。在以往的关于多示例学习问题的研究中,有的是通过修改现有... 在多示例学习问题中,训练数据集里面的每一个带标记的样本都是由多个示例组成的包,其最终目的是利用这一数据集去训练一个分类器,使得可以利用该分类器去预测还没有被标记的包。在以往的关于多示例学习问题的研究中,有的是通过修改现有的单示例学习算法来迎合多示例的需要,有的则是通过提出新的方法来挖掘示例与包之间的关系并利用挖掘的结果来解决问题。以改变包的表现形式为出发点,提出了一个解决多示例学习问题的算法——概念评估算法。该算法首先利用聚类算法将所有示例聚成d簇,每一个簇可以看作是包含在示例中的概念;然后利用原本用于文本检索的TF-IDF(Term Frequency-Inverse Document Frequency)算法来评估出每一个概念在每个包中的重要性;最后将包表示成一个d维向量——概念评估向量,其第i个位置表示第i个簇所代表的概念在某个包中的重要程度。经重新表示后,原有的多示例数据集已不再是"多示例",以至于一些现有的单示例学习算法能够用来高效地解决多示例学习问题。 展开更多
关键词 多示例学习 重新表示 单示例学习 概念评估
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部