期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于数据分布一致性最小最大概率机 被引量:2
1
作者 王晓初 王士同 包芳 《计算机工程与应用》 CSCD 北大核心 2016年第16期79-84,120,共7页
针对既包含有标记样本又包含未标记样本的分类数据,提出数据分布一致性原理,并将其融入到最小最大概率机中。把有标记样本和无标记样本映射到决策超平面所在空间(简称超空间),通过最小化有标记样本和无标记样本在超空间的概率分布差异,... 针对既包含有标记样本又包含未标记样本的分类数据,提出数据分布一致性原理,并将其融入到最小最大概率机中。把有标记样本和无标记样本映射到决策超平面所在空间(简称超空间),通过最小化有标记样本和无标记样本在超空间的概率分布差异,充分利用无标签样本来修正最小最大概率机的误差,使得修正后的决策超平面更接近于真正的分类超平面。实验证明,数据分布一致性最小最大概率机(DCMPM)比最小最大概率机(MPM)具有更好的分类性能。 展开更多
关键词 数据分布一致性 最小最大概率机 决策超平面
下载PDF
基于自训练的蛋白质相互作用关系抽取方法
2
作者 张宏涛 黄民烈 朱小燕 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第3期380-384,共5页
基于有监督机器学习算法的蛋白质相互作用关系抽取方法仍然面临一个问题:标注数据集有限,导致算法无法得到充分学习。该文首先构造了一个丰富的特征空间,包括句法、词汇、词性等特征;然后,该文对不同数据集数据分布的不一致性进行了分析... 基于有监督机器学习算法的蛋白质相互作用关系抽取方法仍然面临一个问题:标注数据集有限,导致算法无法得到充分学习。该文首先构造了一个丰富的特征空间,包括句法、词汇、词性等特征;然后,该文对不同数据集数据分布的不一致性进行了分析,在此基础上提出了一种基于自训练的数据添加算法,通过不断从未标注数据集中选择置信度高的样本加入到已标注数据集中,扩大数据集规模,提高算法效率。实验结果表明:在5个常用的蛋白质相互作用关系数据集上,该方法均有助于提高抽取性能。 展开更多
关键词 蛋白质相互作用关系抽取 自训练 数据分布一致性
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部