在对数据进行分类的过程中,如何用机器学习的方法使数据分类更加准确一直是研究的重点。在对电信用户流失情况的研究中,通常可以比较容易对流失用户进行标记,但是还未流失用户并不代表用户不会流失,所以并不能作为准确的2分类负样本,用O...在对数据进行分类的过程中,如何用机器学习的方法使数据分类更加准确一直是研究的重点。在对电信用户流失情况的研究中,通常可以比较容易对流失用户进行标记,但是还未流失用户并不代表用户不会流失,所以并不能作为准确的2分类负样本,用One Class SVM提取未知样本中密度较高的部分作为真负样本,将源数据分为正样本,负样本与未知样本三部分,方便以后研究。展开更多
文摘在对数据进行分类的过程中,如何用机器学习的方法使数据分类更加准确一直是研究的重点。在对电信用户流失情况的研究中,通常可以比较容易对流失用户进行标记,但是还未流失用户并不代表用户不会流失,所以并不能作为准确的2分类负样本,用One Class SVM提取未知样本中密度较高的部分作为真负样本,将源数据分为正样本,负样本与未知样本三部分,方便以后研究。