-
题名结构化学习的噪声可学习性分析及其应用
被引量:2
- 1
-
-
作者
于墨
赵铁军
胡鹏龙
郑德权
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2013年第10期2340-2353,共14页
-
基金
国家自然科学基金(61173073)
国家高技术研究发展计划(863)(2011AA01A207)
-
文摘
噪声可学习性理论指出,有监督学习方法的性能会受到训练样本标记噪声的严重影响.然而,已有相关理论研究仅针对二类分类问题.致力于探究结构化学习问题受噪声影响的规律性.首先,注意到在结构化学习问题中,标注数据的噪声会在训练过程中被放大,使得训练过程中标记样本的噪声率高于标记样本的错误率.传统的噪声可学习性理论并未考虑结构化学习中的这一现象,从而低估了问题的复杂性.从结构化学习问题的噪声放大现象出发,提出了新的结构化学习问题的噪声可学习性理论.在此基础上,提出了有效训练数据规模的概念,这一指标可用于在实践中描述噪声学习问题的数据质量,并进一步分析了实际应用中的结构化学习模型在高噪声环境下向低阶模型回退的情况.实验结果证明了该理论的正确性及其在跨语言映射和协同训练方法中的应用价值和指导意义.
-
关键词
结构化学习
噪声pac可学习性
词性标注
自然语言处理
协同训练
跨语言映射
半监督学习
-
Keywords
structured learning
pac learning with noise
pos-tagging
natural language processing
co-training
cross-lingual projection
semi-supervised learning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-