摘要
文章探讨了一个中介语语料库的建设设计,它具有精加工的特点,主要体现在完备语料属性、细化偏误标注分类和过滤冗余信息三个方面。在过滤冗余信息时,采用两个函数先后运算的优化算法,降低数据稀疏,提高语料库的质量。整个建设过程采取数据建设与软件建设同步进行的方式。该语料库具备可扩展性,能够进一步收录和处理更大规模的语料。
出处
《乐山师范学院学报》
2012年第5期28-31,共4页
Journal of Leshan Normal University
基金
安徽省教育厅人文社科一般项目"安徽师范大学留学生中介语语法偏误精加工语料库"(项目编号:2009sk07)