基于中文的亚洲英语共同体是中华文化的承载介体,是人类命运共同体的基本通用语之一。然而,缺乏大量的真实可信数据、科学的数据挖掘与自然语言处理方法,已成为制约基于中文的亚洲英语研究发展的关键技术问题。在分析相关研究现状的基础...基于中文的亚洲英语共同体是中华文化的承载介体,是人类命运共同体的基本通用语之一。然而,缺乏大量的真实可信数据、科学的数据挖掘与自然语言处理方法,已成为制约基于中文的亚洲英语研究发展的关键技术问题。在分析相关研究现状的基础上,设计并实现了一个大数据驱动的基于中文的亚洲英语语料库并通过Web开发实现在线检索服务(Corpus of Chinese-based Asian English,CCbAE)。这是一个由六个基于中文的英语变体(中国内地英语、中国香港英语、中国台湾英语、中国澳门英语、新加坡英语、马来西亚英语)组合而成的大规模语料库。首先,简要说明了系统的总体架构和数据库构建。其次,结合Web可视化界面着重介绍了语料库的六大功能,分别为词频统计、特征展示、词汇变异、形态变异、句法变异、词义变异。该系统的设计与实现为不同层次的用户体,提供简捷易用的基于中文的亚洲英语语料检索服务。展开更多
文摘基于中文的亚洲英语共同体是中华文化的承载介体,是人类命运共同体的基本通用语之一。然而,缺乏大量的真实可信数据、科学的数据挖掘与自然语言处理方法,已成为制约基于中文的亚洲英语研究发展的关键技术问题。在分析相关研究现状的基础上,设计并实现了一个大数据驱动的基于中文的亚洲英语语料库并通过Web开发实现在线检索服务(Corpus of Chinese-based Asian English,CCbAE)。这是一个由六个基于中文的英语变体(中国内地英语、中国香港英语、中国台湾英语、中国澳门英语、新加坡英语、马来西亚英语)组合而成的大规模语料库。首先,简要说明了系统的总体架构和数据库构建。其次,结合Web可视化界面着重介绍了语料库的六大功能,分别为词频统计、特征展示、词汇变异、形态变异、句法变异、词义变异。该系统的设计与实现为不同层次的用户体,提供简捷易用的基于中文的亚洲英语语料检索服务。