-
题名基于“词坐标”的文本处理模型算法分析
- 1
-
-
作者
刘晓燕
孙海燕
-
机构
河南师范大学语料库研发中心
-
出处
《河南大学学报(自然科学版)》
CAS
2015年第1期95-101,共7页
-
基金
国家社科基金项目(14BYY084)
教育部人文社科项目(12YJC740062)
-
文摘
传统的文本处理软件大多能够较好地解决文本读入与词汇排序问题,但对内存消耗及数据统计结果的精确性关注较少,因此处理过程中造成诸多资源浪费及少量数据统计误差.基于Java语言,在充分考虑英语语言特点的基础上,结合"词坐标"思想,提出一套全新的算法设计,并对自行开发的英语文本处理模型进行分析与描述.实验结果证明,基于"词坐标"开发的文本处理模型对英语这一自然语言进行处理,能够精确统计文本各项数据;与其他同类软件相比,效率更高.借助于该模型,语料库研究者能够更好地分析与总结英语文本的内部规律,从而构建速度更快、效率更高的自然语言处理平台.
-
关键词
词坐标
文本处理模型
算法分析
-
Keywords
lexical coordination
text processing model
algorithm analysis
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-