摘要
本文主要研究高校招生领域Web短文本的表示方法及处理步骤。基于自编码神经网络对输入数据的要求,研究文本预处理的主要技术:中文分词、停用词处理、降维处理,文本向量化表示等技术,并分析了文本表示的处理流程。
This paper studies the field of representation College Enrollment Web and short text processing steps.Based on self-encoding neural network input data requirements,the main technical pretreatment study text:Chinese word,stop word processing,reduce the dimension text representation techniques to quantify and analyze the process flow text representation.
作者
俸世洲
Feng Shizhou(Chongqing Normal University Foreign Trade And Business College, 401520)
出处
《电子测试》
2016年第10期91-92,共2页
Electronic Test
基金
重庆市教委科学技术研究项目KJ1501703
重庆师范大学涉外商贸学院科研项目KY2015004
关键词
高校招生自编码
中文分词
文本表示
College Admissions self-encoding
Chinese word
text representation