摘要
对多语言信息处理中的文本表示问题进行阐述。在分析单语言文本表示的模型和过程的基础上,说明多语言文本表示的过程,详细分类并阐述其中的各种方法,对其进行比较分析。概括多语言文本表示的特点,指出尚存在的问题,并对多语言文本表示的发展趋势进行探讨。
This article discusses the issues of document representation in multilingual information processing. Firstly, it describes the process of muhilingual document representation, introduces different methods in detail and compares their strengths and weaknesses. Then it summarizes the characteristics of multilingual document representation, and points out some existing problems. Finally, it shows some development trends of multilingual document representation.
出处
《现代图书情报技术》
CSSCI
北大核心
2010年第6期33-41,共9页
New Technology of Library and Information Service
基金
国家自然科学基金项目"基于可比语料的多语言文本聚类研究"(项目编号:70903032)
教育部人文社会科学研究一般项目"多语领域本体自动构建研究"(项目编号:08JC870007)的研究成果之一
关键词
多语言文本表示
跨语言信息检索
潜在语义分析
显式语义分析
Multilingual document representation Cross - Explicit semantic analysis language information retrieval Latent semantic analysis