摘要
汉语自动分词与中华民族文化复兴紧密相联 ,但汉语自动分词又是目前中文信息处理中的难题。通过分析现有汉语词自动分词方法及其局限性、汉语词自动分词中存在的困难、汉语同西方语言和日语的差别 ,认为传统汉语文本具有不可自动切分性 ,从汉语自动分词的成本、影响和汉语言发展的前途出发 ,必须对传统汉语文本进行改革。提出了一种新的自动分词思维 :“无词典切分” ,即改变汉语书写习惯 ,在汉语文本生成时在汉语词之间增加分隔信息 ,使汉语适于计算机自动处理。
出处
《情报杂志》
CSSCI
北大核心
2005年第2期2-4,共3页
Journal of Intelligence
基金
国家人文社会科学重点研究基地重大项目<文献计量与内容分析的综合研究>(编号 :0 2JAZJD870 0 0 3)研究成果之一。