摘要
本文结合Internet中文信息检索系统(WAIS)这样一个特定环境,探索了一种基于频率统计的中文自动标引方法,以往的自动标引方法所采用词典匹配法有词典不完备等限制,而本文所介绍的方法则实现了不用任何词典,并进行了真正的全文献处理的自动词抽词标引,它突破了已有经验和知识的限制,能自动发现和学习新词,可以说它是一种具有自学习特点的智能型中文文献的自动标引方法。基于该方法的自由词主题标引系统已经实现。在Internet下被应用于采用WAIS工具进行中文信息的检索和查询,为在Internet上建立中文信息库和信息查询开辟了道路。
出处
《办公自动化》
2002年第G00期206-212,共7页
Office Informatization