-
题名基于中文机构名简称的检索方法研究
被引量:7
- 1
-
-
作者
钟良伍
郑方
-
机构
清华大学计算机科学与技术系智能技术与系统国家重点实验室语音技术中心
-
出处
《中文信息学报》
CSCD
北大核心
2007年第1期38-42,共5页
-
文摘
对于是否是中文机构名或机构名简称的自动判别,已经有广泛和深入的研究;但是对机构名简称和全称的匹配,目前鲜有研究成果。本文针对基于中文机构名简称的检索方法,研究了机构名的结构特征,总结出两种规则,定制了一个基于关键词类的分词工具,提出简称和全称匹配的一种算法,并且结合多级索引技术,实现了基于中文机构名简称的检索系统。实验结果表明,本文所提方法的准确性较好,首选准确率达到近95%,在全称机构名总数达到51万的情况下,检索平均耗时约0.21秒,达到实用要求。
-
关键词
计算机应用
中文信息处理
多级索引
模糊匹配
分词算法
-
Keywords
computer application, Chinese information processing
multi-level indexing
fuzzy matching
word segmentation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-