摘要
实现了一种基于哈希表索引和匹配算法的藏文分词的系统。进行分词时,为达到消除部分歧义的目的,采用了正向最大匹配和逆向最大匹配算法相结合的方式进行藏文分词,通过分别计算两种分词结果的频率,然后选择频率较大的一个。最终,通过对26个不同大小的文本对该系统进行测试和分析,得出了分词准确率在92%以上的结论。
出处
《电子技术与软件工程》
2016年第1期169-170,共2页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
基金
西藏大学国家级大学生创新性实验训练计划项目(201410694019)
教育部人文社科基金项目(13YJCZH128)