-
题名SVM词库智能更新技术在搜索分类中的应用
被引量:1
- 1
-
-
作者
齐富民
谢晓尧
景凤宣
-
机构
贵州师范大学贵州省信息与计算科学重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第6期2017-2023,共7页
-
基金
贵州省工业攻关基金项目(黔科合GY字[2008]3009)
贵州省科学技术基金项目(黔科合J字[2011]2213)
贵州师范大学2012年度自然科学类学生科研基金重点项目(201219)
-
文摘
为了研究搜索引擎的文本预分类准确率,从词库对搜索引擎的影响角度出发,提出了基于支持向量机的词库智能更新技术。利用网络爬虫丰富的数据源作为生僻词来源,用基础词库结合语法库对网络爬虫获取的文本语料进行分析处理,同时不断充实临时词库;利用支持向量机判定文本的所属类别,确定生僻词的类别标识;根据临时词库中的生僻词的统计数量,将生僻词加入到词库,达到扩大词库的目的。将扩展后的词库应用于搜索引擎的搜索意图识别实验中,实验结果表明,扩展后的词库可以减少句子拆分的错误率并提高搜索主题分类的准确率。
-
关键词
支持向量机
词库智能更新
语法库
搜索引擎
主题分类
-
Keywords
support vector machine
thesaurus intelligent update
grammar library
search engines
subject classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-