期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
人才网页自动识别系统研究 被引量:1
1
作者 徐健 温浩胜 《现代图书情报技术》 CSSCI 北大核心 2011年第6期20-26,共7页
提出人才网页自动识别系统设计,实现对Nutch定向采集系统抓取的高校网站页面进行人才描述网页自动识别。识别过程中使用自动获取的网页的URL特征、网页Title标签特征、链接文字特征以及网页文本内容特征,使用人名词表、正面特征词表、... 提出人才网页自动识别系统设计,实现对Nutch定向采集系统抓取的高校网站页面进行人才描述网页自动识别。识别过程中使用自动获取的网页的URL特征、网页Title标签特征、链接文字特征以及网页文本内容特征,使用人名词表、正面特征词表、负面特征词表对各项识别特征进行匹配以计算特征值,借助开源软件LibSVM实现基于多特征值的人才网页自动识别。 展开更多
关键词 LIBSVM 人才网页 自动分类 分类特征提取
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部