期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文农业网站多元线性回归识别研究 被引量:6
1
作者 李永可 张太红 +2 位作者 冯向萍 陈艳红 马健 《新疆农业大学学报》 CAS 北大核心 2011年第5期442-446,共5页
在对中文网页分类中几种典型特征词选取方法研究基础上,提出了互联网农业网站识别中特征词提取方法,设计了农业网站最小二乘多元线性回归识别模型。为检测不同分词器对模型性能的影响,分别使用JE分词器、IK分词器、庖丁解牛分词器、中... 在对中文网页分类中几种典型特征词选取方法研究基础上,提出了互联网农业网站识别中特征词提取方法,设计了农业网站最小二乘多元线性回归识别模型。为检测不同分词器对模型性能的影响,分别使用JE分词器、IK分词器、庖丁解牛分词器、中科院分词器等中文分词工具进行了对比实验。结果表明,当特征词在160~200时,使用IK分词器、庖丁解牛分词器、中科院分词器,模型识别精确度可达96%以上,当特征词个数达到200个以后,农业网站识别精确度基本趋于稳定。 展开更多
关键词 中文文本分类 农业网站识别 特征提取 多元回归分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部