期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于非GB2312编码识别网页编码的方法
1
作者 侯金强 李宗千 《计算机光盘软件与应用》 2011年第2期84-84,共1页
在web文本挖掘中,网络编码的识别是前期关键步骤,其识别成功与否,直接影响后期任务能否继续执行。本文提出了一种使用非GB2312编码判断网页编码的方法,通过得到的比较值与经验阈值比较,最终用二值区分确定网页代码类型,成功解决... 在web文本挖掘中,网络编码的识别是前期关键步骤,其识别成功与否,直接影响后期任务能否继续执行。本文提出了一种使用非GB2312编码判断网页编码的方法,通过得到的比较值与经验阈值比较,最终用二值区分确定网页代码类型,成功解决了网页信息采集系统在面临大量不同类型网页时的编码识别问题。 展开更多
关键词 网页编码 非gb2312编码 经验阈值 编码识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部