一种基于非GB2312编码识别网页编码的方法

Webpage Coding Identification Method Based on non-GB2312 Coding

下载PDF

导出

摘要在web文本挖掘中，网络编码的识别是前期关键步骤，其识别成功与否，直接影响后期任务能否继续执行。本文提出了一种使用非GB2312编码判断网页编码的方法，通过得到的比较值与经验阈值比较，最终用二值区分确定网页代码类型，成功解决了网页信息采集系统在面临大量不同类型网页时的编码识别问题。 In Web text mining,network coding is the early identification of key steps,the recognition is successful or not, directly affect the ability to continue to perform the task later.This paper presents a use of non-page encoding GB2312 encoding method to determine, by comparing values obtained by comparison with the experience of the threshold,the binary distinction between end-page code to determine the type of successful resolution of a web information collection system in the face of a number different types of webpages encoding recognition.

作者侯金强李宗千

机构地区甘肃省兰州市榆中职教中心甘肃省兰州市榆中一中

出处《计算机光盘软件与应用》 2011年第2期84-84,共1页 Computer CD Software and Application

关键词网页编码非GB2312编码经验阈值编码识别 Web coding Non GB2312 encoding Experience threshold Codeidentification

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

1韩剑波.基于DSP的语音编码识别系统的设计与研究[J].制造业自动化,2010,32(A5):216-218. 被引量：1
2李歆昊,张旻,陆凯,吕全通.基于游程间隔特征的线性分组码码长识别方法[J].探测与控制学报,2014,36(5):29-33. 被引量：2
3怎样通过iPod机身编码识别行货、水货[J].网友世界,2010(3):151-151.
4蒋丹,吴玮琦.部分模板匹配法识别相位编码信号[J].电子信息对抗技术,2009,24(2):31-34.
5于淦.对短波信号调制方式识别方法的研究[J].中国无线电,2008(7):47-51. 被引量：4
6Dishboy.初试同洲8800数字高清卫星电视接收机[J].卫星电视与宽带多媒体,2006(17):40-43.
7激光参数测量[J].中国光学,2004(4):24-24.
8石荣,胡苏,李潇.主动自加噪与高效纠错编码结合的物理层安全传输[J].通信技术,2016,49(12):1593-1597.
9丁峤,徐卫.卷积码识别算法浅述[J].数字通信世界,2016(6):11-13. 被引量：1
10王国裕,李远念.DAB预警系统控制串口控制卡实时显示的设计与实现[J].电子质量,2015(3):24-25.

计算机光盘软件与应用

2011年第2期

浏览历史

内容加载中请稍等...

一种基于非GB2312编码识别网页编码的方法

相关作者

相关机构

相关主题

浏览历史