期刊文献+

Python文本模式匹配与TXT文件编码类型的识别 被引量:1

下载PDF
导出
摘要 使用Python语言中的正则表达式,进行了文本的模式匹配,根据匹配结果修改文本内容;讨论了ASCII、ANSI和Unicode等文字编码的原理,识别了带BOM标志的各种Unicode编码的TXT文件,对不带BOM标志的TXT文件区分UTF-8和ANSI编码进行了详细的讨论,并给出了具体实现。
作者 云太真
出处 《电脑编程技巧与维护》 2018年第9期4-8,共5页 Computer Programming Skills & Maintenance
  • 相关文献

参考文献2

二级参考文献5

  • 1香港增补字符集:http://www.digital21.gov.hk/chi/hkscs/introduction.html.
  • 2CJK 有关信息:ftp://ftp.ora.com/pub/examples/nutshell/ujip/doc/cjk.inf.
  • 3藏文编码http://www.tibetaninfo.net/lyz/wl/zwxxjs.ht.
  • 4The Unicode Consortium:http://www.Unicode.org.
  • 5International Standard ISO/IEC 10646-1 Second Edition:Information technology-Universal Multiple-Octet Coded Character Set(UCS),2000.

共引文献11

同被引文献4

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部