专栏名称: Python爱好者社区
人生苦短,我用Python。分享Python相关的技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。每天自动更新和推送。
目录
今天看啥  ›  专栏  ›  Python爱好者社区

用 Python 处理 HTML 转义字符的5种方式

Python爱好者社区  · 公众号  · Python  · 2017-12-17 17:30

文章预览

作者:刘志军,6年+Python使用经验, 高级开发工程师,目前在互联网医疗行业从事Web系统构架工作 个人公众号:Python之禅(微信ID:vttalk) Photo by  Ahmed Saffu  on  Unsplash 写爬虫是一个发送请求,提取数据,清洗数据,存储数据的过程。在这个过程中,不同的数据源返回的数据格式各不相同,有 JSON 格式,有 XML 文档,不过大部分还是 HTML 文档,HTML 经常会混杂有转移字符,这些字符我们需要把它转义成真正的字符。 什么是转义字符 在 HTML 中   < 、 > 、 &   等字符有特殊含义( 用于标签中, & 用于转义),他们不能在 HTML 代码中直接使用,如果要在网页中显示这些符号,就需要使用 HTML 的转义字符串(Escape Sequence),例如   <   的转义字符是   < ,浏览器渲染 HT ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览