文章预览
作者:@Simon Willison 原文:https://simonwillison.net/2025/Feb/13/shot-scraper/#atom-everything 背景 @Simon Willison 宣布了 shot-scraper 1.6 版本的发布,该版本新增了对 HTTP Archive(HAR)的支持。shot-scraper 是一个命令行工具,用于截取网页截图和抓取网页内容。此次更新使得用户能够生成包含页面及其所有依赖项的 HAR 文件,进一步增强了工具的实用性和灵活性。 shot-scraper:https://github.com/simonw/shot-scraper 要点 1、HAR 支持 shot-scraper 现在可以生成 HAR 文件,记录网页加载过程中的所有请求和响应。 使用新的 shot-scraper har 命令创建 HAR 文件。例如: shot-scraper har https://datasette.io/ 这将生成一个 datasette-io.har 文件。 HAR 文件是 JSON 格式,包含完整的响应副本,二进制文件(如图像)以 Base64 编码。 可以使用 --zip 标志将 HAR 文件压缩成 ZIP 文件,其中 JSON 数据保存在 har.har 中,
………………………………