今天看啥  ›  专栏  ›  GitHubStore

网络数据抓取神器Pipet

GitHubStore  · 公众号  · 科技自媒体  · 2024-10-06 09:42
    

主要观点总结

Pipet是一个基于命令行的网络抓取工具,支持HTML解析、JSON解析和客户端JavaScript评估。它严重依赖于curl等现有工具,并使用unix管道来扩展其功能。Pipet可以用于跟踪各种信息,如发货情况、音乐会门票、股票价格等。它提供了一个灵活的方式来描述如何获取感兴趣的数据。

关键观点总结

关键观点1: Pipet的主要特点和功能

Pipet是一个命令行工具,用于网络抓取。它支持HTML解析、JSON解析和客户端JavaScript评估。Pipet依赖于curl等工具,并使用unix管道扩展其功能。

关键观点2: Pipet的安装和使用

用户可以从版本页面下载最新版本进行预安装,也可以编译安装。安装后在终端运行pipet命令,并传入.pipet文件路径来查看最新的信息。Pipet接受一些标志参数,如--json、--template、--separator等,用于定制输出。

关键观点3: Pipet文件的结构和示例

Pipet文件描述从何处以及如何获取用户感兴趣的数据。文件包含URL、抓取工具、选择器等信息。提供了获取Wikipedia的“On This Day”和加拿大警报天气的Pipet文件示例。


文章预览

项目简介 Pipet 是一个基于命令行的网络抓取工具。它支持 3 种操作模式 - HTML 解析、JSON 解析和客户端 JavaScript 评估。它严重依赖于curl等现有工具,并使用unix管道来扩展其内置功能。 您可以使用 Pipet 跟踪发货情况、在音乐会门票可用时收到通知、股票价格变化以及在线显示的任何其他类型的信息。  试试看! 创建一个包含以下内容的 hackernews.pipet 文件: curl https://news.ycombinator.com/ .title .titleline span > a .sitebit a 跑步  go run github.com/bjesus/pipet/cmd/pipet@latest hackernews.pipet  或安装 Pipet 并运行 pipet hackernews.pipet 在您的终端中查看所有最新的黑客新闻! 安装 预建 从版本页面下载最新版本。  chmod +x pipet 并运行 ./pipet  。 编译 此安装方法需要在您的系统上安装 Go。您可以使用 Go 安装 Pipet go install github.com/bjesus/pipet/cmd/pipet@latest  。否则,您可以运行它 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览