专栏名称: 玉树芝兰
思考教育、写作和互联网。 我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动。
目录
今天看啥  ›  专栏  ›  玉树芝兰

如何用最简方法,爬取网站数据?

玉树芝兰  · 公众号  · 大数据  · 2024-05-29 18:16
    

文章预览

(注:本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户 请勿重复付费 ) 小巧、简单、高效、实用。 许多学科的研究工作范式早已是 数据驱动 。在过去的几年时间里,我给你介绍过不少获取数据的方法。开放数据获取和 API 数据读取更为简单一些,相对而言爬虫就有些复杂。所以我 详细介绍使用编程从头做爬虫的教程并不多 ,而更希望给你介绍一些更为简便的方式,例如 这篇 。 自从有了大语言模型,我们都看到了一个更加智能时代的来临。 我也给你介绍过利用 Code Interpreter 等方式替你编程采集数据的方法 ,这样你就不用自己手动写代码来抓取数据了。 最近给你介绍的样例是一个定制化的 GPT,是有人专门做好放在 GPTS Store 里面供大家使用的。 在这篇文章里,我给你演示了用它来采集我们系的教师介绍网页 。 从这个 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览