文章预览
项目简介 一款浏览器智能助手:cerebellum,基于Claude 3.5 Sonnet、Selenium WebDriver构建,可以完成网页自动化任务,可以用来抓取数据、网站自动化测试等 它能理解任务意图并根据当前网页状态和历史操作,决定下一步行动,用Sonnet分析网页内容和交互元素做出规划,如发生变化会调整策略
与浏览器原生集成,支持Chrome、Firefox、Safari、Edge等浏览器
能精确模拟用户行为,支持复杂的自动化场景 它是如何运作的 Web 浏览被简化为导航有向图。 每个网页都是一个具有可见元素和数据的节点。 用户操作(例如单击或键入)是在节点之间移动的边。 小脑从网页开始,旨在到达体现已完成目标的目标节点。 它使用LLM通过分析页面内容和交互元素来查找新节点。 LLM根据当前状态和过去的行动决定下一步的行动。 Cerebellum 执行LLM的计划操作,并将新状态反馈给LLM
………………………………