今天看啥  ›  专栏  ›  Dance with GenAI

AI爬取网页表格内容保存为excel

Dance with GenAI  · 公众号  ·  · 2024-10-09 20:16
    

文章预览

任务:网页上的表格内容下载保存为excel表格 在deepseek中输入提示词: 你是一个Python编程专家,写一个网页爬取的脚本,完成任务如下: 在F盘新建一个excel表格文件:Amplifypartnersportfolio.xlsx 打开网页:https://www.amplifypartners.com/portfolio, 定位所有的role="listitem"的div元素,在div元素中定位class="mob-name"的div标签,提取其内容,写入excel表格的第1列; 定位class="copy-wr"的div标签,提取其中 标签的文本内容,写入excel表格的第2列; 定位fs-cmsfilter-field="status"的div标签,提取其内容,写入excel表格的第3列; 定位class="mob-link"的div标签,提取其内容,写入excel表格的第4列; 定位第1个class="flex-vertical gap-4"的div标签, 找到所有的 标签, 提取每个 标签中的文本内容,过滤掉不需要的文本:“TEAM”和空字符串,然后写入excel表格的第5列; 定位第2个class="flex-vertical gap- ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览