文章预览
网页中有很多人名,要批量提取出来。 先定位人名的源代码: https://time.com/7012748/sundar -pichai-2/ " class="hidden text-time-black md:block"> Sundar Pichai CEO, Google and Alphabet https://time.com/7012753/sasha- luccioni/ " class="flex flex-col gap-4"> https://api.time.com/wp-content /uploads/2024/09/TIME100-AI-2024-LEADERS_Sasha-Luccioni_RM-NEW.jpg?quality=85 =640 =640 =1 "> Sasha Luccioni AI & Climate Lead, Hugging Face 然后在deepseek中输入提示词: 你是一个Python编程专家,要完成一个爬取网页内容的任务,具体步骤如下: 在文件夹F:\aivideo 里面新建一个Excel文件,文件名为:TIME100AI2024.xlsx 打开网页: https:// time.com/collection/tim e100-ai-2024/ 定位class="my-12 lg:my-14"的所有div元素,在这个div元素中定位class="hidden text-time-black md:block"的a元素,提取a元素中h3元素的文本内容,写入Excel表格第1列;提取a元素中p元素的文本内容,写入Excel表
………………………………