专栏名称: 51CTO技术栈
有趣 | 有料 | 有内涵,为您提供最优质的内容,愿我们一起悦享技术,成就人生。
目录
今天看啥  ›  专栏  ›  51CTO技术栈

用Python爬了知乎“神回复”,笑得根本停不下来

51CTO技术栈  · 公众号  · 程序员  · 2018-11-11 08:00

文章预览

“ 知乎上经常会有很多令人忍俊不禁的神回复,初看之下拍案叫绝,细思之下更是回味无穷。本文就来介绍下如何爬取知乎的神回复,揭晓其背后的原理。 知乎神回复都有些什么特点呢?我们先来观察一下,如下图: 大家看出什么规律了么?短小精辟有没有?赞同很多有没有? 所以爬取知乎神回复我们只要爬取那些赞同多又字数少的回答就可以。 简单的两个步骤就能实现,第一步爬取知乎回答,第二部筛选回答。是不是很 easy? 爬取知乎回答 第一步我们爬取知乎上的回答。知乎上的回答太多了,一下子爬取所有的回答会很费时,我们可以选定几个话题,爬取这几个话题里的内容。 下面的函数用于爬取某一个指定话题的内容: def   get_answers_by_page (topic_id, page_no) ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览