文章预览
作者:朱小五 本文转自公众号:凹凸玩数据 前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司。 意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com/deathCompany) , 统计了2000-2019年之间比较出名的公司“死亡”数据。 小五利用python将其中的死亡公司数据爬取下来,借此来观察最近十年创业公司消亡史。 获取数据 F12,Network查看异步请求XHR,翻页。 成功找到返回json格式数据的url, https://www.itjuzi.com/api/closure?com_prov= _status= = = 1 不了解json的读者可以看 【 python玩转Json数据 】 , 部分爬虫代码(完整代码见文末下载地址): def main () : data = pd.DataFrame(columns=[ 'com_name' , 'born' , 'close' , 'live_time' , 'total_money' , 'cat_name' , 'com_pro
………………………………