今天看啥  ›  专栏  ›  爬虫赚钱(微博搜索)

爬虫赚钱(微博搜索)-20250106-1

爬虫赚钱(微博搜索)  · 微博搜索  ·  · 2025-01-06 00:00
    

文章预览

本条微博地址奔跑的鲲鹏AI量化小王今年刚过29
期货风暴 AI挖掘数据的能力到底有多强大
表面看AI对于数据的统计处理能力可以大量节约人力成本,事实上AI对数据的处理不仅仅是节约成本这么简单,更重要的是未知数据的挖掘能力。
我记得我们还是用爬虫代码的时候,那应该是AI他爷那一代吧,我看中了一家白酒企业准备投资,然后就开始分析其基本面的数据,连续十五年的三张表都没问题,显示企业经营状况良好。
但是最后数据处理的时候,不知道爬虫从什么地方抓出两组数据,一组是该企业酒糟出库数据,一组是该企业酒精入库数据,然后得出结论是这家酒很可能是勾兑而不是全部纯粮酿造并发出指标异常警示。
这让我大吃一惊,然后就找人实地考察了一番,没想到抓出来的数据是真的,可以证实最起码部分酒是勾兑的,并非厂家宣传纯粮酿造。
于是我就放弃了那个标的,后来那企业股价持续下跌,即便是白酒热的时候也没能突破历史高点。
还有一家高科技企业,自称拥有自己现代化的生产线,爬虫抓出这家企业的参保人数,和历次招聘数据,以及企业电费,水费等固定支出,发现这些数据在五年内基本上没大的变化,那就说明这家企业很可能是代工,所谓的自有生产线可能是代工企业的设备。
这样的案例频繁出现之后,我们就开始对数据进行分类,最显著的就是两个极端数据和两种常态数据,如果股价表现和基本面数据表现一致,就属于常态类似于白马,赚钱需要时间,缺乏爆发性。如果基本面数据和估计都表现很差,那就属于非正常警示,属于排除在自选列表之外的标的,两种极端数据则是抓转折的剪刀差,实战价值比较高,实际上到现在细分之后至少有那种不同状态,因为创新企业和传统企业的分析方法不一样。
这样的数据淘汰每年要进行至少两次,半年报和年报之后都要上模型跑,而硬件实际允许的话,最好是实时监测事件,这样能确保警示的及时性。
这种数据处理要让人工做的话,五千多家企业,你多少人工才能处理完,还能挖掘出表外数据!那是不可想象的工程量,但是对于大模型而言,这种数据挖掘就是几分钟的时间,从数据采集,清洗,到分析,出结论一条龙,人工只需要对红字和绿字结果进行必要的审核即可。

搜索微博更多关键词-爬虫赚钱
………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览