专栏名称: 蓝点网
科技资讯、软件工具、技术教程,尽在蓝点网。蓝点网,给你感兴趣的内容!
目录
相关文章推荐
知产宝  ·  综合案例 | ... ·  4 天前  
IPRdaily  ·  AACA活动 ... ·  4 天前  
今天看啥  ›  专栏  ›  蓝点网

知乎故意乱码干扰必应/谷歌 看起来确实是阻止内容被抓取训练AI

蓝点网  · 公众号  ·  · 2024-06-28 16:36
    

文章预览

#科技资讯 知乎故意使用乱码干扰必应 / 谷歌等搜索引擎爬虫,看起来确实是为了阻止内容被抓取用于训练 AI。有网友发现知乎匹配关键词 spider 和 bot,检测到 UA 信息里包含这两个关键词就会返回乱码信息,显然这就是为了阻止其他搜索引擎抓取知乎的内容。对知乎来说现有数据是个巨大金矿,估计接下来某个时候就会传输某某公司与知乎达成协议可以获取内容用于训练 AI。 本周蓝点网提到有用户反馈称使用微软必应搜索和谷歌搜索发现存在不少知乎乱码内容 ,即搜索结果里知乎内容的标题和正文内容都可能是乱码的,但抓取的正文前面一些段落内容可以正常查看。 考虑到此前知乎已经屏蔽除百度和搜狗以外的所有搜索引擎爬虫 (蜘蛛 / 机器人) ,蓝点网猜测知乎应该是想通过乱码来干扰搜索引擎和其他爬虫,避免这些搜索引擎和爬虫抓取知乎内 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览