注册
登录
专栏名称:
蓝点网
科技资讯、软件工具、技术教程,尽在蓝点网。蓝点网,给你感兴趣的内容!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
知产宝
·
综合案例 | ...
·
4 天前
IPRdaily
·
聘!广州广电运通智能科技有限公司招聘「高级知 ...
·
4 天前
IPRdaily
·
AACA活动 ...
·
4 天前
今天看啥
›
专栏
›
蓝点网
知乎故意乱码干扰必应/谷歌 看起来确实是阻止内容被抓取训练AI
蓝点网
·
公众号
· · 2024-06-28 16:36
文章预览
#科技资讯 知乎故意使用乱码干扰必应 / 谷歌等搜索引擎爬虫,看起来确实是为了阻止内容被抓取用于训练 AI。有网友发现知乎匹配关键词 spider 和 bot,检测到 UA 信息里包含这两个关键词就会返回乱码信息,显然这就是为了阻止其他搜索引擎抓取知乎的内容。对知乎来说现有数据是个巨大金矿,估计接下来某个时候就会传输某某公司与知乎达成协议可以获取内容用于训练 AI。 本周蓝点网提到有用户反馈称使用微软必应搜索和谷歌搜索发现存在不少知乎乱码内容 ,即搜索结果里知乎内容的标题和正文内容都可能是乱码的,但抓取的正文前面一些段落内容可以正常查看。 考虑到此前知乎已经屏蔽除百度和搜狗以外的所有搜索引擎爬虫 (蜘蛛 / 机器人) ,蓝点网猜测知乎应该是想通过乱码来干扰搜索引擎和其他爬虫,避免这些搜索引擎和爬虫抓取知乎内 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
知产宝
·
综合案例 | 福建高院:二审改判!法院认定“福润斯”构成对“福斯”商标的侵权,判赔100万元
4 天前
IPRdaily
·
聘!广州广电运通智能科技有限公司招聘「高级知识产权工程师」
4 天前
IPRdaily
·
AACA活动 |2024AACA大会暨知鹰奖颁奖典礼精彩回顾
4 天前
中国认证认可
·
市场监管总局发布检验检测促进经济社会创新发展优秀案例
6 月前
板鸭生活通
·
西班牙准备了6万名军人,准备硬刚俄罗斯!
2 月前
中国农业银行宁夏分行
·
2024年,时光里的璀璨印记……
2 周前