今天看啥  ›  专栏  ›  DAOSquare

Data DAOs:迈向用户拥有的互联网之路

DAOSquare  · 公众号  · 互联网安全 科技自媒体  · 2024-09-19 09:00

主要观点总结

文章提出了一个用户拥有的基础模型概念,该模型使用私人数据而非公开抓取的数据进行训练。文章还讨论了平台锁定开发人员API的趋势,以及个人用户仍然可以访问自己的数据的机会。此外,文章还介绍了数据DAO的作用,它允许用户汇集和管理他们的数据,并用数据集特定代币奖励贡献者。

关键观点总结

关键观点1: 用户拥有的基础模型

使用私人数据训练基础模型,可以提高模型的质量和性能。

关键观点2: 平台锁定开发人员API的趋势

Reddit和Twitter等平台已经意识到其平台数据的价值,并采取行动限制数据访问。

关键观点3: 个人用户访问自己的数据的机遇

尽管平台锁定了数据访问,但个人用户仍然可以访问和导出自己的数据。

关键观点4: 数据DAO的作用

数据DAO是一个去中心化的实体,允许用户汇集和管理他们的数据,并用代表特定数据集所有权的数据集特定代币奖励贡献者。

关键观点5: 集体数据的力量

通过集体行动,用户可以拥有并管理由他们的数据帮助创建的AI模型的一部分。


文章预览

2022 年,我(anna)撰写了 一份提案,提出了一个用户拥有的基础模型 ,该模型使用私人数据而不是从互联网上公开抓取的数据进行训练。我认为,虽然可以使用公共数据(例如 Wikipedia、4Chan)来训练基础模型,但要将它们提升到一个新的水平,您需要高质量的私人数据,这些数据仅存在于需要权限或登录才能访问的孤立平台(例如 Twitter、个人消息、公司信息)中。  这一预测正在开始实现。Reddit 和 Twitter 等公司已经意识到其平台数据的价值,因此他们锁定了开发人员 API(1、2 ) , 以防止其他公司自由地使用其文本数据训练基础模型。  这与两年前相比发生了巨大变化。风险投资人 Sam Lessin 总结了这一变化: “[平台] 只是把这些垃圾扔到后面,没有人看管,然后突然间,你会觉得,哦,该死,那些垃圾是金子,对吧?我们得到了很多。我们必须 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览