今天看啥  ›  专栏  ›  道明数字游牧生活

腾讯的“10亿角色扮演”项目到底在说什么?

道明数字游牧生活  · 公众号  ·  · 2024-07-03 09:57

文章预览

腾讯的AILab新发了一篇论文,本来准备昨天评论的,但因为觉得这个话题粗看起来会有点“敏感”,就放下了,今天一早重新翻了一下论文,还是认为有东西可讲,临时起意,还是更新一篇,而把本来准备讨论的话题延后。 做个小预告,下一个准备讨论的话题是关于“wearable ai”的。 首先,论文题目是《Scaling Synthetic Data Creation with 1,000,000,000 Personas》。大概意思就是如何利用10亿“角色特征”大规模的生产“生成数据”。 部分数据开源,项目地址 https://github.com/tencent-ailab/persona-hub 看题目,就大概能够联想到我认为有些“敏感”的点:因为这所谓的10亿角色其实是用真实存在的“web data”抽象出来的。纯技术和研究视角,这是一个非常棒的想法,而且就是大厂该去做的事情。但是从数据安全的视角,首先原始数据来源其实比较含糊,处理过程也缺乏细 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览