专栏名称: 网信浙江
浙江省互联网信息办公室主办,围绕浙江网络安全与信息化工作,提供最权威、最前沿、最全面的信息服务,搭建有态度、有深度、有温度的发布平台,创建可思考、可体验、可分享的交流空间。
今天看啥  ›  专栏  ›  网信浙江

“喂”给人工智能的真实数据终将耗尽 合成数据能否让AI模型精确可靠?

网信浙江  · 公众号  ·  · 2025-01-22 11:52
    

文章预览

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。   澳大利亚“对话”网站在本月稍早时间报道中指出,合成数据具有诸多优势,但过度依赖合成数据也可能削弱AI的精确性和可靠性。 图片来源: 物理学家组织网    合成数据应运而生   以往,科技公司主要依赖真实数据来构建、训练和改进AI模型。真实数据是指由人类创建的文本、视频和图像。它们通过调查、实验、观察或挖掘网站和社交媒体等途径被收集而来。   真实数据因蕴含真实事件以及其场景和背景而极具价值,但其并非尽善尽美。它可能掺杂拼写错误、不一致或无关 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览