文章预览
中美两国在领先科技AI大模型领域,正在展开激烈的科技竞赛。未来的决胜因素,定格在算法、算力和数据三个具体赛道。 一直以来,大量业内人士更关注算法、算力因素。原因不难理解,算法是硬核科技,中国落后美国至少半年以上;算力背后是芯片竞争,中国是被规则限制的一方,未来得靠自力更生。然而,随着时间推进,数据的重要程度以及短板,被越来越多的业内人士提及。 “中文大数据现有的一些短板,正在成为我国大模型发展的资源瓶颈。”北京智源人工智能研究院副院长兼总工程师林咏华,近日接受 《凤凰WEEKLY财经》 采访时表示。她近半年已多次在媒体上表达此观点。 “数据的数量和质量,决定AI大模型一半以上的认知。据我所知,我国大部分AI大模型训练所需的中文数据语料较为短缺,中文语料占英文开源语料的十分之一甚至
………………………………