专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

//@钱钱_P大数学病院患者:llama之类的原始模型训练语料英-20250204095112

宝玉xp  · 微博  · AI  · 2025-02-04 09:51
    

文章预览

2025-02-04 09:51 本条微博链接 // @钱钱_P大数学病院患者 :llama之类的原始模型训练语料英语是90%,所以很少从英语跑偏。openai他可能合成数据的时候为了照顾低资源语言能力额外做了非英语的扩张。以前其实也只是英语和中文这种强势语言相对稳定,我平常测试一些低资源语言经常说着说着变英语// @voidtide :这种确实挺常见的,是因为中文语料最多吗?还是说训练方式的问题?毕竟以前没有遇到过语言混乱的情况// @宝玉xp :不 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览