专栏名称: 张俊林say
自然语言处理
今天看啥  ›  专栏  ›  张俊林say

不用试中文不太行,其实405B的正确用法不是用来提供服务,而是用-20240725121843

张俊林say  · 微博  ·  · 2024-07-25 12:18

文章预览

2024-07-25 12:18 本条微博链接 不用试中文不太行,其实405B的正确用法不是用来提供服务,而是用来蒸馏应用的基座模型,来提升基座模型能力。毕竟用闭源模型蒸馏成本太高了。当然,405b中文化方面需要改进。// @如影随行忙着 :有没有体验的网址。个人没有设备跑得动 LLama 3 405B模型效果已经赶上目前最好的闭 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览