近期模型方面的几个趋势性变化

道明数字游牧生活 · 公众号 · · 2024-06-28 08:16

文章预览

临近暑假，大模型领域依然热闹纷呈。仅仅在过去24小时，Google发布了Gemma-2 27B，OpenAI发布了CriticGPT，用来给GPT修bug （当然，我们都用不了），Meta发布了LLM Compiler，编译优化器。各有各的突破点，但是都会偏技术层面多一些，所以，我就简单贴一下Claude 3.5读完后生成的总结性的网站结果。 CriticGPT，简单结论：修bug能力比人强很多。原文链接： https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf Gemma2，简单结论：知识蒸馏很有用（用大模型训练小模型）原文链接： https://storage.googleapis.com/deepmind-media/gemma/gemma-2-report.pdf LLM Compiler，简单结论，编译优化能力提升明显原文链接： https://scontent.fsin14-2.fna.fbcdn.net/v/t39.2365-6/448997590_1496256481254967_2304975057370160015_n.pdf?_nc_cat=106 =1-7 & _nc_sid=3c67a6 & _nc_ohc=4Yn8V9DFdbsQ7kNvgGo7Xn5 & _nc_ht=scontent.fsin14-2.fna =00_AYD9mqFqjw7LHQwMjVm5EoiPiX ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博