专栏名称: AI for Research
每天分享最新最热的Arxiv论文、一起来关注大模型、AIGC、AGI
今天看啥  ›  专栏  ›  AI for Research

苹果发布手机基础模型报告!LLM生成代码在Leetcode上的性能研究 | 近一年来大模型在低资源语言上的性能

AI for Research  · 公众号  ·  · 2024-08-01 20:53

文章预览

前言: 如果你想成为一只科学界的“独角兽”,那么看论文是必不可少的。只有掌握了最新的技术和理论,才能在这个竞争激烈的市场中脱颖而出,成为那只最闪亮的“独角兽”! 1. 苹果智能语言模型   标题: Apple Intelligence Foundation Language Models   机构: Apple   作者: Tom Gunter,  Zirui Wang,  Chong Wang   分析: 本文介绍了为苹果智能功能提供支持的基础语言模型,包括一个设计用于在设备上高效运行的约30亿参数模型和一个大型基于服务器的语言模型,适用于私有云计算。这些模型旨在高效、准确和负责任地执行各种任务。报告描述了模型架构、用于训练模型的数据、训练过程、如何优化推理以及评估结果。该论文强调了该论文在负责任AI方面的重点,并说明了原则在整个模型开发过程中的应用。   地址: https://arxiv.org/pdf/2407.21075 2. LLM生成代码 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览