专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
目录
今天看啥  ›  专栏  ›  AINLP

Google最新开源大语言模型:Gemma 2介绍及其微调(上篇)

AINLP  · 公众号  ·  · 2024-07-21 17:30
    

文章预览

引言 简介 Gemma 2模型介绍 架构设计 训练方法 后训练优化 关键发现:知识蒸馏的影响 性能评估 使用 体验:Hugging Chat 如何提示 Gemma 2 基于Hugging Face Transformers 结论与展望 模型汇总 引言 Google 最近谷歌发布了开源大语言模型 Gemma 2,目前可以在 huggingface 上找到 4 个开源模型(2 个基础模型和 2 个微调模型)。今天这篇小作文主要介绍Gemma 2的一些技术特点及其使用初体验,下一篇小作文将介绍如何微调Gemma 2模型。 技术报告原文:https://storage.googleapis.com/deepmind-media/gemma/gemma-2-report.pdf 简介 2024年6月27日,Google DeepMind发布了Gemma 2,这是Gemma系列轻量级开放语言模型的最新成员。Gemma 2在架构和训练方法上都有重大创新,在多项基准测试中取得了显著进步,甚至可以与参数规模大2-3倍的模型相媲美。本文将对Gemma 2技术报告的主要内容进行解读,包括模型架构 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览