专栏名称: Ai fighting

本公众号主要分享自动驾驶感知实战，从算法训练到模型部署。主要致力于3D目标检测，3D目标追踪，多传感器融合，Transform，BEV，OCC，模型量化，模型部署等方向的实战。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

ChatGLM: 从GLM-130B到GLM-4的系列大型语言模型

Ai fighting · 公众号 · · 2024-12-18 07:00

文章预览

ChatGLM ： A Family of Large Language Models from GLM-130B to GLM-4 All Tools ChatGLM: 从 GLM-130B 到 GLM-4 的系列大型语言模型摘要 : 我们介绍了 ChatGLM ，这是我们持续开发的大规模语言模型家族。本报告主要聚焦于 GLM-4 系列语言模型，包括 GLM-4 、 GLM-4-Air 和 GLM-4-9B 。它们是我们最强大的模型，集成了前三代 ChatGLM 的所有经验和教训。迄今为止， GLM-4 模型在中文和英文的十万亿个标注符号上进行了预训练，并辅以来自 24 种语言的小型语料库，主要为中英文使用进行了对齐。高质量的对齐通过多阶段后训练过程实现，包括监督微调和从人类反馈中学习。评估表明， GLM-4 在通用指标上与 GPT-4 相媲美甚至超越，如 MMLU 、 GSM8K 、 MATH 、 BBH 、 GPQA 和 HumanEval ；在指令跟随方面接近 GPT-4-Turbo ；在长上下文任务上匹敌 GPT-4 Turbo (128K) 和 Claude 3 ；在中文对齐上优于 GPT-4 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博