|
关于post-training和一些思考 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
国产GPU公司:传原地解散 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
AMD英特尔高通与近30家中国力量同台!2024全球AI芯片峰会下周举行,议程公布 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
大模型SFT的局限性 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
【小白必备】Meta祭出三篇最详尽的LLaMA微调指南 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
字节跳动成立大模型研究院,零一万物、面壁智能前核心成员已加入 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
一文剖析模型压缩(量化、稀疏)经典算法 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
基于 NVIDIA TensorRT-LLM 的大语言模型调度方法 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
李沐重返母校上海交大,从LLM聊到个人生涯 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
从Qwen2、LLaMA3.1、Gemma2等谈LLM预训练和后训练新范式 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
一文了解英伟达Nvlink的各类知识点 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型变小的秘密,如何软硬件齐抓,中国科学院10余年研究实践成果都在这本书里! 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
IntactKV:保持关键词元无损的大语言模型量化方法 吃果冻不吐果冻皮 · 公众号 · 大数据 科技自媒体 · 3 月前 · 访问文章快照 |
|
大模型量化技术原理:FP8 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
快速了解国产AI生态平台-海光DTK 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |