专栏名称: Datawhale
一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。
目录
今天看啥  ›  专栏  ›  Datawhale

一篇AI冬令营第一期的优秀学习笔记!

Datawhale  · 公众号  ·  · 2024-12-18 22:30
    

文章预览

 Datawhale冬令营  学习:Task01,作者:Reacal_子轩 前言 大模型是指具有大规模参数和复杂计算结构的机器学习模型。它们通常拥有数百万到数十亿的参数,需要大量的数据和计算资源进行训练和推理。大模型在深度学习领域中占据重要地位,能够处理复杂的任务,如自然语言处理、计算机视觉和语音识别等。  了解如何制作专属大模型 1、大模型制作平台 讯飞星辰 MaaS 平台,零代码低门槛领域精调,全栈工具链加速大模型效果定制。  2、数据集制作 我们常见的微调数据集需要符合 Alpaca 格式 。数据存储形式:通常以 JSON 文件格式存储。这样方便数据的读取、处理和在不同的机器学习框架中使用。例如一个简单的 Alpaca 格式的 JSON 数据示例如下:  [ { "instruction": "用“梦想”、“坚持”和“成功”这三个词组成一个句子。", "input": "", "outp ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览