专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

一文详解模型权重存储新格式 Safetensors

AINLP  · 公众号  ·  · 2024-08-01 22:09

文章预览

在日常AI模型训练过程中,需要好的模型权重通常需要以一种格式存储在磁盘中。比如:目前最流行的AI框架 PyTorch 使用 pickle 格式存储模型权重文件。但 PyTorch 文档中有一段话说明如下: 使用 torch.load()  保存模型,除非 weights_only 参数设置为True (只加载张量、原始类型和字典),否则隐式使用  pickle  模块,这是不安全的。可以构造恶意的 pickle 数据,该数据将在 unpickling 期间执行任意代码。切勿在不安全模式下加载可能来自不受信任来源的数据或可能已被篡改的数据,仅加载您信任的数据 。为了规避类似的问题,新的权重存储格式 Safetensors 应运而生。 Safetensors 简介 Safetensors 是一种用于安全地存储张量的新格式,非常简单,但速度仍然很快(零拷贝)。它是  pickle  格式的替代品,因为, pickle  格式不安全,可能包含可以执行的恶意代码。 S ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览