专栏名称: 看雪学苑
致力于移动与安全研究的开发者社区,看雪学院(kanxue.com)官方微信公众帐号。
今天看啥  ›  专栏  ›  看雪学苑

专为在个人设备本地运行而设计,苹果推出小型开源AI模型OpenELM

看雪学苑  · 公众号  · 互联网安全  · 2024-04-30 18:06
科技巨头苹果公司最近又新推出了一款名为OpenELM的开源大语言模型,与市面上其他LLM产品不同的是,OpenELM设计为直接在本地设备上运行,而无需云计算。以往LLM产品常为用户所诟病的一点就是隐私保护和数据安全,而通过将数据保留在本地进行处理,毫无疑问能够保障更高的安全性。据了解,OpenELM系列有八个模型,其中一半使用苹果的CoreNet库进行了预训练(原始模型),另一半经过了特定指令微调以增强其效用(更适合开发AI助手和聊天机器人),所有八款OpenELM模型都能处理至多2048词。这一系列模型现在可通过Hugging Face Hub(一个供AI开发人员分享及合作的热门平台)访问。这些模型的其中一个显著特点是它们使用了分层缩放策略,优化了Transformer 模型各层之间的参数分配。这种方法不仅节省了计算资源,还提高了在相对较小数据量上的训练性 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照