专栏名称: OpenMMLab
构建国际领先的人工智能开源算法平台
今天看啥  ›  专栏  ›  OpenMMLab

安卓端侧大模型MLC-LLM部署全攻略:以InternLM2.5-1.8B为例

OpenMMLab  · 公众号  ·  · 2024-08-13 18:04
    

主要观点总结

本文介绍了如何使用MLC-LLM将InternLM 2.5-1.8B-Chat模型部署到安卓手机上的步骤,包括环境准备、模型转换、生成配置、打包运行等流程。文章还提到了在部署过程中可能遇到的问题和解决方案。

关键观点总结

关键观点1: 环境准备

包括安装Rust、Android Studio和设置环境变量等步骤。

关键观点2: 模型转换

使用mlc_llm工具进行模型参数转换和量化,生成适用于安卓平台的模型。

关键观点3: 生成配置

使用mlc_llm工具生成配置,处理tokenizer等。

关键观点4: 打包运行

使用mlc_llm工具进行打包,创建签名,修改gradle配置,最后运行编译命令生成apk安装包。

关键观点5: 额外信息

介绍了上海人工智能实验室主办的书生大模型实战营的相关信息,以及报名方式和课程特色。


文章预览

本文来自社区投稿,作者 Tim MLC-LLM 是一个机器学习编译器和高性能大型语言模型部署引擎。该项目的使命是让每个人都能在自己的平台上开发、优化和部署 AI 模型。 InternLM 2.5 是上海人工智能实验室发布的新一代大规模语言模型,相比于之前的版本,InternLM 2.5 支持百万长文,推理能力开源领先。 本文将带大家手把手使用  MLC-LLM 将 InternLM2.5-1.8B-Chat 部署到安卓手机上。 https://github.com/InternLM/InternLM (文末点击阅读原文可直达, 觉得好用欢迎 star) 首先我们来看一下最终的效果~ 1. 环境准备 1.1 安装 rust 可参考 https://forge.rust-lang.org/infra/other-installation-methods.html#which 此处使用了国内的镜像,如下列命令,当出现选项时选择 Enter 安装。 export RUSTUP_DIST_SERVER=https://mirrors.ustc.edu.cn/rust-static export RUSTUP_UPDATE_ROOT=https://mirrors.ustc.edu.cn/rust-static/rustup curl --pro ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览