Project Icon

mlc-MiniCPM

Android设备上运行MiniCPM轻量级AI模型

mlc-MiniCPM项目基于MLC-LLM技术,实现了MiniCPM和MiniCPM-V模型在Android设备上的运行。该项目开发了Android应用程序,支持用户与AI模型进行文本和图像交互。通过4位量化技术,项目将模型压缩以适应移动设备资源,在保持性能的同时提高运行效率。

MLC-MiniCPM

英文版

基于MLC-LLM,我们在Android设备上运行MiniCPM和MiniCPM-V。

Android APK

  1. 安装MiniCPM 1.2B和MiniCPM-V 2.0 APK(旧版本可在此处找到:MiniCPM和MiniCPM-V APK

  2. 接受相机和照片权限:这些权限是为MiniCPM-V提供的,它可以处理多模态输入(文本+图像)

  3. 下载模型:(1) 按下载按钮 (2) 等待进度条填满 (3) 开始聊天

    注意:由于下载bug,目前两个模型无法同时下载。

  4. 与MiniCPM聊天:(1) 等待模型初始化,直到"准备聊天"弹出 (2) 输入并发送问题

  5. 与MiniCPM-V聊天:(1) 等待模型初始化,直到"准备聊天"弹出 (2) 上传图片 (3) 等待"图片处理完成"显示 (4) 输入并发送问题

    注意:图片处理可能需要一些时间。

  6. 演示:

请注意,在Android上运行的模型已被量化为4位,可能会损失一些性能。 未量化的模型可以在这里找到。

准备环境

按照https://llm.mlc.ai/docs/deploy/android.html准备所需环境。

对于从HuggingFace编译PyTorch模型部分,使用我们的GitHub仓库并按照以下说明安装我们修改版的mlc_chat。

mkdir -p build && cd build
# 生成构建配置
python3 ../cmake/gen_cmake_config.py && cd ..
# 构建`mlc_chat_cli`
cd build && cmake .. && cmake --build . --parallel $(nproc) && cd ..
# 安装
cd python && pip install -e . && cd ..

编译模型

将从HuggingFace下载的模型检查点放入dist/models

对于MiniCPM

MODEL_NAME=MiniCPM
QUANTIZATION=q4f16_1
MODEL_TYPE=minicpm
mlc_chat convert_weight --model-type ${MODEL_TYPE} ./dist/models/${MODEL_NAME}-hf/ --quantization $QUANTIZATION -o dist/$MODEL_NAME/
mlc_chat gen_config --model-type ${MODEL_TYPE} ./dist/models/${MODEL_NAME}-hf/ --quantization $QUANTIZATION --conv-template LM --sliding-window-size 768 -o dist/${MODEL_NAME}/
mlc_chat compile --model-type ${MODEL_TYPE} dist/${MODEL_NAME}/mlc-chat-config.json --device android -o ./dist/libs/${MODEL_NAME}-android.tar
cd ./android/library
./prepare_libs.sh
cd -

对于MiniCPM-V(视觉版本)

MODEL_NAME=MiniCPM-V
QUANTIZATION=q4f16_1
MODEL_TYPE=minicpm_v
mlc_chat convert_weight --model-type ${MODEL_TYPE} ./dist/models/${MODEL_NAME}-hf/ --quantization $QUANTIZATION -o dist/$MODEL_NAME/
mlc_chat gen_config --model-type ${MODEL_TYPE} ./dist/models/${MODEL_NAME}-hf/ --quantization $QUANTIZATION --conv-template LM --sliding-window-size 1024 -o dist/${MODEL_NAME}/
mlc_chat compile --model-type ${MODEL_TYPE} dist/${MODEL_NAME}/mlc-chat-config.json --device android -o ./dist/libs/${MODEL_NAME}-android.tar
cd ./android/library
./prepare_libs.sh
cd -

--sliding-window-size仅为手机设置以限制内存使用,可以根据您的手机情况设置更小或更大。

构建Android应用

进入android/目录并使用Android Studio构建应用。(按照https://llm.mlc.ai/docs/deploy/android.html操作)

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号