#ModelScope
EmoLLM学习资料汇总 - 心理健康大模型的开源项目
LangChain-ChatGLM-Webui学习资料汇总 - 基于LangChain和ChatGLM的本地知识库问答系统
3D-Speaker: 多模态说话人验证、识别与分割的开源工具包
深入探索Text-To-Video-Finetuning:使用Diffusers微调ModelScope的文本生成视频模型
深入解析sd-webui-text2video:将文本转化为视频的强大工具
modelscope
ModelScope简化了AI模型在推理、训练和评估方面的流程,支持CV、NLP、语音、多模态和科学计算等领域的应用。该平台提供统一接口和丰富的API层级,便于开发者轻松集成和使用700多种最新开源模型。适合初学者和专业人士快速上手,体验强大功能。
魔搭社区
魔搭社区是一个专业平台,旨在汇聚各领域机器学习模型,提供模型探索、推理、训练、部署和应用等一站式服务。设计简约,操作便捷,确保用户可以快速找到所需功能。直观的导航和详尽的文档支持帮助用户快速上手,推动机器学习技术的广泛应用。
LangChain-ChatGLM-Webui
LangChain-ChatGLM-Webui 是一个利用LangChain和ChatGLM-6B系列模型的Web界面,支持txt、docx、md、pdf等格式文件上传,适用于本地知识驱动的大模型应用。项目支持HuggingFace、OpenXLab等多个平台的在线体验,适合开发者快速部署多种大语言模型和嵌入模型。
KAN-TTS
KAN-TTS能够提供从零开始训练个性化文本到语音模型的能力。支持包括sam-bert和hifi-GAN在内的多种模型,并持续进行模型更新。支持多种语言,包括普通话、英语等。详尽的培训教程和在线演示可在官方网站查阅。如有疑问,欢迎联系我们。
EmoLLM
EmoLLM是一个心理健康大模型,旨在提升个体和群体的心理健康。通过微调InternLM、Qwen、Baichuan等多种LLM模型,实现认知、情感和行为分析。EmoLLM具备情感调节和评估功能,结合预防和干预措施,促进心理韧性。项目提供丰富的模型配置和开源资源,适用于日常使用及学术研究,提供全面的心理健康支持。
ms-swift
SWIFT是一款高效框架,支持超过300个大语言模型和50多个多模态大模型的训练、推理、评估和部署。它集成了NEFTune、LoRA+和LLaMA-PRO等先进技术,适用于研究和生产环境。框架还提供了易用的Gradio web-ui界面和详细文档,非常适合初学者和资深开发者使用。最新版本增加了对多种前沿模型和加速算法的支持,适用于广泛的应用场景。
phi3-Chinese
phi3-Chinese收录多种phi3训练变体,小体积高性能,适用于手机部署。提供Phi-3-mini-128k-instruct-Chinese中文版和其他英文原版模型的下载链接,并包含训练、推理和部署的详细教程。尽管目前版本存在词表过小和实际效果与预期不符的问题,但仍适用于轻量级垂直任务。
AdaSeq
AdaSeq是由阿里巴巴达摩院开发的一体化序列理解工具库,构建在ModelScope之上。支持词性标注、分块、命名实体识别、实体类型化、关系抽取等多种任务。提供丰富的前沿模型和训练方法,优于许多现有框架。该库使用简便,只需一行命令即可生成模型,支持自定义模型和数据集。适用于研究人员和开发者,项目处于快速开发阶段,并提供多语言、多领域的数据集和在线演示。
sd-webui-text2video
基于Auto1111的webui依赖,该扩展实现了ModelScope和VideoCrafter等text2video模型,无需登录即可使用。要求至少6GB的VRAM,支持不同帧数和分辨率的视频生成。项目包含多次更新,新增功能如VAE设置、提示权重和WebAPI,并支持LoRA训练。提供详细的模型下载指南,并欢迎社区的贡献与支持。