Project Icon

Lamini

提供高精度LLM推理和微调服务的企业平台

Lamini是一个面向企业的大型语言模型平台,为软件团队提供快速开发和控制LLM的能力。平台内置最佳实践,可在海量专有文档上优化模型,提高性能并确保安全。Lamini支持本地和云端部署,是首个可在AMD GPU上运行并大规模扩展的LLM平台。目前已被多家大型企业和AI初创公司采用,实现了95%的准确率,查询处理能力是vLLM的52倍。

TinyLLM - 在本地硬件上构建小型LLM,支持多种模型和ChatGPT界面
ChatGPTGithubOllamaTinyLLMllama.cppvLLM开源项目
该项目帮助用户在消费级硬件上构建小型本地LLM,并提供类似ChatGPT的网页界面。支持通过Ollama、llama-cpp-python和vLLM搭建兼容OpenAI API的服务,允许访问外部网站、矢量数据库等。具备详尽的硬件要求和模型下载链接,方便用户快速上手并使用自定义提示进行互动。
Langtail - 简化AI应用开发的综合性工具平台
AI工具AI开发API部署LLM监控Langtail提示词调试
Langtail是一个面向AI应用开发的工具平台,集成了提示调试、测试运行和生产环境监控功能。平台提供playground、测试、部署和监控工具,帮助开发者快速迭代、优化大型语言模型性能,确保应用稳定。支持无代码操作,适用于各类用户,并提供API日志和性能指标,促进团队协作开发AI应用。
modelz-llm - 开源大语言模型推理服务器,支持本地和云端部署并兼容OpenAI API
GithubModelz LLMOpenAI兼容 API云原生开源LLMs开源项目自托管
Modelz LLM 是一款推理服务器,支持在本地或云端环境中运行开源大语言模型(LLM),如FastChat、LLaMA和ChatGLM,并兼容OpenAI API。用户可以通过OpenAI Python SDK或LangChain与模型交互,支持将不同LLM的Docker镜像部署在Kubernetes等云原生环境,便于开发者快速上手和灵活部署各种AI应用。
airllm - 在单个4GB GPU上运行70B大模型,无需量化和蒸馏
AirLLMGithubLlama3.1大语言模型开源项目推理优化模型压缩
AirLLM优化了推理内存使用,使70B大模型能在单个4GB GPU上运行,无需量化、蒸馏或剪枝。同时,8GB显存可运行405B的Llama3.1。支持多种模型压缩方式,推理速度可提升至3倍。兼容多种大模型,提供详细配置和案例,支持在MacOS上运行。
llm - LLM实验项目集合 探索大型语言模型应用
API密钥GithubLLM实验OpenAIPinecone开源项目虚拟环境
该开源项目提供了一系列LLM实验。内容包括虚拟环境设置、必要包安装以及API集成指南。通过这些实验,开发者可以深入了解大型语言模型的应用,探索AI文本处理和向量数据库技术。项目注重实践,为AI领域学习者提供了有价值的资源。
fastllm - 纯C++实现的跨平台大语言模型推理库
GPU加速Githubc++实现fastllm多平台大模型推理开源项目
fastllm是一个纯C++实现的大语言模型推理库,无第三方依赖,支持多平台部署。这个开源项目具有快速的推理速度,支持多种模型格式,可实现多卡部署和流式输出。fastllm兼容ChatGLM、Qwen、LLAMA等多种模型,提供Python接口和自定义模型结构功能。该项目适用于需要高效、灵活部署大语言模型的场景。
LM Studio - 支持多种大型语言模型的本地运行与下载平台
AI工具LM Studio人工智能大语言模型用户界面离线运行
LM Studio是一款简化开源大型语言模型(LLMs)使用的软件应用。支持在个人电脑上离线运行LLMs,如LLaMa、MPT和Gemma等,提供内置聊天界面和兼容OpenAI的本地服务器。用户可从Hugging Face仓库下载兼容模型文件,无需编程技能即可操作。支持多模型同时运行,兼容Apple Silicon Mac和支持AVX2的Windows/Linux PC。LM Studio通过直观界面,使AI技术更易于访问和管理。
JsonLLM - 为大型语言模型提供JSON格式交互的开发工具
AI工具JSONJsonLLM加载数据程序
JsonLLM是一款专为大型语言模型(LLM)设计的交互工具。该工具采用JSON格式构建和处理LLM请求,为开发者提供高效的操作和调用方式。通过结构化和标准化的通信方法,JsonLLM有望提升AI开发效率和代码可读性。尽管当前网站内容较少,这款工具仍展现出成为LLM交互领域重要解决方案的潜力。
aikit - 简化部署和优化大型语言模型的平台
AIKitDockerGithubKubernetesLocalAIOpenAI API开源项目
AIKit是一个全方位平台,专为快速部署、构建和微调大型语言模型(LLM)而设计。它支持OpenAI API兼容的推理和灵活的微调接口,无需GPU即可使用。AIKit还支持多模式模型、图像生成、多平台CPU和GPU加速推理以及Kubernetes部署,简化了开发流程并确保供应链安全,适用于各种环境。
rtp-llm - 大型语言模型推理加速引擎
CUDAGithubrtp-llm多模态输入大语言模型开源项目量化
rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎,广泛应用于支持淘宝问答、天猫、菜鸟网络等业务,并显著提升处理效率。该项目基于高性能CUDA技术,支持多种权重格式和多模态输入处理,跨多个硬件后端。新版本增强了GPU内存管理和设备后端,优化了动态批处理功能,提高了用户的使用和体验效率。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号