#开源

awesome-huge-models - 大型AI模型最新动态与开源资源汇总
deep learning模型LLM开源AI训练大模型Github开源项目
详尽介绍大型AI语言模型最新进展及开源资源,包括训练代码、数据集和预训练权重。收录Baichuan、Falcon、OpenLLaMA等模型,并关注开源与分布式训练框架如PyTorch和XLA生态。提供全面资源链接,帮助研究人员和开发者了解当前AI模型的最前沿动态。
connery-sdk - 创建AI插件和操作的开源SDK与CLI
Connery SDK插件开发CLI工具JavaScript API开源Github开源项目
Connery SDK是一个集成SDK和CLI的NPM包,专为开发AI插件和操作而设计。CLI简化了开发流程,而SDK提供的JavaScript API用于定义和打包插件。插件服务器处理授权、输入验证和日志记录,使开发者专注于操作逻辑,各种客户端可以通过统一的标准API与操作进行交互。
llm-leaderboard - 为LLM模型提供的全球性能排行榜
LLM-Leaderboard语言模型榜单开源评估指标Github开源项目
由社区合力打造的LLM模型排行榜,提供交互式仪表板和丰富的性能比较。用户可查看各模型在Chatbot Arena Elo、HellaSwag、HumanEval-Python、LAMBADA等指标上的表现。项目特别关注开源模型的本地部署和商业应用,欢迎各类贡献和修改。
infra - 开源云基础设施,专为AI代理打造
E2B基础设施AI代理云运行时开源Github开源项目
E2B Infra是一个云运行时平台,通过提供SDK和CLI,用户可以定制和管理不同环境以运行AI代理。主要组件包括API服务器、实例内部守护程序及环境管理和构建的Nomad驱动程序。目前系统使用Terraform在GCP上部署,并计划进一步优化部署流程。
AMchat - 解答高等数学问题的大语言模型
AMchatInternLM2-Math-7B高等数学模型微调开源Github开源项目
AMchat是一种针对高等数学问题设计的大语言模型,基于InternLM2-Math-7B,通过xtuner微调,集成了丰富的数学知识和高等数学习题解答。AMchat支持多种部署方式,包括本地、Docker和OpenXLab,方便用户快速使用。该项目定期更新,包括新版本模型的微调和改进,以及参与创新竞赛,展示其在高等数学领域的应用潜力。
lechat-pro - 开源AI聊天工具,支持多种模型API集成
LeChatKimiChatUniAIAI模型开源Github开源项目
LeChat是一个基于UniAI开发、受KimiChat启发的开源聊天工具,支持Moonshot、OpenAI GPT和百度文心等多种AI模型。与KimiChat不同,LeChat完全由个人维护且代码开源。项目功能覆盖文档上传解析、图像识别、图像生成和图表绘制,并允许用户灵活选择和集成多种模型,适合不使用商业模型的开源爱好者。
beikeshop - 开源跨境电商平台,支持多语言和货币
BeikeShop跨境电商系统Laravel开源插件化Github开源项目
BeikeShop 是基于 Laravel 开发的开源跨境电商系统,主要提供商品管理、订单管理、支付和物流等功能。系统100%开源,支持多语言和多货币,无佣金和手续费。易于维护和扩展,拥有丰富的插件市场和简单易用的操作界面。BeikeShop 为用户提供优质的独立站解决方案,方便快速上线电商网站。
minimal-chat - 轻量级多语言聊天应用,支持本地与自定义模型
MinimalChat开源语言模型PWA支持DockerGithub开源项目
开源轻量级聊天应用,支持GPT-4 Omni等多种语言模型和本地/自定义模型端点,具备移动PWA支持。可通过Docker自托管,能转换和编辑消息,支持语音互动、Markdown和代码高亮,并集成DALL-E 3。提供导入导出对话功能,兼容Open AI响应API端点,支持离线使用,对话本地存储确保安全。
selefra - 开源的多云与SaaS策略分析工具
Selefra开源多云分析SaaS策略即代码Github开源项目
这个开源软件使用政策即代码的方式,支持AWS、GCP、Azure等30多项服务的多云与SaaS环境分析。用户可以通过SQL和YAML编写自定义策略,整合多云配置数据,使用VCS进行版本控制,并通过自动化任务确保合规、安全和成本优化。Selefra还集成了GPT模型,提供安全、成本和架构检查建议,帮助用户更好地管理云资源,提升安全性,降低成本,优化架构。
rasa - 开源框架Rasa,便捷实现文本与语音对话自动化
Rasa开源对话机器人机器学习自动化Github开源项目
Rasa 是开源的机器学习框架,用于自动化处理文本和语音对话。支持在Facebook Messenger、Slack、Google Hangouts、Microsoft Bot Framework 等平台上构建上下文助手,以及创建Alexa Skills 和Google Home Actions等语音助手。Rasa 的助手能够进行层次化对话,利用上下文实现有意义的交流和可扩展的对话能力。
MiNLP - 迈向智能文本解析的先进中文自然语言处理平台
MiNLP自然语言处理中文分词开源结构化解析Github开源项目
小米自然语言处理平台(MiNLP)涵盖词法、句法和语义分析模块,已在公司业务中广泛应用。MiNLP-Tokenizer中文分词工具自2020年11月开源以来不断优化。2021年计划开源词性标注和命名实体识别工具,并逐步开源句法和语义分析工具,致力于打造功能领先的NLP平台。duckling-fork-chinese专注于中文结构化解析,广泛应用于小爱生产环境,尤其在数字和时间解析方面表现出色。
refinery - 自然语言数据管理和标注的开源解决方案
人工智能自然语言处理开源Github开源项目refineryKern AI
开源工具refinery帮助数据科学家管理和提升自然语言处理项目的数据质量。通过半自动化标注和数据监控,提高数据标注效率。支持Hugging Face和spaCy集成,提升处理速度与质量。旨在优化单人开发者与团队的协作,确保训练数据的可靠管理,并提供多语言文本的新分析视角,使NLP模型构建更加快捷高效。
OpenGPTAndBeyond - 开源类ChatGPT模型的实现与发展概述
ChatGPTLLaMAGPT-3开源大语言模型Github开源项目
自LLaMA权重泄露和斯坦福小羊驼取得显著成果以来,开源社区对开发ChatGPT级别的大语言模型充满希望。页面详细记录了从复刻到超越的整个过程,包括基础模型、领域模型、训练、推理、多语言支持、多模态技术等各方面的进展。此外,还提供了丰富的开发和实施指导,从数据准备到低成本推理,并介绍了多个著名开源模型如LLaMA、BLOOM、GPT-J等。它是研究者和开发者理解和推进大语言模型开源发展的全面资源。
vectorflow - 高效、容错的开源码向量嵌入处理流程
VectorFlow开源向量嵌入高吞吐量API端点Github开源项目
VectorFlow 提供高效、可靠的 API 端点,能够快速处理和存储大量原始数据的向量嵌入。支持多种文本格式(如 TXT、PDF、HTML、DOCX),推荐在生产环境中使用 Kubernetes 部署。用户可以通过 Python 客户端或 Docker-Compose 快速本地运行。项目当前为 MVP 版本,具备重试功能、集成 AWS S3 和自定义块校验 Webhook 等特性。访问官方文档或加入社区以了解更多信息及使用案例。
gpt-scrolls - 开源集合的安全GPT-3提示词库
gpt-scrollsOpenAI APIGPT-3开源自动化Github开源项目
gpt-scrolls是一个开源项目,提供安全有效的GPT-3提示词库。用户可以自由地贡献和使用提示词,通过OpenAI API运行,支持pip安装或本地环境运行。项目注重提示词的高效性、有效性和安全性,旨在生成优质文本,并减少有害内容的出现。
Stage-Whisper - 跨平台免费开源音频转录工具
Stage-Whisper音频转录Whisper开源应用程序Github开源项目
Stage Whisper是一款免费开源的音频转录应用,基于OpenAI的Whisper模型,提供精确的音频文件转录。它拥有直观的图形界面,用户可以轻松存储和编辑转录内容。该项目旨在让非技术用户也能方便地使用Whisper的强大功能。适用于MacOS、Windows和Linux多平台,目前正进行重大改进,测试版即将发布。
choco-builder - 开源LLM框架,简化软件生命周期管理与生成辅助工具
ChocoBuilder开源LLM 应用SDK依赖管理Github开源项目
ChocoBuilder 是一款简化软件开发生命周期及生成助手的开源LLM框架。支持多种集成方式,包括JVM项目、RAGScript和本地部署,并提供Pinecone和ElasticSearch模块。应用场景涵盖桌面IDE、服务器和安卓设备,通过领域驱动方法提升语义化代码搜索、测试用例生成及代码解释的效率。
eidolon - 帮助设计和部署代理服务的开源代理服务SDK
Eidolon开源代理服务开发者工具模块化Github开源项目
Eidolon是一个开源SDK,帮助开发者设计和部署代理服务。内置HTTP服务器简化了部署过程,接口定义清晰,支持代理间的简易通信。模块化设计允许组件的定制和便捷的升级,无供应商依赖。Eidolon适应快速变化的AI环境,支持代理间通信、组件替换和结构化输入。该项目完全开源,欢迎各类贡献者参与。
npi - 提供工具使用API,使AI代理能够操作和交互多种软件和应用
NPiAI工具开源APIPythonGithub开源项目
NPi是一个开源平台,提供工具使用API,使AI代理能够操作和交互多种软件和应用。目前NPi正在积极开发中,未来版本的API可能会变化。用户可以通过命令行工具体验NPi,访问在线演示、示例和文档,学习使用和构建NPi工具。还可以加入Discord社区,参与NPi的发展。安装npiai包,即可轻松启动并创建首个NPi工具,如计算Fibonacci数。
insanely-fast-whisper-api - 音频转文字的高速开源API,支持GPU云部署与并发处理
Whisper API转换音频开源DockerJigsawStackGithub开源项目
这是一款基于OpenAI Whisper Large v3的API,能够高速将音频转录为文字。此开源项目支持在任意支持GPU的云提供商上部署,内置说话人分离功能,提供易用的Fast API层、异步后台任务和Webhooks,优化了并发处理。支持任务管理、取消与状态查询,拥有安全的管理员认证访问。通过Docker可以轻松部署到包括Fly.io在内的多种VM环境,实现高效的生产用途。
nltk - 开源Python工具包促进自然语言处理研究
NLTK自然语言处理开源Python模块NLTK文档Github开源项目
NLTK是一个用于自然语言处理的开源Python工具包,包含模块、数据集和教程。适用于Python 3.8到3.12版本。访问nltk.org获取文档和贡献指南,支持开发。NLTK代码采用Apache 2.0许可,文档采用Creative Commons许可,语料库可用于非商业用途。
stackwise - 丰富的开源AI应用程序集合,带来更多创新解决方案
Stackwise开源AI应用合集社区MIT许可证Github开源项目
Stackwise 提供丰富的开源AI应用程序集合,致力于创新解决方案。用户可以通过贡献、反馈和建议来进一步提升项目。访问Stackwise官方页面,了解更多详情和加入活跃社区。
chatgpt-translator - 开源桌面翻译应用,可自动检测和翻译多种语言
ChatGPT Translator翻译开源多语言支持桌面应用Github开源项目
ChatGPT Translator是一款使用GPT语言模型的开源桌面翻译应用程序。自动检测源语言并支持多种语言翻译,支持自定义快捷键和API域名,兼容macOS、Windows和Linux系统。通过简单安装步骤即可快速开始使用,任何问题或功能需求可在GitHub上提交。
openkf - 开源智能客服系统,兼容多渠道与本地知识库
OpenKF智能客服系统开源OpenIM集成Github开源项目
OpenKF 是一款开源智能客服系统,支持本地知识库及多渠道整合。系统易于部署且便于二次开发,提供丰富功能及快速启动指南。采用MVC架构,文档详细,社区活跃,适用于对智能客服系统有需求的企业和开发者。
underthesea - 越南语自然语言处理开源工具包
开源项目Underthesea越南自然语言处理开源Python文本分类Github
越南语自然语言处理开源 Python 工具包,提供简便的 API 和预训练模型,支持词语分割、词性标注、命名实体识别、文本分类和依存句法分析。工具包遵循 GNU 通用公共许可证 v3.0,包含数据集和教程,适用于科研和开发。最新版本支持 LLMs 和基于提示的文本分类功能,用户可以通过 pip 安装。教程涵盖从句子分割到情感分析和语言检测等多种功能。
Canvas - 为Mac用户提供的DALL·E图像生成与编辑开源工具
CanvasDALL·E 3macOS 14.0OpenAI API开源Github开源项目
Canvas是一款适用于Mac的开源工具,支持使用DALL·E 2和DALL·E 3生成和编辑图像。工具具备图像编辑与变体功能(目前仅支持DALL·E 2),并提供生成图像的复制、保存和分享功能。需要macOS 14.0及以上版本和OpenAI API密钥。
datumbox-framework - Datumbox开源机器学习和统计框架
开源项目Datumbox机器学习框架Java开源Apache许可证Github
Datumbox是一个Java编写的开源框架,支持多种机器学习算法和统计方法,能够处理大规模数据集。它包含已实现的多种算法、预训练模型和丰富的代码示例,帮助用户快速进行情感分析、主题分类、垃圾邮件检测等任务。该框架使用语义版本控制,最新版本可通过Maven Central获取。用户可以通过官方博客和示例了解更多使用方法。有关Bug报告或代码贡献,请访问GitHub仓库。
machinelearning-samples - 专为.NET开发者设计的跨平台的开源机器学习框架
ML.NET跨平台开源机器学习MLOpsGithub开源项目
ML.NET是一个跨平台的开源机器学习框架,专为.NET开发者设计。它提供丰富的样例和教程,涵盖二分类、多分类、推荐系统、回归、时间序列预测、异常检测和聚类等任务,方便开发者将机器学习模型集成至现有或新建的.NET应用中。项目还提供了完整的端到端应用示例,包括Web和桌面应用,扩展了机器学习的实际应用场景。
sematic - 开源的机器学习平台,支持ML工程师和数据科学家使用Python编写并运行复杂的端到端流水线
Sematic机器学习PythonKubernetes开源Github开源项目
Sematic是一个开源的机器学习平台,支持ML工程师和数据科学家使用Python编写并运行复杂的端到端流水线。无论在本地计算机、云虚拟机还是Kubernetes集群上执行,Sematic都可以高效利用云资源。它具有易于上手、端到端可追溯性、本地与云一致性和高可重复性等特点,可在无需部署或额外基础设施的情况下开始使用,所有流水线步骤都可以在web仪表盘上监控和可视化,适用于优化不同计算资源。
DL-Simplified - 为深度学习领域的贡献者提供从入门到高级的项目集
Deep LearningMachine Learning开源项目贡献数据分析Github开源项目
DL-Simplified 资源库为深度学习领域的贡献者提供从入门到高级的项目集。该库包括按模板组织的数据集、图片、模型文件和依赖。用户可浏览问题区、fork仓库、创建PR等方式参与。深度学习通过多层神经网络处理大量数据,实现不同级别的数据抽象。了解最新的开源活动和参与方法,及项目成就与贡献者。
pycaret - 开源的低代码Python机器学习库,能够简化和自动化机器学习工作流程
PyCaret机器学习低代码Python开源Github开源项目
PyCaret是一个开源的低代码Python机器学习库,能够简化和自动化机器学习工作流程。通过减少代码量,PyCaret使实验更高效、更快速。它支持scikit-learn, XGBoost, LightGBM, CatBoost等多种机器学习框架,用户可以通过少量代码完成模型训练、评估和预测。无论是经验丰富的数据科学家,还是对低代码解决方案感兴趣的用户,PyCaret都是理想选择。
featureform - 使数据科学家能够定义、管理并服务于机器学习模型的特征的虚拟特征库
Featureform数据科学特征存储机器学习开源Github开源项目
Featureform 是一个虚拟特征库,使数据科学家能够定义、管理并服务于机器学习模型的特征。它通过协调现有基础设施,将变换、特征、标签和训练集标准化,促进团队协作和资源共享。Featureform 支持从个人数据科学家到大型企业团队的多种应用场景,并提供内置合规支持,包括角色访问控制和审计日志。该开源项目兼容现有数据基础设施,适用于本地和云端部署。
flow-forecast - 开源时间序列深度学习框架,支持最新模型和云端集成
Flow Forecast深度学习时间序列预测transformer开源Github开源项目
Flow Forecast 是一个开源时间序列预测深度学习框架,提供最新的Transformer、注意力模型、GRU等技术,并具有易于理解的解释指标、云集成和模型服务功能。该框架是首个支持Transformer模型的时间序列框架,适用于流量预测、分类和异常检测。
blindai - 确保数据隐私的开源AI模型查询与部署工具
BlindAIAI隐私开源数据保密Mithril SecurityGithub开源项目
BlindAI是一款开源AI隐私解决方案,允许用户查询流行AI模型或部署自有模型,确保数据在硬件强化的可信执行环境中始终保密。通过Python库,用户可轻松使用BlindAI API查询Mithril Security托管的AI模型,或利用BlindAI Core技术安全部署自有模型。虽现暂不积极维护,仍适用于非敏感数据处理。
speech_dataset - 多语言语音识别与合成数据集详细介绍及应用
语音识别语音合成数据集开源多人语音识别Github开源项目
此页面总结了多语言语音数据集,包括中文、英文、日语、韩语、俄语等。涵盖了语音识别、语音合成、说话人识别和分离等应用领域,详细描述了每个数据集的时长、下载地址及其具体用途,帮助用户快速找到符合科研或项目需求的语音数据。
DevChat - 开源AI编程助手
AI开发辅助编程AI工具DevChat智能编程工具开源AI编码助手IDE插件热门
DevChat 编程助手是一个开源AI编程工具,通过智能编码提示和问题解决方案提升开发效率。它支持多个流行IDE和多种语言模型,轻松处理复杂编程任务。无论文档编写、错误调试还是代码优化,DevChat 都能有效提高工作效率,简化工程标准。