#机器学习

ray-educational-materials - 提供Ray的教育资源,帮助规模化Python和机器学习任务
Python教育材料Github开源项目Ray分布式计算机器学习
提供丰富的教育资源,专注于Ray分布式计算框架,帮助扩展Python和机器学习任务,从笔记本电脑到集群处理。课程内容涵盖Ray核心功能、AI运行时、计算机视觉和NLP模型优化等,适合各层次学习者。加入社区,探索文档、参与讨论、提出问题和贡献代码,提升开发体验。
awesome-yolo-object-detection - YOLO目标检测开源项目与资源汇编
YOLO目标检测实时检测机器学习视觉AIGithub开源项目
提供YOLO目标检测的全面资源汇编。包含官方以及多个针对特殊任务或硬件的优化版本,涵盖YOLOv1至YOLOv7等系列。项目中还包括丰富的学习资源、应用示例及工具,为学者和开发者提供了解及使用YOLO技术的优质资料。
awesome-chatgpt - ChatGPT和GPT-3资源的合集
ChatGPTOpenAIAPI插件机器学习Github开源项目
探索ChatGPT和OpenAI GPT-3的官方应用、API工具、特色社区讨论和Chrome扩展。无论开发者或日常用户,均可深度利用这些资源,提升AI技术应用。
langup-ai - AI语音和视频互动集成方案
LangupB站AI助手直播机器学习Github开源项目
Langup-ai 是一个多功能AI机器人平台,专注于语音与视频交互。该平台支持多平台适配如哔哩哔哩,实现高效的实时交互功能。通过轻松的设定,用户可以快速启动AI驱动的互动式内容,适用于娱乐直播、视频回复及自动化私信交互,确保用户体验的便捷和稳定性。
paxml - 基于Jax的高效机器学习实验配置和运行框架
PaxmlCloud TPU机器学习Google性能优化Github开源项目
Paxml是一个基于Jax的开源框架,致力于机器学习实验的配置与运行。该框架支持云TPU VM快速部署,同时提供PyPI和GitHub的稳定及开发版本下载。Paxml还包含丰富的文档资源和Jupyter Notebook教程,支持GPU加速,并可广泛适用于不同开发者的需求,是推动机器学习实验项目高效发展的优选工具。
NLP-Tutorials - 从搜索引擎到预训练模型的全面教程
NLP自然语言处理机器学习深度学习神经网络Github开源项目
NLP教程全面介绍多种自然语言处理模型,涉及搜索引擎技术、词汇及句子理解,并深入探讨seq2seq、Transformer、BERT和GPT等先进模型,包括实用的代码示例和理论分析。
LLM-Prompt-Library - 专为大型语言模型设计的全方位提示库
LLM提示库语言模型编程帮助AI绘图机器学习Github开源项目
LLM-Prompt-Library 提供各类大型语言模型的提示集合,实现文本操作、医疗助手及代码生成等多场景应用。该项目以其实用性和活跃的社区支持为开发者提供价值,促进技术交流。
Open-Interface - 利用LLM实现计算机自驱动操作
Open Interface自驾电脑软件GPT-4V自动化机器学习Github开源项目
Open Interface通过向LLM后端(如GPT-4V)发送用户请求来实现计算机的全自动驾驶功能。系统通过模拟键盘和鼠标输入自动执行任务,并在必要时发送当前屏幕截图进行调整。此项目支持MacOS、Linux和Windows,并允许连接不同的LLM后端进行自定义配置,带来了提高效率和自动化的新选择。
neptune-client - 可伸缩的实验跟踪工具,简化团队基础模型训练
neptune.ai实验跟踪机器学习模型训练数据处理Github开源项目
Neptune 提供一款高效实验跟踪平台,适用于团队基础模型训练。用户可记录大量运行数据,实时对比实验结果。其灵活日志记录、自定义仪表板、多节点支持,加速训练监控和优化。支持25+框架集成,是MLOps理想工具。
voxelgpt - 自然语言驱动的计算机视觉数据查询插件
VoxelGPTAI查询FiftyOne数据处理机器学习Github开源项目
VoxelGPT 是基于 FiftyOne 的插件,结合大型语言模型和多模态模型,通过自然语言即可对数据进行过滤、排序、语义切片和查询。支持数据集、计算、工作区查询及机器学习问题,无需编写代码。提供实时演示和详细安装指南,助用户轻松从数据中获取价值。
upgini - 免费且低代码的自动化数据丰富工具
Upgini数据增强机器学习特征生成外部数据Github开源项目
提供免费且低代码的自动化数据丰富工具,帮助机器学习和AI模型从众多公开、社区和高质量外部数据源中轻松查找并添加相关特征。通过大语言模型(LLM)、GraphNN和循环神经网络(RNN)等技术优化数据源,提高模型精度。Upgini简化了特征搜索与丰富过程,支持多种监督学习任务,包括二分类、多分类、回归和时间序列预测,确保外部数据在机器学习流程中的稳定性。
gguf-tools - 处理和解析GGUF文件的实用工具库
GGUF机器学习模型比较量化APIGithub开源项目
该工具库正在开发中,专注于处理和解析GGUF文件。它提供详细的键值对和张量信息展示、文件比较和张量细节检查等功能。gguf-tools旨在为机器学习领域提供多种实现方案,帮助理解和使用GGUF格式,提升模型操作和分析的效率。该工具展示了如何在实际应用中使用库,并将来计划加入更多有趣且实用的示例和功能。
DeepWorks - 深度学习开源项目集锦
DeepWorks人工智能机器学习Data ScienceProdrampGithub开源项目
DeepWorks是一个覆盖广泛的深度学习开源项目和资源平台,包含数据处理教程、Gradio Tabbed UI开发、卫星图像处理、LLM开源模型、NeRF项目和生成式AI等。用户可以通过Prodramp YouTube频道获取更多数据科学、机器学习和人工智能相关视频。平台还包括多种深度学习工具和开发者指南,如OpenAI Whisper、Stable Diffusion及TorchStudio。非常适合希望深入学习和实践深度学习技术的开发者和研究人员。
BLIVA - 处理文本视觉问题的多模态LLM
BLIVA多模态文本富媒体视觉问答机器学习Github开源项目
BLIVA是一款简单有效的多模态大语言模型,专门处理富文本视觉问题。其在多个视觉问答基准中表现出色,并公开了模型权重和训练代码。结合FlanT5和Vicuna版本,BLIVA适用于多种商业用途并提升认知和感知任务性能。演示和安装教程也非常详细。
OpenML-Guide - 开源AI知识和资源的全方位指南
OpenML GuideAI深度学习机器学习开源Github开源项目
Open DeepLearning为AI学习者提供免费、高质量的课程、书籍、教程和研究论文,涵盖从基础到高级的概念,助力掌握最新的AI技术。无论是初学者还是专家,该开源项目旨在通过明确的学习路径简化学习过程。用户还可以通过GitHub、Discord和Twitter参与社区互动,贡献内容、改进资源和提出建议,提升学习效果。
Chat-With-Excel - 直接自然语言与表格数据互动,简化数据分析流程
Chat-With-Excel数据分析机器学习自然语言处理Google ColabGithub开源项目
Chat-With-Excel项目允许用户使用自然语言与表格数据交互,无需记忆公式或学习Pandas。用户可以通过Google Colab轻松运行数据分析任务,并与机器学习模型进行自然语言训练。即将上线Replit和Streamlit版本。更多更新请关注Anil Chandra Naidu Matcha的Twitter或YouTube频道。项目相关的其他示例和代码包括Chat with Website、Chat with PDF、Chat with Youtube及DiscordGPT。
EasyDeL - 多模型训练优化框架
EasyDeL机器学习JAXFlax模型训练Github开源项目
EasyDeL是一个开源框架,用于通过Jax/Flax优化机器学习模型的训练,特别适合在TPU/GPU上进行大规模部署。它支持多种模型架构和量化方法,包括Transformers、Mamba等,并提供高级训练器和API引擎。EasyDeL的架构完全可定制和透明,允许用户修改每个组件,并促进实验和社区驱动的开发。不论是前沿研究还是生产系统构建,EasyDeL都提供灵活强大的工具以满足不同需求。最新更新包括性能优化、KV缓存改进和新模型支持。
quickai - 简化复杂机器学习模型的实验过程
QuickAIPython机器学习卷积神经网络YOLOGithub开源项目
QuickAI 是一个 Python 库,简化了前沿机器学习模型的实验流程。支持 EfficientNet、VGG、ResNet 等图像分类模型和 GPT-NEO、Distill BERT 等自然语言处理模型。只需1-2行代码即可完成模型训练和评估,兼容 TensorFlow 和 PyTorch,并提供 Docker 容器便于环境配置。适用于各水平用户,助力快速推进机器学习项目。
chatgpt-failures - 深入解析ChatGPT和其他AI模型的失误案例,提供研究参考
ChatGPTNew BingAI故障机器学习人工智能Github开源项目
本页面提供ChatGPT及其他类似AI模型的失败案例分析,涵盖新Bing和ChatGPT在不同场景下的错误表现,如数学问题、常识错误、艺术创作失败和偏见示例。这些资料对其他模型的比较研究和创建测试、训练数据具有重要意义。
Transformers-for-NLP-2nd-Edition - BERT到GPT-4的Transformer模型详解
Transformers-for-NLP-2nd-EditionGPT-4BERTOpenAI API机器学习Github开源项目
本项目涵盖了从BERT到GPT-4的Transformer模型,提供了在Hugging Face和OpenAI环境下的微调、训练及提示工程示例。还包括ChatGPT、GPT-3.5-turbo、GPT-4和DALL-E的使用示例,包括语音到文本、文本到语音、文本到图像生成等内容。详述了GPT-4 API提示工程和最新平台更新,提供实用的指导与教程。
rasa - 开源框架Rasa,便捷实现文本与语音对话自动化
Rasa开源对话机器人机器学习自动化Github开源项目
Rasa 是开源的机器学习框架,用于自动化处理文本和语音对话。支持在Facebook Messenger、Slack、Google Hangouts、Microsoft Bot Framework 等平台上构建上下文助手,以及创建Alexa Skills 和Google Home Actions等语音助手。Rasa 的助手能够进行层次化对话,利用上下文实现有意义的交流和可扩展的对话能力。
awesome-huggingface - 综合NLP开源项目与Hugging Face集成工具
Hugging Facetransformers自然语言处理机器学习NLP工具包Github开源项目
该项目列出了多个优秀的开源项目和应用,均与Hugging Face库集成,为各类NLP任务提供有效的解决方案。内容涵盖官方库教程、NLP工具包、文本表示、推理引擎、模型扩展、模型压缩、对抗攻击、风格转换、情感分析、语法纠正、翻译、知识与实体、语音处理、多模态学习、强化学习、问答系统、推荐系统、评估工具、神经搜索、云支持和硬件支持等多个领域。此项目能够帮助用户找到并使用适合的工具和库,提升自然语言处理任务的效率和效果。
wit - 全球最大多语言多模态数据集,助力机器学习模型优化
WIT数据集多模态机器学习WikipediaGithub开源项目
Wikipedia-based Image Text (WIT) 数据集包括3760万张图片与文本对,涵盖108种语言和1150万独特图片。该数据集旨在支持多模态机器学习模型的训练,特别是在多语言环境下的有效性已得到广泛验证。WIT数据集获得了WikiMedia基金会的年度研究奖,并且现已开放下载,为研究人员和开发者提供了宝贵的资源和支持。
lingua-rs - 多语言检测库,支持75种语言,提供高精度文本分类和识别
Lingua语言检测自然语言处理Rust机器学习Github开源项目
此库可识别文本语言,适用于自然语言处理中的文本分类和拼写检查。相比其他工具,配置简便,适用于长短文本且准确度高,不使用外部API或服务,完全离线操作。目前支持75种语言,注重高质量检测,通过规则和统计方法实现,无需词典。测试数据显示它是目前最准确的语言检测库之一。
tribuo - 提供分类、回归、聚类、异常检测和多标签分类的Java机器学习库
TribuoJava机器学习分类回归Github开源项目
Tribuo是一个用于分类、回归、聚类、异常检测和多标签分类的Java机器学习库。它提供加载、特征处理和数据转换的完整解决方案,并包括评估所有预测类型的类。Tribuo支持通过配置文件重复构建模型,并允许模型序列化以便跨平台部署。该库还集成了TensorFlow、ONNX和XGBoost等流行机器学习工具,并兼容多种Java平台版本。该项目由Oracle Labs领导,欢迎社区贡献。
chatGPT-cheatsheet - 逐步指南,教您如何使用ChatGPT提示门户和API构建聊天机器人
ChatGPTAI机器学习自然语言处理APIGithub开源项目
本开源指南帮助新手和开发者理解ChatGPT和基础AI概念,涵盖从使用提示门户生成对话到通过API构建应用的详细步骤,包括创意生成、提取关键信息、编写有效提示、以及与其他工具集成的多种用例。提醒注意避免分享敏感信息。通过本指南,您将掌握如何高效利用ChatGPT进行各种任务。
ktrain - 轻量级的深度学习和AI工具包
ktrain机器学习深度学习TensorFlow Keras预训练模型Github开源项目
ktrain 是一个基于 TensorFlow Keras 的轻量级深度学习库封装,帮助用户快速构建、训练和部署各种机器学习模型。适用于文本、视觉、图表和表格数据,支持文本分类、图像识别、节点分类和因果推断等任务。无论是初学者还是有经验的研究人员,都能借助其简单的 API 和多种学习率策略,快速实现高效模型部署,支持导出到 ONNX 和 TensorFlow Lite。
LightAutoML - 自动化创建二分类、多分类和回归模型解决方案
LightAutoML自动机器学习模型创建机器学习分类Github开源项目
LightAutoML是一款自动化机器学习框架,专注于二分类、多分类和回归任务的模型创建。框架支持独立样本数据集处理,并运用AutoWoE库生成可解释模型。目前正在开发多表数据集和序列处理功能,还提供了GPU和Spark管道以提升计算效率。LightAutoML配有详细的文档和丰富的示例教程,适合多种机器学习需求,简化自动化模型开发。
Python-AI - 深度学习100例:机器学习与自然语言处理实用案例
深度学习机器学习Python卷积神经网络自然语言处理Github开源项目
《深度学习100例》开源项目现已开放,提供代码和数据资源,涵盖卷积神经网络、循环神经网络、生成对抗网络等主题,并包含机器学习和自然语言处理的实用案例。每周更新至少两篇原创文章,最新内容将在公众号首发。可加入技术交流群进行交流与反馈,获取最新技术资源和实战经验。
Daily-DeepLearning - 全面计算机基础、Python应用、数据科学及机器学习指南
Python数据结构操作系统机器学习深度学习Github开源项目
提供丰富的计算机科学教育资源,涵盖数据结构、操作系统、计算机网络等基础课程。Python和数据科学部分包括numpy、pandas、matplotlib等流行库的使用教程。机器学习和深度学习部分涉及逻辑回归、集成学习、RNN、CNN等理论及实践内容,适合初学者及进阶学习者掌握计算机科学与人工智能技术。
chat - 基于自然语言理解和机器学习的聊天系统
Chat聊天机器人自然语言处理机器学习知识图谱Github开源项目
Chat 是一款基于自然语言理解和机器学习的聊天机器人系统,提供丰富的语义分析和知识图谱构建工具,适合从头搭建聊天机器人。支持多用户并发和自定义对话场景,易于修改和扩展。适用于对知识图谱和 KBQA 感兴趣的用户,支持 Python 3.3-3.6,通过 pip 安装后可快速启动数据库和语义服务器。
openai-cpp - 轻量级C++库,用于简化与OpenAI API的集成
OpenAI-C++C++库API集成机器学习libcurlGithub开源项目
开源的OpenAI C++库,简化了在C++应用中调用OpenAI API的过程。兼容C++11及以上版本编译器,仅需两个头文件,无需额外依赖。支持全部OpenAI API功能,包括模型管理、完成、编辑、图像生成、嵌入和文件管理等。简单设置环境变量或直接在代码中配置API密钥即可使用,支持自定义实例管理,详情参见示例代码。
openai-scala-client - OpenAI API 和兼容提供商的高效异步 Scala 客户端
OpenAIScala ClientAPI集成机器学习流处理Github开源项目
这个异步 Scala 客户端支持所有 OpenAI API 的端点和参数,包括流媒体和最新的聊天、视觉和语音功能。同时兼容多个 API 提供商,如 Azure OpenAI 和 Anthropic。库设计简单,依赖最少,适用于异步操作的应用场景,使用 OpenAIService 提供统一服务。
relataly-public-python-tutorials - Python机器学习和深度学习项目合集
Python机器学习深度学习生成式AIJupyter notebooksGithub开源项目
本页面汇集了多个用于机器学习、深度学习和分析的Python Jupyter笔记本,涵盖股票预测、图像分类、异常检测、数据可视化等技术内容。每个文件都是一个独立的Python项目,并在博客中有详细介绍。还包括分布式计算、生成式AI和推荐系统等高级主题,提升业务应用能力。访问relataly.com获取更多信息。
ailearning - AI学习资源与实战教程
AI learning机器学习深度学习算法推荐系统Github开源项目
Ailearning项目提供全面的机器学习和深度学习教程,涵盖实战资料、基础知识以及权威视频资源。适用于具备Python基础的程序员,帮助快速掌握AI技术。项目包含在线阅读、教学视频和多种数据下载链接,提升学习效率。
cheatsheets-ai - 深度学习和机器学习工程师常用速查表
AI Cheatsheets机器学习深度学习TensorFlowKerasGithub开源项目
提供详尽的深度学习和机器学习速查表,包括Tensorflow、Keras、Numpy等热门工具,帮助工程师和研究人员快速掌握核心知识,提高工作效率。访问AI Cheatsheets获取更多资源和最新技术信息,适用于各水平从业者。