#机器学习

leedl-tutorial - 覆盖深度学习基础与高级知识的教程
LeeDL-Tutorial李宏毅深度学习机器学习台湾大学Github开源项目
李宏毅教授的深度学习教程,基于《机器学习》(2021年春)并进行了优化,涵盖卷积神经网络、生成模型和自监督学习等多个领域。教程通过详细推导和重点讲解,降低了学习难度,适合中文学习者入门深度学习。
lance - 优化机器学习工作流程的高性能列式数据格式
LanceParquet机器学习矢量搜索数据格式Github开源项目
Lance是为机器学习工作流程优化的现代列式数据格式,提供比Parquet快100倍的随机访问性能,支持矢量索引和数据版本控制。兼容pandas、DuckDB、Polars和pyarrow,适用于搜索引擎、大规模机器学习训练以及复杂数据的存储和查询,如机器人数据和大型图像。更多集成支持即将推出。
mediapipe - 支持在移动、Web、桌面、边缘设备和物联网中集成机器学习功能的平台
MediaPipe机器学习人工智能跨平台开源项目Github
MediaPipe为开发者提供了一个平台,支持在移动、Web、桌面、边缘设备和物联网中集成机器学习功能。通过跨平台API和预训练模型,可快速部署和定制AI解决方案。MediaPipe还包含模型定制工具和浏览器内的可视化评估工具,支持高效开发和迭代。欢迎访问Google官方文档了解更多,并参与社区交流和贡献。
DeepSpeech - 开源的深度学习语音识别引擎
Project DeepSpeechTensorFlow开源语音识别机器学习Github开源项目
DeepSpeech是一个开源语音转文字引擎,基于百度的Deep Speech研究,并利用Google TensorFlow实现。提供详细的安装、使用和训练模型文档。最新版本及预训练模型可在GitHub获取,支持和贡献指南请参阅相应文件。
d2l-en - 互动深度学习教程,结合代码、数学与讨论
D2L.ai深度学习开源书籍Jupyter笔记本机器学习Github开源项目
这本开源书籍使用Jupyter笔记本无缝整合深度学习的概念、背景和代码,免费提供给所有人。书中包含可运行代码、技术深度和社区讨论,帮助读者解决实际问题并成长为应用机器学习科学家。
tfjs - 支持浏览器和Node.js的硬件加速JavaScript机器学习库
TensorFlow.js机器学习JavaScriptAPI模型转换Github开源项目
TensorFlow.js 是开源的硬件加速JavaScript库,专用于训练和部署机器学习模型。开发者能利用灵活直观的API在浏览器和Node.js环境中创建和运行模型,包括从头开始构建模型、运行现有模型和使用传感器数据重新训练模型。支持多种后端和平台,满足不同项目的需求。
sonnet - 基于TensorFlow的高灵活性机器学习模块库,支持自定义与分布式训练
SonnetTensorFlow 2DeepMind机器学习神经网络Github开源项目
Sonnet是由DeepMind开发的TensorFlow 2扩展库,提供简单且可组合的抽象模型,核心概念为snt.Module,支持自定义和预定义模块。Sonnet不限制训练框架,适合监督、非监督和强化学习,并支持分布式训练和高级的TensorFlow功能。
autotrain-advanced - 机器学习模型的训练与部署的无代码训练
AutoTrainHugging FaceColab机器学习部署Github开源项目
AutoTrain Advanced 是一款无代码解决方案,只需几次点击即可训练机器学习模型。需要上传正确格式的数据以创建项目,关于数据格式和定价的详细信息请查阅文档。AutoTrain 免费使用,只需为使用的资源付费。支持在 Colab 和 Hugging Face Spaces 上运行,也可以通过 PIP 本地安装。适用于 Python 3.10 及以上版本,推荐在 Conda 环境中运行。更多信息请访问项目文档页面。
onnxruntime - 跨平台的机器学习模型推理与训练加速工具
ONNX Runtime机器学习深度学习硬件加速模型训练Github开源项目
ONNX Runtime是一款跨平台的机器学习推理和训练加速工具,兼容PyTorch、TensorFlow/Keras、scikit-learn等深度学习框架及传统机器学习库。它支持多种硬件和操作系统,通过硬件加速和图优化实现最佳性能,显著提升模型推理和训练速度,尤其在多节点NVIDIA GPU上的Transformer模型训练中表现出色。
transferlearning - 最新迁移学习综述、研究和教程资源
Transfer Learning机器学习领域自适应领域泛化负迁移Github开源项目
探索迁移学习的最新论文、理论综述、研究领域等。页面提供丰富教程和代码库,助力你从基础到高级应用的学习。适合各级读者深入理解迁移学习的关键技术及前沿动态。
Keras-GAN - 多种生成对抗网络(GAN)的Keras实现与教程
Keras-GAN生成对抗网络图像生成深度学习机器学习Github开源项目
该项目包含多种Keras实现的生成对抗网络(GAN),如AC-GAN、CycleGAN、Pix2Pix等,基于研究论文,提供核心概念的实现与详细教程。欢迎社区贡献以扩展更多GAN变体。
gradio - 高效构建和共享机器学习Web应用的开源Python库
GradioPython机器学习网页应用APIGithub开源项目
Gradio是一个开源Python库,能够快速构建机器学习模型、API或任意Python函数的演示或Web应用。其内置的共享功能允许在几秒钟内生成链接,无需JavaScript、CSS或Web托管经验。支持Python 3.8以上版本,提供多种组件和灵活布局,适用于各种应用场景。
onnx - 一个为 AI 开发人员提供支持的开放生态系统
ONNXAI模型深度学习机器学习推理Github开源项目
ONNX是一个开放生态系统,提供AI模型的开源格式,支持深度学习和传统机器学习。通过定义可扩展的计算图模型和内置操作符及标准数据类型,ONNX增强了不同框架间的互操作性,加速了从研究到生产的转化。ONNX广泛支持各种工具和硬件,助力AI社区快速创新。了解ONNX的文档、教程和预训练模型,加入社区,共同推动ONNX的发展。
Screenshot-to-code - 神经网络技术将设计图像转换为HTML/CSS代码
pix2code深度学习HTML生成Bootstrap机器学习Github开源项目
项目利用神经网络将设计图像转化为HTML/CSS代码。经过三次迭代,最终的Bootstrap版本模型实现了97%的准确性,采用GRU替代LSTM。该项目受Tony Beltramelli的pix2code、Airbnb的sketching interfaces和Harvard的im2markup启发。用户可在FloydHub或本地环境中运行模型,适合深度学习和前端开发爱好者。
dlib - 现代C++机器学习工具包,实现高效复杂软件开发
dlibC++机器学习编译Python APIGithub开源项目
dlib是一个功能丰富的C++工具库,专注于机器学习解决方案,支持快速编译和高效运算。提供完整的Python集成和标准Boost许可,适用于各类项目。
LaTeX-OCR - 智能数学公式图像转LaTeX代码工具
pix2texLaTeX识别机器学习图像处理数学公式Github开源项目
这是一个基于机器学习的系统,可以将数学公式图像转换为相应的LaTeX代码。系统支持命令行工具、图形用户界面、API和Python集成,提供多种使用方式。适用于不同分辨率的图像,自动优化处理以提高识别性能。还包括模型训练指南和数据集生成工具,适用于科研和教育用途。
AI-Expert-Roadmap - 人工智能专家路线图详解
AI Expert Roadmap人工智能数据科学机器学习深度学习Github开源项目
全面解析成为人工智能专家的路线图,从数据科学、机器学习到深度学习,涵盖所有必备知识和技能。项目旨在帮助新员工和社区成员掌握AI技术。互动版提供详细步骤链接,并通过定期更新保持前沿性。关注项目获取最新AI研究与应用案例,了解不同工具的适用场景,助力职业发展。
netron - 多格式神经网络和机器学习模型查看器
Netron神经网络深度学习机器学习模型查看器Github开源项目
支持多种格式的神经网络、深度学习和机器学习模型查看,包括ONNX、TensorFlow Lite、Core ML、Keras和Caffe等,实验性支持PyTorch、TorchScript等。适用于macOS、Linux、Windows和浏览器版本,提供简单的安装和启动方式,方便不同操作系统用户使用。
mlflow - 机器学习生命周期管理的轻量级平台
MLflow机器学习模型管理实验跟踪项目打包Github开源项目
MLflow 是一个轻量级平台,帮助简化机器学习的开发和部署过程。它支持实验跟踪、代码打包和模型部署,并且可以集成 TensorFlow、PyTorch 和 XGBoost 等库。主要组件包括 MLflow Tracking、MLflow Projects、MLflow Models 和 MLflow Model Registry,助力全面管理机器学习生命周期。
fast-style-transfer - 快速将照片和视频转换为名画风格
TensorFlow风格迁移视频风格化图像风格化机器学习Github开源项目
本项目利用TensorFlow技术,快速将照片和视频转换为多种名画风格。通过深度学习算法实现毫秒级风格迁移,并提供详细文档和示例,适用于研究和开发。项目采用实例归一化和感知损失优化,确保转换效果精美且实时。
autokeras - 机器学习自动化工具,简化图像分类任务
AutoKeras机器学习AutoML深度学习PythonGithub开源项目
AutoKeras是由德州农工大学DATA实验室开发的开源项目,旨在简化机器学习流程。通过Keras的AutoML系统,用户能够轻松完成图像分类等任务。支持Python 3.7及以上版本和TensorFlow 2.8.0及以上版本,安装方便,只需使用pip命令。提供详细的官方教程和相关书籍资源,社区鼓励贡献和参与。
lively - 允许用户设置由 WinUI 3 提供支持的动画桌面壁纸和屏幕保护程序的软件
Lively Wallpaper桌面动态壁纸开源软件Windows应用机器学习Github开源项目
Lively Wallpaper提供视频、网页、应用和游戏等多种动态壁纸,支持多显示器和屏保功能。通过命令行和API实现自动化和互动,利用机器学习增强动态效果,硬件加速视频播放,使用简单高效,完全开源免费,兼容最新Windows 11设计。
TaskWeaver - 高效规划和执行数据分析的代码优先框架
TaskWeaver数据分析插件代码执行机器学习Github开源项目
TaskWeaver是一个创新的代码优先代理框架,能够通过代码片段解释用户请求,并高效协调多种插件来执行数据分析任务。它的独特功能包括保留聊天和代码执行历史,适合处理高维表格等复杂数据结构。支持本地小型语言模型、多种LLM配置、容器模式和CLI模式,提供安全和用户友好的体验。
dvc - 提升机器学习项目可重复性和快速迭代的命令行工具
DVC数据版本控制机器学习版本管理VS Code扩展Github开源项目
DVC是一个命令行工具和VS Code扩展,用于管理机器学习项目的数据和模型版本控制。数据存储在云端,版本信息保存在Git仓库,通过轻量级管道实现快速迭代。DVC还支持本地实验跟踪和对比,允许在无服务器的情况下分享和重现实验结果。
daily-paper-computer-vision - 计算机视觉与深度学习论文每日精选更新
CVer计算机视觉计算机视觉深度学习机器学习AI论文Github开源项目
该项目每日更新和整理计算机视觉、深度学习及机器学习领域的最新优质论文和项目,涵盖多个研究方向。内容涵盖从2017年至今的顶会顶刊论文列表和代码链接,为研究人员提供丰富的资源参考。
python-machine-learning-book-2nd-edition - Python机器学习与深度学习实用指南
Python Machine LearningPackt Publishing深度学习机器学习数据科学Github开源项目
本书详细介绍机器学习和深度学习的核心概念,教你使用Python及其主要库(如Scikit-Learn和TensorFlow)进行数据处理、分类、回归和模型优化。书中包含丰富的示例代码和Jupyter笔记本,帮助读者理解复杂的数学理论和实现步骤,是数据科学家和工程师学习和提升机器学习技能的理想选择。
autogluon - 自动化机器学习工具,简单实现高精度预测
AutoGluon机器学习深度学习自动化PythonGithub开源项目
AutoGluon简化了机器学习任务,让用户可以在图像、文本、时间序列和表格数据上轻松训练和部署高精度模型。它支持Python 3.8至3.11,并可在Linux、MacOS和Windows上运行。只需几行代码即可快速构建端到端机器学习模型,提供详细的安装指南、快速入门教程和丰富的资源,适合各层次用户的需求。
Deep-Learning-Interview-Book - 详尽介绍深度学习求职面试所需的各类知识
Deep Learning Interview Book深度学习求职攻略机器学习自然语言处理Github开源项目
该指南全面涵盖深度学习领域的求职面试知识,包括数学、机器学习、深度学习、强化学习、计算机视觉、图像处理、自然语言处理、SLAM、推荐算法、数据结构与算法、编程语言(C/C++/Python)、深度学习框架等,旨在帮助求职者高效准备面试。
serving - 灵活且高效的机器学习模型推理平台
TensorFlow Serving模型部署机器学习高性能推理DockerGithub开源项目
TensorFlow Serving 是一个为生产环境设计的灵活且高性能的机器学习模型推理系统。它管理训练后的模型生命周期,通过高效查询表提供版本化访问,支持多模型和多版本同时部署。系统支持 gRPC 和 HTTP 推理端点,允许无缝部署新版本,支持金丝雀发布和 A/B 测试,并且延迟极低。调度器将推理请求分组以在 GPU 上联合执行,支持包括 TensorFlow 模型、嵌入、词汇表和特征转换在内的多种服务对象。
snorkel - 通过编程自动化构建和管理训练数据的新方法
SnorkelSnorkel FlowAI应用机器学习弱监督建模Github开源项目
Snorkel项目由斯坦福大学发起,致力于通过编程自动化标注、构建和管理训练数据,重塑机器学习项目的成功要素。该项目不仅实现了其研究目标,还与Google、Intel等领先机构合作,支持生产部署,并发表了大量相关论文。Snorkel现已发展为Snorkel Flow,一个简化AI应用开发的端到端平台。
fiftyone - 高效的数据集构建与计算机视觉模型工具
FiftyOne数据集计算机视觉模型评估机器学习Github开源项目
FiftyOne 是一款提升机器学习工作流的开源工具,通过可视化数据集和解读模型结果来提高效率。用户可用它处理复杂标签、评估模型、探索场景、识别错误模式和注释错误等。安装简便,可通过 pip 安装并运行示例代码快速上手。
Augmentor - 图像增强库,支持平台无关和精细控制
Augmentor图像增强Python机器学习数据扩展Github开源项目
Augmentor是一个Python图像增强库,适用于机器学习,特别是神经网络和深度学习。它支持平台无关的图像增强,允许用户通过构建增强管道实现精细控制,采用随机方法进行操作。主要功能包括多线程加速、多掩码处理、与Keras和PyTorch集成,以及弹性扭曲、透视变换、尺寸保持旋转和剪切、随机擦除等多种增强技术。
machine-learning-yearning-cn - 阅读《机器学习训练秘籍》中文版并参与翻译
Machine Learning Yearning机器学习翻译质量CC BY-NC-SA 4.0许可协议Github开源项目
在线阅读《机器学习训练秘籍》中文版,了解机器学习训练指南。此版本为预览版,欢迎通过项目Issues、Pull Request或邮件参与翻译改进。本项目遵循CC BY-NC-SA 4.0协议,允许共享和演绎但需署名且非商业使用。
TensorFlow-2.x-Tutorials - 详解TensorFlow 2.0教程,掌握深度学习模型与应用
TensorFlow深度学习机器学习视频教程神经网络Github开源项目
本教程详细介绍了TensorFlow 2.0的安装与基础操作,并包含线性回归、MNIST、CIFAR10等多个实战案例。通过配套的视频资源,帮助数据科学家和AI研究人员掌握TensorFlow 2.0在深度学习中的实际应用。
eat_pytorch_in_20_days - 20天掌握Pytorch的核心技能
Pytorch机器学习深度学习KerasTensorFlowGithub开源项目
本书帮助读者在20天内系统性地掌握Pytorch,从基础到进阶,涵盖核心概念与实际应用。内容基于Pytorch官方文档,优化了结构和范例,提升了用户友好度。适合有一定基础的学习者,提供每日学习计划和实用代码,并附有资源获取方式。欢迎对Pytorch感兴趣的读者前来学习和讨论,获取全面的深度学习指南。
cheatsheets-ai - 深度学习和机器学习工程师常用速查表
AI Cheatsheets机器学习深度学习TensorFlowKerasGithub开源项目
提供详尽的深度学习和机器学习速查表,包括Tensorflow、Keras、Numpy等热门工具,帮助工程师和研究人员快速掌握核心知识,提高工作效率。访问AI Cheatsheets获取更多资源和最新技术信息,适用于各水平从业者。