#机器学习

shogun - 多语言支持的开源机器学习工具库
Shogun机器学习开源工具箱多语言接口BSD许可证Github开源项目
SHOGUN是一个开源的机器学习工具库,自1999年开始开发。该项目使用C++实现核心功能,并提供自动生成的接口,支持Python、Octave、Java等多种编程语言。SHOGUN可在Linux、MacOS、Windows等主流操作系统上运行,提供丰富的示例和文档。它拥有广泛的机器学习算法支持,性能优异,采用BSD许可证发布,适合机器学习研究和应用开发。
awesome-ai-residency - 全球AI研究居留计划和实习项目一览
AI Residency机器学习人工智能实习项目研究机会Github开源项目
该项目全面汇总了全球知名科技公司和研究机构的AI研究居留计划、实习项目和训练营信息。内容涵盖Google、Facebook、Microsoft等公司的AI居留项目,以及长期实习机会。同时收录相关文章、博客和讨论,为AI研究人才提供丰富资源。项目定期更新,实时跟踪AI研究机会,是AI领域求职和深造的权威参考。
runhouse - 灵活高效的Python机器学习远程部署框架
Runhouse云计算机器学习远程执行资源共享Github开源项目
Runhouse是一个Python机器学习开发框架,支持将函数和类快速部署到各种云计算基础设施。它实现了从笔记本电脑远程运行和调试代码,提供了灵活性和成本优化。该框架简化了从研究到生产的过程,支持跨集群、区域或云的复杂操作,并具备资源共享和版本控制功能。Runhouse适合在异构计算环境中执行Python的团队,能够提升机器学习开发的成熟度和效率。
handson-unsupervised-learning - Python实现无监督学习的实用指南
无监督学习Python机器学习TensorFlowscikit-learnGithub开源项目
该项目为Python无监督学习提供实践指南,介绍scikit-learn和TensorFlow框架处理未标记数据的方法。涵盖聚类、降维、生成模型等算法,并提供代码示例。项目包含Windows、macOS环境配置说明,支持GPU加速。内容涉及模式发现、异常检测、自动特征工程等应用,适合机器学习从业者参考学习。
data-centric-AI - 数据工程革新人工智能的新兴领域
Data-centric AI机器学习数据工程AI系统数据质量Github开源项目
Data-centric AI是一个新兴领域,注重通过改善数据质量和数量来提升AI系统性能。这个项目整理了Data-centric AI的全面资源,包含论文、代码和教程等。内容涵盖训练数据开发、推理数据开发和数据维护三大方面,为研究人员和开发者提供了深入了解和应用Data-centric AI概念与技术的宝贵参考。
AI-Notes - 全面的AI学习资源 从理论到实践的系统指南
人工智能机器学习深度学习AI神经网络Github开源项目
该项目提供全面的AI学习资源,涵盖机器学习、深度学习和自然语言处理等领域。内容包括数学基础、算法原理及工具应用,从理论到实践构建系统知识。通过Jupyter Notebook和Colab实现互动学习,适合AI初学者和从业者掌握核心概念及最新进展。
GPBoost - 融合树提升与高斯过程的先进机器学习库
GPBoost机器学习树提升高斯过程混合效应模型Github开源项目
GPBoost是一个创新机器学习库,融合树提升、高斯过程和分组随机效应模型。它支持独立应用树提升、高斯过程和广义线性混合效应模型,主要用C++编写,提供C接口及Python和R包。GPBoost算法结合树提升和潜在高斯模型优势,提高预测函数学习效率,优化高基数分类变量处理,并适用于空间或时空数据建模。这使其成为非线性建模和复杂依赖结构分析的理想工具。
lit - 自学AI实践者必备技术书籍精选
AINLP机器学习编程数据科学Github开源项目
lit项目为自学AI实践者提供了精心策划的技术书籍集锦。涵盖人工智能、数据科学、计算机科学、编程等多个领域的经典著作,从入门到进阶兼具理论深度和实践指导。项目创建者基于个人经验对每本书进行简要介绍,为读者选择合适学习材料提供参考。这一资源有助于系统全面地学习AI相关知识。
ai_projects - 多领域机器学习项目开源仓库
AI项目机器学习深度学习GitHubMiguel FierroGithub开源项目
ai_projects是一个涵盖多个机器学习领域的开源项目仓库。内容包括CNN、转移学习、推荐系统和自然语言处理等主题。每个项目都配有Jupyter笔记本和相关博客文章,为开发者和研究者提供实践资源。仓库定期更新,展示AI技术在实际应用中的最新进展。
awesome-ai - 人工智能资源汇总 课程、工具与开源项目
人工智能机器学习深度学习神经网络自然语言处理Github开源项目
本项目汇集了人工智能领域的优质资源,包括课程、工具、应用和开源项目。内容涵盖机器学习、深度学习、自然语言处理、机器人技术和对话系统等热门方向,适合研究人员、开发者和学习者参考。此外还收录了AI公司、研究机构信息及业界动态,为探索AI前沿提供全面指南。
OnnxStack - 高效机器学习集成框架 无缝对接.NET生态
ONNX Runtime机器学习.NETStableDiffusion图像处理Github开源项目
OnnxStack为.NET开发者提供了一个便捷的机器学习集成方案。它与ONNX Runtime和Microsoft ML无缝对接,支持Stable Diffusion、图像放大和对象检测等AI模型。开发者可以在.NET环境中直接构建和运行机器学习应用,不再依赖Python。这个框架大大简化了AI开发流程,是.NET生态系统中的一个重要补充。
modular-diffusion - 灵活可扩展的PyTorch扩散模型框架
Modular Diffusion扩散模型PyTorch机器学习模块化设计Github开源项目
Modular Diffusion是一个基于PyTorch的模块化扩散模型框架,为设计和训练自定义扩散模型提供了简洁的API。该框架支持多种噪声类型、调度类型、去噪网络和损失函数,并提供了预构建模块库。Modular Diffusion适用于图像生成和非自回归文本合成等多种应用场景,适合AI研究人员和爱好者使用。其模块化设计简化了新型扩散模型的创建和实验过程。
ML-for-High-Schoolers - 面向高中生的机器学习和人工智能学习路径
机器学习人工智能高中生学习Python学习路径Github开源项目
这个开源项目为高中生设计了一条机器学习和人工智能的学习路径。内容涵盖Python基础、机器学习算法和特定领域深入学习,无需复杂数学知识。通过推荐课程、实践项目和深入学习建议,学生可在短期内掌握相关技能。项目还提供AI领域前沿资讯,帮助学生全面了解这一领域。
lab2d - 高效灵活的2D网格环境创建工具,专为机器学习研究设计
DeepMind Lab2D机器学习网格世界环境创建强化学习Github开源项目
DeepMind Lab2D是一个专为机器学习研究设计的2D环境创建系统。它通过文本地图和Lua代码定义网格世界,兼具易用性和高性能。系统支持多智能体交互,提供Python dm_env API和C API接口。适用于Linux和macOS平台,可通过pip安装或源码构建。DeepMind Lab2D为研究人员提供了一个灵活高效的2D环境开发工具。
TDC - 人工智能助力药物研发的开源平台
TDC机器学习药物发现人工智能数据集Github开源项目
Therapeutics Data Commons (TDC) 是一个开源的人工智能平台,旨在促进药物发现和开发领域的技术创新。该平台提供多样化的AI任务、数据集和基准测试,覆盖从靶点识别到药物安全评估的全过程。TDC为研究人员提供便捷的数据加载工具和高效的数据处理功能,同时建立了透明的评估体系。这一开放科学倡议正在推动人工智能在治疗科学中的应用和验证,重塑药物研发流程。
ML-University - 机器学习免费学习资源库
机器学习深度学习自然语言处理GitHubML-UniversityGithub开源项目
ML-University是一个开源的机器学习学习资源库,汇集了顶尖大学和机构的免费课程。内容涵盖数学基础、机器学习、深度学习、自然语言处理等,适合不同层次的学习者。项目持续更新,提供系统化的学习路径,助力机器学习爱好者提升技能。
awesome-machine-learning-in-compilers - 编译器和程序优化中的机器学习资源集锦
机器学习编译器优化程序优化自动调优强化学习Github开源项目
这个项目收集了机器学习在编译器和程序优化领域的重要资源,包括研究论文、数据集和工具。涵盖迭代编译、指令级优化、并行映射等多个主题,提供了全面的参考材料。除学术资源外,还包括相关书籍、演讲、软件和基准测试,是该领域研究和开发的综合指南。
reservoirpy - Python库实现高效储层计算和回声状态网络
ReservoirPy机器学习神经网络时间序列预测超参数优化Github开源项目
ReservoirPy是一个实现高效储层计算架构的Python库,专注于回声状态网络(ESN)。它具备离线和在线训练、并行计算、稀疏矩阵运算等功能,支持构建复杂的多储层架构。该库提供图形化工具用于超参数探索,并包含多个教程和科学论文复现案例。适用于Python 3.8及以上版本,ReservoirPy为储层计算提供了简洁而强大的实现方案。
DiffusionFromScratch - 实践教程:从零构建和训练稳定扩散模型
Stable Diffusion机器学习图像生成教程UNetGithub开源项目
DiffusionFromScratch是一个开源项目,提供精简代码库用于重建稳定扩散模型。项目特点包括单Python脚本实现、支持MNIST和CelebA数据集训练,以及提供多个Colab笔记本。这些笔记本涵盖模型架构探索、UNet模型构建和基于文本生成MNIST图像等内容。项目还展示了演示输出和音乐视频生成示例,为学习稳定扩散模型提供了实用资源。
ISP-Guide - 图像信号处理技术与应用全面指南
图像信号处理ISP数字信号处理机器学习计算机视觉Github开源项目
本指南全面介绍图像信号处理(ISP)技术,涵盖应用、库和工具。内容包括机器学习、深度学习、计算机视觉和LiDAR等相关领域,并提供丰富的学习资源和开发工具。适合初学者和有经验开发人员深入学习ISP知识,提升相关技能。
ComputeLibrary - 优化Arm架构的开源机器学习函数库
Compute Library机器学习ARM架构性能优化开源软件Github开源项目
ComputeLibrary是一个专为Arm架构优化的机器学习函数库,支持Cortex-A、Neoverse处理器和Mali GPU。它提供100多个低级机器学习函数,覆盖多种数据类型和卷积算法,并采用微架构优化、内核融合等先进技术。作为开源项目,ComputeLibrary具有高性能、高度可配置的特点,为Arm平台的机器学习应用开发提供了强大支持。
kshape-python - 高效精准的时间序列聚类算法
k-Shape时间序列聚类无监督学习数据挖掘机器学习Github开源项目
kshape-python是一种用于单变量和多变量时间序列聚类的高效无监督算法。该方法在ACM SIGMOD 2015会议上获得最佳论文奖,已在多个科学领域和知名企业中广泛应用。kshape-python在准确性和效率方面表现出色,在包含100多个数据集的基准测试中名列前茅。该项目提供CPU和GPU版本实现,可处理大规模时间序列数据。项目提供详细的安装说明、使用示例和基准测试结果,支持单变量和多变量时间序列数据,可在CPU或GPU上运行。该方法在UCR和UAE两个established benchmarks上进行了评估,展示了其在不同数据集上的性能。
AutoQuant - 开源自动化机器学习工具包
AutoCatBoostRegression机器学习回归模型自动化建模模型评估Github开源项目
AutoQuant是一个开源的自动化机器学习工具包,旨在提升模型开发和运营效率。它集成了CatBoost、LightGBM、XGBoost和H2O等先进算法,支持GPU和CPU计算。该工具包涵盖了特征工程、模型训练、评估和部署等机器学习全流程。AutoQuant在多个行业应用中表现出色,为数据科学家提供了一个高效的机器学习开发平台。
hctsa - MATLAB时间序列分析与特征提取工具包
Github开源项目hctsa时间序列分析特征提取数据可视化机器学习
hctsa是一款功能强大的MATLAB时间序列分析工具包,专注于特征提取和比较分析。它能从单变量时间序列中提取大量特征,并提供多种分析工具。主要功能包括数据标准化、聚类、降维、特征识别和分类模型评估。该工具包适用于多领域的时间序列研究,能够深入挖掘数据特征,进行全面的比较分析。
PyPOTS - 部分观测时间序列机器学习的开源Python工具箱
PyPOTS时间序列机器学习缺失值开源工具Github开源项目
PyPOTS是一个专注于部分观测时间序列(POTS)机器学习的Python工具箱。它集成了经典和前沿算法,支持数据插补、分类、聚类、预测和异常检测等任务。该工具箱提供统一API、详细文档和交互示例,简化POTS数据处理流程。PyPOTS支持多种神经网络模型,并具备超参数优化功能,为时间序列分析提供综合解决方案。
causal-learn - 强大的Python因果发现工具包
因果发现Python包causal-learn机器学习数据分析Github开源项目
causal-learn是一个开源的Python因果发现库,实现了多种经典和前沿的因果发现算法。它提供了基于约束、基于评分、基于函数因果模型等方法,以及独立性测试、评分函数等实用工具。该库文档完善,示例丰富,适用于研究人员和数据科学家进行因果关系分析和算法开发。causal-learn是Tetrad项目的Python版本和扩展,由CMU-CLeaR小组积极开发和维护,并提供了丰富的基准数据集供社区使用。
catch22 - 精选时间序列特征提取库
catch22时间序列特征数据挖掘机器学习特征提取Github开源项目
catch22是一个包含22个时间序列特征的开源库,由C语言编写,支持Python、R、Matlab和Julia等多种编程语言。这些特征是从7000多个候选中精选而来,在93个实际时间序列分类问题中表现优异。catch22提供了跨平台的安装方法和使用接口,包括各语言的原生版本和C编译版本。该工具主要用于高效提取时间序列的动态特征,适用于多种研究和应用场景。
luminaire - 开源时间序列异常检测库
Luminaire异常检测时间序列机器学习开源库Github开源项目
Luminaire是一个开源的Python库,专门用于时间序列数据的异常检测和预测。它集成了数据预处理、建模和配置优化功能,可自动处理各类时间序列数据。该库支持批处理和流式数据监控,能识别相关性和季节性模式,并适应数据随时间的变化。Luminaire设计简单易用,仅需少量配置即可实现高效的异常检测。
scalecast - 功能全面的时间序列预测Python库
Scalecast时间序列预测机器学习Python库数据可视化Github开源项目
Scalecast是一个功能全面的时间序列预测Python库。它提供统一的机器学习建模接口,支持LSTM、ARIMA等多种模型类型。该库集成了自动特征选择、超参数调优、模型堆叠等功能,并提供便捷的数据可视化工具。Scalecast致力于简化复杂的时间序列预测任务,适用于不同规模的预测项目。
pyaf - Python开源库实现自动化时间序列预测
PyAF时间序列预测机器学习Python自动化Github开源项目
PyAF是一个开源的Python自动预测库,基于NumPy、SciPy等流行数据科学模块构建。该库利用机器学习方法自动预测时间序列未来值,功能comparable于一些商业预测产品。它支持信号分解、外生数据和层次预测,提供简洁API和可定制建模过程。PyAF适用于Python 3.x,采用BSD 3-Clause许可证。PyAF可用于销售预测、股票走势分析、能源需求预测等多种时间序列预测任务。
EasyTemporalPointProcess - 灵活可配置的时序点过程开源工具包 支持多框架和结果复现
EasyTPP时间点过程机器学习开源工具包事件预测Github开源项目
EasyTemporalPointProcess是一个用于时序点过程开发和应用的开源工具包。该工具包具有配置灵活、兼容性强和结果可复现等特点,支持多种先进TPP模型,提供预处理数据集和超参数优化功能。EasyTPP同时兼容TensorFlow和PyTorch框架,可用于学术研究和工业实践。研究人员和从业者可以利用它轻松定制TPP模型并进行开放基准测试。
anomaly-detection-resources - 异常检测领域的综合学习资源库
异常检测机器学习数据挖掘PyODADBenchGithub开源项目
本项目汇集了异常检测领域的全面学习资源,包括书籍、论文、课程、数据集和工具库。涵盖多变量数据、时间序列和图网络等多种异常检测类型,并提供关键算法、高维数据和集成方法等研究方向的资料。同时列出重要会议和期刊,为异常检测研究者和实践者提供了宝贵的资源库。
Time-Series-Analysis-with-Python-Cookbook - Python时间序列分析与预测实战指南
时间序列分析Python数据科学机器学习预测Github开源项目
这本书全面介绍Python时间序列分析和预测技术,涵盖数据获取、预处理和高级建模。内容包括统计方法、机器学习和深度学习算法,以及使用TensorFlow、PyTorch等框架进行预测。通过实用代码示例和案例研究,读者可以学习处理复杂时间序列数据、进行异常检测,并解决实际业务问题。适合数据分析师和开发者提升时间序列分析技能。
PanelCleaner - 基于机器学习的漫画文本清理工具
Panel Cleaner机器学习文本检测图像处理OCRGithub开源项目
PanelCleaner 是一款开源的漫画文本清理工具,采用机器学习技术精确识别文本区域并生成高质量遮罩。该工具能自动清理简单对话气泡,支持批量处理和自定义清理参数,并提供OCR文本提取功能。通过直观的图形界面,PanelCleaner 可大幅提高漫画翻译效率,减少重复性工作,同时避免误删非文本内容。
deeptime - Python时间序列分析与动态建模库
deeptime时间序列分析机器学习动力学模型开源库Github开源项目
deeptime是一个专注于时间序列数据分析的Python库,集成了多种动态模型估计工具。该库涵盖传统线性学习方法(如马尔可夫状态模型、隐马尔可夫模型和Koopman模型)及先进的核方法和深度学习技术。与scikit-learn兼容的同时,deeptime还提供了独特的Model类,用于分析热力学、动力学和其他动态特性。该库支持多平台安装,适用于各类时间序列数据研究。
feature-engineering-for-time-series-forecasting - 时间序列预测特征工程全面指南
时间序列预测特征工程数据处理机器学习PythonGithub开源项目
该项目提供时间序列预测特征工程的全面指南,涵盖数据表格化、时间序列分解、缺失值处理和异常值检测等核心内容。深入介绍滞后特征、窗口特征、趋势和季节性特征的创建方法,以及日期时间和分类特征的处理技巧。通过实践代码和详细说明,旨在提升预测模型性能。