#机器学习
dvclive - 简单易用的机器学习实验跟踪和指标记录工具
DVCLive机器学习指标记录实验比较数据版本控制Github开源项目
DVCLive是一个用于记录机器学习指标和元数据的Python库。它支持多种机器学习框架,无需额外服务,以纯文本文件存储实验结果,方便版本控制。DVCLive提供直观API,支持参数记录、指标跟踪和实验比较,有助于简化机器学习工作流程。
imageinwords - 致力于生成超详细图像描述的研究项目
ImageInWords图像描述数据集机器学习计算机视觉Github开源项目
ImageInWords 是一个致力于生成超详细图像描述的研究项目。该项目提供基准评估数据集,可通过 Hugging Face 访问。它集成了计算机视觉和自然语言处理技术,为研究人员和开发者提供数据集、可视化工具和探索接口。这项研究旨在推进图像理解和描述生成领域的发展。
uncertainty-calibration - 深度学习预测校准技术的前沿研究与实践应用
预估校准机器学习广告推荐不确定性量化模型评估Github开源项目
uncertainty-calibration项目是预估校准技术研究的综合资源库。该项目涵盖后处理方法、模型集成方法和校准理论分析等多个领域,并提供广告等实际应用案例。项目还包括评价指标、公开数据集和中文资料,为研究人员和从业者提供了全面的校准技术参考。
DMFF - 革新分子模拟和力场参数化的全可微分子力场
DMFF分子力场参数优化自动微分机器学习Github开源项目
DMFF是一个基于Jax的Python包,实现全可微分子力场模型。它简化力场参数化,支持点电荷和多极化模型,适用于水、生物大分子和有机聚合物系统。DMFF集成自动微分技术和AI优化,支持GPU加速,为分子系统研究和力场开发提供高效工具。
vizier - 开源黑盒优化框架助力机器学习研究
Vizier黑盒优化超参数调优分布式系统机器学习Github开源项目
Open Source Vizier是一个Python开发的黑盒优化框架,源自Google Vizier项目。它提供用户、开发者和基准测试三大API,支持分布式多客户端环境。该框架集成了基于JAX的贝叶斯优化器,适用于超参数调优、进化算法和程序搜索等多种场景。作为开源项目,Vizier具有灵活的安装选项,可满足不同的优化研究需求。
learned_optimization - 基于JAX的元学习优化器研究框架
learned_optimization元学习优化器JAX机器学习Github开源项目
learned_optimization是一个研究代码库,主要用于学习型优化器的训练、设计、评估和应用。该项目实现了多种优化器和训练算法,包括手工设计的优化器、学习型优化器、元训练任务以及ES、PES和截断反向传播等外部训练方法。项目提供了详细的文档和教程,包括Colab笔记本,方便用户快速入门。learned_optimization适用于元学习和动态系统训练的研究,为相关领域提供了功能丰富的工具。
brax - 基于JAX的高性能物理引擎 适用于机器人和强化学习仿真
Brax物理引擎JAX机器学习仿真Github开源项目
Brax是一款基于JAX的高性能物理引擎,专注于机器人、人体感知、材料科学和强化学习等领域的仿真应用。它支持单设备高效仿真和多设备并行仿真,无需依赖大型数据中心。Brax提供多种物理模拟管道,如MuJoCo XLA、广义坐标和基于位置的动力学,并统一API接口。此外,Brax集成了多种高效学习算法,能在短时间内完成智能体训练。
tensorflow-image-models - 将PyTorch图像模型移植到TensorFlow的预训练模型库
TensorFlow图像模型预训练权重机器学习深度学习Github开源项目
tensorflow-image-models是一个将PyTorch图像模型移植到TensorFlow的开源项目。它提供了多种预训练模型,包括ViT、DeiT、ResNet等,可用于图像分类和分割。该项目为开发者提供了简单的API来创建、预处理和保存/加载模型,并支持调整类别数量以适应不同任务。通过这个模型库,研究人员和开发者可以更方便地在TensorFlow中使用先进的图像模型。
evosax - 基于JAX的高性能进化策略框架
evosax进化策略JAX优化算法机器学习Github开源项目
evosax是基于JAX的进化策略框架,通过XLA编译和自动向量化/并行化技术实现大规模进化策略的高效计算。它支持CMA-ES、OpenAI-ES等多种经典和现代神经进化算法,采用ask-evaluate-tell API设计。evosax兼容JAX的jit、vmap和lax.scan,可扩展至不同硬件加速器。该框架为进化计算研究和应用提供了高性能、灵活的工具。
evojax - 基于JAX的高性能神经进化工具包
EvoJAX神经进化JAX硬件加速机器学习Github开源项目
EvoJAX是基于JAX库开发的神经进化工具包,支持在多个TPU/GPU上并行运行神经网络。通过在NumPy中实现进化算法、神经网络和任务,并即时编译到加速器上运行,EvoJAX显著提升了神经进化算法的性能。该工具包提供了多个示例,涵盖监督学习、强化学习和生成艺术等领域,展示了如何在几分钟内完成原本需要数小时或数天的进化实验。EvoJAX为研究人员提供了一个高效、灵活的神经进化开发平台。
synjax - 基于JAX的结构化概率分布神经网络库
SynJaxJAX概率分布神经网络库机器学习Github开源项目
SynJax是一个基于JAX的神经网络库,专注于结构化概率分布处理。它支持多种分布类型,包括线性链CRF、半马尔可夫CRF和成分树CRF等。该库提供计算对数概率、边际概率和最可能结构等标准操作,并兼容JAX的主要转换功能。SynJax采用纯Python编写,结合JAX的C++代码,为结构化概率建模提供了高效灵活的解决方案。
minRF - 轻量级可扩展整流流变换器实现
Rectified FlowAI模型机器学习图像生成TransformersGithub开源项目
minRF是一个开源项目,提供整流流变换器的轻量级实现,适用于深度学习研究。它结合SD3训练方法和LLaMA-DiT架构,包括支持MNIST和CIFAR数据集的基础版本,以及支持ImageNet训练并引入muP技术的高级版本。项目代码结构清晰,便于理解和定制,为研究人员提供了灵活的整流流模型实验环境。
AI-Scientist - 突破性全自动科学发现系统
AI Scientist科学发现机器学习人工智能论文生成Github开源项目
AI-Scientist是一个全自动科学发现系统,采用大型语言模型进行独立研究。该系统可生成涵盖数据科学和机器学习等领域的科学论文。项目包含完整代码库、示例论文和详细文档,便于研究人员复现和拓展。AI-Scientist展示了人工智能在科学研究中的应用潜力,推动自动化科学发现的发展。
scikit-learn - Python机器学习的核心工具库
scikit-learn机器学习Python开源项目数据科学Github
scikit-learn是基于SciPy构建的Python机器学习库,提供高效的数据挖掘和分析工具。支持分类、回归、聚类等多种机器学习任务,自2007年启动以来由志愿者维护,已成为广受欢迎的开源项目。其特点包括易用性、高性能和完善的文档,在学术和工业领域得到广泛应用。
grokfast - 放大低频梯度加速模型泛化
Grokfast机器学习梯度下降过拟合泛化Github开源项目
Grokfast是一种创新的机器学习优化方法,通过放大参数梯度的低频成分来加速模型泛化。该方法可将原本需数万次迭代的泛化过程缩短50倍以上,仅需添加几行代码即可实现。Grokfast适用于图像、语言和图形等多种任务,为研究突然泛化现象提供了实用工具。项目开源了代码实现,并提供了详细的使用说明和实验复现指南。
interpret-community - 强化可解释AI的开源工具库
Interpret-Community可解释性机器学习SHAP模型解释Github开源项目
Interpret-Community是扩展Interpret库的开源项目,为表格数据模型提供增强的可解释性技术。它集成了SHAP、LIME等多种解释器,适用于各类机器学习模型。项目还包含交互式可视化工具,便于分析数据与模型。该项目优化了可解释性技术,使其能够处理实际数据集和工作流程,致力于增强机器学习模型的可解释性和透明度。
audio-development-tools - 综合音频开发工具集 从机器学习到声音合成
音频开发工具机器学习音频处理音乐生成深度学习Github开源项目
Audio Development Tools提供了涵盖机器学习、音频生成、信号处理、声音合成等多个领域的综合性音频开发工具集。该项目汇集了丰富的资源和工具,可用于游戏音频、数字音频工作站、空间音频、音乐信息检索、语音识别等多种音频相关项目的开发和研究。
cookbook - 大型语言模型应用开发与优化实用指南
MistralAI模型示例代码数据处理机器学习Github开源项目
Mistral Cookbook 汇集了社区贡献的大型语言模型应用实例,涵盖基础聊天、嵌入、RAG、函数调用和微调等多个方面。项目包含Mistral AI官方示例和第三方工具集成,为开发者提供了全面的LLM应用开发资源。
deforum-stable-diffusion - 开源AI图像合成项目 支持2D/3D动画生成
Deforum Stable Diffusion机器学习图像合成开源项目AI艺术Github
Deforum Stable Diffusion是一个开源AI图像合成项目,支持生成插值、2D和3D动画。该项目提供CLIP、美学和调色板条件控制等功能,使稳定扩散技术更易于使用和定制。尽管目前已停止维护,用户仍可通过fork继续开发。Deforum为创作者提供了灵活的AI图像生成工具,可用于创作短视频、艺术动画、视觉效果等领域,为视频制作和创意内容创作提供强大支持。
diffusion-explainer - 将扩散模型的图像生成过程可视化的交互式工具
Diffusion-Explainer机器学习人机交互开源项目可视化工具Github
Diffusion-Explainer是一个交互式可视化工具,用于展示扩散模型的图像生成过程。该工具通过直观的界面呈现生成过程中的每个步骤,使用户能够深入了解模型的内部机制。由乔治亚理工学院和IBM研究院开发的这个开源项目,为AI研究人员和开发者提供了一个分析扩散模型的平台,并提供在线演示功能。
gemma_pytorch - Gemma模型的官方PyTorch实现及多平台推理支持
GemmaPyTorchAI模型机器学习自然语言处理Github开源项目
gemma_pytorch项目是Gemma模型的官方PyTorch实现,支持CPU、GPU和TPU多平台推理。项目提供PyTorch和PyTorch/XLA两种实现,涵盖2B、7B、9B和27B等多个模型变体及量化版本。通过Docker可快速部署环境并进行推理。项目还包含最新的Gemma v2和CodeGemma模型支持,为用户提供全面的Gemma模型应用方案。
plinder - 综合蛋白质-配体相互作用数据集与评估平台
PLINDER蛋白质-配体相互作用分子对接机器学习结构生物学Github开源项目
PLINDER是一个面向蛋白质-配体对接算法的综合数据集和评估资源。该数据集包含40多万个蛋白质-配体相互作用系统,涵盖11,000多个SCOP结构域和50,000多种小分子。每个系统配有500多项详细注释,涉及蛋白质和配体特性、结构质量等多个方面。此外,PLINDER提供14种相互作用评估指标、200多亿个相似性得分,以及与结合态(holo)系统对应的未结合态(apo)和AlphaFold2预测结构。该平台还包含训练-验证-测试数据集划分功能和标准化评估工具,有助于简化模型性能比较流程。
python_audio_loading_benchmark - Python音频库加载性能基准测试
Python音频加载性能评估机器学习音频处理库Github开源项目
该项目评估了多个Python音频库的加载性能,包括scipy、soundfile和pydub等。测试比较了各库将不同格式音频文件加载为numpy、PyTorch和TensorFlow张量的速度,以及音频元数据获取效率。这项基准测试为机器学习模型开发者提供了宝贵参考,特别是在处理原始音频数据时。项目展示了详细的测试结果,并提供了运行基准测试的指导。
awesome-cvpr-2024 - CVPR 2024计算机视觉前沿进展集锦
CVPR 2024计算机视觉人工智能深度学习机器学习Github开源项目
该项目汇总了CVPR 2024会议的重要论文、挑战赛和教程。涵盖计算机视觉领域多个前沿方向,包括视觉变换器、视觉语言模型和3D重建等。为研究人员和从业者提供了解计算机视觉最新进展的全面资源,展现了该领域的创新趋势和突破性成果。
modulus-makani - 用于天气和气候机器学习模型的大规模并行训练库
Makani机器学习天气预报气候模型并行训练Github开源项目
Makani是一个基于PyTorch的实验库,用于研发机器学习驱动的天气和气候模型。它支持在100多个GPU上进行大规模并行训练,提供多种模型和数据并行技术,以及异步数据加载等功能。该项目由NVIDIA和NERSC研发,用于训练FourCastNet等深度学习天气预报模型,为下一代天气和气候模型的开发提供支持。
rf_diffusion_all_atom - 全原子精度蛋白质结构生成工具
RFDiffusion AA蛋白质设计分子对接机器学习结构生物学Github开源项目
rf_diffusion_all_atom是一个基于AI的蛋白质结构生成工具,实现全原子精度的模型设计。该工具支持小分子结合蛋白和包含特定基序的蛋白质设计,提供简单的安装步骤和使用指南。rf_diffusion_all_atom能够生成自定义蛋白质结构,适用于药物发现和蛋白质工程等研究领域。
hands-on-rl - 实践驱动的强化学习进阶教程
强化学习课程Python机器学习深度学习Github开源项目
hands-on-rl项目提供一套系统化的强化学习实践教程。该教程涵盖从Q-learning到策略梯度等核心算法,通过递进难度的案例帮助学习者掌握RL技术。内容包括出租车驾驶和登月模拟等实例,并结合深度学习知识。教程提供Python代码实现和详细解释,适合希望深入学习强化学习的研究者和开发者。
aTrain - 本地化多语言语音转录工具 支持主流质性分析软件
aTrain语音转录机器学习隐私保护多语言支持Github开源项目
aTrain是格拉茨大学研究人员开发的本地化语音转录工具,采用先进机器学习模型实现快速准确转录和说话人检测。支持57种语言,兼容MAXQDA、ATLAS.ti和NVivo等主流质性分析软件。该工具在本地设备处理数据,确保隐私安全和GDPR合规。适用于Windows系统,可通过Microsoft应用商店安装,为研究人员提供高效的访谈转录解决方案。
unified-io-2 - 跨模态人工智能的开源新标杆
Unified-IO 2多模态模型机器学习深度学习人工智能Github开源项目
Unified-IO 2是一个开源的多模态AI框架,集成视觉、语言、音频和动作处理能力。项目提供完整代码支持演示、训练和推理,适用于TPU和GPU环境。基于T5X优化,内含多规格预训练模型和丰富数据集。其跨模态学习和生成能力为AI研究与应用提供了新的可能性。项目采用模块化设计,便于研究人员和开发者进行二次开发和定制。Unified-IO 2支持多种数据格式和预处理流程,为不同任务场景提供灵活解决方案。其开源性质促进了AI社区的协作与创新,为多模态AI技术的进步做出贡献。
pykan - 实现了Kolmogorov-Arnold网络,提升神经网络准确性和可解释性
KAN神经网络机器学习可解释性数学基础Github开源项目
pykan项目实现了Kolmogorov-Arnold网络(KAN),这是一种在边缘应用激活函数的创新神经网络架构。KAN在多项任务中表现优于多层感知器(MLP),提高了模型准确性、参数效率和可解释性。项目提供详细教程和示例,涵盖从函数拟合到PDE求解的应用,为科学发现和数学定律探索开辟新途径。
mlx - 为Apple芯片优化的开源机器学习框架
MLX机器学习Apple芯片数组框架APIGithub开源项目
MLX是一款针对Apple芯片优化的开源机器学习框架。它具有类NumPy的Python接口、可组合的函数转换、惰性计算和动态图构建等特性。通过统一内存模型,MLX支持在CPU和GPU间无缝切换。该框架为机器学习研究者提供了友好高效的开发环境,有助于快速验证创新想法。
tslearn - Python时间序列分析机器学习库
tslearn时间序列分析机器学习Python库数据预处理Github开源项目
tslearn是一个开源的Python库,专注于时间序列分析和机器学习。它提供数据预处理、分类、聚类、回归和多种距离度量方法。支持可变长度时间序列,兼容scikit-learn,包含UCR数据集和数据生成器。tslearn适用于需要进行时间序列分析的数据科学工作,支持超参数调优和管道等功能,为研究和实践提供全面工具支持。
pesto - 基于机器学习的高效音高估计开源工具
PESTO音高估计机器学习PyTorch命令行界面Github开源项目
PESTO是一个开源的音高估计工具,基于机器学习技术开发。该项目获得ISMIR 2023最佳论文奖,具有出色的性能和快速的处理速度。PESTO支持多种音频格式,提供命令行和Python API接口,便于集成使用。与CREPE相比,PESTO的模型参数更少,但在主要数据集上表现相当。适用于需要高效音高估计的音频处理应用。
alphageometry - 无需人类示范的奥林匹克几何问题求解器
AlphaGeometry几何定理证明机器学习人工智能数学奥林匹克Github开源项目
AlphaGeometry是一个创新的几何定理证明系统,能够解决奥林匹克级别的几何问题,无需人类示范。它结合了演绎-归纳推理和大型语言模型,自动构建辅助线并生成严格证明。在IMO-AG-30和JGEX-AG-231测试集上,AlphaGeometry分别解决了25和228个问题,大幅超越传统DDAR方法。项目开源了核心代码,包括DDAR求解器和语言模型推理模块,为几何定理自动证明开辟新路径。
multimodal - PyTorch多模态模型开发框架
TorchMultimodal多模态模型PyTorch机器学习深度学习Github开源项目
TorchMultimodal是基于PyTorch的多模态模型开发框架,提供模块化构建块和预训练模型,支持ALBEF、BLIP-2、CLIP等多种架构。该框架包含训练、微调和评估示例,可用于构建内容理解和生成模型。TorchMultimodal整合了PyTorch生态系统,便于研究人员复现和开发先进的多模态多任务模型。
cheatsheets-ai - 深度学习和机器学习工程师常用速查表
AI Cheatsheets机器学习深度学习TensorFlowKerasGithub开源项目
提供详尽的深度学习和机器学习速查表,包括Tensorflow、Keras、Numpy等热门工具,帮助工程师和研究人员快速掌握核心知识,提高工作效率。访问AI Cheatsheets获取更多资源和最新技术信息,适用于各水平从业者。
相关文章
Ray: 统一框架助力AI和Python应用扩展
3 个月前
SQLFlow: 融合SQL与AI的创新技术
3 个月前
Efficient-AI-Backbones: 华为诺亚方舟实验室开发的高效AI骨干网络
3 个月前
Netron: 强大的神经网络和机器学习模型可视化工具
3 个月前
DVC: 开源数据版本控制系统助力数据科学和机器学习项目
3 个月前
SynapseML:简单而强大的分布式机器学习库
3 个月前
TensorWatch: 微软开源的机器学习调试与可视化工具
3 个月前
AI专家路线图2024:成为人工智能专家的学习指南
3 个月前
Ray :用于扩展 AI 和 Python 应用程序的统一框架
2024年08月03日