#机器学习

gorgonia - Go语言机器学习库,具备自动微分和符号微分功能
Gorgonia机器学习Go语言自动微分神经网络Github开源项目
Gorgonia是专为Go语言开发的机器学习库,提供自动微分、符号微分、梯度下降优化和数值稳定功能。用户可以轻松编写和评估多维数组的数学方程,并利用CUDA进行快速计算。其目标是成为高性能、可扩展的机器学习和图计算库,适合多机部署,同时支持非标准深度学习和神经网络研究。
tensorwatch - 数据科学和机器学习的实时可视化与调试工具
TensorWatchMicrosoft机器学习数据可视化Jupyter NotebookGithub开源项目
TensorWatch是由微软研究院开发的调试和可视化工具,专为数据科学、深度学习和强化学习设计。它运行在Jupyter Notebook中,提供实时的机器学习训练可视化和分析功能。其灵活的架构允许创建自定义的可视化、界面和仪表板,并支持独特的Lazy Logging模式进行实时查询和流式数据处理。TensorWatch支持多种图表类型和并行流可视化,是一个易于使用且可扩展的调试平台。
courses - AI课程和资源精选合集
AI courses人工智能深度学习自然语言处理机器学习Github开源项目
本仓库汇集了各种人工智能课程和资源链接,适合不同学习阶段的用户。涵盖生成式AI、深度学习、自然语言处理等多个主题的免费课程,资源来自麻省理工学院、斯坦福大学、哈佛大学等知名机构。欢迎贡献和建议,共同打造优质的AI学习平台。
python-machine-learning-book-3rd-edition - Python与机器学习代码实例——从基础到高级应用
Python Machine Learningscikit-learnTensorFlow机器学习数据处理Github开源项目
《Python Machine Learning》第三版全面覆盖了数据预处理、分类、回归、深度学习和强化学习等机器学习领域的核心概念。书中提供了Scikit-Learn和TensorFlow的代码示例,帮助读者掌握模型评估、超参数优化和集成学习等技术。本书适合初学者和进阶用户,通过代码仓库可以获得丰富的实践经验。出版信息:Packt Publishing, 2019年12月12日,ISBN-13: 978-1789955750。
NN-SVG - 高效自动生成神经网络架构图的工具
NN-SVG神经网络机器学习SVG文件深度学习Github开源项目
NN-SVG是一款通过参数化方式创建神经网络架构图的工具,支持导出为SVG文件,适用于学术论文和网页。它能生成经典全连接神经网络、卷积神经网络和深度神经网络图形,使用D3和Three.js库,用户可自定义图形大小、颜色和布局。该工具旨在节省机器学习研究人员的时间,并可作为教学工具使用。
zenml - 帮助数据科学家和机器学习工程师标准化机器学习流程的框架
ZenMLMLOps数据科学机器学习云基础设施Github开源项目
ZenML是一个MLOps框架,帮助数据科学家和机器学习工程师标准化机器学习流程。用户可以通过Python装饰器创建机器学习流水线,并在AWS、GCP、Azure等云平台上运行。ZenML提供一键部署功能,支持远程堆栈快速设置和使用。其优势包括简化的端到端MLOps流程、与现有工具的无缝集成及全面的模型跟踪和审计功能。适合在复杂基础设施上构建和管理ML流水线的用户。
DeepLearningProject - 全面教程涵盖数据集创建与深度学习
Harvard UniversityPyTorch机器学习深度学习PythonGithub开源项目
本教程详细介绍了从创建自定义数据集到应用传统和深度学习算法的完整机器学习管道。基于哈佛大学高级数据科学课程项目,内容更新为PyTorch版本,适合希望深入理解和实践机器学习的用户。
interviews.ai - 深度学习面试宝典,涵盖广泛AI关键主题
Deep Learning InterviewsAIBayesian统计卷积神经网络机器学习Github开源项目
本书包含数百个AI面试问题的详细解答,涵盖信息理论、贝叶斯统计和算法微分等核心主题。特别为数据科学研究生和求职者设计,帮助在面试中脱颖而出。无论是初学者还是有经验的研究人员,都能从中获益。书中配有清晰图表和逐步解析,助读者全面掌握深度学习理论和实践。
SynapseML - 简化大规模机器学习管道的开源工具
SynapseMLApache Spark机器学习文本分析异常检测Github开源项目
SynapseML是一个开源库,旨在简化大规模机器学习管道的创建。它提供简单、可组合和分布式的API,支持文本分析、视觉处理、异常检测等多种任务。基于Apache Spark,SynapseML与SparkML/MLLib共享相同的API,能够无缝集成到现有的Spark工作流中。该库支持Python、R、Scala、Java和.NET,适用于各种数据库和云数据存储,助力构建智能系统。
dlwpt-code - 深入浅出PyTorch深度学习指南
Deep Learning with PyTorch深度学习PyTorch机器学习编程Github开源项目
《Deep Learning with PyTorch》通过实际项目展示深度学习的基础知识,适合希望掌握PyTorch的开发者、计算机科学家、数据科学家及相关专业学生。书中提供了对深度学习的直观理解,并深入探讨PyTorch的部分功能,适合具备编程基础的读者。作者团队拥有丰富的实践经验和开源项目贡献,确保内容实用且前沿。
Flux.jl - 轻量级的纯Julia机器学习框架
FluxJulia机器学习轻量级抽象GPU支持Github开源项目
Flux.jl是一个基于100%纯Julia技术栈的机器学习框架,结合原生GPU和自动微分支持,提供简洁优雅的解决方案。该框架使简单任务易于实现,并且高度可定制。适用于Julia 1.9及更高版本,支持快速模型构建与训练。了解更多信息,请参阅快速入门和文档页面。
VoTT - 开源图像与视频标注工具,兼容多种数据存储方式
VoTT开源标注工具图像标注视频标注机器学习Github开源项目
VoTT是一个基于React和Redux的开源图像和视频标注工具,支持从本地或云存储导入数据,并将标注数据导出到不同的存储提供商。作为机器学习工作流中的工具,VoTT提供图像和视频帧的标签功能,采用现代开发框架TypeScript编写,并进行代码检查和单元测试。支持Azure Blob Storage、Bing Image Search等多种数据源,用户可通过浏览器使用Web版本。
TensorFlow-World - TensorFlow教程与代码优化指南
TensorFlow深度学习开源项目教程机器学习Github
本项目提供全面易懂的TensorFlow教程,每个教程均附源代码和详细文档,帮助开发者和研究者快速高效地掌握TensorFlow。内容涵盖基础操作、机器学习、神经网络等多个领域,并提供虚拟环境安装指南,避免包冲突并支持环境定制。
nlp - NLP基础知识与应用案例介绍
NLP自然语言处理机器学习fasttext开源书籍Github开源项目
介绍自然语言处理(NLP)的基础知识和实际应用,包括常用数据集、机器学习模型评价方法、词袋模型、TFIDF、Word2Vec、Doc2Vec等技术,以及多层感知机、fasttext和LDA在文档分类和主题建模中的应用。还展示了对美食评语的情感分析,说明了NLP在文本理解与安全领域的重要性。此外,还介绍了一本开源NLP入门书籍的写作和更新过程,适合想深入了解NLP技术的读者。
pybroker - Python和机器学习驱动的高效算法交易框架
PyBroker算法交易机器学习Python回测Github开源项目
PyBroker是一个专为开发算法交易策略而设计的Python框架,特别侧重于使用机器学习技术。它提供了超快速的回测引擎、支持多资产的交易规则执行、历史数据访问、步进分析训练和回测、以及随机自助法等功能。PyBroker支持多平台安装,适用于Windows、Mac和Linux系统,帮助加速开发流程并获得更精确的交易结果。
tree-of-thoughts - 提高AI推理能力的先进算法
Tree of ThoughtsAI算法机器学习AI推理Github开源项目
Tree of Thoughts (ToT) 是一种强大且灵活的算法,通过即插即用版本,可显著提高模型推理能力达70%。用户可以连接自己的模型,体验高级智能。项目支持通过Python库安装和使用,并提供详细的使用指南和代码示例,包括如何与Hugging Face Transformers集成。该项目由Princeton University和Google DeepMind的研究人员开发,旨在推进AI推理能力的前沿进展。
ML - PHP语言的高层次机器学习和深度学习库
Rubix MLPHP机器学习开源算法Github开源项目
Rubix ML是一个为PHP设计的高层次机器学习与深度学习开源库,提供40多种算法及完整的ETL、预处理和交叉验证工具。API设计开发者友好,支持商业用途。丰富的文档与教程助力各类用户快速上手。
djl - 简洁易用的Java深度学习框架,支持多引擎切换
Deep Java Library深度学习Java框架开源机器学习Github开源项目
Deep Java Library (DJL) 是一个开源、高级、与深度学习引擎无关的Java框架,提供简单易用的深度学习体验。Java开发者无需成为机器学习专家即可使用现有技能构建、训练和部署模型。DJL支持自动选择CPU/GPU并提供最佳性能,用户可以随时在项目中切换引擎。其符合人体工程学的API接口指导用户完成深度学习任务,支持从模型加载到训练和推理的全流程操作,简化深度学习模型的集成。
fun-rec - 系统化机器学习推荐算法教程与实战
FunRec推荐系统算法工程师机器学习阿里天池Github开源项目
本教程适合具备机器学习基础、希望进入推荐算法领域的学习者,内容包括推荐系统概述、算法基础、实战项目和面经总结。系统化学习从基础到实战,助力面试成功。由多位热爱分享的同学整理,FunRec学习社区提供交流和技术支持。
ray - 全面扩展AI和Python应用的统一框架
Ray分布式计算机器学习Python人工智能Github开源项目热门
Ray是一个统一的框架,专门用于扩展AI和Python应用。它包含一个核心分布式运行时和一套AI库,用于简化机器学习计算。无论是在单机还是集群上,Ray都能让相同的代码无缝扩展。此外,Ray支持各种机器、云服务提供商和Kubernetes,且拥有日益增长的社区生态系统。此框架易于安装,只需执行简单的命令即可:'pip install ray'。
sqlflow - 机器学习与SQL编程的先进集成
SQLFlow机器学习TensorFlowXGBoostKubernetesGithub开源项目热门
SQLFlow 是一款编译器,它将SQL程序编译成在Kubernetes上运行的工作流,支持包括机器学习训练、预测、模型评估等在内的AI作业。此平台支持MySQL、TiDB、Hive等多种数据库系统,以及TensorFlow、Keras、XGBoost等机器学习工具包。SQLFlow 致力于通过SQL增强机器学习模型开发,让拥有SQL技能的工程师也能轻松开发高级机器学习应用。
aim - 开源AI实验跟踪工具,可视化比较和高效管理AI实验
Aim实验跟踪机器学习API开源Github开源项目热门
Aim是一款易于使用且功能强大的开源AI实验跟踪工具,支持数以万计的训练运行。它提供了高性能的用户界面来探索和比较训练运行,同时通过其SDK实现对跟踪元数据的编程访问,完美支持自动化和Jupyter Notebook分析。Aim专注于与多种机器学习框架集成,可视化和比较元数据,组织和标记实验,使其成为团队中信赖的机器学习项目支持工具。
Efficient-AI-Backbones - 领先的人工智能模型与技术 - Huawei Noah's Ark Lab 研发
AI模型Transformer华为机器学习NeurIPSGithub开源项目热门
Efficient-AI-Backbones 项目涵盖了由华为诺亚方舟实验室研发的一系列先进的人工智能模型,包括 GhostNet, TNT, AugViT, WaveMLP, 和 ViG 等。这些模型通过创新的结构设计和优化,有效提升了计算效率和性能,广泛应用于各种智能处理任务。最新发布的 ParameterNet 在 CVPR 2024 会议上被接受,展现了华为在人工智能技术领域的持续领先。
SerpentAI - 强大的游戏代理框架,提供机器学习与AI研究的工具
Serpent.AI游戏代理框架Python机器学习开源Github开源项目热门
Serpent.AI是一个简单而强大的游戏代理框架,专为开发者打造,以协助他们利用Python开发视频游戏代理。该框架旨在为机器学习和人工智能研究提供有价值的工具,同时也适合爱好者使用。框架支持少依赖、易于使用,并提供图形用户界面。Serpent.AI支持Linux和Windows系统,采用开源MIT许可证,并探索为非技术用户提供Steam分发。
FLAML - 高效的Python库,用于自动化机器学习和模型调优
FLAMLAutoML机器学习模型优化PythonGithub开源项目
FLAML是一款轻量级且高效的Python库,旨在简化大语言模型和机器学习模型的自动化工作流程。通过多智能体对话框架和经济高效的自动调优功能,它帮助用户找到优质模型并优化GPT-X工作流。FLAML支持代码优先的AutoML和调优,能处理大规模搜索空间和复杂约束,广泛适用于分类、回归等任务。适用于Python 3.8及以上版本,并提供详细文档和多种扩展选项,满足用户的不同需求。
Dive-into-DL-TensorFlow2.0 - TensorFlow 2.0 深度学习中文教程与代码实现
TensorFlow2深度学习动手学深度学习代码重构机器学习Github开源项目
本项目将《动手学深度学习》一书中的MXNet代码改为TensorFlow 2.0实现,提供完整的中文学习资源,涵盖线性回归、卷积神经网络、循环神经网络等核心内容。适合对深度学习感兴趣的初学者,只需掌握基础数学和Python编程即可入门。
hands-on-ml-zh - Sklearn和TensorFlow机器学习指南
Python数据分析Github开源项目SklearnTensorFlow机器学习
本指南详细介绍了如何使用Sklearn和TensorFlow进行机器学习,包括在线阅读、Docker镜像、PYPI包和NPM包的多种下载方式,并提供了完整的编译和安装步骤。通过该指南,读者能够学习和掌握数据分析及机器学习的实用技能。
Huemint - 基于机器学习的独特色彩方案生成器
热门AI创意AI辅助设计AI工具Huemint机器学习颜色方案品牌网站
Huemint是一款采用机器学习技术的AI工具,可为品牌、网站或图形设计提供个性化色彩方案。该平台通过机器学习技术,助力用户迅速生成并定制悦目的色彩组合,旨在提高视觉效果和设计的专业水平。
Gradio - 构建和分享机器学习应用程序的平台
热门AI开发模型训练AI工具Gradio机器学习友好的Web界面Hugging Face SpacesPython
通过Gradio,用户可以通过简洁的Web界面快速展示机器学习模型,任何人都能轻松接入。在几行代码的帮助下,即可构建交互式界面,无论是在Gradio平台上还是作为嵌入Python笔记本的形式。Gradio还能长期托管于Hugging Face Spaces,提供公共分享链接,简化远程协作和模型展示过程。
Hugging Face - 源代码开源平台
热门AI开发模型训练AI工具机器学习Hugging Face开源企业解决方案合作平台
Hugging Face是开放源码机器学习平台,支持模型、数据集与应用的无限制托管,包含丰富的模态支持,已服务于超过5万家机构。
IBM watsonx.ai - 企业级AI平台
热门AI开发模型训练AI工具IBM watsonx.aiGenerative AI企业级AI基础模型机器学习
IBM watsonx.ai,领先的企业级AI平台,专为AI模型全周期管理设计。支持快速部署至多云环境,并提供高级安全保护,帮助企业简化AI开发流程,加速创新。
Evidently AI - 开源AI监控与机器学习观测平台
热门AI开发模型训练AI工具Evidently AI模型监控数据质量机器学习数据偏移
Evidently AI是一个开源的AI质量协作平台,旨在评估、测试和监控机器学习、LLM及通用AI应用。此平台帮助用户管理AI产品质量,维护模型性能,及时识别及应对数据偏移和异常。它支持文本、表格数据和嵌入式数据的监控,适用于各种规模的公司,提供直观的界面与丰富的可视化功能。
EmojiIntelligence - Swift编写的神经网络示例,展示机器学习的应用
EmojiIntelligence神经网络机器学习Swift编程开源Github开源项目
此开源项目展示了如何使用Swift在macOS的Playground中创建神经网络。项目旨在使神经网络和机器学习更易于理解和有趣,网络结构包括输入层、隐藏层和输出层,使用sigmoid函数进行激活。通过将图像转换为二进制数,该项目实现了基本的图像识别。开放源码以促进技术进步。
training-operator - Kubernetes原生的分布式机器学习训练解决方案
KubeflowTraining OperatorKubernetes机器学习分布式训练Github开源项目
Kubeflow Training Operator是一个Kubernetes原生工具,支持PyTorch、TensorFlow等多种框架的分布式训练。用户可以通过Kubernetes自定义资源API或Python SDK轻松部署和管理大规模机器学习模型的训练任务。项目还提供全面的监控设计和社区支持,是优化模型训练流程的理想工具。
graph-of-thoughts - 使用大型语言模型的灵活问题解决框架
Graph of ThoughtsLarge Language ModelPython机器学习复杂问题求解Github开源项目
该框架通过将复杂问题建模为操作图(GoO),并使用大型语言模型(LLM)自动执行,提供了一种新的解决复杂问题的方法。GoT框架灵活且可扩展,用户不仅可以使用新方法解决问题,还可以实现类似CoT或ToT的操作图。框架提供详细的安装和配置指南,并包含多个示例,帮助用户快速上手。文档详尽,便于理解和扩展。
cheatsheets-ai - 深度学习和机器学习工程师常用速查表
AI Cheatsheets机器学习深度学习TensorFlowKerasGithub开源项目
提供详尽的深度学习和机器学习速查表,包括Tensorflow、Keras、Numpy等热门工具,帮助工程师和研究人员快速掌握核心知识,提高工作效率。访问AI Cheatsheets获取更多资源和最新技术信息,适用于各水平从业者。