#机器学习

Stock-Prediction-Neural-Network-and-Machine-Learning-Examples - Python实现的股票预测神经网络和机器学习模型集
股票预测机器学习神经网络Python超参数优化Github开源项目
这个开源项目集成了多种用于股票预测的机器学习和神经网络方法,包括遗传算法、梯度提升和K均值聚类等。项目展示了如何使用Keras、PyTorch等主流深度学习框架实现这些模型。其特色在于提供了超参数优化功能,支持多线程处理以提升效率。开发者可以方便地配置和测试不同的超参数,如学习率、批量大小和网络结构。项目还包含了使用实时市场数据进行股票预测的实例代码和详细文档,适合学习和研究股票预测技术。
KoopmanLab - Koopman神经算子 高效求解非线性偏微分方程
KoopmanLabKoopman神经算子偏微分方程机器学习物理方程求解Github开源项目
KoopmanLab是一个开源的Koopman神经算子包,基于PyTorch开发。该项目结合机器学习和动力系统理论,提供了一种无网格方法来求解非线性偏微分方程。KoopmanLab实现了多种模型,如KNO和ViT-KNO,并配备完整的数据处理、训练和测试工具。它可应用于Navier-Stokes方程和浅水方程等物理模拟场景,为研究人员提供了高效灵活的计算框架。
linfa - Rust语言的综合机器学习工具库
Linfa机器学习Rust算法库数据处理Github开源项目
Linfa是一个用Rust语言开发的开源机器学习工具库,为常见ML任务提供全面解决方案。它实现了多种算法,包括聚类、降维、回归和分类等,并具备数据预处理功能。Linfa支持多种BLAS/LAPACK后端,可满足不同性能需求。这个项目旨在为Rust生态系统构建一个活跃的机器学习社区。
dtreeviz - 提供直观的决策树可视化和模型解释功能
dtreeviz决策树可视化机器学习模型解释数据科学Github开源项目
dtreeviz是一个专注于决策树可视化和模型解释的Python库。它支持多个主流机器学习框架,如scikit-learn、XGBoost等。该库提供树结构、预测路径、叶节点和特征空间等多种可视化功能,帮助用户直观理解决策树模型原理。dtreeviz适用于机器学习实践者和研究人员,可用于模型解释和教学等场景。
MachineLearning-QandAI-book - 深入探讨机器学习和人工智能领域的30个核心问题
机器学习人工智能Sebastian Raschka深度学习自然语言处理Github开源项目
该书通过30个章节探讨机器学习和人工智能领域的核心问题,内容涵盖基础概念和前沿技术。涉及多GPU训练范式、Transformer微调、编码器和解码器型LLM差异、视觉Transformer等主题。每章提供详细解释和扩展阅读资料,适合希望扩展知识并了解最新AI技术的读者。
Simd - 开源图像处理与机器学习库 支持多平台SIMD指令优化
Simd Library图像处理机器学习SIMD优化跨平台Github开源项目
Simd是一个开源的图像处理和机器学习库,专为C和C++开发者设计。它提供像素转换、图像缩放、滤波、统计分析、运动检测、对象识别和神经网络等高性能算法。该库针对x86/x64的SSE、AVX、AVX-512、AMX和ARM的NEON等SIMD指令集进行了优化。Simd提供C API和C++接口,支持动态和静态链接,兼容32位和64位的Windows及Linux平台。
zheye - 智能识别知乎倒立汉字验证码的开源工具
知乎验证码识别卷积神经网络高斯混合模型机器学习Github开源项目
zheye是一个开源项目,专注于识别知乎的倒立汉字验证码。该项目结合了卷积神经网络和高斯混合模型,可准确定位图中的倒立文字。zheye提供完整的训练和测试流程,包括依赖安装、模型训练和验证码评估。作为计算机视觉领域的实践案例,zheye展示了先进的图像识别技术。项目开发目的为学习和研究,使用时需遵守相关协议。
2018-MachineLearning-Lectures-ESA - 欧洲航天局2018年机器学习系列讲座综述
机器学习欧洲航天局深度学习神经网络无监督学习Github开源项目
该项目汇集了欧洲航天局2018年举办的6场机器学习讲座资源。讲座内容涵盖机器学习导论、线性回归、支持向量机、决策树、随机森林、神经网络、深度学习、无监督学习和文本挖掘。每场讲座提供视频、幻灯片和实践笔记本,展示了机器学习在航天领域的应用。
openfoodfacts-ai - 开源食品数据库的人工智能实验平台
Open Food FactsAI机器学习数据分析食品数据库Github开源项目
openfoodfacts-ai是一个致力于食品数据人工智能研究的开源项目。该平台集成了多个实验性AI项目,包括营养表格识别、食品分类预测和标签检测等。其主要目标是优化Open Food Facts数据库,为研究人员和开发者提供高质量的食品数据和AI模型。项目重视社区贡献,定期组织线上会议,并提供完善的文档支持。
tpot - 基于遗传算法的自动机器学习管道优化工具
TPOT机器学习自动化管道优化遗传算法Github开源项目
TPOT是一个开源的自动机器学习工具,基于Python开发。它采用遗传算法来优化机器学习管道,能够自动探索大量可能的管道组合,为给定数据集找到最佳模型。TPOT构建于scikit-learn之上,可生成易读易修改的Python代码。该工具支持分类和回归任务,适用于多种数据科学场景,能够有效减少数据科学家在模型选择和参数调优上的时间投入。
ploomber - 快速构建和部署数据流水线的开源框架
Ploomber数据管道部署Jupyter机器学习Github开源项目
Ploomber是一个开源的数据流水线构建框架,支持多种主流编辑器进行交互式开发。它可以无缝部署到Kubernetes、Airflow等平台,提供YAML和Python API,具备自动缓存和笔记本重构功能。Ploomber适用于各级数据科学工作者,能显著提升数据处理效率。
DeepRobust - PyTorch图像和图神经网络对抗性攻防开源库
DeepRobust对抗攻击机器学习图神经网络PyTorchGithub开源项目
DeepRobust是一个基于PyTorch的开源库,专注于图像和图神经网络的对抗性攻击与防御。它提供多种攻防算法,支持MNIST、CIFAR10等数据集,可与PyTorch Geometric集成。该库适用于对抗性机器学习研究,也为构建鲁棒深度学习模型提供工具。DeepRobust支持大规模图如OGB-ArXiv的攻击,并包含节点嵌入攻击和受害模型。它还提供图像预处理方法APE-GAN,支持ImageNet数据集,新增UGBA后门攻击和PRBCD可扩展攻击算法。库中包含MedianGCN、AirGNN等鲁棒模型,以及用于转换PyTorch Geometric和DeepRobust数据集的工具,成为全面的对抗性机器学习研究平台。
scikeras - Keras与Scikit-Learn的无缝集成工具
Scikit-LearnKerasSciKeras机器学习PythonGithub开源项目
SciKeras是一个开源项目,旨在为Keras模型提供Scikit-Learn兼容的包装器。作为tf.keras.wrappers.scikit_learn的继任者,SciKeras保持API兼容性的同时,提供了更多功能。该项目支持TensorFlow,可通过pip轻松安装。SciKeras不仅提供详细文档,还有完整的迁移指南,方便用户从原有框架过渡。项目基于scikit-learn 1.4.1post1及以上版本和Keras 3.2.0及以上版本,为机器学习实践者提供了一个强大的集成工具。
intro-to-deep-learning - 全面实用的深度学习入门课程
深度学习神经网络Jupyter Notebook机器学习PythonGithub开源项目
这是一个面向深度学习初学者的开源项目,提供全面的入门课程。课程内容包括神经网络基础知识的介绍材料、实践演练和扩展资源。采用Jupyter Notebook形式,鼓励学生动手实践以加深理解。课程涵盖深度学习核心概念,为学习者打下扎实基础,为进一步探索高级主题如GAN和NLP做好准备。项目注重理论与实践结合,并提供深入学习资源。项目内容结构清晰,按主题分类组织,每个主题包含概述、预习建议、实践演示和深入学习资源。课程支持本地运行和Google Colab使用两种方式,增加了学习的灵活性。
llama_cpp.rb - Ruby语言的LLaMA模型集成工具
llama.cppRuby大语言模型自然语言处理机器学习Github开源项目
llama_cpp.rb是一个为Ruby开发者提供llama.cpp绑定的工具,支持在Ruby项目中集成LLaMA模型。该项目实现了模型加载、上下文管理和文本生成等功能,并包含交互式聊天示例。通过简化Ruby环境中大型语言模型的部署和使用过程,llama_cpp.rb为开发者提供了实用的集成方案。
optimum-quanto - PyTorch模型量化框架 提升性能和效率
Optimum Quanto量化PyTorch机器学习模型优化Github开源项目
Optimum Quanto是专为Optimum设计的PyTorch量化框架。它支持eager模式、多设备部署,自动插入量化/反量化存根和操作,实现从浮点到动态/静态量化模型的无缝转换。支持多种精度的权重和激活量化,有效提升模型性能和内存效率。该框架为Hugging Face和原生PyTorch模型提供简便的量化流程。
tuned-lens - 变压器模型分层预测机制的解析工具
Tuned Lenstransformer机器学习自然语言处理模型解释Github开源项目
Tuned Lens是一个开源工具包,用于分析变压器模型的分层预测过程。该工具通过训练和评估调谐镜头,展示了模型如何逐层构建预测。它使用仿射变换替代模型后几层,从中间表示中提取最佳预测,为研究人员提供了深入了解模型内部机制的方法。
SwanLab - 开源AI实验跟踪工具 支持多框架集成及云端协作
SwanLab实验跟踪机器学习可视化协作Github开源项目
SwanLab是一款开源的AI实验跟踪工具,支持跟踪超参数、记录指标、在线协作和分享实验链接。该工具可与PyTorch、TensorFlow等主流框架集成,同时支持离线模式和自托管。SwanLab提供用户友好的API和直观界面,适用于个人研究和团队项目,能够帮助研究人员高效管理、比较和协作AI实验。
modern-srwm - 现代自引用权重矩阵的神经网络学习方法
Self-Referential Weight Matrix深度学习神经网络机器学习人工智能Github开源项目
modern-srwm项目开发了一种新型自引用权重矩阵,使神经网络能自主修改自身结构。该项目提供多篇相关研究论文的代码实现,包括强化学习和监督学习应用。通过优化CUDA内核,项目提升了算法性能,并探索了神经网络自我改进的创新方法。这一技术为机器学习领域的自主学习和持续优化提供了新的研究方向。
LightGBMLSS - LightGBM概率建模扩展框架 实现全条件分布预测
LightGBMLSS概率建模分布预测梯度提升机器学习Github开源项目
LightGBMLSS作为LightGBM的扩展框架,实现了单变量目标全条件分布的建模和预测。该框架支持多种分布类型,包括连续、离散和混合分布,并具备归一化流和混合密度等先进功能,能够有效处理复杂的多模态数据。LightGBMLSS自动推导梯度和海森矩阵,集成了超参数优化和可解释性分析功能,同时保持与LightGBM的完全兼容。这一框架为概率建模提供了全面而灵活的解决方案。
transformers-php - 先进的PHP机器学习库
TransformersPHP机器学习PHPONNX预训练模型Github开源项目
TransformersPHP是一个PHP机器学习库,提供与Python版Transformers相同的功能。基于Hugging Face的Transformers构建,支持众多预训练模型,适用于文本生成、摘要、翻译等任务。该库采用ONNX Runtime执行模型,性能优异。通过简洁的API,PHP开发者可以方便地在项目中集成先进的机器学习技术。
magvit - 单模型实现多种视频合成任务的创新技术
MAGVIT视频生成机器学习计算机视觉深度学习Github开源项目
MAGVIT是一种创新的视频生成技术,采用掩码生成视频变换器实现单一模型解决多种视频合成任务。该项目在视频生成质量、效率和灵活性方面表现出色,能够执行类别条件生成、帧预测和多任务视频处理。MAGVIT在UCF-101、BAIR Robot Pushing、Kinetics-600等多个基准测试中取得优异成绩,展示了其在视频生成领域的应用前景。
llama-2-jax - 基于JAX的大语言模型高效实现
Llama 2JAX模型实现大语言模型机器学习Github开源项目
这是一个利用JAX框架实现Llama 2模型的开源项目。该项目致力于提高模型训练和推理效率,构建高质量Transformer代码库,为自然语言处理领域提供有价值见解。项目功能包括参数转换、数据加载、模型架构实现等,并在持续开发训练和生成功能。这为研究人员和开发者提供了便捷的Llama 2模型研究与应用工具。
simpletransformers - 快速构建和优化Transformer模型的开源工具
Simple TransformersNLPHugging Face机器学习深度学习Github开源项目
simpletransformers是一个基于Hugging Face Transformers的开源工具,通过简化的API让用户能够用少量代码快速构建和优化Transformer模型。该库支持文本分类、命名实体识别、问答系统等多种NLP任务,为研究人员和开发者提供了便捷的方式来应用这些强大的模型。simpletransformers具有直观的接口和丰富的功能,可用于各类自然语言处理场景,有效降低了使用Transformer模型的门槛。
awesome-ml-model-compression - 机器学习模型压缩与加速技术资源汇总
模型压缩机器学习深度学习神经网络AI加速Github开源项目
本项目汇总了机器学习模型压缩和加速领域的优质资源,包括研究论文、技术文章、教程和工具库等。涵盖量化、剪枝、知识蒸馏和轻量级网络设计等多种技术方法。为研究人员和工程师提供了优化深度学习模型性能和效率的重要参考。项目内容持续更新,欢迎提交新的相关资源。
document-ai-samples - Google Cloud Document AI 应用示例与工具集
Document AIGoogle Cloud文档分析样本代码机器学习Github开源项目
本项目汇集了多个Google Cloud Document AI应用示例和工具。涵盖文档分析、分类和搜索等功能,包括Google Drive集成、仓库处理、批量导入和内容审核等实用工具。还提供PDF处理、语言提取和表格数据提取等功能示例。项目中的Web应用演示支持表单、发票和OCR处理。这些资源有助于开发者学习和实践Document AI技术。
Multimodal-AND-Large-Language-Models - 多模态与大语言模型前沿研究综述
多模态大语言模型视觉语言模型人工智能机器学习Github开源项目
本项目汇总了多模态和大语言模型领域的最新研究进展,涵盖结构化知识提取、事件抽取、场景图生成和属性识别等核心技术。同时探讨了视觉语言模型在推理、组合性和开放词汇等方面的前沿问题。项目还收录了大量相关综述和立场文章,为研究人员提供全面的领域概览和未来方向参考。
mixture-of-experts - PyTorch实现的稀疏门控专家混合层
PyTorch神经网络机器学习专家混合深度学习Github开源项目
mixture-of-experts项目提供PyTorch版本的稀疏门控专家混合层实现,基于'Outrageously Large Neural Networks'论文。该实现支持自定义专家数量和输入输出维度,并提供训练和评估示例。项目包含CIFAR-10数据集应用实例,展示实际性能。作为深度学习工具,它有助于构建大规模高效的神经网络模型。
LLMPapers - 大型语言模型研究论文和资源汇总
大语言模型ChatGPT自然语言处理人工智能机器学习Github开源项目
LLMPapers是一个汇集ChatGPT、GPT-3等大型语言模型相关论文和资源的开源项目。该项目涵盖评估、调查、上下文学习、指令微调、RLHF等多个研究方向,由多位专家学者维护。LLMPapers为研究人员提供大语言模型领域的最新进展和参考资料,是该领域重要的学术资源库。
ai-powered-search - 现代搜索引擎的AI驱动技术实践
AI搜索引擎机器学习自然语言处理语义搜索Apache SolrGithub开源项目
AI-Powered Search项目展示了现代搜索引擎的AI驱动技术,包括语义搜索、检索增强生成和个性化搜索等。项目基于Python和PySpark开发,支持多种搜索引擎和向量数据库。通过Docker容器和Jupyter Notebooks,开发者可以实践《AI-Powered Search》一书中的代码示例,深入学习构建智能搜索引擎的先进技术。
Awesome-LLM-Tabular - 大型语言模型与表格数据处理研究进展
LLM表格数据自然语言处理机器学习人工智能Github开源项目
Awesome-LLM-Tabular汇集了大型语言模型在表格数据处理领域的研究论文,涵盖数据表示、问答和推理等方面。项目提供论文详细信息、相关工作坊和博客文章,为研究人员提供全面的参考资源,助力快速了解该领域的最新进展。
awesome-MLSecOps - 机器学习安全运维工具与资源精选MLSecOps实践指南
MLSecOpsAI安全机器学习开源工具攻击向量Github开源项目
该项目汇集了机器学习安全运维(MLSecOps)领域的开源工具、资源和教程。内容涵盖安全工具、数据保护、代码安全、攻击向量分析等多个方面,为从业者提供全面的参考资料。项目适合不同层次的MLSecOps实践者,有助于提升机器学习系统的整体安全性。
Rasa_NLU_Chi - 基于Rasa NLU的中文自然语言理解框架
Rasa NLU中文自然语言处理MITIEJieba分词机器学习Github开源项目
Rasa_NLU_Chi是基于Rasa NLU的中文自然语言理解框架。该项目提供意图分类和实体识别功能,集成MITIE和Jieba进行中文处理。框架包含预训练中文词向量模型,支持自定义NLU系统的配置和训练。通过REST API服务,Rasa_NLU_Chi可轻松集成到各类应用中,为开发者提供构建中文对话系统的基础工具。
sparkling-water - Apache Spark与H2O-3的机器学习集成框架
Sparkling Water机器学习Apache Spark数据集成H2O-3Github开源项目
Sparkling Water是一个开源项目,将H2O-3机器学习引擎与Apache Spark集成。它提供了Spark和H2O数据结构间的转换工具,支持使用Spark数据作为H2O算法输入,并提供构建机器学习应用的基础模块。项目还包含PySparkling接口,支持从PySpark直接使用。Sparkling Water支持Spark Shell集成、Spark Submit应用、以及通过Maven包使用。它提供多种后端部署模式,适应不同使用场景。项目致力于简化大规模数据处理和机器学习任务的开发流程,在Spark环境中优化机器学习解决方案的开发和部署过程。
torchquad - 基于GPU加速的开源数值积分框架
torchquad数值积分GPUPyTorch机器学习Github开源项目
torchquad是一个开源的高性能数值积分框架,支持PyTorch、JAX和Tensorflow等多个后端。该框架针对GPU进行了优化,能有效处理高维积分问题,并在GPU上展现出优异的扩展性。torchquad提供多种积分方法,支持自动微分,适用于机器学习和科学计算等领域。其简洁的API设计使研究人员和开发者能够高效地完成复杂的数值积分任务。
MIVisionX - AMD开源计算机视觉和机器智能开发工具包
MIVisionXOpenVX计算机视觉机器学习AMDGithub开源项目
MIVisionX是一套开源的计算机视觉和机器智能开发工具包。它包含优化的OpenVX实现、神经网络模型编译器和多种实用工具。支持ONNX和NNEF格式,可在嵌入式设备到高性能服务器等多种硬件平台上部署计算机视觉和机器学习应用。