#机器学习

phenaki-pytorch - PyTorch实现Phenaki长视频AI生成技术
Phenaki视频生成AI机器学习PytorchGithub开源项目
项目采用PyTorch框架,实现Phenaki视频生成技术。通过Mask GIT方法,能根据文本提示生成最长2分钟的视频。引入token critic技术以提升生成质量。提供简洁API,支持条件和无条件生成模式。包含完整训练与推理代码,适用于文本到图像和视频生成的相关研究。
DeepLagrangianFluids - 拉格朗日流体模拟的连续卷积神经网络方法
流体模拟机器学习粒子系统深度学习物理引擎Github开源项目
DeepLagrangianFluids项目实现了基于连续卷积的粒子流体模拟网络,源于ICLR 2020会议发表的研究成果。项目包含数据生成、模型训练和预训练模型运行的完整代码,支持PyTorch和TensorFlow框架,并集成Open3D等库实现高效模拟与可视化。这种新方法在流体动力学模拟的准确性和计算效率方面取得了显著进展。
s2client-proto - StarCraft II API接口 助力AI开发与游戏分析
StarCraft II API人工智能游戏开发机器学习bot开发Github开源项目
s2client-proto项目提供全面的StarCraft II API接口,实现对游戏的完全控制。这一开源工具支持开发AI机器人、回放分析和玩家辅助工具。项目包括协议定义、C++实现、Linux包、地图和回放数据,并汇集丰富的社区资源,为StarCraft II AI研究奠定坚实基础。
neuralgcm - 结合机器学习与物理的大气模拟新方法
NeuralGCM大气模型天气模拟气候模拟机器学习Github开源项目
NeuralGCM是一个Python库,用于构建结合机器学习和物理模型的大气模拟系统。这个开源项目为天气和气候模拟提供新方法,融合了物理模型的精确性和机器学习的灵活性。NeuralGCM旨在提升天气预报和气候研究的准确度,为大气科学研究者提供实用工具。该项目采用Apache 2.0许可证,支持学术研究和商业应用。
awesome-emotion-recognition-in-conversations - 对话情感识别的最新研究资源与进展综述
情感识别对话系统自然语言处理机器学习深度学习Github开源项目
本文整理了对话情感识别(ERC)领域的全面论文阅读列表,包括上下文情感分析、讽刺识别和对话行为分类等相关研究。列表涵盖ERC的概述文章、数据集、最新方法及相关任务,为研究人员提供了丰富的参考资源。内容持续更新,欢迎补充相关论文。
clinica - 多模态神经影像分析平台 支持临床研究
Clinica临床神经影像数据处理管道BIDS标准机器学习Github开源项目
Clinica是一个开源的临床神经影像研究软件平台,支持多模态数据处理。平台提供多种处理流程,用于分析T1加权MRI、弥散MRI和PET数据。它可将公开数据集转换为BIDS格式,并集成机器学习和深度学习技术。Clinica为神经退行性疾病研究提供了有力工具,尤其适用于阿尔茨海默病等领域。
dash - 构建数据科学和机器学习Web应用的Python框架
DashPython数据可视化Web应用机器学习Github开源项目
Dash是一个Python框架,基于Plotly.js、React和Flask,用于构建数据科学和机器学习Web应用。该框架将现代UI元素(如下拉菜单、滑块和图表)与Python分析代码直接连接,便于开发者快速创建交互式数据可视化应用。Dash支持包括地图在内的多种图表类型,并允许完全控制应用外观。它不仅适用于构建仪表板,还可用于创建PDF报告风格的应用。
flax - 灵活强大的JAX神经网络库和生态系统
FlaxJAX神经网络库机器学习深度学习Github开源项目
Flax是一个基于JAX的高性能神经网络库,以灵活性为核心设计理念。它提供神经网络API、实用工具、教育示例和优化的大规模端到端示例。Flax支持MLP、CNN和自编码器等多种网络结构,并与Hugging Face集成,涵盖自然语言处理、计算机视觉和语音识别等领域。作为Google Research与开源社区合作开发的项目,Flax致力于促进JAX神经网络研究生态系统的发展。
vid2player3d - 基于广播视频的物理模拟网球技能学习系统
物理模拟网球技能机器学习视频分析SIGGRAPHGithub开源项目
vid2player3d是一个从广播视频中学习网球技能的物理模拟系统。该项目结合物理模拟和机器学习技术,使用分层控制器架构,包括低级模仿策略、运动嵌入和高级规划策略。系统在IsaacGym环境中实现,能够捕捉真实选手的动作特征,为虚拟体育训练和娱乐应用提供了新的技术方案。
kaggle-solutions - Kaggle竞赛解决方案及创意全面收录
Kaggle数据科学竞赛解决方案机器学习数据分析Github开源项目
kaggle-solutions项目收录了众多Kaggle竞赛顶级选手的解决方案和创意。项目在每次竞赛结束后更新,提供历届竞赛解决方案和想法的搜索功能。用户可通过fork仓库访问学习,并用Markdown记录笔记。项目推荐关注竞赛描述、评估标准和数据等关键信息,欢迎贡献未收录的解决方案。
ai_wiki - 从基础到前沿的全栈AI实践指南
AI实践量化交易大模型机器学习深度学习Github开源项目
ai_wiki是一个综合性AI知识库,覆盖系统平台、编程技术、机器学习、深度学习和强化学习等领域。项目提供学习资源、原理讲解和实战案例,重点关注大模型和量化交易等前沿技术。内容以Markdown和Jupyter Notebook形式呈现,旨在帮助学习者系统掌握AI技术并提升实践能力。
thundersvm - GPU加速的开源支持向量机库
ThunderSVM机器学习GPU加速支持向量机并行计算Github开源项目
ThunderSVM是一个开源的支持向量机库,通过GPU和多核CPU加速计算,显著提高SVM训练效率。该库实现了LibSVM的全部功能,支持一类SVM、SVC、SVR和概率SVM等多种模型。ThunderSVM提供Python、R、Matlab和Ruby等多种编程语言接口,跨平台兼容Linux、Windows和MacOS。采用与LibSVM一致的命令行参数,便于用户快速上手。作为高效的SVM实现,ThunderSVM为数据科学家和机器学习研究者提供了强大的工具支持。在某些大规模数据集上,ThunderSVM相比传统SVM实现可实现10-100倍的加速,已被多个知名机器学习项目采用。
imodelsX - 多功能文本模型分析与优化库
imodelsX文本模型可解释性机器学习自然语言处理Github开源项目
imodelsX是一个与Scikit-learn兼容的Python库,专注于文本模型和数据的解释、预测和优化。该库集成了多种可解释的建模技术,包括Tree-Prompt、iPrompt和Aug-Linear等。imodelsX还提供LLM封装器和数据集封装器等实用工具,简化文本数据处理流程。通过支持多种解释方法,imodelsX能够生成自然语言解释,并为用户提供易于实现的基线模型。
TransformerPrograms - Transformer模型转Python程序的新型解释方法
Transformer Programs机器学习自然语言处理代码生成程序合成Github开源项目
TransformerPrograms项目提出了一种新方法,可将Transformer模型转换为易读的Python程序。该项目提供了训练和转换工具,并包含多个示例程序,涵盖从排序到命名实体识别等任务。这为解释Transformer模型提供了新视角,有助于研究者探索模型内部机制,推进AI可解释性研究。
DiffEqFlux.jl - 将微分方程与机器学习结合的Julia科学计算库
DiffEqFlux.jl机器学习微分方程神经网络科学机器学习Github开源项目
DiffEqFlux.jl是一个Julia库,旨在将微分方程与机器学习相结合。该项目基于DifferentialEquations.jl和Lux.jl,主要用于科学机器学习研究,尤其是神经微分方程领域。DiffEqFlux.jl提供了多种神经网络层,包括神经常微分方程、神经随机微分方程等,并支持高阶、自适应、隐式和GPU加速等计算方法。这个库为研究人员和开发者提供了一个探索连续时间机器学习模型的工具。
tspiral - 优化时间序列预测的Python工具包
时间序列预测scikit-learntspiral机器学习Python包Github开源项目
tspiral是一个专注于时间序列预测的Python工具包,提供多种优化技术如递归预测、直接预测、堆叠预测和修正预测。它与scikit-learn兼容,支持全局和多变量时间序列预测,并提供简洁API。tspiral将复杂的时间序列问题转化为表格式监督回归任务,方便用户利用scikit-learn生态系统进行预测分析。
kaggle_pipeline_tps_aug_22 - 开源Python框架简化Kaggle表格数据竞赛流程
Kaggle机器学习数据处理特征工程模型训练Github开源项目
这是一个面向Kaggle表格数据竞赛的开源Python框架。它集成了数据处理、可视化、特征工程、模型训练等功能的API。虽然最初为Kaggle TPS August 2022设计,但经简单调整可适用于其他表格数据竞赛。该框架涵盖了从数据预处理到提交预测结果的完整机器学习流程,为Kaggle参赛者提供了实用的工具支持。
tensorflow-directml-plugin - DirectML驱动的TensorFlow硬件加速插件
TensorFlowDirectMLGPU加速机器学习WindowsGithub开源项目
TensorFlow-DirectML-Plugin是基于DirectML的TensorFlow插件,为Windows 10和WSL提供跨厂商硬件加速。该插件利用Pluggable Device API,支持在DirectX 12兼容硬件上训练和推理机器学习模型。目前处于早期开发阶段,兼容Python 3.8-3.11,支持AMD、Intel和NVIDIA主流GPU。该插件旨在为Windows平台的TensorFlow用户提供更多硬件加速选择。
secretflow - 统一隐私保护数据分析与机器学习框架
SecretFlow隐私计算数据智能机器学习密码学协议Github开源项目
SecretFlow框架集成了多个隐私计算项目,包括Kuscia、SCQL和SPU等。它通过抽象设备层、设备流层、算法层和工作流层的设计,实现了对水平和垂直分区数据的高效分析。这一开源项目为隐私保护数据分析和机器学习提供了全面的技术支持,推动了隐私计算领域的发展。
awesome-machine-learning - 机器学习框架与资源汇总 多语言开源项目集锦
机器学习深度学习计算机视觉自然语言处理数据分析Github开源项目
Awesome Machine Learning项目汇集了按编程语言分类的机器学习开源资源。涵盖计算机视觉、自然语言处理、深度学习等领域的框架、库和工具,涉及Python、Java、C++等多种语言。此外还收录相关书籍、课程和博客,为机器学习从业者提供全面参考。项目保持活跃更新,欢迎社区贡献优质资源。
hdbscan - 灵活高效的层次密度聚类算法
HDBSCAN聚类算法密度聚类数据分析机器学习Github开源项目
HDBSCAN是一种高性能的层次密度聚类算法,能够处理不同密度的聚类并对参数选择更加稳健。该算法主要参数直观易选,无需复杂调优,适合探索性数据分析。HDBSCAN具有快速可靠的特点,能返回有意义的聚类结果。此外,它还支持异常检测和分支检测,并提供可视化工具辅助理解聚类结果。该开源项目在GitHub上提供详细文档和示例,支持Python 2和3版本。
sample-apps - Vespa搜索和推荐系统示例应用集合
Vespa搜索引擎机器学习向量检索语义搜索Github开源项目
Sample-apps项目展示了Vespa的多种应用场景,包括基础推荐、语义搜索、检索增强生成(RAG)和多向量索引等。该项目通过电商搜索、新闻推荐和大规模图像检索等实例,展示了Vespa的实际应用能力。开发者可以参考album-recommendation、news和billion-scale-image-search等多个示例应用,快速掌握Vespa的基础和高级功能实现。
Ensemble-Pytorch - PyTorch集成学习框架助力模型优化
Ensemble-PyTorch深度学习模型集成pytorch机器学习Github开源项目
Ensemble-Pytorch是一个为PyTorch设计的集成学习框架,旨在提高深度学习模型的性能和鲁棒性。该框架支持多种集成策略,如Fusion、Voting、Bagging和Gradient Boosting,适用于分类和回归任务。作为PyTorch生态系统的一部分,Ensemble-Pytorch提供简洁的API和详细文档,便于研究人员和开发者实现和优化集成模型。
micrograd - 轻量级自动梯度引擎实现神经网络核心训练
micrograd神经网络自动梯度反向传播机器学习Github开源项目
micrograd是一个轻量级自动梯度引擎,实现反向传播算法,为神经网络训练提供核心功能。项目基于karpathy/micrograd,并针对LLM101n模块进行了优化。包含自动梯度引擎、简单神经网络和训练循环,致力于提供直观的神经网络训练可视化。后续将开发交互式Web演示,支持实时数据点调整和网络响应观察。
sbx - Jax加持的Stable-Baselines3强化学习库
Stable Baselines Jax强化学习机器学习算法实现开源项目Github
SBX是Stable-Baselines3的Jax实现版本,集成了SAC、TQC、PPO等多种先进强化学习算法。它与SB3保持相同API,可与RL Zoo无缝对接,并提供详细使用示例。SBX为复杂环境和任务提供高效、可靠的强化学习实现。
ssm-book - 状态空间模型可执行教程,配合dynamax库的实践指南
状态空间模型机器学习贝叶斯滤波动态系统JaxGithub开源项目
ssm-book项目提供了一本关于状态空间模型的可执行教程,与dynamax库配套使用。该教程由Kevin Murphy、Scott Linderman等人编写,采用MIT许可证。内容涵盖贝叶斯滤波、平滑和状态估计等主题,并提供JAX代码实现。这一资源有助于学习者掌握状态空间模型的理论和实践,适用于概率机器学习和机器人技术等领域。
hagrid - 大规模手势识别图像数据集助力人机交互系统开发
HaGRID手势识别图像数据集机器学习计算机视觉Github开源项目
HaGRID是一个包含554,800张全高清RGB图像的手势识别数据集,涵盖18种手势类别。数据集由37,583名受试者在多种光照条件下采集,适用于图像分类和目标检测任务。HaGRID可用于开发视频会议、家庭自动化和汽车领域的手势识别系统,推动人机交互技术进步。
ngboost - 自然梯度提升的概率预测Python库
NGBoost自然梯度提升概率预测机器学习Python库Github开源项目
NGBoost是一个基于自然梯度提升的Python库,专注于概率预测。该库构建于Scikit-Learn之上,提供可扩展和模块化的设计,支持多种评分规则、分布和基础学习器。NGBoost适用于回归和分类任务,提供直观的API和丰富的文档。它特别适合需要不确定性估计的机器学习项目,是数据科学领域的实用工具。
nntrainer - 设备端神经网络训练与个性化框架
NNtrainer神经网络嵌入式设备机器学习个性化Github开源项目
NNtrainer是专为资源受限的嵌入式设备设计的开源神经网络训练框架。支持k-NN、神经网络和逻辑回归等多种机器学习算法,提供少样本学习、ResNet和VGG等任务示例。通过设备端微调实现模型个性化,高效利用有限资源。NNtrainer独特之处在于支持设备端完整训练流程,而非仅限于推理。这使得它在保护用户数据隐私的同时,能够实现个性化模型优化。框架已在Samsung Galaxy智能手机和Ubuntu PC上验证可用。
End-to-end-Autonomous-Driving - 端到端自动驾驶研究资源综合集成
自动驾驶端到端机器学习计算机视觉CARLAGithub开源项目
该项目整合端到端自动驾驶研究资源,涵盖学习材料、研讨会、论文集、基准测试、数据集及竞赛信息。旨在为自动驾驶研究提供全面参考,推动技术发展。内容定期更新,欢迎社区参与贡献。
armnn - 针对Arm架构优化的高性能机器学习推理引擎
Arm NN机器学习推理引擎TensorFlow LiteAndroidGithub开源项目
Arm NN是为Android和Linux平台设计的机器学习推理引擎,针对Arm Cortex-A CPU和Mali GPU进行了优化。通过Arm架构特定优化和Arm Compute Library,Arm NN在性能上表现出色。该引擎支持TensorFlow Lite和ONNX格式模型,提供TF Lite Delegate和解析器,方便开发者将机器学习模型集成到应用中。Arm NN使用C++17编写,可在多种目标平台和主机环境下构建。
tfjs-examples - TensorFlow.js机器学习示例集 涵盖浏览器和Node.js应用
TensorFlow.js机器学习深度学习浏览器JavaScriptGithub开源项目
tfjs-examples是一个包含多种TensorFlow.js机器学习示例的项目。涵盖图像分类、文本生成、强化学习等领域,展示了TensorFlow.js在浏览器和Node.js环境中的应用。示例包括模型训练和推理部署,为开发者提供了实用的学习资源和参考案例。
Predictive-Maintenance-using-LSTM - LSTM神经网络预测飞机发动机故障时间 助力预防性维护
LSTM预测性维护神经网络机器学习飞机引擎Github开源项目
这个开源项目利用LSTM神经网络分析飞机传感器数据,预测发动机剩余使用寿命和潜在故障时间。项目采用回归模型和二元分类两种方法,分别预测剩余工作周期和特定周期内的故障概率。实验结果表明,该方法在预测准确性和可靠性方面表现优异,为航空维护领域提供了实用的预测性维护解决方案。
timetk - R语言时间序列分析与可视化工具包
timetk时间序列分析R语言数据可视化机器学习Github开源项目
timetk是一个功能丰富的R语言时间序列分析工具包。它提供数据可视化、处理和特征工程功能,支持交互式和静态绘图、时间序列机器学习、异常检测和聚类分析。与同类包相比,timetk功能更全面、易用性更高,可简化时间序列分析和预测建模流程。该包适用于需要高效处理和分析时间序列数据的研究人员和数据科学家。
Data-science - 数据科学项目的综合资源库和实践指南
数据科学MLOpsPython机器学习GitHubGithub开源项目
Data-science项目汇集了丰富的数据科学资源,涵盖MLOps、数据管理、测试和生产力工具等领域。通过文章、代码和视频教程,该项目全面展示了数据科学工作流程,从项目管理到部署。它为数据科学家和机器学习工程师提供了提高效率、构建可靠项目的实用指南。
Data-Science-Interview-Resources - 数据科学面试全面准备资源集锦
数据科学机器学习面试准备算法GitHubGithub开源项目
该项目汇集了数据科学面试的全面准备资源,覆盖简历制作、技能提升和面试技巧等方面。内容包括概率统计、SQL、数据处理、机器学习算法等关键知识点,并提供大量实用链接和视频资料。项目旨在帮助求职者系统备考,适合不同经验水平的数据科学从业者参考使用。