#机器学习

spark-nlp - 高效自然语言处理与大规模语言模型开源库
Spark NLPApache Spark自然语言处理机器学习预训练模型Github开源项目
Spark NLP 是一个基于 Apache Spark 的开源库,提供高效且准确的自然语言处理注释,支持机器学习管道的分布式扩展。该库包含超过 36000 个预训练管道和模型,支持 200 多种语言,涵盖分词、词性标注、嵌入、命名实体识别、文本分类、情感分析、机器翻译等任务。兼容 BERT、RoBERTa 等主流变压器模型,支持 Python、R、Java、Scala 和 Kotlin。
BotSharp - 开源AI机器人平台构建框架,将LLMs融入商业系统
BotSharpAI机器学习企业级应用C#Github开源项目
BotSharp是一个开源AI机器人平台,基于C#和.Net Core开发,具备高度模块化架构。通过一体化的插件和管道设计,该框架支持多种UI/UX和LLM供应商,提供多代理管理和有状态会话功能,并支持如ChatGPT与HuggingFace等多个AI平台,便于企业将AI技术高效整合入商业应用。
start-llms - 大语言模型线上课程
大型语言模型在线课程人工智能编程实践机器学习Github开源项目
start-llms项目全方位引导编程和机器学习初学者,通过免费的YouTube视频、深度在线课程及实操指导,探索大语言模型的核心技术。项目不仅资源全面,还定期刷新行业新闻与技术动态,助您踏上AI领域的前沿。
superlinked - 信息检索与特征工程的超模态向量嵌入计算框架
Superlinked信息检索机器学习特征工程向量嵌入Github开源项目
Superlinked 是一个计算框架,专注将复杂数据(如结构化和非结构化数据)转化为超模态向量嵌入,适用于RAG、搜索、推荐和分析系统。它结合了预训练模型的便利性和自定义模型的性能。该框架提供多种嵌入类型、定制编码器、组合编码器和动态参数等功能,并支持多种向量数据库,适用于实验和生产环境。
sagify - AWS SageMaker机器学习工作流管理简化工具
SagifyAWS Sagemaker机器学习LLMFastAPIGithub开源项目
Sagify提供简化的接口,帮助管理AWS SageMaker的机器学习工作流程,让用户专注于构建模型而不是基础设施。其模块化架构包括一个LLM Gateway模块,通过简单的API接口访问多种大语言模型。用户可以轻松部署如稳定扩散模型的大型模型,并使用生成的代码片段进行查询。该项目支持OpenAI和开源模型,并提供详细的安装和部署指南,适合希望简化机器学习流程的用户。
VectorHub - 免费开源的向量检索学习平台与工具
VectorHub向量检索机器学习VDB 比较工具开源Github开源项目
VectorHub是一个免费开源的学习平台,旨在帮助用户将向量检索技术集成到机器学习堆栈中。用户可以在这里找到实用资源,用于创建最小可行产品(MVP),解决特定用例中的挑战,了解和选择合适的向量数据库供应商。VectorHub还提供了一个免费工具,用于比较不同向量数据库的特性,确保在生产环境中的应用效果。
ML-YouTube-Courses - YouTube上的机器学习课程清单
机器学习深度学习自然语言处理AI教育DAIR.AIGithub开源项目
发掘DAIR.AI整理的YouTube机器学习课程清单,覆盖从基础到高级的各类主题,如决策树、神经网络和深度学习。课程适合不同水平的学习者,帮助你提升机器学习技能。
interpret - 集合先进机器学习解释技术的开源工具包
InterpretML可解释性机器学习EBM模型Github开源项目
InterpretML 是集合先进机器学习解释技术的开源工具包,使用户能训练可解释模型及分析黑箱系统。工具包支持模型调试、特征工程、公平性检测和人工智能协作等,帮助用户全方位理解模型行为并确保法规与高风险应用的合规性。通过实例展示,InterpretML 不仅增强了模型透明度,也提高了其可信度。
awesome-generative-ai - 现代生成式人工智能项目和服务指南
Generative AI人工智能OpenAI机器学习内容生成Github开源项目
awesome-generative-ai是一个综合性平台,聚焦最先进的生成式人工智能技术与项目。这些技术基于丰富数据训练的机器学习算法,能创造独特的图像、声音和文本。覆盖艺术、编程支持、交互式聊天等多个应用领域,本平台不仅展示成熟项目如GPT模型、Stable Diffusion,也鼓励社区成员贡献想法,共推技术进步。
DeepMoji - 情感分析模型,基于12亿推文训练,支持迁移学习与多情感预测
DeepMojitorchMoji情感分析机器学习KerasGithub开源项目
DeepMoji是一个情感分析模型,基于12亿推文数据训练,可通过迁移学习在多种情感任务中表现出色。项目包含代码示例和预训练模型,兼容Python 2.7和Keras框架,适用于情感预测和文本编码。还提供了PyTorch实现,用户可使用不同模块进行数据处理、模型微调和测试。
transformers - 机器学习库,覆盖文本、视觉与音频处理
Hugging Face人工智能自然语言处理机器学习多模态Github开源项目
探索🤗 Transformers——一个功能全面的机器学习库,覆盖文本、视觉与音频处理。该库提供数千种可对接JAX、PyTorch或TensorFlow的预训练模型,适用于多种语言处理与多模态任务。主要功能包括: - 文本分类 - 信息提取 - 问答系统 - 摘要生成 - 翻译 - 文本生成 此外,还能处理表格问答、OCR及视觉问答等多模态任务。Transformers库易于使用,支持模型间的快速切换与无缝整合。
TensorFlow-Examples - 探索TensorFlow的最佳实践与全面教程
TensorFlow神经网络机器学习深度学习数据管理Github开源项目
TensorFlow-Examples提供针对TensorFlow 1和2的详尽教程,涵盖从基础操作到高级模型如深度神经网络,适合初学者通过详细的笔记本和代码解析深入学习,同时介绍最新的API使用实践,如layers、estimator和dataset。
pytorch_geometric - 图形神经网络开发库
PyTorch Geometric图神经网络机器学习深度学习数据处理Github开源项目
PyTorch Geometric是一个基于PyTorch的图形神经网络库,旨在简化结构化数据的建模与训练流程。支持小批量和大规模图的处理,并提供全面的GPU加速、数据管道处理以及常用基准数据集。这使得它成为机器学习研究者和初学者理想的选择。
CVPR2024-Papers-with-Code - 探索CVPR 2024最新发布的计算机视觉论文与代码集锦
CVPR 2024计算机视觉人工智能机器学习深度学习Github开源项目
CVPR 2024的论文和代码集锦,涵盖3D建模、机器学习、视觉感知等多种计算机视觉领域,为研究人员和技术开发者提供一站式检索最新科研成果与实用工具。
ML-Notebooks - 机器学习笔记本资源库,支持快速搭建和扩展
机器学习人工智能深度学习代码示例自然语言处理Github开源项目
ML-Notebooks为不同的机器学习任务和应用提供了一系列精简且易于扩展的笔记本。项目整合了Codespaces技术,用户仅需几步简单配置,便可启动一个配备完整依赖项的开发环境,非常适合教育和研究使用。从基础入门到深入探索如PyTorch、GNN及GANs等前沿技术,应有尽有。
AiLearning-Theory-Applying - 人工智能领域的全面学习资源
机器学习深度学习自然语言处理AiLearning-Theory-ApplyingTransformerGithub开源项目
AiLearning-Theory-Applying项目提供人工智能领域的全面学习资源,覆盖基础知识、机器学习、深度学习及自然语言处理。项目持续更新,附带详尽注释和数据集,便于理解与操作,助力初学者及研究人员迅速掌握AI理论及应用实践。
clip-retrieval - 构建高效图像和文本检索系统的开源工具
clip-retrieval语义搜索图像嵌入文本嵌入机器学习Github开源项目
clip-retrieval 提供一个建立语义搜索系统的强大工具,使得用户能够迅速实现图像和文本的嵌入计算及索引构建。该项目能在20小时内处理超过1亿的图文嵌入,支持远程查询、数据过滤以及简洁的前端用户界面,适用于学术研究和商业应用。
100-Days-Of-ML-Code - 100天机器学习编程
机器学习线性回归逻辑回归支持向量机神经网络Github开源项目
100-Days-Of-ML-Code项目通过每天的编程挑战带领学习者深入机器学习领域。覆盖从数据预处理到复杂算法的全面教程,项目内容涵盖线性回归、逻辑回归到决策树等多种算法,每日实践确保理论与实战结合。适合任何级别的开发者提升机器学习技能。
data-science-ipython-notebooks - Python, TensorFlow, Scikit-learn 教程
深度学习TensorFlow机器学习数据科学PythonGithub开源项目
项目包含多个IPython笔记本,详解Python及其数据科学库例如TensorFlow、Scikit-learn与NumPy的使用,覆盖数据处理、统计分析到机器学习等多个应用场景。
recommenders - 从概念到部署推动推荐系统的发展的完整教程
推荐系统机器学习Recommenders协同过滤内容过滤Github开源项目
Recommenders项目支持开发者和技术爱好者从概念到部署推动推荐系统的发展。项目提供完整的教程,包括数据准备、模型建立、评估和优化,通过丰富的Jupyter笔记本示例展示各种推荐算法的实际应用。
Best_AI_paper_2020 - 2020年AI领域顶级研究论文与开源项目解析
人工智能AI论文深度学习机器学习计算机视觉Github开源项目
探索2020年AI研究的顶尖成果。本页面提供从计算机视觉到自然语言处理的最新AI研究论文,每篇论文均配有清晰视频讲解及深度分析链接,同时提供开源代码下载,助您深入了解AI技术如何塑造未来。
EvalAI - 专为机器学习与人工智能算法评估和比较设计的平台
EvalAI人工智能机器学习算法比较开源平台Github开源项目
EvalAI是一个开源平台,用于评估和比较机器学习及AI算法,提供中心化排行榜和提交界面,支持自定义评估协议和多语言环境,可适应高需求的计算挑战,助力研究者复现研究结果,进行准确可靠的分析。
awesome-AI-books - 聚集了包括AI基础理论、数学、深度学习等多方面的书籍和PDF资源
人工智能深度学习机器学习数据挖掘量子计算Github开源项目
awesome-AI-books聚集了包括AI基础理论、数学、深度学习等多方面的书籍和PDF资源。详尽的章节覆盖了数据挖掘、机器学习实战与最新学术研究,为初学者到研究者的AI学习提供综合性帮助。
Made-With-ML - 学习设计、开发、部署和迭代机器学习生产系统的开放资源
Made With ML机器学习软件工程MLOps模型部署Github开源项目
Made With ML 是开发者学习设计、开发、部署和迭代机器学习生产系统的开放资源。它提供完整课程和代码实践指导,支持本地及云集群环境配置,适合求知欲强的技术人员和研究者。
awesome-datascience - 一个综合的数据科学学习和应用平台
Data Science机器学习数据分析PythonR语言Github开源项目
此开源项目提供了一个综合的数据科学学习和应用平台,适合初学者和专业人士。包括算法、课程、教程及工具等内容,旨在帮助用户通过数据科学技术解决现实问题。
datasets - 最大的 ML 模型即用型数据集中心,具有快速、易用且高效的数据操作工具
Hugging Face数据集机器学习APIApache ArrowGithub开源项目
🤗 Datasets是一个高效的轻量级数据处理库,支持一行代码完成数据集的下载和预处理。库支持Numpy、Pandas、PyTorch、TensorFlow和JAX等框架,并提供智能缓存及大规模数据集的流式处理,有效减轻内存限制的压力,简化机器学习和数据分析的前置工作。
imodels - 一款提供易用且兼容的透明、简洁预测模型的集成scikit-learn的Python库
imodels解释模型机器学习Pythonscikit-learnGithub开源项目
imodels,一款集成scikit-learn的Python库,提供易用且兼容的透明、简洁预测模型。它应用最新的解释性模型技术,旨在提高机器学习的计算效率和预测精准度。包含imodelsX模块以支持NLP领域,且拥有完善的教程和文档,满足多样化应用需求。
shap - 通过博弈论解释机器学习模型输出的实用工具
SHAP机器学习解释模型特征影响算法Github开源项目
SHAP(SHapley Additive exPlanations)采用博弈论中的Shapley值进行机器学习模型输出解释,支持包括树模型、深度学习及自然语言处理模型,提供丰富的可视化工具以清晰显示模型决策过程。
yt-channels-DS-AI-ML-CS - 汇集了超过180个涵盖数据科学、机器学习、人工智能等领域的顶级YouTube频道
数据科学机器学习人工智能编程软件工程Github开源项目
yt-channels-DS-AI-ML-CS项目汇集了超过180个涵盖数据科学、机器学习、人工智能等领域的顶级YouTube频道。这些频道由领域内经验丰富的专家主持,内容涵盖初级到高级的编程技巧与洞察,适合所有级别的学习者,帮助用户获取最新资讯与知识提升。
tensorflow - 开源机器学习平台的最新发展
TensorFlow机器学习API开源平台神经网络Github开源项目
TensorFlow是一个开源的机器学习平台,拥有完整的工具和资源生态系统。它由Google Brain团队开发,提供Python和C++的API支持,适应多种研究和应用需求。用户可以参照官方文档进行安装,包括使用pip、Docker以及从源码构建等方法。TensorFlow定期更新以提升性能和安全性。
awesome-artificial-intelligence - 工具、课程、图书及更多人工智能资源集合
人工智能机器学习深度学习AI工具AI课程Github开源项目
提供AI工具、课程、图书等丰富资源,帮助初学者和专业人士掌握人工智能领域的必备知识与技能。此项目不仅涵盖学习资源,还包括与人工智能相关的代码、视频教程和组织信息,适用于初学者及需进阶研究的AI专业工具和资料。
Introduction-NLP - 《自然语言处理入门》详细解析
自然语言处理HanLP机器学习文本分类命名实体识别Github开源项目
本项目详细解析《自然语言处理入门》,涵盖中文分词、词性标注、命名实体识别等NLP核心技术,为初学者及爱好者提供清晰的学习路径和实用的笔记。
cog - 专门用于将机器学习模型打包进生产级容器的开源工具
CogDocker机器学习部署开源Github开源项目
Cog是一款开源工具,专门用于将机器学习模型打包进生产级容器。它简化了自定义Docker环境的配置过程,能自动创建符合最佳实践的Docker镜像。Cog支持多版本CUDA,标准化的Python I/O 定义,队列处理和即将推出的云存储功能,使得从开发到部署的全过程更加高效。用户可选在本地或通过Replicate部署模型。
postgresml - GPU 驱动的 AI 应用程序数据库
PostgresML机器学习PostgreSQL自然语言处理模型Github开源项目
PostgresML是集成于PostgreSQL的全面ML/AI平台,优化模型数据管理流程,支持高级自然语言处理和多维文本分析,提供先进模型训练调整API,加速数据驱动的业务决策。
nlpaug - NLP数据增强的Python工具库
nlpaug数据增强自然语言处理音频处理机器学习Github开源项目
nlpaug为文本和音频提供数据增强解决方案,适用于多种机器学习和神经网络框架,如scikit-learn、PyTorch和TensorFlow,只需几行代码即可实现数据增强。
cheatsheets-ai - 深度学习和机器学习工程师常用速查表
AI Cheatsheets机器学习深度学习TensorFlowKerasGithub开源项目
提供详尽的深度学习和机器学习速查表,包括Tensorflow、Keras、Numpy等热门工具,帮助工程师和研究人员快速掌握核心知识,提高工作效率。访问AI Cheatsheets获取更多资源和最新技术信息,适用于各水平从业者。