Logo

#模型训练

Logo of BLOOM
BLOOM
作为致力于通过开源和开放科学推进AI发展的平台,BLOOM提供包括BloomModel在内的多款AI模型,充实的文档与代码资源助力研究人员与开发者更好地探索与应用前沿AI技术。
Logo of pytorch-metric-learning
pytorch-metric-learning
PyTorch Metric Learning提供多种损失函数、挖掘器和评估工具,支持自定义和无监督学习。该库适用于各种训练和测试需求,配有详细文档和示例,适合高效嵌入空间计算的应用场景。
Logo of superduper
superduper
superduper.io 是一个强大的Python框架,专门为现有数据库直接集成人工智能模型、API 和向量搜索引擎而设计。此平台支持实时数据处理、可扩展的模型训练和简化的Python接口,使得 AI 集成变得简单高效。无需重复数据迁移,即可在您信赖的数据库中进行多模态向量搜索,以及存储和管理AI模型的输入输出。探索如何通过少量代码实现高级AI功能,并通过社区支持和丰富的文档资源加速您的AI项目。
Logo of Jan
Jan
Jan是一个完全开源的AI软件,提供跨平台支持和完全的可定制性,支持在本地或通过远程API运行大型语言模型。平台特别注重隐私,支持离线操作,用户可以完全控制其数据并自定义AI体验,兼容多种操作系统,无需订阅费用,完全免费使用。凭借其用户友好的接口和超过1.4M的下载量,Jan提供了一个可靠的AI解决方案。
Logo of MiracleVision
MiracleVision
MiracleVision,美图自研的AI视觉大模型,基于深入的美学和审美研究,提供专业图像及视频生成。平台涵盖广泛的图像处理服务,支持快速创造高品质视觉内容,适合广告、电商和游戏等行业需求。借助尖端的美学训练和评估体系,MiracleVision确保每一项输出的视觉艺术品质,成为用户可信赖的创意伙伴。
Logo of 序列猴子
序列猴子
序列猴子开放平台借助其超大规模语言模型,有效支持多模态的语音、文本、和图像处理。此平台通过其卓越的语言理解与生成技术,优化企业流程,加速智能化转型,实现用户体验与业务效率的双重提升。
Logo of Runway Gen-2
Runway Gen-2
Runway Research的Gen-2系统是一款前沿的AI视频创作工具,能够仅通过文本、图像或视频片段来生成全新视频。该系统不仅支持文本到视频的转换,还能进行图像到视频的多样化合成,无需实际摄制即可制作电影级视频。可广泛应用于电影预告片制作、品牌广告创意展示等领域,特别适合广告、电影制作和个性化内容创建。此外,其易用性和用户友好性,使得任何人都可以轻松创建专业级视频内容。
Logo of Segment Anything Model
Segment Anything Model
Meta AI推出的Segment Anything Model (SAM),能够一键从图像中分割任意对象。此AI模型具备零样本泛化能力,可处理未知对象和图像,适用于视频追踪、图像编辑等多种应用场景。
Logo of IBM watsonx.ai
IBM watsonx.ai
IBM watsonx.ai,领先的企业级AI平台,专为AI模型全周期管理设计。支持快速部署至多云环境,并提供高级安全保护,帮助企业简化AI开发流程,加速创新。
Logo of DataDreamer
DataDreamer
DataDreamer 是一个功能强大的开源Python库,专为创建提示工作流、生成合成数据集和训练模型而设计。它支持复杂的多步提示工作流,适用于各种大语言模型。该工具简单易用,且达到研究级别,兼具高效性和可复现性,支持最新技术如量化和LoRA等。无论是研究人员还是普通用户,都可以轻松发布数据集和模型。
Logo of wandb
wandb
Weights & Biases(简称W&B)是一个专注于机器学习流程优化的工具,它通过追踪和可视化机器学习的各个阶段——从数据集处理到模型部署——以提高开发效率。W&B 允许用户在一处平台上管理和比较多个实验,便捷地监控实验的运行效果及进度。
Logo of pytorch-cifar100
pytorch-cifar100
pytorch-cifar100项目提供了一套完整的训练和测试框架,使得使用者能在CIFAR-100数据集上通过多种网络架构实施图像识别。支持的网络包括VGG, ResNet, DenseNet等多种深度学习模型,并详细记录每种模型的错误率。项目还包括自定义数据集模块的示例代码,供不熟悉数据处理的用户参考。项目提供了清晰的代码,便于使用者根据需求调整模型训练与测试。
Logo of One-Shot-Voice-Cloning
One-Shot-Voice-Cloning
One-Shot-Voice-Cloning利用Unet结构和AdaIN层,实现了高效的说话人和风格转换。此技术支持单次语音克隆,无需额外的声音参数输入,有效解决了面对未见说话人和风格迁移的难题。此外,通过Colab notebook,用户可以便捷地测试和验证模型性能。
Logo of Paddle
Paddle
PaddlePaddle是中国首个自主研发并开源的深度学习平台,提供先进技术和多样功能,包括核心框架、模型库、开发工具和服务平台。该平台广泛应用于制造、农业、企业服务等行业,已服务超过1070万开发者和23.5万企业,生成86万个模型。PaddlePaddle支持超大规模训练、兼容第三方模型、提供高性能推理引擎,并拥有丰富的行业模型库和开源资源,推动AI商业化。
Logo of GPT-SoVITS
GPT-SoVITS
GPT-SoVITS-WebUI是一款功能强大的在线语音转换和文本转语音工具,支持跨语言转换与实时语音合成。项目集成了自动训练集分段、中文语音识别和文本标记等工具,能够帮助初学者轻松创建训练数据集和GPT/SoVITS模型。GPT-SoVITS支持零样本和少样本文本转语音,是音频处理领域的创新应用。
Logo of 讯飞星火
讯飞星火
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,旨在提升办公和日常生活的效率。
Logo of 智源研究院
智源研究院
探访智源研究院,了解悟道系列最新大模型技术,如悟道2.0与悟道3.0。致力于推进人工智能的领先技术和开源进程,网站提供丰富的研究成果、项目信息及最新动态,是研究者和开发者的理想交流平台。
Logo of Gradio
Gradio
通过Gradio,用户可以通过简洁的Web界面快速展示机器学习模型,任何人都能轻松接入。在几行代码的帮助下,即可构建交互式界面,无论是在Gradio平台上还是作为嵌入Python笔记本的形式。Gradio还能长期托管于Hugging Face Spaces,提供公共分享链接,简化远程协作和模型展示过程。
Logo of M6
M6
阿里云大数据和AI案例体验馆展示了大数据和人工智能领域的顶尖实践案例。用户可以一站式体验从数据处理到模型训练的完整流程,探索如何通过DataWorks、MaxCompute和PAI机器学习实践行业解决方案。此外,使用Hologres和Flink等先进技术,我们助力企业充分利用云计算资源,实现智能转型。
Logo of DeepSpeed
DeepSpeed
DeepSpeed是一个先进的深度学习优化工具库,专门设计用于简化和增强分布式训练。通过一系列创新技术,如ZeRO、3D并行处理、MoE和ZeRO-Infinity,DeepSpeed能大幅提高训练速度,同时降低成本。这些技术支持在数千GPU上扩展模型训练,并实现低延迟和高吞吐量的推理性能。DeepSpeed同时提供了先进的模型压缩技术,优化模型存储与推理效率,是大规模AI模型训练和推理的优选方案。
Logo of Hugging Face
Hugging Face
Hugging Face是开放源码机器学习平台,支持模型、数据集与应用的无限制托管,包含丰富的模态支持,已服务于超过5万家机构。
Logo of Scale
Scale
Scale AI为自动驾驶、地图、AR/VR、机器人等多领域提供优质数据服务,并通过其先进的生成AI平台,帮助企业释放AI潜力,加速技术革新。
Logo of gpt-neo
gpt-neo
GPT-Neo项目在mesh-tensorflow库的支持下,开发出了类似于GPT-3的高级模型与数据并行技术。项目支持在TPU及GPU上进行高效训练与推理,并集成了局部注意力、线性注意力和多专家系统等先进技术,能有效处理大规模参数模型。GPT-Neo还提供了多项模型评估功能,专注于语言和科学推理,拓宽了其在自然语言处理应用中的领域。
Logo of U-2-Net
U-2-Net
U-2-Net,一项荣获2020年模式识别最佳论文奖的创新技术,通过其深度嵌套U结构显著提升对象检测精准度。此技术广泛适用于图像处理、视频分析、背景移除及人像生成等领域,并提供丰富的开发资源助力应用的快速迭代。
Logo of x-transformers
x-transformers
x-transformers提供了多功能的Transformer模型,支持完整的编解码器配置和最新研究成果,适合各种应用,从图像分类到语言模型。其先进技术如闪存注意力和持久内存,有助于提高模型的效率和性能。此项目是研究人员和开发者的理想选择,用于探索和优化机器学习任务中的Transformer技术。
Logo of 网易云课堂
网易云课堂
网易云课堂AI设计工坊集成了全面的AI绘画工具和云端Stable Diffusion技术,无安装需求,支持即时使用。平台整合了学习、创作、分享及接单等功能,提供专业多样的Checkpoint和LoRA风格模型,支持在线定制模型训练,以及丰富的社区与课程资源,助力设计师技能提升与作品商业化。
Logo of CLIP
CLIP
CLIP通过对比学习训练神经网络,结合图像和文本,实现自然语言指令预测。其在ImageNet零样本测试中的表现与ResNet50相当,无需使用原始标注数据。安装便捷,支持多种API,适用于零样本预测和线性探针评估,推动计算机视觉领域发展。
Logo of PaddleOCR
PaddleOCR
PaddleOCR旨在为开发者提供一套丰富、领先且实用的OCR工具库,帮助开发者快速训练并部署OCR模型。它不仅支持中英文识别,还支持多语言和多硬件平台,包括最新的PP-OCRv4模型,有效提高了中英文场景下的识别精确度。适用于移动端和服务器端,适配多种开发需求。
Logo of Google AI Gemma
Google AI Gemma
Google AI Gemma 网站展示了一系列高性能AI开放模型,旨在提供针对复杂数据、编程和科学计算的优化解决方案。Gemma系列模型,包括Gemma 1和Gemma 2,以不同的模型大小提供卓越性能,具备前沿的技术和可靠的设计,确保AI使用的安全性和责任感。
Logo of Coze
Coze
Coze提供了一个新一代AI及聊天机器人开发平台,面向各类用户无需编程经验即可快速构建及部署聊天机器人至多种社交平台和通讯应用,界面友好,支持跨平台操作。
Logo of Cohere
Cohere
Cohere专为企业提供尖端的大语言模型和检索增强生成技术,帮助企业高效解决实际问题并优化生成型AI、搜索与发现功能,从而推动全球企业在人工智能领域的持续竞争力。
Logo of Lamini
Lamini
Lamini,作为唯一支持在AMD GPU上运行的企业LLM平台,为软件团队提供快速开发及全面控制功能。它不仅支持本地及云部署,还可通过数十亿专有文档的专用LLMs来提升性能,减少错误解读,并保障数据安全。此平台已广泛应用于财富500强和顶尖AI创企。
Logo of PaLM 2
PaLM 2
PaLM 2,Google AI开发的最新一代多功能语言模型,专为提高多语言翻译、编程、推理和问题解答的效率而设计。该模型不仅基于谷歌的深度机器学习研究,且通过严格的评估流程,保证其应用的公正性和安全性。
Logo of 天壤小白
天壤小白
天壤小白LLM APP Stack 是为企业提供的全面大模型开发和管理平台,覆盖从训练至部署全流程,内置高效的大语言模型管理和多样的API集成选项,加速企业AI应用创新和业务效能提升。
Logo of Replicate
Replicate
Replicate提供了一个云API服务,用户仅需一行代码即可启动、调优以及部署自定义机器学习模型。网站集合了数千种开源模型,支持图像生成、语音合成等多种功能。通过Replicate,企业和开发者能快速将AI模型集成到应用中,无需担心底层基础设施和维护问题。
Logo of tensor2tensor
tensor2tensor
Google Brain团队和社区合作开发的tensor2tensor库,通过提供多模态的深度学习模型和数据集,简化了机器学习的应用,尤其在文本、图像与语音处理上表现出色。项目不再开发新功能,但持续维护并推荐用户迁移到其后继库Trax,以获得更好的支持和更新。
Logo of vall-e
vall-e
VALL-E是一个基于PyTorch的开源项目,通过神经编解码器语言模型实现零样本文本到语音的转换。该模型可在单GPU上训练,能模拟特定说话者的语音,并采取了措施以防止技术的潜在滥用。然而,开发者没有提供完全训练的模型和服务。VALL-E提供了包括英语和中文在内的多语种语音技术支持,是语音技术研究的有益工具。
Logo of lingvo
lingvo
Lingvo由Google维护的高质量框架,专用于在Tensorflow中构建神经网络,特别适用于序列模型的开发。此框架支持多种模型类型,包括自动语音识别、图片处理、语言建模和机器翻译等。Lingvo允许通过pip安装或源代码编译来灵活部署。借助详尽的文档和综合的模型库,用户可以轻松地构建、训练并评估自定义模型。此外,Lingvo还与最新版本的Tensorflow和Python兼容,确保与当前技术生态的同步。
Logo of onnxruntime
onnxruntime
ONNX Runtime是一款跨平台的机器学习推理和训练加速工具,兼容PyTorch、TensorFlow/Keras、scikit-learn等深度学习框架及传统机器学习库。它支持多种硬件和操作系统,通过硬件加速和图优化实现最佳性能,显著提升模型推理和训练速度,尤其在多节点NVIDIA GPU上的Transformer模型训练中表现出色。
Logo of sd-webui-EasyPhoto
sd-webui-EasyPhoto
EasyPhoto是一款WebUI插件,专注于使用AI技术生成个性化人像。支持快速部署,支持云端和本地两种使用方式,并具备自定义模板和多人生成功能。提供详尽算法和培训详解,适合个人和开发者。
Logo of 腾讯混元
腾讯混元
腾讯混元,腾讯研发的大语言模型,能精确处理自然语言并支持跨领域知识应用。通过人机自然交互,理解指令并执行任务,高效提供必要信息和灵感。此模型适合多样的业务场景,提供智能而便捷的服务。
Logo of Ollama
Ollama
Ollama 提供丰富的大型语言模型选择,包括 Llama 3.1、Phi 3、Mistral、Gemma 2 等,适用于 macOS、Linux 和 Windows 进行高效的语言处理任务。平台支持用户按需自定义模型,并提供便捷的下载服务。
Logo of 文心大模型
文心大模型
百度文心大模型,一个集成了全面工具及平台的产业级知识增强AI技术,旨在通过高效应用开发、优异的学习效率及出色的可解释性,显著降低AI开发与应用的门槛。
Logo of StableLM
StableLM
探索Stability AI的StableLM网站,了解和参与最前沿的AI语言模型开发,通过详细的模型介绍和技术报告,加深对自然语言处理技术的理解和应用。
Logo of llama
llama
meta-llama/llama在GitHub提供先进的Llama模型推理代码,开发者可以参与贡献,助力项目发展。该平台允许下载各种预训练及微调的Llama大型语言模型,并提供完整的模型权重及实施代码,推动技术创新与企业发展。
Logo of Imagen
Imagen
Imagen,一种先进的AI图片生成工具,利用深度语言理解和极致的图像真实性,实现从文字到图像的转换。此模型不仅在COCO数据集上刷新了技术记录,还通过高效的U-Net架构和强大的文本编码系统,优化了图文一致性和图像质量。鉴于潜在的社会影响和数据集偏差问题,当前未开放源代码或公共演示版本。
Logo of Evidently AI
Evidently AI
Evidently AI是一个开源的AI质量协作平台,旨在评估、测试和监控机器学习、LLM及通用AI应用。此平台帮助用户管理AI产品质量,维护模型性能,及时识别及应对数据偏移和异常。它支持文本、表格数据和嵌入式数据的监控,适用于各种规模的公司,提供直观的界面与丰富的可视化功能。
Logo of xllm
xllm
X—LLM是一个便捷的微调大语言模型工具,集成了诸如QLoRA、DeepSpeed、GPTQ、Flash Attention 2和FSDP等最新优化方法,显著提升训练效率。用户可以专注于模型和数据的优化,而不需要繁琐的代码编写。该工具支持多种Transformer模型,并可无缝对接HuggingFace Hub,适用于生产环境和快速原型设计,有助于用户更好地掌控模型训练进度并降低开销。
Logo of vall-e
vall-e
VALL-E项目是EnCodec Tokenizer在开源PyTorch环境下的实施,提供高效音频合成技术。支持GPU加速,允许用户迅速搭建、训练个性化音频模型,并通过CLI完成音频合成。包括AR和NAR模型训练,模型配置与导出等功能,并持续优化以期未来提供预训练模型和更丰富的示例。
Logo of VoiceFlow-TTS
VoiceFlow-TTS
VoiceFlow-TTS项目采用先进的矫正流匹配技术,提升了文本到语音转换的效率和自然度。此项目详细介绍了设置环境、准备数据、训练模型以及推理过程,支持多GPU并发处理,兼容多种数据集。