精选AI数据集工具和项目大集合

Infinity-Instruct-7M-Gen-mistral-7B

Infinity-Instruct-7M-Gen-mistral-7B

北京人工智能研究院开源

Infinity-Instruct-7M-Gen-Mistral-7B 提升AI模型指令执行效率的开源方案

orca_mini_v3_13b

orca_mini_v3_13b

模型评估语言模型

增强文本生成的Orca与Llama2结合模型

LanguageBind_Audio

LanguageBind_Audio

语义对齐公开源码

语言驱动的多模态预训练解决方案

dolphin-2.6-mixtral-8x7b

dolphin-2.6-mixtral-8x7b

编码开源项目

非DPO调整的高效编程AI

regnety_120.sw_in12k_ft_in1k

regnety_120.sw_in12k_ft_in1k

预训练图像分类

高级图像分类模型,优化大规模数据集的性能

gpt2-horoscopes

gpt2-horoscopes

开源项目星座

基于GPT-2的星座预测,探索五大类星座运势

stella-large-zh-v3-1792d

stella-large-zh-v3-1792d

数据集开源项目

多领域文本相似性与分类模型

dolphin-2.9.1-mixtral-1x22b

dolphin-2.9.1-mixtral-1x22b

Apache-2.0许可模型精调

Dolphin在指令对话及编程能力上的优化

Configurable-Yi-1.5-9B-Chat

Configurable-Yi-1.5-9B-Chat

安全调优数据集

提升语言模型安全性和灵活性的方法

gpt2-imdb

gpt2-imdb

学习率开源项目

利用IMDB电影评论数据集微调的GPT-2模型

KoAlpaca-Polyglot-5.8B

KoAlpaca-Polyglot-5.8B

训练数据集

韩文文本生成模型的优化与安全增强

retrocomicflux

retrocomicflux

图像生成Huggingface

了解如何使用AI技术生成复古漫画风格图像

ALMA-13B-Pretrain

ALMA-13B-Pretrain

ALMALoRA微调

改进大型语言模型的翻译性能与偏好优化技术

Llama-3.1-WhiteRabbitNeo-2-8B-GGUF

Llama-3.1-WhiteRabbitNeo-2-8B-GGUF

RAM量化

Llama-3.1量化模型实现优化文本生成

Skywork-Reward-Llama-3.1-8B

Skywork-Reward-Llama-3.1-8B

文本分类开源项目

开源奖励模型的紧凑数据集设计

vit_large_patch14_clip_336.openai

vit_large_patch14_clip_336.openai

数据集OpenAI

通过CLIP模型探索计算机视觉鲁棒性

wav2vec2-xls-r-1b-ca-lm

wav2vec2-xls-r-1b-ca-lm

wav2vec2-xls-r-1b-ca-lmHuggingface

基于先进技术的加泰罗尼亚语语音识别模型

opus-mt-eo-en

opus-mt-eo-en

Huggingface模型

准确的跨语言翻译引擎,支持世界语到英语的转换

rut5-base-absum

rut5-base-absum

数据集Github

结合多任务训练的俄语文本抽象摘要模型

dolphin-2.5-mixtral-8x7b

dolphin-2.5-mixtral-8x7b

模型训练模型

高效编程辅助模型,支持多数据集优化