#数据集
awesome-lego-machine-learning - 乐高积木领域机器学习应用资源精选
机器学习LEGO零件分类分拣机数据集Github开源项目
这个精选列表汇集了乐高积木领域的机器学习应用和资源。内容涵盖零件分类、自动分拣、数据集、渲染技术等多个方面,包括应用程序、开源项目、学术论文和工具。列表为乐高爱好者和机器学习研究者提供了丰富参考,无论是构建分拣系统还是研究模型生成,都能找到有价值的信息。
ALLaVA - GPT4V合成数据集助力轻量级视觉语言模型训练
ALLaVAGPT-4V视觉语言模型数据集微调Github开源项目
ALLaVA项目推出大规模GPT4V合成数据集,旨在促进轻量级视觉语言模型的训练。项目发布了ALLaVA-Phi3-mini-128k、ALLaVA-StableLM2-1_6B和ALLaVA-Phi2-2_7B等多个模型版本,可直接从Hugging Face仓库加载。ALLaVA-4V数据集整合了LAION和Vision FLAN的图像标注与指令数据,以及GPT-4-Turbo生成的文本指令,总样本量超过140万。这一资源为视觉语言模型研究提供了丰富的训练数据和预训练模型,有望推动该领域的进一步发展。
NewsMTSC - 新闻文章多目标情感分析的开源数据集和模型
NewsMTSC目标依赖情感分类新闻文章数据集情感分析Github开源项目
NewsMTSC是一个针对新闻文章中目标依赖情感分类的开源项目,包含超过11000个来自美国在线新闻媒体政策报道的标记句子。项目提供了名为GRU-TSC的模型,实现了先进的目标情感分类性能。NewsMTSC不仅开放了详细的数据集,还提供了易用的Python包,方便研究人员和开发者进行情感分析。该工具支持多目标情感分类,为新闻文本分析提供了实用的解决方案。
CMB - 中文医学基准测试,全面评估医疗AI模型的知识与临床能力
CMB医学基准测试评估模型数据集人工智能Github开源项目
Chinese Medical Benchmark (CMB)是一个全面的中文医学基准测试项目,由CMB-Exam和CMB-Clin两部分组成。CMB-Exam包含11200道测试题,覆盖6大类28个子类的医学知识。CMB-Clin提供74个复杂医疗咨询案例。该项目致力于评估医疗AI模型的知识储备和临床推理能力,为中文医疗AI发展提供参考标准。
hatespeechdata - 多语言仇恨言论数据集汇总与研究资源
仇恨言论数据集在线辱骂多语言社交媒体Github开源项目
该项目汇集了涵盖多种语言的仇恨言论、在线辱骂和攻击性语言数据集。收录内容包括来自不同平台的文本、图像和音频数据。项目旨在为自然语言处理系统提供训练资源,以提升有害内容检测能力。此外,项目还提供关键词列表和贡献指南,为研究人员和开发者改进在线内容审核和仇恨言论检测技术提供支持。
CommonGen - 约束文本生成挑战促进常识推理
CommonGen文本生成常识推理数据集自然语言处理Github开源项目
CommonGen是一个创新的约束文本生成数据集,旨在评估自然语言生成模型的常识推理能力。通过要求机器学习模型生成日常场景的合理描述,该项目为研究人员提供了测试生成式常识推理的重要平台。CommonGen包含最新数据集、基线模型和评估工具,有助于推动自然语言处理和人工智能领域的发展。
Mol-Instructions - 大规模生物分子指令数据集助力大语言模型
Mol-Instructions生物分子大语言模型数据集蛋白质Github开源项目
Mol-Instructions是一个开放的大规模生物分子指令数据集,包含分子导向、蛋白质导向和生物分子文本三类指令。数据集涵盖分子设计、蛋白质功能预测等多个任务,通过AI协作、数据提取和模板转换等方法构建。该数据集旨在增强大语言模型在生物分子领域的表现,现已在Hugging Face平台发布。
Surface-Defect-Detection - 表面缺陷检测数据集及关键研究论文汇总
表面缺陷检测数据集深度学习计算机视觉工业应用Github开源项目
本项目汇总了表面缺陷检测领域的开源数据集和关键研究论文,包含2017年以来的重要文献。项目着重解决小样本和实时性问题,提供钢材、太阳能电池板、金属、PCB等多个工业领域的缺陷数据集。这些数据集支持缺陷分类、定位和分割任务,为工业视觉检测研究提供重要参考资源。
ViViD - 视频虚拟试衣技术运用扩散模型实现逼真效果
ViViD视频虚拟试穿扩散模型数据集深度学习Github开源项目
ViViD是一个基于扩散模型的视频虚拟试衣开源项目。该技术能将静态服装图片自然融入动态视频,实现逼真的虚拟试衣效果。项目提供完整代码、预训练模型和数据集,便于研究和开发。ViViD在计算机视觉和AI领域展现潜力,为时尚电商和虚拟现实等行业提供新的应用可能。
MVHumanNet - 多视角日常穿着人体捕捉大规模数据集
MVHumanNet数据集人体捕捉多视角计算机视觉Github开源项目
MVHumanNet是一个大规模多视角人体捕捉数据集,包含4,500个人物身份、9,000套日常服装和60,000个动作序列。数据集提供645百万帧图像,附带丰富标注,如人体遮罩、相机参数、2D/3D关键点、SMPL/SMPLX参数及相应文本描述。这一资源为计算机视觉和人体建模研究提供了重要支持,适用于多种应用场景。
HumanArt - 多场景人体数据集助力计算机视觉研究
Human-Art人体姿态估计数据集人工智能计算机视觉Github开源项目
Human-Art数据集包含50,000张来自20个场景的图像,涵盖自然和人工环境中的2D和3D人体表现。该数据集提供人体边界框、21个2D关键点、自接触关键点和描述文本等标注,旨在推进多场景人体检测、姿态估计和3D重建等任务。Human-Art的多样性有助于提高模型在实际应用中的特征提取和人体理解能力,同时支持跨域应用和可控人体图像生成。
CapsFusion - 创新的大规模图像描述生成框架
CapsFusion图像文本数据大型多模态模型大语言模型数据集Github开源项目
CapsFusion是一个用于生成高质量图像描述的创新框架。该项目结合大型语言模型,融合真实和合成图像-文本对,解决了大规模多模态模型训练中的可扩展性和知识保留问题。CapsFusion提供120M数据集、模型和分布式推理代码,为多模态预训练研究提供重要资源。
GuitarSet - 专为吉他转录研究设计的音频和标注数据集
GuitarSet吉他转录数据集音乐注释MIDIGithub开源项目
GuitarSet是一个为吉他转录研究设计的数据集。它包含音频样本和标注信息,如MIDI数据和时间戳。研究人员可通过官方网站下载数据集,并使用提供的函数读取和可视化标注。项目提供示例和演示代码,便于使用。GuitarSet适用于吉他音乐分析、自动转录和音乐信息检索等研究领域。
ArtGAN - 深度学习驱动的艺术品生成与分类开源项目
ArtGAN深度学习艺术生成图像分类数据集Github开源项目
ArtGAN是一个融合深度学习与艺术的开源项目,专注于艺术作品的生成和分类。项目包含WikiArt数据集、改进的ArtGAN模型用于条件合成图像和艺术品,以及深度卷积网络用于绘画分类。通过生成高质量肖像画,ArtGAN展示了AI在艺术领域的应用潜力。该项目不仅为学术研究提供了重要资源,还为艺术创作和鉴赏开拓了新视角。项目由三个主要部分组成:精炼的WikiArt数据集、用于条件合成图像的改进ArtGAN模型,以及用于绘画分类的深度卷积网络。这些组件共同构成了一个全面的艺术智能研究平台,为探索AI与艺术的交叉领域提供了有力支持。
TDC - 人工智能助力药物研发的开源平台
TDC机器学习药物发现人工智能数据集Github开源项目
Therapeutics Data Commons (TDC) 是一个开源的人工智能平台,旨在促进药物发现和开发领域的技术创新。该平台提供多样化的AI任务、数据集和基准测试,覆盖从靶点识别到药物安全评估的全过程。TDC为研究人员提供便捷的数据加载工具和高效的数据处理功能,同时建立了透明的评估体系。这一开放科学倡议正在推动人工智能在治疗科学中的应用和验证,重塑药物研发流程。
MagicBrush - 基于人工标注的指令引导图像编辑数据集
MagicBrush图像编辑数据集指令引导InstructPix2PixGithub开源项目
MagicBrush是一个大规模人工标注的指令引导图像编辑数据集,包含10,000组源图像、指令和目标图像的三元组。该数据集涵盖单轮、多轮、带掩码和无掩码等多种编辑场景,支持图像编辑模型的训练和评估。MagicBrush还提供经过微调的模型检查点,可应用于实际图像编辑任务,为计算机视觉研究提供了重要资源。
anime-offline-database - 多源动漫元数据综合开放数据集
anime-offline-database动画元数据数据集JSONGitHubGithub开源项目
该项目整合了MyAnimeList、AniDB等多个来源的动漫元数据,创建了一个开放的综合数据集。数据库包含34560个条目,每周更新。提供JSON和ZIP格式下载,内容涵盖动漫标题、类型、集数等信息。这个资源可用于动漫应用开发和数据研究。
tsa4 - 时间序列分析与应用的开源资源库
时间序列分析R语言astsaPython数据集Github开源项目
tsa4是一个综合性时间序列分析资源库,包含《Time Series Analysis and Its Applications》第四版的更新代码和astsa R包。项目提供errata列表、Python代码转换和数据集包,支持R和Python用户学习和应用时间序列分析。该资源库为研究者和实践者提供了丰富的工具和参考材料。详情请访问项目GitHub页面:https://github.com/nickpoison/tsa4
AwesomeAnimeResearch - 动漫研究前沿探索 从数据集到生成技术
动漫研究数据集图像生成图像翻译生成对抗网络Github开源项目
AwesomeAnimeResearch汇集了动漫和漫画相关信号处理与机器学习研究的最新成果。项目涵盖数据集构建、图像生成和翻译等多个领域,提供动漫人物识别、风格迁移和少样本学习等热门主题的研究资源。这些内容有助于推动动漫AI技术的发展与创新。
Leaderboard - 多语言语音识别基准测试平台 促进ASR系统评估
语音识别基准测试数据集模型评估Github开源项目
SpeechColab ASR leaderboard是一个开源的语音识别基准平台,集成测试集、模型集和标准化评估流程。平台提供多样化测试数据,涵盖广泛ASR场景,支持商业API和开源模型评估。它简化了ASR系统的基准测试、复现和验证过程,方便研究人员和开发者比较不同系统性能。通过统一的评估标准,该平台有助于推动语音识别技术的持续进步。
TextClassificationBenchmark - 基于PyTorch的文本分类基准测试平台
文本分类深度学习模型数据集PyTorch基准测试Github开源项目
TextClassificationBenchmark是一个开源的文本分类基准测试平台。该项目基于PyTorch实现,集成了IMDB、SST和Trec等多个主流数据集,支持情感分析和主题分类任务。平台内置FastText、CNN、LSTM和Transformer等多种深度学习模型,并提供自动数据配置、模型训练和评估功能。研究人员和开发者可以利用此平台方便地进行文本分类实验和性能对比。
bdd100k - 大规模驾驶视频数据集赋能自动驾驶多任务学习
BDD100K自动驾驶数据集计算机视觉多任务学习Github开源项目
BDD100K是一个专为异构多任务学习设计的多样化驾驶数据集,包含10万个视频和10个评估任务。这些数据涵盖了超过1000小时的驾驶经验,体现了地理、环境和天气的多样性。BDD100K支持图像标记、车道检测、可行驶区域分割等多项任务,为自动驾驶技术研究提供了丰富的数据资源,有助于评估图像识别算法在实际驾驶场景中的表现。
bird-recognition-review - 深度学习推动鸟类声音识别研究进展
鸟类识别数据集机器学习音频处理生态学Github开源项目
本项目梳理了鸟类声音识别领域的数据集、论文和开源项目等资源。重点介绍了卷积神经网络等深度学习方法在提高识别准确率方面的进展。同时探讨了野外录音中的背景噪声、多种鸟类同时发声等挑战,为该领域研究提供了参考。
MedMNIST - 标准化医学图像分类数据集
MedMNIST医学图像分类神经网络机器学习数据集Github开源项目
MedMNIST是一个标准化的生物医学图像数据集,包含18个2D和3D子集。数据集提供28x28及更大尺寸的图像,涵盖多种医学影像模态,适用于不同的分类任务。总计约708K个2D图像和10K个3D图像,支持生物医学图像分析、计算机视觉和机器学习研究。MedMNIST以其多样性、标准化和易用性,成为评估机器学习算法和开发医学模型的重要资源。
Awesome-Deepfakes-Detection - 全面深度伪造检测资源库 数据集工具及最新研究
Deepfake检测数据集竞赛工具论文Github开源项目
该项目汇集了深度伪造检测领域的综合资源,包括视频和图像数据集、开源检测工具、竞赛信息以及顶级会议论文。内容涵盖最新数据集、实用工具和前沿研究成果,为研究人员提供了深度伪造检测领域的全面参考资料,有助于快速掌握该领域的最新进展。
LViT - 结合语言和视觉Transformer的医学图像分割技术
LViT医学图像分割Vision Transformer数据集深度学习Github开源项目
LViT是一种创新的医学图像分割方法,融合了语言信息和视觉Transformer。该技术在QaTa-COV19、MosMedData+和MoNuSeg等多个数据集上展现出优异性能,大幅提升了分割精度。项目包含完整代码实现、数据准备指南、训练评估流程及详细实验结果。除常规任务外,LViT在结肠息肉和食管CT等特定领域分割中也表现出色。
Complete-Life-Cycle-of-a-Data-Science-Project - 数据科学项目全生命周期实践指南
数据科学web爬虫数据收集数据集APIGithub开源项目
该项目提供了数据科学项目完整生命周期的实践指南。涵盖数据收集、清洗、特征工程、模型训练及部署全过程。详细介绍网络爬虫、API、数据库等数据获取方法,并汇总多个开放数据集资源。同时包含数据预处理、特征选择、模型评估等关键环节的最佳实践。对数据科学学习者和从业人员具有重要参考价值,有助于全面把握数据科学项目流程。
Minari - 简化离线强化学习数据集管理的Python库
Minari离线强化学习Python库数据集GymnasiumGithub开源项目
Minari是一个面向离线强化学习研究的Python库,提供类似Gymnasium离线版本的功能。该库具备简洁的数据集读写API,支持远程数据集管理,并允许创建自定义数据集。Minari旨在为研究人员提供标准化工具,推动离线强化学习领域的进步。
RecSysDatasets - 推荐系统公开数据集汇总及处理工具
推荐系统数据集RecBole数据处理模型评估Github开源项目
RecSysDatasets是一个汇总公开推荐系统数据集的开源项目。该项目收集了电商、广告、电影等多个领域的数据集,并提供将数据集转换为统一格式的工具。这有助于研究人员更便捷地获取和使用各类推荐系统数据集,为算法开发和评估提供支持。项目与RecBole推荐系统库集成,便于进行算法测试。
easyportrait - 人像分割和面部解析大规模数据集
EasyPortrait人像分割数据集面部解析人工智能Github开源项目
EasyPortrait是一个包含40,000张高质量标注RGB图像的数据集,用于人像分割和面部解析研究。数据集提供9个类别的标注,涵盖背景、人物、皮肤、眉毛、眼睛等。它可应用于视频会议背景移除、面部美化等多个场景。数据集基于用户ID划分训练、验证和测试集,并提供多个基线模型的预训练权重,为计算机视觉研究提供了有价值的资源。
awesome-camouflaged-object-detection - 伪装物体检测研究进展综述与资源汇总
伪装物体检测计算机视觉深度学习图像分割数据集Github开源项目
本项目全面总结伪装物体检测(COD)领域的研究进展,涵盖检测、分割、场景理解等方向。汇集顶级论文、数据集和代码资源,定期更新最新成果。为研究人员提供了解COD前沿进展的重要参考。
RUL - Transformer和AttMoE网络在锂电池剩余寿命预测中的应用
锂电池寿命预测TransformerAttMoE机器学习数据集Github开源项目
本项目探索了Transformer和AttMoE网络在锂电池剩余寿命预测领域的应用。研究基于NASA和CALCE数据集进行实验,展示了详细的实验结果和模型架构。项目分析了dropout和noise_level参数对模型性能的影响,并提出了优化建议。代码采用PyTorch实现,并提供了相关学术文献引用。此外,项目还整理了多个锂电池寿命预测研究的相关资源,为该领域的研究人员提供了comprehensive参考。项目内容包括模型图示、实验结果可视化以及代码包依赖说明。研究者可以通过提供的邮箱地址与作者进行进一步交流。项目持续更新,最新增加了AttMoE相关内容和预测图表。
covid19-severity-prediction - 美国COVID-19严重程度预测数据库与模型
Covid预测数据集模型县级数据医院数据Github开源项目
项目整合了多源数据,包括确诊病例、死亡数据、人口统计、风险因素和社交距离信息,构建了预测美国各县和医院COVID-19严重程度的模型。其中包括3-5天短期死亡率预测模型和大流行严重程度指数(CPSI),有助于优化医疗资源分配。数据库和模型支持Python访问,为疫情研究和决策提供科学依据。
Awesome-Learning-with-Label-Noise - 噪声标签学习研究资源汇总
机器学习标签噪声深度学习数据集算法Github开源项目
Awesome-Learning-with-Label-Noise项目汇总了噪声标签学习领域的重要资源。该项目收集2008年以来的相关论文、代码和工具,涵盖多种噪声标签处理方法。这一资源列表为研究人员和开发者提供全面参考,有助于解决噪声标签问题,促进机器学习在不完美数据环境中的应用。
Advances-in-Label-Noise-Learning - 标签噪声学习最新研究进展与实践技术
机器学习噪声标签数据集数据清洗深度学习Github开源项目
这个项目全面总结了标签噪声学习领域的最新研究成果,包括论文、代码、软件工具、竞赛和教程等资源。它涵盖了群体分布鲁棒性、标签分布偏移等热点问题,并提供了真实噪声数据集和模拟框架。对于从事标签噪声学习研究的学者和工程师来说,这是一个非常有价值的知识库。
google-research - 多项目代码和数据集共享平台
Google Research代码库数据集许可证GitHubGithub开源项目
Google Research提供多种项目的代码和数据集,数据集在CC BY 4.0国际许可下发布,源码文件在Apache 2.0许可下发布。用户可通过GitHub编辑器下载所需子目录,并进行浅克隆以提交拉取请求。库内容持续更新,最新更新时间为2023年。
相关文章
Google Research: 探索科学与人工智能的前沿
2024年08月30日
Argilla: 打造高质量AI数据集的协作工具
2024年08月30日
Google Research:引领人工智能和计算机科学的前沿探索
2024年08月30日
Argilla: 人工智能工程师和领域专家的数据集协作工具
2024年08月30日
FiftyOne: 构建高质量数据集和计算机视觉模型的开源工具
2024年08月30日
SSD: PyTorch中的单发多框目标检测器实现
2024年08月30日
深度学习与计算机视觉的完整学习指南
2024年08月30日
深入探讨大语言模型的越狱攻击:挑战、影响与防御策略
2024年08月30日
Google Research: 探索科学与人工智能的前沿
2024年08月30日