diagram_detr_r50_finetuned

BPMN形状数据集上的精细调优识别模型

开源项目 bpmn-shapes 评估损失 daigram_detr_r50_albumentations 模型细化调整 Huggingface 训练损失 Github

该项目在BPMN形状数据集上，精细调优了kacper-cierzniewski/daigram_detr_r50_albumentations模型，取得了有效的评估表现。通过调整学习率、批量大小以及优化器等超参数，并采用线性学习率调度，该模型在多达500个训练周期中持续优化。最终的训练损失达到0.9817，通过Native AMP混合精度训练技术，该模型在BPMN形状识别任务中具有较高的准确性和稳定性。

Huggingface

介绍相关项目

Finetune_LLMs - 引用数据集微调大型语言模型（LLM）的代码

DeepSpeedFinetune LLMsGPTJGithubHuggingfaceNvidia-docker开源项目

Finetune_LLMs 项目提供代码支持DeepSpeed、Lora或QLora方法微调大型语言模型，涵盖从名言数据集学习及利用 Nvidia-docker 简化环境配置，适于需GPU支持的用户。

yolos-small-finetuned-license-plate-detection - 车牌识别微调模型提升物体检测能力

GithubHuggingfaceYOLOS开源项目模型模型微调目标检测视觉Transformer车牌识别

YOLOS小型模型经过微调适用于车牌检测，使用5200张图片进行训练，并在380张图片上验证，实现49.0的平均精度。模型支持PyTorch平台，并通过Python代码执行对象检测与边界框预测。其此前版本曾在ImageNet-1k和COCO 2017数据集上进行训练，具备卓越的识别性能。

MIMDet - 掩码图像建模应用于目标检测的开源项目

GithubMIMDet卷积神经网络实例分割开源项目物体检测视觉变换器

MIMDet是一个利用掩码图像建模技术的开源项目，能够提升预训练的Vanilla Vision Transformer在目标检测中的表现。此框架采用混合架构，用随机初始化的卷积体系取代预训练的大核Patchify体系，实现多尺度表示无需上采样。在COCO数据集上的表现亮眼，使用ViT-Base和Mask R-CNN模型时，分别达到51.7的框AP和46.2的掩码AP；使用ViT-L模型时，成绩分别是54.3的框AP和48.2的掩码AP。

robust-sentiment-analysis - 使用distilBERT的情感分析模型，实现对社交媒体和客户反馈的精确分析

GithubHuggingfacedistilBERT合成数据客户反馈开源项目情感分析模型社交媒体分析

模型基于distilBERT结构并利用合成数据训练，可精确解析社交媒体、客户反馈和产品评价的情感变化。适用于品牌监测、市场研究和客户服务优化，支持五个情感分类，准确率达95%。帮助企业有效识别用户情绪动向。

ChatGLM-Finetuning - ChatGLM系列模型的多方法微调工具

ChatGLMGithub大语言模型开源项目微调深度学习自然语言处理

ChatGLM-Finetuning为ChatGLM系列模型提供多种微调方法,包括Freeze、Lora、P-Tuning和全量参数训练。该项目支持信息抽取、文本生成和分类等任务,可进行单卡或多卡训练。通过DeepSpeed等优化技术,实现高效大模型微调,并有效缓解灾难性遗忘问题。项目支持最新的ChatGLM3模型,并提供详细的使用说明。

TF-ID-large-no-caption - 学术文献中图表精准识别工具

GithubHuggingfaceTF-ID图像识别学术论文对象检测开源项目模型表格提取

TF-ID项目专注于精准提取学术论文中的表格和图形，由高效的TF-ID-large-no-caption版本支持。该项目来自Yifei Hu，基于Hugging Face的Florence-2，具备97%以上的识别准确率。适合需要处理大量学术图表的研究工作者。

awesome-llms-fine-tuning - 大语言模型微调资源指南，包括教程、工具与最佳实践

BERTGPTGithubLLMRoBERTafine-tuning开源项目

本页面汇总了微调大语言模型（如GPT、BERT、RoBERTa）的全面资源，适用于特定任务和领域的需求。包含教程、论文、工具、框架和最佳实践，为研究人员、数据科学家和机器学习从业者提供宝贵的指导，提升模型表现，优化工作流程。

edm2 - 优化扩散模型训练动态的创新技术

EDM2GithubPyTorch图像生成开源项目扩散模型训练动态

EDM2项目开发了改进扩散模型训练动态的新方法。通过重新设计网络层来维持激活、权重和更新幅度的期望值，该方法显著提高了模型效果。在ImageNet-512图像合成中，EDM2使FID得分从2.41提升到1.81。项目还引入了训练后调整指数移动平均(EMA)参数的技术，可精确设置EMA长度，为模型优化开辟新途径。

chatglm_finetuning - ChatGLM模型微调教程

Githubchatglm-6bdeep_training开源项目微调推理训练

本项目提供详细的ChatGLM系列模型微调教程，支持全参数训练、Lora、AdaLora、IA3及P-Tuning-V2等方法。涵盖最新更新，如支持accelerator和colossalai训练，解除chatglm-6b-int4全参训练限制等。项目包含数据处理、推理脚本及多种训练参数设置，适合深度学习研究与应用。

Step-DPO - 优化大语言模型长链推理的高效方案

GithubStep-DPO大语言模型开源项目数学问题模型微调长链推理

Step-DPO是一种旨在提升大语言模型长链推理能力的新方法。该方法通过数据构建流程生成了1万对高质量步骤偏好对数据集，在仅使用少量数据的情况下显著提升了模型性能。研究表明，Step-DPO能将Qwen2-7B-Instruct在MATH和GSM8K测试集上的得分分别提高5.6%和2.4%。应用Step-DPO后的Qwen2-72B-Instruct更是在这两个测试集上分别达到70.8%和94.0%的得分，超越了多个闭源模型。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号