Project Icon

diagram_detr_r50_finetuned

BPMN形状数据集上的精细调优识别模型

该项目在BPMN形状数据集上,精细调优了kacper-cierzniewski/daigram_detr_r50_albumentations模型,取得了有效的评估表现。通过调整学习率、批量大小以及优化器等超参数,并采用线性学习率调度,该模型在多达500个训练周期中持续优化。最终的训练损失达到0.9817,通过Native AMP混合精度训练技术,该模型在BPMN形状识别任务中具有较高的准确性和稳定性。

fast-DiT - 改进PyTorch实现的可扩展扩散模型转换器
DiTGithubPyTorchTransformer图像生成开源项目扩散模型
fast-DiT 项目提供了扩散模型转换器(DiT)的改进 PyTorch 实现。该项目包含预训练的类条件 DiT 模型、Hugging Face Space 和 Colab 笔记本,以及优化的训练脚本。通过采用梯度检查点、混合精度训练和 VAE 特征预提取等技术,显著提升了训练速度和内存效率。这一实现为研究人员和开发者提供了探索和应用扩散模型的有力工具。
flowgpt - AI自动流程图生成工具
FlowGPTGPT-3.5GithubMermaidNext.jsOpenAI开源项目
FlowGPT利用GPT-3.5技术,通过Next.js、langchain和Mermaid等实现智能流程图生成。需要Node版本18及以上和OpenAI API Key即可快速安装和运行。FlowGPT的功能包括自动语法错误检测与重试、UI界面API Key插入、本地存储流程图及动画流程图生成。项目仍在持续改进中,欢迎贡献建议。
HunyuanDiT - 实现多分辨率扩散和细粒度中英文理解
GithubHunyuanDiT中英双语多轮对话开源开源项目文本生成图像
HunyuanDiT是一个多分辨率扩散变换器模型,具有细粒度的中英文理解能力。该模型采用优化的变换器结构、文本编码器和位置编码,通过迭代数据流程提升性能。HunyuanDiT支持多轮多模态对话,可根据上下文生成和优化图像。经专业评估,该模型在中文到图像生成方面达到开源模型的先进水平。
finetune-embedding - 利用合成数据微调嵌入模型提升RAG检索效果
GithubLlamaIndexRAG合成数据嵌入模型微调开源项目检索性能
finetune-embedding项目展示了利用合成数据微调嵌入模型来提升RAG性能的方法。该项目详细介绍了使用大语言模型生成合成数据集、微调开源嵌入模型和评估模型效果的步骤。在小规模金融PDF文档数据集上的实验证明,微调后的嵌入模型能显著提高检索性能。这种方法通过大语言模型生成假设性问题,无需人工标注即可创建高质量训练数据,为RAG系统优化提供了新思路。
distilbert-base-uncased - 紧凑高效的语言模型,提升下游任务处理速度
DistilBERTGithubHuggingface使用限制开源项目模型模型压缩训练数据语言模型
DistilBERT是一种高效的Transformers模型,比原始BERT更小更快,适合快速推理的下游任务。通过自监督预训练,它支持掩码语言建模和句子预测。主要用于全句任务如分类和问答,尽管继承了部分原模型偏见。在海量公开数据的支持下,DistilBERT在多种任务中表现优异,兼顾性能和速度。可在模型中心查看微调版本。
distilabel - AI数据合成与反馈框架
AI反馈DistilabelGithub开源社区开源项目数据合成高质量数据
Distilabel是专为AI工程师设计的开源框架,用于数据合成和反馈。该框架提供高质量输出、数据所有权和高效性,适用于预测和生成模型。通过提升数据质量和整合多种LLM反馈,Distilabel提高AI输出质量。支持与最新研究的整合,确保灵活性、可扩展性和容错能力。欢迎加入开源社区,参与数据集和模型的构建,享受社区资源和支持。
gdrnpp_bop2022 - GDRNPP:BOP挑战赛获奖的6D物体姿态估计算法
6D姿态估计BOP Challenge 2022GDRNPPGithub姿态优化开源项目目标检测
GDRNPP_BOP2022是一个在ECCV'22 BOP挑战赛中获得多项大奖的6D物体姿态估计算法。该项目采用域随机化技术、ConvNext骨干网络和双重掩码头,并结合深度信息进行姿态优化。项目提供完整的训练和测试代码,涵盖目标检测、姿态估计和优化,为计算机视觉研究提供高性能的6D姿态估计工具。
lora - 使用低秩自适应技术进行快速稳定扩散模型微调
DreamboothGithubHuggingfaceLoRAPivotal TuningStable Diffusion开源项目
该项目使用低秩自适应技术进行快速稳定扩散模型微调,比dreambooth方法快两倍,支持inpainting,并且生成非常小的模型文件(1MB~6MB),便于共享和下载。兼容diffusers库,提供多向量核心调优反演功能,并实现更好的性能。项目集成了Huggingface Spaces,增加了LoRA合并、Resnet应用和转换脚本功能。通过仅微调模型的残差,该方法显著缩小模型大小,同时保持高保真度,适用于需要快速高效微调的用户。
AI Doctor for Business Processes - 业务流程分析与自动化优化综合平台
AI分析AI工具业务优化任务挖掘流程映射自动化工具
该工具通过任务挖掘技术自动分析日常计算机操作,绘制流程图并提供智能化自动化建议。集成Zapier等平台,实现快速流程自动化。持续监控和优化业务流程,提升运营效率。注重数据安全,提供灵活的应用跟踪选项和严格的加密措施。适用于运营管理者、自动化专家和内部IT团队。
FinGPT - 开源金融大模型FinGPT,快速适应市场变化
FinGPTGithub开源项目情感分析指令调优数据集金融大语言模型
FinGPT项目提供开源金融大语言模型,重点解决金融行业的高训练成本和频繁更新需求。利用RLHF技术,实现了金融数据的快速更新和轻量级适配,并降低微调费用。FinGPT-Forecaster和多任务情感分析模型的性能超过GPT-4,展现出在金融预测和情感分析方面的强大能力。开源平台和丰富的数据集使开发者能够轻松再现和应用这些先进模型。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号
]}]\n23:null\n"])