#模型配置
BLOOM - 开发的多语言、大规模开放科学语言模型
AI开发模型训练AI工具BloomModeltransformers自然语言处理PyTorch模块模型配置热门
作为致力于通过开源和开放科学推进AI发展的平台,BLOOM提供包括BloomModel在内的多款AI模型,充实的文档与代码资源助力研究人员与开发者更好地探索与应用前沿AI技术。
prompt-tuning - 简介提示微调技术的参数优化及其实践方法
Prompt TuningT5XFlaxJax模型配置Github开源项目
本指南客观介绍了基于T5X、Flaxformer和JAX的提示微调技术,涵盖完整流程,包括安装、训练和推理,并详细说明在TPU和TPU Pod上执行大规模模型微调的方法。提供了配置文件管理和提示参数初始化的详细步骤,适用于研究人员和开发者优化模型性能。
prompty - Prompty 革新LLM提示工程 提升开发效率与可移植性
PromptyLLM提示VSCode扩展模型配置开发工具Github开源项目
Prompty是一种专为LLM提示设计的标准化资产类和格式,旨在提高开发过程的效率。它提供语言规范和VS Code扩展,支持快速创建、实时预览和模型配置管理等功能。Prompty可与Prompt flow、Langchain和Semantic Kernel等框架集成,通过标准化提示和执行流程,有效加速开发周期并增强提示工程的可观察性、可理解性和可移植性。
jina-bert-flash-implementation - 将BERT与Flash-Attention结合的高效模型实现
模型模型配置BERTFlash-AttentionGithub深度学习Huggingface开源项目GPU加速
本项目展示了一种将Flash-Attention技术与BERT模型相结合的实现方案。内容涵盖了依赖安装指南、参数配置说明和性能优化策略。核心功能包括Flash Attention的应用、局部注意力窗口的实现以及稀疏序列输出。此外,项目还引入了多项可调节的配置选项,如融合MLP和激活检查点,以适应各种训练环境和硬件条件。该实现的目标是提高BERT模型在处理大规模数据集时的训练效率和内存利用率。
tiny-random-paligemma - 精简PaLiGeMMA模型实现 用于机器学习快速开发与测试
Transformers库Github模型开源项目模型配置Hub推送HuggingfacePaliGemma自然语言处理
这个项目提供了PaLiGeMMA模型的精简版实现,包括自定义配置、模型初始化和处理器设置。通过将模型架构参数优化至32维,项目适用于快速测试和开发。它整合了文本和视觉配置,采用AutoProcessor,并支持自定义聊天模板,为开发者提供了便捷的模型验证和实验环境。
Aura_L3_8B-GGUF-IQ-Imatrix - 体验Llama-3的进化之旅,适配最新模型
实验性开源项目模型GithubHuggingfaceAura L3反馈技术演进模型配置
Aura L3是基于Llama-3架构的新一代模型,提供GGUF-IQ-Imatrix量化和预设。该模型经过六个不同数据集的训练,建议使用最新的KoboldCpp进行操作,并采用提供的预设。该项目仍处于实验阶段,用户的反馈对于后续改进至关重要。页面中附有详细的模型信息和历史配置备份,便于用户深入理解和应用。