#开源实现

Open-LLaVA-NeXT: 开源实现大规模多模态模型的潜力

2 个月前
Cover of Open-LLaVA-NeXT: 开源实现大规模多模态模型的潜力

LaMDA-rlhf-pytorch: 开源实现Google对话AI模型LaMDA的预训练

2 个月前
Cover of LaMDA-rlhf-pytorch: 开源实现Google对话AI模型LaMDA的预训练

AudioLCM:基于潜在一致性模型的高效文本到音频生成技术

2 个月前
Cover of AudioLCM:基于潜在一致性模型的高效文本到音频生成技术
相关项目
Project Cover

AudioLCM

AudioLCM是一个开源的文本到音频生成系统,基于潜在一致性模型。该项目提供完整实现代码和预训练模型,支持高效生成高质量音频内容。AudioLCM在ACM-MM'24会议被接受,并在GitHub和HuggingFace平台发布。研究人员可使用预训练模型进行推理,或按指南准备数据集训练自定义模型。项目还包含数据集处理、变分自编码器训练等功能。

Project Cover

nanoPerplexityAI

nanoPerplexityAI是一个开源项目,通过简洁的Python代码复现了perplexity.ai的核心功能。该系统整合大型语言模型与Google搜索,提供带引用的智能问答服务。其架构涵盖查询分析、网页搜索、上下文构建和答案生成。项目特点包括易于部署、使用简单,并支持多种答案可视化方式,为开发者和研究人员提供了探索AI辅助搜索的便捷工具。

Project Cover

LaMDA-rlhf-pytorch

LaMDA-rlhf-pytorch是Google LaMDA对话AI模型的开源PyTorch实现,聚焦2B参数预训练架构。项目整合了T5相对位置编码、门控GELU激活函数和GPT式解码器结构,并提供预训练脚本、Hugging Face数据集集成和Weights & Biases日志记录功能。后续将加入SentencePiece分词器、详细文档、微调脚本和推理能力。此项目为AI研究者和开发者提供了研究大规模对话模型的平台。

Project Cover

C-Plus-Plus

C++算法开源项目提供多领域算法实现,包括计算机科学、数学、统计学等。项目特点是详细文档、多种实现方式、严格遵守C++11标准,并通过持续集成保证代码质量。适合教育者和学生学习使用,也可用于其他应用开发。

Project Cover

Open-LLaVA-NeXT

Open-LLaVA-NeXT是一个复现LLaVA-NeXT系列模型的开源项目。它提供开源训练数据和检查点,基于LLaVA代码库进行修改。该项目支持CLIP-L-336视觉编码器以及Vicuna-7B和LLaMA3-8B等语言模型。通过特征对齐和视觉指令微调两个阶段的训练,Open-LLaVA-NeXT实现了多模态能力,在多项评估任务中表现优异。

Project Cover

OpenPAL3

OpenPAL3是一个开源项目,致力于重现经典游戏《仙剑奇侠传三》。目前支持Windows、Linux、macOS和Android等多个平台,但仍处于早期开发阶段。该项目不包含原版游戏数据,需要正版游戏才能运行。OpenPAL3正在持续开发中,欢迎社区贡献。

Project Cover

hdmi

该项目采用SystemVerilog实现HDMI 1.4b视频音频输出,适用于FPGA开发。支持多种视频格式和音频采样率,输出完整HDMI信号。提供详细文档、多平台支持和调试指南,并讨论HDMI许可事宜。作为全面的开源方案,为FPGA开发者提供了有价值的参考资源。

Project Cover

openlrm-mix-base-1.1

OpenLRM V1.1结合Objaverse和MVImgNet数据集提供从图像生成3D模型的开源解决方案。该项目利用DINOv2作为图像编码器,并使用多层次三平面解码器。与原始论文不同,该模型未采用延迟反向传播技术,并引入随机背景色进行训练。本项目依据Creative Commons非商业许可协议发布,适用于研究用途,商业使用被禁止。用户需注意训练数据中可能存在的偏见,并确保其用法符合法律法规。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号