#AI

LangGPT是一个为大语言模型设计的结构化提示词框架，将提示词创作转变为类似面向对象编程的过程。它通过模板、变量和命令，使高质量提示词的创建变得直观高效。LangGPT提供系统化、可适应的方法，帮助用户快速掌握提示词工程技巧，实现大规模生产高质量提示词。这一框架旨在让更多人能够轻松创建出色的提示词，从而更好地发挥大语言模型的潜力。

Awesome-Interaction-Aware-Trajectory-Prediction - 最新交互感知行为与轨迹预测资源

Behavior and Trajectory PredictionautoregressiveJiachen Litrajectory datasetsAIGithub开源项目

本页面汇集了交互感知行为与轨迹预测相关的研究资料，包括数据集、博客、论文和公开代码，面向学术界和工业界。内容涵盖车辆、行人和运动员的轨迹预测数据集、研究论文及代码实现。由斯坦福大学和加州大学伯克利分校的研究人员维护，并持续更新，欢迎提交新资源或通过邮件交流。

langchain-nextjs-template - LangChain与Next.js集成的AI应用开发模板

LangChainNext.jsAI开发模板自然语言处理Github开源项目

此开发模板整合LangChain和Next.js，展示多种AI应用场景的实现方法。包括基础聊天、结构化输出、复杂问题解答和检索增强生成等功能。模板支持流式响应，集成Vercel AI SDK，并提供LangGraph.js智能工作流示例。适合开发者快速构建和部署AI驱动的应用程序。

LLM101n - 深度学习课程教你构建AI讲故事模型

LLMAI深度学习TransformerPythonGithub开源项目

LLM101n深度学习课程从零教授构建AI讲故事模型。内容涵盖语言建模、机器学习、Transformer架构等核心知识，指导学员开发功能完善的Web应用。课程采用Python、C和CUDA编程，适合具备基础计算机科学知识的学习者。除核心AI技术外，还包括分布式优化、量化推理、微调等高级主题，以及多模态AI应用开发。通过实践，学员将掌握AI、大型语言模型和深度学习原理，能够独立创作、优化并为小故事配图。

subtitle - 开源多语言字幕生成工具支持AI驱动和自托管部署

Subtitle开源AI多语言自托管Github开源项目

Subtitle是一款开源的字幕生成工具，支持多语言处理和自托管部署。该工具采用AI技术为视频内容创建准确、自然的字幕，并可轻松集成到现有工作流程。它提供多种AI模型选择和自定义参数设置，适应不同场景的字幕需求。用户可通过命令行或二进制文件运行，输出多种格式的字幕文件。这个项目为个人用户、内容创作者和企业提供了便捷的字幕解决方案。

seemore - PyTorch实现的开源视觉语言模型项目

Vision Language ModelPytorchAI机器学习图像处理Github开源项目

seemore是一个基于PyTorch的开源视觉语言模型(VLM)项目。它包括图像编码器、视觉-语言投影器和解码器三个核心组件，参考了CLIP和LLaVA等前沿VLM架构。项目提供完整代码实现和详细教程，有助于开发者理解VLM原理。seemore在Databricks平台开发，支持GPU加速，并集成MLFlow用于实验管理。

llm-app-stack - 全面的大语言模型应用开发资源集合

LLM应用程序架构AI开源数据处理Github开源项目

LLM-App-Stack项目汇总了构建大语言模型应用所需的各类工具和服务。该资源集合涵盖数据管道、嵌入模型、向量数据库、编排工具和API插件等关键组件。项目同时整合了专有和开源的LLM API，以及应用托管平台和云服务选项，为开发者提供了全面的技术栈参考。这一资源库旨在帮助开发者更高效地构建和部署智能应用。

QuakeBotArchive - 归档保存Quake机器人的开源历史项目

QuakebotAI游戏档案Github开源项目

QuakeBotArchive项目致力于收集和归档1996-2000年间开发的所有版本Quake机器人。这些机器人是早期计算机游戏人工智能的重要代表作。项目通过定位和保存原始分发形式的Quake机器人，防止这些珍贵历史资料丢失。同时提供机器人年表和家族树等元数据分析，为研究者和爱好者提供重要参考资源。

papers.cool - 智能化学术论文浏览与分析平台

Cool Papers论文阅读AIArxivKimiGithub开源项目

papers.cool是一个智能化学术论文浏览平台，提供多学科论文实时更新、智能摘要生成和全文搜索功能。平台集成机器翻译、LaTeX渲染等工具，支持论文筛选、收藏和分享。通过持续优化用户体验和功能更新，papers.cool旨在提高研究人员的学术效率。该平台支持arXiv多学科论文的实时更新和浏览，致力于提升学术研究效率。

motif - 利用大语言模型偏好生成奖励函数的强化学习框架

MotifAI强化学习NetHack大语言模型Github开源项目

Motif是一个新型强化学习框架,通过大型语言模型的偏好生成奖励函数。它分为数据集注释、奖励函数训练和强化学习三个阶段。在NetHack游戏中,Motif展现出优秀性能,生成符合人类直觉的行为,并可通过提示词灵活调整。这种方法为开发智能AI代理提供了新的研究方向,具有良好的扩展潜力。

Mangio-RVC-Fork - 开源语音转换框架支持多种F0算法和快速训练

RVC语音转换AI深度学习音频处理Github开源项目

Mangio-RVC-Fork是一个基于VITS的开源语音转换框架,具有top1检索功能。它提供CLI和Web界面,支持多种F0估计方法,包括混合F0算法。该工具可快速训练,使用少量数据也能获得良好效果。支持模型融合改变音色,以及UVR5模型分离人声和伴奏。项目持续开发中,计划添加更多功能优化用户体验。

TurnVoice - 强大的视频声音转换和多语种翻译命令行工具

TurnVoice语音转换视频处理AI命令行工具Github开源项目

TurnVoice是一款功能丰富的命令行工具，专注于视频声音转换和多语种翻译。该工具集成了多种语音合成引擎，包括免费的Coqui TTS在内的多个选项。它允许用户精确控制渲染过程，提供句子文本、时间和语音的自定义选项。TurnVoice还具备保留原始背景音频和本地视频处理的能力，适用于各类视频创作需求。

whisper-vits-svc - 基于VITS的端到端歌声转换开源项目

VITS语音转换深度学习PyTorchAIGithub开源项目

whisper-vits-svc是一个开源的端到端歌声转换项目,基于VITS模型架构。该项目支持多说话人转换,可混合创建新音色,并能处理带轻伴奏的声音。它集成了Whisper、BigVGAN等技术,提高了抗噪性和音质。项目面向深度学习入门者,需要Python和PyTorch基础。目前不支持实时转换,训练需要至少6GB显存。

voice-changer - 多平台实时语音转换软件支持多种AI模型

VC Client音声変換AIリアルタイムクロスプラットフォームGithub开源项目

VC Client是一款多功能实时语音转换软件，支持MMVC、so-vits-svc、RVC等多种AI模型。该软件兼容Windows、Mac和Linux平台，可通过网络远程使用。提供预构建二进制文件和Docker环境两种部署选项，方便不同技术水平的用户使用。软件具备将处理负载转移到外部设备的功能，适合与游戏等高负载应用同时运行。用户可根据需求选择合适的使用方式，实现高质量的实时语音转换。

Agently-Daily-News-Collector - 基于LLM的开源自动新闻收集工作流

AgentlyAI新闻收集自动化开源Github开源项目

Agently-Daily-News-Collector是基于LLM的开源自动新闻收集项目。该工具利用Agently框架，用户输入主题后自动生成新闻汇总。支持多主题，输出Markdown和PDF格式。克隆仓库并设置API密钥即可使用，简化了新闻收集流程。

weekly - 周刊分享独立开发者产品变现实践

独立开发产品变现周刊SaaSAIGithub开源项目

该周刊聚焦独立开发和产品变现，每周分享成功案例。内容涵盖从小型工具到大型SaaS的多类项目，展示开发者如何通过创新实现盈利。涉及AI、浏览器插件、在线工具等领域，为独立开发者提供实践经验和创意启发。

VADER - 基于奖励梯度的视频生成质量优化技术

视频生成AIVADER机器学习视觉处理Github开源项目

VADER是一种基于奖励梯度的视频生成质量优化技术。该方法无需大规模标注数据集，即可有效提高视频与文本的一致性、美观度，并生成更长时间的高质量视频。VADER兼容多个主流视频生成模型，如VideoCrafter2、Open-Sora和ModelScope，能显著提升其生成能力。项目提供了详细的安装、推理和训练指南，便于研究人员和开发者进行实验和应用。

zerox - 基于视觉模型的创新文档数字化工具

Zerox OCRAI文档处理GPTMarkdownGithub开源项目

Zerox OCR是一款基于视觉模型的文档处理工具，通过将PDF转换为图像并使用GPT模型生成Markdown文本，有效处理复杂布局、表格和图表。与传统OCR服务相比，Zerox在准确度和表格处理方面表现出色，同时保持价格竞争力。该工具支持多种输入方式，提供灵活配置，为文档数字化提供了简单高效的解决方案。

VideoLLaMA2 - 增强视频理解的多模态语言模型

VideoLLaMA2视频理解大语言模型多模态AIGithub开源项目

VideoLLaMA2是一款先进的视频语言模型,通过增强空间-时间建模和音频理解能力,提高了视频问答和描述任务的性能。该模型在零样本视频问答等多项基准测试中表现出色。VideoLLaMA2能处理长视频序列并理解复杂视听内容,为视频理解技术带来新进展。

Schedule - 图学习研讨会定期分享前沿研究

图学习图神经网络研讨会研究分享AIGithub开源项目

Schedule是一个图学习研讨会社区,定期邀请相关研究者分享最新成果。涵盖数据高效图学习、时空深度学习、图神经网络表达、芯片设计等热门话题。来自国内外知名机构的学者参与,为图学习研究者提供交流平台。

private-gpt - 离线运行的AI文档问答系统

PrivateGPT隐私AI大语言模型APIGithub开源项目

PrivateGPT是一个离线AI文档问答系统，无需网络连接即可使用大型语言模型进行文档分析和问答。该项目提供API接口，支持文档ingestion、上下文聊天、补全和嵌入生成等功能，可用于构建私密的AI应用。系统还包含Gradio用户界面，方便测试API功能。此外，PrivateGPT提供批量下载模型、监控文档等辅助工具，便于用户部署和使用。

copilot-workspace-user-manual - GitHub Next推出的AI原生开发环境全面提升编码协作效率

Copilot WorkspaceGitHub NextAI用户手册开发环境Github开源项目

Copilot Workspace是GitHub Next推出的实验性AI原生开发环境，通过自然语言实现全仓库范围的编码协作。该用户手册全面介绍Copilot Workspace的使用方法，涵盖入门指南、使用技巧、故障排除、技术路线图及项目起源等内容，为各级别开发者提供实用指导。

AI-News-Daily - AI领域每日资讯汇总聚焦技术突破与行业应用

AI人工智能大语言模型生成式AIOpenAIGithub开源项目

AI-News-Daily项目提供每日AI领域最新动态，涵盖从尖端技术突破到行业应用的广泛内容，包括大语言模型、计算机视觉、机器人技术等多个领域。项目不仅报道技术进展，还深入探讨AI对社会的影响，为读者提供全面而深入的AI资讯。适合AI专业人士和技术爱好者阅读，提供有价值的行业信息。

MotionCtrl - 视频生成中的动作控制统一解决方案

MotionCtrl视频生成动作控制AI腾讯Github开源项目

MotionCtrl是一个统一的视频生成动作控制系统，可独立调节生成视频中的相机和物体运动。该项目兼容SVD、VideoCrafter和AnimateDiff等多个视频生成模型，并提供训练代码、推理脚本和在线演示。通过MotionCtrl，研究人员和内容创作者能够更精确地控制生成视频的动作效果，从而提高视频生成的质量和灵活性。

MimicMotion - 基于AI的高质量人体动作视频生成框架

MimicMotion视频生成人体动作AI深度学习Github开源项目

MimicMotion是一个创新的视频生成框架，可基于任意动作指导生成高质量的长视频。该项目采用置信度感知的姿态引导技术，提高了时间平滑性和模型鲁棒性。通过区域损失放大和渐进式潜在融合策略，MimicMotion有效解决了图像失真问题，并能以较低的资源消耗生成长视频。这一技术在视频质量、控制性和生成长度等方面显著优于现有方法，为人体运动视频生成领域开辟了新的可能性。

diffusion-nbs - 扩散模型入门资源集合

扩散模型机器学习AI图像生成深度学习Github开源项目

diffusion-nbs项目是一个专注于扩散模型的入门资源集合。该项目提供了一系列教程和Jupyter notebooks示例，旨在帮助初学者和研究人员理解扩散模型的基本概念。内容涵盖了扩散过程的原理和实践应用，为学习者提供了扎实的基础知识，并展示了如何在各种场景中应用这一技术。

anole - Anole实现图文交错生成的开源多模态模型

Anole多模态模型图文生成开源AIGithub开源项目

Anole是一款开源的大型多模态模型，具备图文交错生成能力。该模型通过微调约6000张图像数据集，在Chameleon基础上实现了图像生成和理解功能。Anole支持文本到图像生成、图文交错生成、文本生成和多模态理解，为多模态AI研究提供了新的可能性。

screenshot-to-code - AI驱动的设计稿到多种前端代码转换工具

screenshot-to-codeAI代码生成前端开发图像识别Github开源项目

screenshot-to-code是一个AI驱动的工具，能将截图、原型和Figma设计转换为功能性代码。支持HTML+Tailwind、React、Vue等多种前端技术栈，并集成了Claude Sonnet 3.5、GPT-4O等先进AI模型。此外，该工具还具备将网站视频或屏幕录像转化为功能性原型的能力，为开发和设计过程提供了高效的解决方案。

ChatGLM3 - 突破性能与功能的开源对话模型

ChatGLM3大语言模型开源模型对话系统AIGithub开源项目

ChatGLM3是智谱AI与清华大学KEG实验室联合开发的开源对话模型。该模型在保持对话流畅和易于部署的基础上，引入了更强大的基础架构、更全面的功能支持和多个开源版本。ChatGLM3-6B不仅支持多轮对话，还能进行工具调用和代码执行，在10B以下模型中表现出色。此外，项目还开源了基础模型和长文本版本，为学术研究和商业应用提供了多样化选择。

DI-star - 开源星际争霸II AI训练框架

StarCraft IIAI强化学习监督学习游戏智能Github开源项目

DI-star是一个为星际争霸II设计的开源AI训练框架。它提供预训练模型、对战演示和训练代码，支持监督学习和强化学习。该平台已训练出大师级AI，并支持多种测试模式。DI-star适用于Windows和Linux系统，为研究人员提供了构建和训练自定义AI代理的工具。

smart-excel-ai - 智能Excel公式生成工具助力高效电子表格创建

SmartExcelAIExcel公式Next.js开源项目Github

SmartExcel.cc是一款基于AI技术的Excel公式生成工具，能快速生成精确的Excel公式。该工具采用ChatGPT API和Vercel AI SDK，通过流式处理技术实现高效响应。项目使用Next.js和TailwindCSS等现代技术栈，提供直观的用户界面。SmartExcel.cc适用于数据分析和日常办公，有助于提高Excel使用效率。

PythonProgrammingPuzzles - Python编程谜题集：评估与提升AI编程技能

Python编程AI算法开源项目Github

PythonProgrammingPuzzles是一个开源项目，提供多样化的Python编程谜题，用于评估和提升AI的编程能力。项目包含从基础到高级的各类问题，涵盖经典算法、竞赛题目和开放性数学难题。通过代码定义的规范和自动验证机制，该平台为AI编程学习和评估提供了客观、有效的测试环境。项目不仅展示了现有AI系统的解题能力，还鼓励社区贡献新谜题，促进AI编程技术的持续发展。

latentbox - AI、创意和艺术领域的精选资源聚合平台

Latent BoxAI创意艺术资源聚合Github开源项目

Latent Box是一个创新资源聚合平台，专注于AI、创意和艺术领域。通过精心筛选和社区共创，该平台致力于缩小信息差距，促进跨界合作，并持续更新高质量内容。Latent Box旨在提供有价值的资源，激发创新灵感，推动多元化学习和探索。

plip - 病理学视觉语言基础模型革新AI分析

PLIP病理学AI预训练模型视觉语言模型Github开源项目

PLIP是首个针对病理AI的视觉和语言基础模型，通过大规模预训练实现病理图像和文本描述的特征提取。作为CLIP模型的改进版，PLIP支持图像文本编码和相似度计算，可通过多种API方式使用。该模型为病理图像分析提供新的研究工具，助力医疗AI在病理诊断和研究中的应用。

RestoreFormerPlusPlus - 先进的高质量人脸图像修复技术

人脸修复RestoreFormer++深度学习图像处理AIGithub开源项目

RestoreFormerPlusPlus是一种高级人脸图像修复方法，采用全空间注意力机制和扩展退化模型(EDM)提高修复效果的保真度和真实感。该方法利用丰富的上下文信息和高质量先验，提升了对真实场景的适应性和通用性。项目开源了预训练模型、推理代码和在线演示，为研究和开发人员提供了实现高质量人脸图像修复的便捷工具。

ml-agents - 用于游戏和模拟环境的开源智能代理训练工具

Unity ML-Agents ToolkitAI强化学习模拟环境游戏开发Github开源项目

Unity ML-Agents Toolkit是一个开源项目，利用游戏和模拟环境训练智能代理。集成了基于PyTorch的先进算法，用户可以轻松训练2D、3D和VR/AR游戏中的智能代理。支持强化学习、模仿学习和神经进化等方法，适用于NPC行为控制、自动化测试和游戏设计评估。该工具包为游戏开发者和AI研究人员提供了一个共享平台，助力在Unity丰富环境中测试AI进展，并惠及广泛的研究和开发社区。

第一个基于Mamba2的模型！！7B模型竟然超过22B模型！Transformer岌岌可危

2024年08月03日

IMAGDressing：最新开源换装模型，可更改人物姿势，还有更多惊艳功能首发

2024年08月03日

AI也能刷短视频了？！清华大学最新发布短视频理解模型，含图像文本音频多模态理解

2024年08月03日

DB-GPT：12.7k星星！让大模型与数据库的交互更简单便捷，助力开发

2024年08月03日

AutoGPT:开创AI代理新纪元的开源项目

2024年08月29日

AutoGPT:开创自主AI助手的新时代

2024年08月29日

FaceFusion:下一代人脸交换与增强技术

2024年08月29日

DevOpsGPT：AI驱动的软件开发自动化解决方案

2024年08月30日

今天不讲技术，分享点简单的AI副业，做好了盈利还是很可观的，只介绍不卖课放心看！

2024年08月02日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com