#AI
LangGPT - 面向大语言模型的结构化提示词设计框架
LangGPT提示词AIGPT结构化Github开源项目
LangGPT是一个为大语言模型设计的结构化提示词框架,将提示词创作转变为类似面向对象编程的过程。它通过模板、变量和命令,使高质量提示词的创建变得直观高效。LangGPT提供系统化、可适应的方法,帮助用户快速掌握提示词工程技巧,实现大规模生产高质量提示词。这一框架旨在让更多人能够轻松创建出色的提示词,从而更好地发挥大语言模型的潜力。
Awesome-Interaction-Aware-Trajectory-Prediction - 最新交互感知行为与轨迹预测资源
Behavior and Trajectory PredictionautoregressiveJiachen Litrajectory datasetsAIGithub开源项目
本页面汇集了交互感知行为与轨迹预测相关的研究资料,包括数据集、博客、论文和公开代码,面向学术界和工业界。内容涵盖车辆、行人和运动员的轨迹预测数据集、研究论文及代码实现。由斯坦福大学和加州大学伯克利分校的研究人员维护,并持续更新,欢迎提交新资源或通过邮件交流。
langchain-nextjs-template - LangChain与Next.js集成的AI应用开发模板
LangChainNext.jsAI开发模板自然语言处理Github开源项目
此开发模板整合LangChain和Next.js,展示多种AI应用场景的实现方法。包括基础聊天、结构化输出、复杂问题解答和检索增强生成等功能。模板支持流式响应,集成Vercel AI SDK,并提供LangGraph.js智能工作流示例。适合开发者快速构建和部署AI驱动的应用程序。
LLM101n - 深度学习课程教你构建AI讲故事模型
LLMAI深度学习TransformerPythonGithub开源项目
LLM101n深度学习课程从零教授构建AI讲故事模型。内容涵盖语言建模、机器学习、Transformer架构等核心知识,指导学员开发功能完善的Web应用。课程采用Python、C和CUDA编程,适合具备基础计算机科学知识的学习者。除核心AI技术外,还包括分布式优化、量化推理、微调等高级主题,以及多模态AI应用开发。通过实践,学员将掌握AI、大型语言模型和深度学习原理,能够独立创作、优化并为小故事配图。
subtitle - 开源多语言字幕生成工具 支持AI驱动和自托管部署
Subtitle开源AI多语言自托管Github开源项目
Subtitle是一款开源的字幕生成工具,支持多语言处理和自托管部署。该工具采用AI技术为视频内容创建准确、自然的字幕,并可轻松集成到现有工作流程。它提供多种AI模型选择和自定义参数设置,适应不同场景的字幕需求。用户可通过命令行或二进制文件运行,输出多种格式的字幕文件。这个项目为个人用户、内容创作者和企业提供了便捷的字幕解决方案。
seemore - PyTorch实现的开源视觉语言模型项目
Vision Language ModelPytorchAI机器学习图像处理Github开源项目
seemore是一个基于PyTorch的开源视觉语言模型(VLM)项目。它包括图像编码器、视觉-语言投影器和解码器三个核心组件,参考了CLIP和LLaVA等前沿VLM架构。项目提供完整代码实现和详细教程,有助于开发者理解VLM原理。seemore在Databricks平台开发,支持GPU加速,并集成MLFlow用于实验管理。
llm-app-stack - 全面的大语言模型应用开发资源集合
LLM应用程序架构AI开源数据处理Github开源项目
LLM-App-Stack项目汇总了构建大语言模型应用所需的各类工具和服务。该资源集合涵盖数据管道、嵌入模型、向量数据库、编排工具和API插件等关键组件。项目同时整合了专有和开源的LLM API,以及应用托管平台和云服务选项,为开发者提供了全面的技术栈参考。这一资源库旨在帮助开发者更高效地构建和部署智能应用。
QuakeBotArchive - 归档保存Quake机器人的开源历史项目
QuakebotAI游戏档案Github开源项目
QuakeBotArchive项目致力于收集和归档1996-2000年间开发的所有版本Quake机器人。这些机器人是早期计算机游戏人工智能的重要代表作。项目通过定位和保存原始分发形式的Quake机器人,防止这些珍贵历史资料丢失。同时提供机器人年表和家族树等元数据分析,为研究者和爱好者提供重要参考资源。
papers.cool - 智能化学术论文浏览与分析平台
Cool Papers论文阅读AIArxivKimiGithub开源项目
papers.cool是一个智能化学术论文浏览平台,提供多学科论文实时更新、智能摘要生成和全文搜索功能。平台集成机器翻译、LaTeX渲染等工具,支持论文筛选、收藏和分享。通过持续优化用户体验和功能更新,papers.cool旨在提高研究人员的学术效率。该平台支持arXiv多学科论文的实时更新和浏览,致力于提升学术研究效率。
motif - 利用大语言模型偏好生成奖励函数的强化学习框架
MotifAI强化学习NetHack大语言模型Github开源项目
Motif是一个新型强化学习框架,通过大型语言模型的偏好生成奖励函数。它分为数据集注释、奖励函数训练和强化学习三个阶段。在NetHack游戏中,Motif展现出优秀性能,生成符合人类直觉的行为,并可通过提示词灵活调整。这种方法为开发智能AI代理提供了新的研究方向,具有良好的扩展潜力。
Mangio-RVC-Fork - 开源语音转换框架 支持多种F0算法和快速训练
RVC语音转换AI深度学习音频处理Github开源项目
Mangio-RVC-Fork是一个基于VITS的开源语音转换框架,具有top1检索功能。它提供CLI和Web界面,支持多种F0估计方法,包括混合F0算法。该工具可快速训练,使用少量数据也能获得良好效果。支持模型融合改变音色,以及UVR5模型分离人声和伴奏。项目持续开发中,计划添加更多功能优化用户体验。
TurnVoice - 强大的视频声音转换和多语种翻译命令行工具
TurnVoice语音转换视频处理AI命令行工具Github开源项目
TurnVoice是一款功能丰富的命令行工具,专注于视频声音转换和多语种翻译。该工具集成了多种语音合成引擎,包括免费的Coqui TTS在内的多个选项。它允许用户精确控制渲染过程,提供句子文本、时间和语音的自定义选项。TurnVoice还具备保留原始背景音频和本地视频处理的能力,适用于各类视频创作需求。
whisper-vits-svc - 基于VITS的端到端歌声转换开源项目
VITS语音转换深度学习PyTorchAIGithub开源项目
whisper-vits-svc是一个开源的端到端歌声转换项目,基于VITS模型架构。该项目支持多说话人转换,可混合创建新音色,并能处理带轻伴奏的声音。它集成了Whisper、BigVGAN等技术,提高了抗噪性和音质。项目面向深度学习入门者,需要Python和PyTorch基础。目前不支持实时转换,训练需要至少6GB显存。
voice-changer - 多平台实时语音转换软件 支持多种AI模型
VC Client音声変換AIリアルタイムクロスプラットフォームGithub开源项目
VC Client是一款多功能实时语音转换软件,支持MMVC、so-vits-svc、RVC等多种AI模型。该软件兼容Windows、Mac和Linux平台,可通过网络远程使用。提供预构建二进制文件和Docker环境两种部署选项,方便不同技术水平的用户使用。软件具备将处理负载转移到外部设备的功能,适合与游戏等高负载应用同时运行。用户可根据需求选择合适的使用方式,实现高质量的实时语音转换。
Agently-Daily-News-Collector - 基于LLM的开源自动新闻收集工作流
AgentlyAI新闻收集自动化开源Github开源项目
Agently-Daily-News-Collector是基于LLM的开源自动新闻收集项目。该工具利用Agently框架,用户输入主题后自动生成新闻汇总。支持多主题,输出Markdown和PDF格式。克隆仓库并设置API密钥即可使用,简化了新闻收集流程。
weekly - 周刊分享独立开发者产品变现实践
独立开发产品变现周刊SaaSAIGithub开源项目
该周刊聚焦独立开发和产品变现,每周分享成功案例。内容涵盖从小型工具到大型SaaS的多类项目,展示开发者如何通过创新实现盈利。涉及AI、浏览器插件、在线工具等领域,为独立开发者提供实践经验和创意启发。
VADER - 基于奖励梯度的视频生成质量优化技术
视频生成AIVADER机器学习视觉处理Github开源项目
VADER是一种基于奖励梯度的视频生成质量优化技术。该方法无需大规模标注数据集,即可有效提高视频与文本的一致性、美观度,并生成更长时间的高质量视频。VADER兼容多个主流视频生成模型,如VideoCrafter2、Open-Sora和ModelScope,能显著提升其生成能力。项目提供了详细的安装、推理和训练指南,便于研究人员和开发者进行实验和应用。
zerox - 基于视觉模型的创新文档数字化工具
Zerox OCRAI文档处理GPTMarkdownGithub开源项目
Zerox OCR是一款基于视觉模型的文档处理工具,通过将PDF转换为图像并使用GPT模型生成Markdown文本,有效处理复杂布局、表格和图表。与传统OCR服务相比,Zerox在准确度和表格处理方面表现出色,同时保持价格竞争力。该工具支持多种输入方式,提供灵活配置,为文档数字化提供了简单高效的解决方案。
VideoLLaMA2 - 增强视频理解的多模态语言模型
VideoLLaMA2视频理解大语言模型多模态AIGithub开源项目
VideoLLaMA2是一款先进的视频语言模型,通过增强空间-时间建模和音频理解能力,提高了视频问答和描述任务的性能。该模型在零样本视频问答等多项基准测试中表现出色。VideoLLaMA2能处理长视频序列并理解复杂视听内容,为视频理解技术带来新进展。
Schedule - 图学习研讨会定期分享前沿研究
图学习图神经网络研讨会研究分享AIGithub开源项目
Schedule是一个图学习研讨会社区,定期邀请相关研究者分享最新成果。涵盖数据高效图学习、时空深度学习、图神经网络表达、芯片设计等热门话题。来自国内外知名机构的学者参与,为图学习研究者提供交流平台。
private-gpt - 离线运行的AI文档问答系统
PrivateGPT隐私AI大语言模型APIGithub开源项目
PrivateGPT是一个离线AI文档问答系统,无需网络连接即可使用大型语言模型进行文档分析和问答。该项目提供API接口,支持文档ingestion、上下文聊天、补全和嵌入生成等功能,可用于构建私密的AI应用。系统还包含Gradio用户界面,方便测试API功能。此外,PrivateGPT提供批量下载模型、监控文档等辅助工具,便于用户部署和使用。
copilot-workspace-user-manual - GitHub Next推出的AI原生开发环境 全面提升编码协作效率
Copilot WorkspaceGitHub NextAI用户手册开发环境Github开源项目
Copilot Workspace是GitHub Next推出的实验性AI原生开发环境,通过自然语言实现全仓库范围的编码协作。该用户手册全面介绍Copilot Workspace的使用方法,涵盖入门指南、使用技巧、故障排除、技术路线图及项目起源等内容,为各级别开发者提供实用指导。
AI-News-Daily - AI领域每日资讯汇总 聚焦技术突破与行业应用
AI人工智能大语言模型生成式AIOpenAIGithub开源项目
AI-News-Daily项目提供每日AI领域最新动态,涵盖从尖端技术突破到行业应用的广泛内容,包括大语言模型、计算机视觉、机器人技术等多个领域。项目不仅报道技术进展,还深入探讨AI对社会的影响,为读者提供全面而深入的AI资讯。适合AI专业人士和技术爱好者阅读,提供有价值的行业信息。
MotionCtrl - 视频生成中的动作控制统一解决方案
MotionCtrl视频生成动作控制AI腾讯Github开源项目
MotionCtrl是一个统一的视频生成动作控制系统,可独立调节生成视频中的相机和物体运动。该项目兼容SVD、VideoCrafter和AnimateDiff等多个视频生成模型,并提供训练代码、推理脚本和在线演示。通过MotionCtrl,研究人员和内容创作者能够更精确地控制生成视频的动作效果,从而提高视频生成的质量和灵活性。
MimicMotion - 基于AI的高质量人体动作视频生成框架
MimicMotion视频生成人体动作AI深度学习Github开源项目
MimicMotion是一个创新的视频生成框架,可基于任意动作指导生成高质量的长视频。该项目采用置信度感知的姿态引导技术,提高了时间平滑性和模型鲁棒性。通过区域损失放大和渐进式潜在融合策略,MimicMotion有效解决了图像失真问题,并能以较低的资源消耗生成长视频。这一技术在视频质量、控制性和生成长度等方面显著优于现有方法,为人体运动视频生成领域开辟了新的可能性。
diffusion-nbs - 扩散模型入门资源集合
扩散模型机器学习AI图像生成深度学习Github开源项目
diffusion-nbs项目是一个专注于扩散模型的入门资源集合。该项目提供了一系列教程和Jupyter notebooks示例,旨在帮助初学者和研究人员理解扩散模型的基本概念。内容涵盖了扩散过程的原理和实践应用,为学习者提供了扎实的基础知识,并展示了如何在各种场景中应用这一技术。
anole - Anole实现图文交错生成的开源多模态模型
Anole多模态模型图文生成开源AIGithub开源项目
Anole是一款开源的大型多模态模型,具备图文交错生成能力。该模型通过微调约6000张图像数据集,在Chameleon基础上实现了图像生成和理解功能。Anole支持文本到图像生成、图文交错生成、文本生成和多模态理解,为多模态AI研究提供了新的可能性。
screenshot-to-code - AI驱动的设计稿到多种前端代码转换工具
screenshot-to-codeAI代码生成前端开发图像识别Github开源项目
screenshot-to-code是一个AI驱动的工具,能将截图、原型和Figma设计转换为功能性代码。支持HTML+Tailwind、React、Vue等多种前端技术栈,并集成了Claude Sonnet 3.5、GPT-4O等先进AI模型。此外,该工具还具备将网站视频或屏幕录像转化为功能性原型的能力,为开发和设计过程提供了高效的解决方案。
ChatGLM3 - 突破性能与功能的开源对话模型
ChatGLM3大语言模型开源模型对话系统AIGithub开源项目
ChatGLM3是智谱AI与清华大学KEG实验室联合开发的开源对话模型。该模型在保持对话流畅和易于部署的基础上,引入了更强大的基础架构、更全面的功能支持和多个开源版本。ChatGLM3-6B不仅支持多轮对话,还能进行工具调用和代码执行,在10B以下模型中表现出色。此外,项目还开源了基础模型和长文本版本,为学术研究和商业应用提供了多样化选择。
DI-star - 开源星际争霸II AI训练框架
StarCraft IIAI强化学习监督学习游戏智能Github开源项目
DI-star是一个为星际争霸II设计的开源AI训练框架。它提供预训练模型、对战演示和训练代码,支持监督学习和强化学习。该平台已训练出大师级AI,并支持多种测试模式。DI-star适用于Windows和Linux系统,为研究人员提供了构建和训练自定义AI代理的工具。
smart-excel-ai - 智能Excel公式生成工具 助力高效电子表格创建
SmartExcelAIExcel公式Next.js开源项目Github
SmartExcel.cc是一款基于AI技术的Excel公式生成工具,能快速生成精确的Excel公式。该工具采用ChatGPT API和Vercel AI SDK,通过流式处理技术实现高效响应。项目使用Next.js和TailwindCSS等现代技术栈,提供直观的用户界面。SmartExcel.cc适用于数据分析和日常办公,有助于提高Excel使用效率。
PythonProgrammingPuzzles - Python编程谜题集:评估与提升AI编程技能
Python编程AI算法开源项目Github
PythonProgrammingPuzzles是一个开源项目,提供多样化的Python编程谜题,用于评估和提升AI的编程能力。项目包含从基础到高级的各类问题,涵盖经典算法、竞赛题目和开放性数学难题。通过代码定义的规范和自动验证机制,该平台为AI编程学习和评估提供了客观、有效的测试环境。项目不仅展示了现有AI系统的解题能力,还鼓励社区贡献新谜题,促进AI编程技术的持续发展。
latentbox - AI、创意和艺术领域的精选资源聚合平台
Latent BoxAI创意艺术资源聚合Github开源项目
Latent Box是一个创新资源聚合平台,专注于AI、创意和艺术领域。通过精心筛选和社区共创,该平台致力于缩小信息差距,促进跨界合作,并持续更新高质量内容。Latent Box旨在提供有价值的资源,激发创新灵感,推动多元化学习和探索。
plip - 病理学视觉语言基础模型 革新AI分析
PLIP病理学AI预训练模型视觉语言模型Github开源项目
PLIP是首个针对病理AI的视觉和语言基础模型,通过大规模预训练实现病理图像和文本描述的特征提取。作为CLIP模型的改进版,PLIP支持图像文本编码和相似度计算,可通过多种API方式使用。该模型为病理图像分析提供新的研究工具,助力医疗AI在病理诊断和研究中的应用。
RestoreFormerPlusPlus - 先进的高质量人脸图像修复技术
人脸修复RestoreFormer++深度学习图像处理AIGithub开源项目
RestoreFormerPlusPlus是一种高级人脸图像修复方法,采用全空间注意力机制和扩展退化模型(EDM)提高修复效果的保真度和真实感。该方法利用丰富的上下文信息和高质量先验,提升了对真实场景的适应性和通用性。项目开源了预训练模型、推理代码和在线演示,为研究和开发人员提供了实现高质量人脸图像修复的便捷工具。
ml-agents - 用于游戏和模拟环境的开源智能代理训练工具
Unity ML-Agents ToolkitAI强化学习模拟环境游戏开发Github开源项目
Unity ML-Agents Toolkit是一个开源项目,利用游戏和模拟环境训练智能代理。集成了基于PyTorch的先进算法,用户可以轻松训练2D、3D和VR/AR游戏中的智能代理。支持强化学习、模仿学习和神经进化等方法,适用于NPC行为控制、自动化测试和游戏设计评估。该工具包为游戏开发者和AI研究人员提供了一个共享平台,助力在Unity丰富环境中测试AI进展,并惠及广泛的研究和开发社区。
相关文章
第一个基于Mamba2的模型!!7B模型竟然超过22B模型!Transformer岌岌可危
2024年08月03日
IMAGDressing:最新开源换装模型,可更改人物姿势,还有更多惊艳功能首发
2024年08月03日
AI也能刷短视频了?!清华大学最新发布短视频理解模型,含图像文本音频多模态理解
2024年08月03日
DB-GPT:12.7k星星!让大模型与数据库的交互更简单便捷,助力开发
2024年08月03日
AutoGPT:开创AI代理新纪元的开源项目
2024年08月29日
AutoGPT:开创自主AI助手的新时代
2024年08月29日
FaceFusion:下一代人脸交换与增强技术
2024年08月29日
DevOpsGPT:AI驱动的软件开发自动化解决方案
2024年08月30日
今天不讲技术,分享点简单的AI副业,做好了盈利还是很可观的,只介绍不卖课放心看!
2024年08月02日