#Github

stanza - Python自然语言处理库，支持多种语言

StanzaNLPPythonStanford CoreNLP生物医学Github开源项目

Stanza是斯坦福NLP团队开发的Python自然语言处理库，支持60多种语言，提供高精度的自然语言处理工具，并可与Java Stanford CoreNLP软件集成。新推出的生物医学和临床英文模型包可以处理生物医学文献和临床笔记的句法分析和命名实体识别。Stanza可通过pip和Anaconda安装，适用于Python 3.6及以上版本，提供详细的文档和在线示例，帮助用户快速入门并高效使用。

models - 产业级开源模型库，支持多场景端到端开发

飞桨开源模型库语义理解图像分类目标检测Github开源项目

飞桨开源模型库提供经过实践验证的主流模型，支持语义理解、图像分类、目标检测等场景，助力企业低成本开发和快速集成。模型库根据国内企业研发流程定制，广泛应用于能源、金融、工业、农业等领域，包含超过600个官方模型和260个生态模型。

DeepLearningFlappyBird - 使用深度Q网络训练AI玩Flappy Bird游戏

Deep Q-NetworkFlappy Bird深度强化学习卷积神经网络PythonGithub开源项目

该项目演示了如何使用深度Q学习算法在Flappy Bird游戏中进行应用。项目利用Python、TensorFlow和OpenCV等技术，详细讲解了如何通过卷积神经网络处理游戏画面并优化游戏策略，使AI智能体可以自学并在游戏中取得高分。内容包括游戏画面的预处理、网络结构的设计、训练过程的参数调整以及常见问题的解决方案。此项目适合对深度强化学习有兴趣的开发者和研究人员参考。

pix2pixHD - 高分辨率图像到图像转换及语义编辑

pix2pixHD图像翻译GANs高分辨率语义操控Github开源项目

此Pytorch实现的高分辨率图像到图像转换方法（如2048x1024），可以将语义标签图转化为真实感图像，或从面部标签图生成肖像。该项目适用于街景和肖像等图像生成及交互编辑。需要NVIDIA GPU，提供详细的安装、测试和训练指南，支持多GPU和自动混合精度训练。

PyTorch-VAE - PyTorch中多种变分自编码器的实现与训练示例

PyTorch VAE变分自编码器PyTorch深度学习图像生成Github开源项目

PyTorch-VAE项目实现了多种变分自编码器（VAE），专注于结果的可重复性，包括从Vanilla VAE到VQ-VAE的众多模型。所有模型都在CelebA数据集上训练，确保一致的对比结果。代码简洁易用，支持PyTorch和PyTorch Lightning，适合研究人员和开发者快速构建、调试和优化VAE模型。

daily-paper-computer-vision - 计算机视觉与深度学习论文每日精选更新

CVer计算机视觉计算机视觉深度学习机器学习AI论文Github开源项目

该项目每日更新和整理计算机视觉、深度学习及机器学习领域的最新优质论文和项目，涵盖多个研究方向。内容涵盖从2017年至今的顶会顶刊论文列表和代码链接，为研究人员提供丰富的资源参考。

darkflow - 实时物体检测与分类工具，支持多种YOLO模型

darkflowYOLOobject detectiontensorflow训练模型Github开源项目

Darkflow是一个用于实时物体检测和分类的开源项目，兼容Python3、Tensorflow、Numpy和OpenCV。用户可以通过pip安装、构建Cython扩展或使用自定义标签进行训练和推理。项目还提供Android演示和支持保存加载protobuf文件，适合跨平台应用。

Practical_RL - 强化学习开源课程：实用技巧与实践

Practical_RL强化学习HSEYSDAGoogle ColabGithub开源项目

Practical_RL是一个专注于强化学习实用性的开源课程，提供HSE和YSDA的课堂教学及线上学习支持，涵盖英语和俄语材料。课程从基础理论到实践应用，包括价值迭代、Q学习、深度学习、探索策略、策略梯度方法、序列模型及部分观察MDP等内容。学生可以通过GitHub改进课程，使用Google Colab或本地环境进行实践。适合希望在实际问题中应用强化学习的学生和研究者。

HyperLPR - 高性能跨平台车牌识别框架

HyperLPR3车牌识别高性能跨平台快速部署Github开源项目

HyperLPR3是一个高性能车牌识别框架，支持Python、Windows、Mac、Linux和树莓派等平台。其识别速度快，准确率高，适用于多种场景。项目提供详细的安装、测试指南和多种API接口，方便开发者快速集成和使用。

seq2seq-couplet - 使用Tensorflow的seq2seq对联生成项目

seq2seq modelTensorflow对对联Python 3.6训练模型Github开源项目

该开源项目利用Tensorflow和seq2seq模型生成对联。用户可以通过[在线演示](https://ai.binwang.me/couplet)体验效果。运行项目需要Tensorflow、Python 3.6及特定数据集。通过配置couplet.py文件并运行可进行模型训练，训练过程中可在Tensorboard查看损失和BLEU评分。训练完成后，可运行server.py启动Web服务生成对联，或使用Docker镜像部署。

video-subtitle-extractor - 多语言视频字幕批量提取工具，支持GPU加速和多种提取模式

Video-subtitle-extractor字幕提取OCR识别批量提取GPU加速Github开源项目

Video-subtitle-extractor是一款高效的视频字幕提取工具，可以将视频中的硬字幕提取为外挂字幕文件（srt格式）。支持批量处理、多语言字幕提取和水印去除，适用于Windows、macOS和Linux系统。用户可选择快速、自动或精准模式，使用GPU加速提高提取速度和准确度。本地OCR识别无需连接在线服务，适合对字幕提取有高要求的用户。

DeepLearning.ai-Summary - DeepLearning.ai课程的详细笔记与总结

DeepLearning.ai神经网络深度学习卷积神经网络机器学习项目Github开源项目

此页面收录了DeepLearning.ai系列课程的详细笔记和总结，涵盖神经网络、超参数调整、机器学习项目结构、卷积神经网络和序列模型。读者可以通过这些笔记全面了解深度学习的基础知识和实际应用。

Realtime_Multi-Person_Pose_Estimation - 实时多人人体姿态估计的开源实现

Realtime Multi-Person Pose EstimationOpenPoseCVPRMSCOCO Keypoints ChallengePart Affinity FieldsGithub开源项目

该项目展示了一种无需人体检测器的实时多人人体姿态估计方法，曾获2016年MSCOCO关键点挑战赛冠军等多个奖项。项目提供了C++、TensorFlow、Pytorch等多种实现版本，适用于不同应用场景。页面还包括详细的测试与训练步骤，以及相关的代码库和资源链接，适合研究人员和开发者使用。

dalai - 在电脑上运行LLaMA和Alpaca模型，跨平台兼容

DalaiLLaMAAlpacaAI模型跨平台Github开源项目

Dalai项目允许用户在Linux、Mac和Windows系统上运行LLaMA和Alpaca模型，提供用户友好的Web应用和JavaScript API。通过简单的安装步骤即可在本地使用这些模型，支持多种模型尺寸，适应不同计算机配置。详细的安装和故障排除指南帮助用户快速上手。

carla - 一个用于自动驾驶研究的开源模拟器

CARLA自主驾驶开源模拟器自动驾驶系统仿真平台Github开源项目

CARLA是一款专为自动驾驶研究设计的开源模拟器，支持开发、训练和验证自动驾驶系统。提供丰富的开放数字资产，包括城市布局、建筑物和车辆，并支持灵活配置传感器套件和环境条件。CARLA支持在多平台上模拟和测试自动驾驶解决方案。

awesome-chatgpt-zh - 全面的ChatGPT中文资源与应用指南

ChatGPTOpenAIGPT-4AI工具开源项目Github

ChatGPT中文指南，涵盖免费与付费资源、高效交流方法、应用开发工具及案例等。提供丰富的ChatGPT工具、插件和生产力工具，持续更新，帮助用户充分利用ChatGPT的能力。

promptflow - 全方位简化LLM应用开发与部署的工具

Prompt flowLLM应用生产部署流开发VS Code扩展Github开源项目

Prompt flow是一款开发工具套件，专注于从创意、原型制作、测试、评估到生产部署和监控的LLM应用开发。它支持流的创建、调试和性能评估，兼容多种平台部署，并提供VS Code扩展用于交互式开发，适用于希望快速高效构建高质量LLM应用的开发者。

react-native-vision-camera - 高性能React Native相机库，支持多种自定义功能

VisionCameraReact Native高性能相机库QR/条形码扫描4k/8k图像Github开源项目

VisionCamera 是一个高性能的 React Native 相机库，支持照片和视频捕捉、QR/条码扫描、多设备和鱼眼变焦、自定义分辨率和纵横比、可调帧率、帧处理器、实时滤镜、平滑变焦、HDR 和夜间模式等功能。通过 npm 安装并设置权限，即可快速上手。

chatgpt-advanced - 一个可使用网络结果增强您的 ChatGPT 提示的浏览器扩展程序

WebChatGPTChatGPT浏览器扩展人工智能网页访问Github开源项目

该浏览器扩展为ChatGPT添加了网络访问功能，提供更相关和最新的回答。支持Chrome、Firefox和Edge浏览器，并提供手动安装和源码构建选项。需注意：此Github仓库将在2023年6月30日后停止更新，因为新功能需要用户凭证和服务器端逻辑。扩展不收集任何用户数据，保障隐私安全。

autoscraper - 自动化智能高效的Python网页抓取工具

AutoScraper自动网页抓取Python数据提取安装教程Github开源项目

AutoScraper 是一款为简化网页爬取而设计的智能工具，能够自动学习爬取规则，获取网页中的文本、URL及HTML标签值。兼容Python 3，支持从Git、PyPI或源代码安装，允许使用代理和自定义请求参数，并且可以保存和加载模型，满足各种复杂的网页数据抓取需求。

vespa - 大规模数据集搜索与推荐的高性能解决方案

Vespa搜索机器学习模型高可用性性能Github开源项目

Vespa 是一个高性能平台，专为大规模数据集的搜索、推荐和个性化任务设计。它支持向量、张量、文本和结构化数据的实时组织和推断，具备高可用性和可扩展性。Vespa 被广泛应用于大规模互联网服务，每秒处理数十万次查询。用户可以选择在云端或本地部署应用，平台提供详尽的文档和不断更新的博客，帮助用户开发和集成。

ShortGPT - 使用AI自动化生成视频和短内容的开源工具

ShortGPT自动化视频制作内容创作AI剪辑语音合成Github开源项目

ShortGPT是一款开源工具，利用AI简化视频创建、素材搜集、语音合成和编辑任务。支持多语言配音和视频字幕生成，并能长效保存编辑变量。用户可以选择通过Google Colab快速开始，或本地运行。它集成了Moviepy、OpenAI、ElevenLabs、EdgeTTS、Pexels和Bing Image等技术，提供高效灵活的内容创作体验。

superagent - 开源AI助手框架与API，集成多种应用功能

SuperagentAI助手框架开源大语言模型Y CombinatorGithub开源项目

Superagent是完全开源的AI助手框架，利用大语言模型、检索增强生成和生成式AI技术，帮助开发者在应用中集成强大的AI助手。功能涵盖文档问答、聊天机器人、内容生成、数据聚合和工作流自动化。由Y Combinator支持，提供Python和Typescript SDK，并附有详细文档和教程。

text-generation-inference - 生产级高性能文本生成推理工具

Text Generation InferenceHugging Face大语言模型分布式追踪量化Github开源项目

Text Generation Inference (TGI) 是一个部署和服务大型语言模型的工具包。它支持Llama、Falcon、StarCoder、BLOOM、GPT-NeoX等流行的开源模型，提供简便的启动器、分布式追踪、张量并行、多GPU推理加速、令牌流等特性。TGI还支持权重量化和安全张量加载，具备自定义提示生成和微调功能，兼容Nvidia、AMD、Inferentia、Intel GPU、Gaudi和Google TPU等硬件平台。

einops - 灵活高效的张量操作，兼容多个框架

einopstensor操作深度学习numpypytorchGithub开源项目

Einops 提供简洁高效的张量操作，适用于 numpy、pytorch、tensorflow、jax 等多个框架。通过易于理解的 Einstein 风格操作符，提高代码的可读性和可靠性。主要功能包括张量的重新排列、简化、复制、打包与解包。Einops 适用于深度学习和复杂数据处理任务，是开发者优化代码的理想工具。

server - 开源AI推理服务，兼容多种深度学习和机器学习框架

Triton Inference ServerAI推理深度学习框架NVIDIA AI Enterprise模型优化Github开源项目

Triton Inference Server是一款开源推理服务软件，支持TensorRT、TensorFlow、PyTorch等多种深度学习和机器学习框架。它优化了云端、数据中心、边缘和嵌入式设备的推理性能，适用于NVIDIA GPU、x86和ARM CPU，以及AWS Inferentia。主要功能包括动态批处理、模型流水线、HTTP/REST和gRPC协议支持等。通过Triton，用户可以轻松部署和优化AI模型，提升推理效率。

denoising-diffusion-pytorch - 生成模型新方法：Pytorch中的Denoising Diffusion

Denoising Diffusion Probabilistic ModelPytorch生成建模Langevin采样扩散模型Github开源项目

Denoising Diffusion Probabilistic Model在Pytorch中的实现，通过去噪得分匹配估计数据分布梯度，并使用Langevin采样生成样本。这种方法可能成为GANs的有力竞争者。项目支持多GPU训练，提供详细的安装和使用指南，是研究人员和开发者的高效工具，支持1D序列数据和图像数据的生成和训练。

vosk-api - 离线开源多语言语音识别工具，支持多种设备

Vosk语音识别离线开源工具包多语言支持Github开源项目

Vosk是一款离线开源语音识别工具包，支持20多种语言和方言。其模型体积小（仅50MB），但能提供连续的大词汇量转录、零延迟响应和流媒体API。支持Python、Java、Node.JS、C#、C++、Rust、Go等多种编程语言。适用于聊天机器人、智能家居设备、虚拟助手，也能为电影创建字幕、为讲座和采访生成转录。Vosk从Raspberry Pi等小型设备到大型集群均可扩展。访问Vosk官网获取安装指南、示例和文档。

machine-learning-roadmap - 机器学习核心概念与工具指南

Machine Learning机器学习工具机器学习过程机器学习数学机器学习资源Github开源项目

提供涵盖机器学习问题、流程、工具、数学基础和资源的完整路线图，帮助学习者全面掌握机器学习的核心内容。包含从问题定义到解决方案实施的详细步骤，并推荐相关学习资源，适合机器学习初学者和进阶者。

python-machine-learning-book-2nd-edition - Python机器学习与深度学习实用指南

Python Machine LearningPackt Publishing深度学习机器学习数据科学Github开源项目

本书详细介绍机器学习和深度学习的核心概念，教你使用Python及其主要库（如Scikit-Learn和TensorFlow）进行数据处理、分类、回归和模型优化。书中包含丰富的示例代码和Jupyter笔记本，帮助读者理解复杂的数学理论和实现步骤，是数据科学家和工程师学习和提升机器学习技能的理想选择。

BentoML - 简化AI模型推理API的构建与部署

BentoML模型服务框架AI模型Docker容器生产环境Github开源项目

BentoML是一个开源模型服务框架，简化了AI和ML模型的生产部署。可以将任何模型推理脚本轻松转化为REST API服务器，并通过简单配置文件管理环境、依赖和模型版本。BentoML支持高性能推理API的构建，利用动态批处理、模型并行化和多阶段流水线等优化功能，最大化CPU/GPU利用率。此外，还支持自定义AI应用、异步推理任务和定制化前后处理逻辑。通过Docker容器或BentoCloud可轻松部署至生产环境，适用于各种机器学习框架和推理运行时。

vits - 基于变分自编码器和对抗学习的端到端TTS系统

VITS语音合成变分自编码器对抗学习TTSGithub开源项目

VITS是一种结合变分自编码器和对抗学习的端到端TTS系统，能够提升语音合成的自然度。通过变分推理和正态化流，以及随机时长预测器，VITS实现了多样节奏的语音合成。实验结果表明，该方法在LJ Speech数据集上的表现优于现有的TTS系统，接近真实语音的水平。

gpt-researcher - 自主在线研究并生成报告的AI工具

GPT ResearcherAI研究在线研究工具自动化代理GPT-4Github开源项目

GPT Researcher是一款自主AI工具，专为多种任务的全面在线研究设计。它能够生成详细、真实且无偏见的研究报告，并支持定制化资源和大纲。通过并行代理提升性能和速度，GPT Researcher解决了信息错误、速度慢和可靠性问题，使个人和组织能够获取准确、无偏见的信息。项目支持本地文档和网络资源，生成长达2000字以上的报告，并可导出为PDF和Word文档。

SWE-agent - 将 LM（例如 GPT-4）转换为软件工程代理问题来解决的工具

SWE-agent软件工程Princeton UniversityGitHubLM-centricGithub开源项目

SWE-agent由普林斯顿大学团队开发，将语言模型（如GPT-4）转变为能在实际GitHub仓库中解决问题的软件工程代理。通过设计简洁的指令和反馈格式，SWE-agent能够浏览仓库、查看、编辑和执行代码文件。在SWE-bench测试中，SWE-agent实现了12.47%的问题解决率，达到了最先进的性能。用户可以通过网页界面或命令行使用SWE-agent，详细信息请查阅项目文档。

plandex - 终端中的AI助手，高效构建复杂应用

PlandexAI开发工具终端AI助手代码生成自动化开发Github开源项目

Plandex是一个终端AI助手，帮助开发者高效完成跨文件和多步骤的复杂任务。支持OpenAI等多种模型，允许在沙盒环境中进行代码审查和管理。支持多平台，简化项目管理、测试编写、错误修复和功能开发。

bytom - 高度可扩展的区块链协议，实现数字资产的管理与交易

区块链数字资产多资产共享账本Go语言Github开源项目Bytom

Bytom是一种区块链协议，支持用户定义、发行和转移数字资产。其官方golang实现提供关键管理、账户及资产管理、交易发送等功能，可通过Homebrew或源码安装。项目正在积极开发中，提供详细的安装和运行指南，并欢迎社区贡献。

相关文章

Article Cover

Visual-Chinese-LLaMA-Alpaca 学习资料汇总 - 多模态中文大语言模型

Article Cover

LLM-groundedDiffusion学习资料汇总 - 用大语言模型增强文本到图像扩散模型的提示理解

Article Cover

awesome-llm-agents学习资料汇总 - 大语言模型智能体精选列表

Article Cover

ChatLLM学习资料汇总 - 轻松玩转LLM兼容OpenAI与LangChain

Article Cover

ollama-grid-search学习资料汇总-自动化评估和比较LLM模型的桌面应用

Article Cover

awesome-llm-role-playing-with-persona学习资料汇总 - 大语言模型角色扮演与人格赋予技术综述

Article Cover

NeMo-Curator学习资料汇总 - GPU加速的大语言模型数据处理工具包

Article Cover

pykoi-rlhf-finetuned-transformers学习资料汇总 - 开源RLHF统一接口

Article Cover

ChainFury入门指南 - 开源生产级LLM链式引擎

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号