#Python

manga-ocr - 日本漫画光学字符识别工具,支持多种文本处理场景
Github开源项目PythonTransformersManga OCR日本放送協会光学字符识别
Manga OCR 是一款基于Transformer的自定义端到端模型的光学字符识别工具,专为日本漫画设计。它可以识别垂直和平行文本、带有振假名的文本、覆盖在图像上的文本、各种字体以及低质量图像。Manga OCR 支持一次性识别多行文本,适用于漫画中的文本气泡。同时,该项目还提供与GUI阅读器和HTML覆盖生成工具的集成,便于用户创建完整的阅读和挖掘工作流程。
datamodel-code-generator - 多格式支持的Python数据模型代码生成工具
Github开源项目PythonPydanticOpenAPIJSON Schema数据模型生成器
datamodel-code-generator是一款Python数据模型代码生成工具,支持从OpenAPI、JSON Schema、GraphQL等格式生成Pydantic、dataclasses等模型。它可以读取本地文件、URL或多种数据格式作为输入,并提供自定义输出选项。该工具安装简便,使用灵活,在多个开源项目中得到应用,有效简化了数据模型开发流程。
sqlalchemy - Python SQL工具包和对象关系映射框架
Github开源项目PythonSQL数据库SQLAlchemyORM
SQLAlchemy是一个Python SQL工具包和对象关系映射(ORM)框架。它提供SQL的功能和灵活性,包括ORM、关系型查询系统、eager loading机制和SQL构建系统。SQLAlchemy的设计既满足高性能数据库访问需求,又保持Python风格。适用于从简单数据库操作到复杂企业级应用的各种项目。
seewav - 开源音频波形动画生成工具
Github开源项目PythonFFmpegSeeWav音频波形动画生成器
SeeWav是一个开源的音频波形动画生成工具,可为音频文件创建可视化动画。它支持自定义颜色、立体声显示和多种参数调整,能够生成独特的音频可视化效果。这个工具适合音乐制作、播客创作和视频编辑等领域,用于为作品添加动态视觉元素。
alibaba.alicloud - 专门用于管理阿里云资源的Ansible模块集合
Github开源项目PythonAnsible自动化管理模块Alibaba Cloud
alibaba.alicloud是一个专门用于管理阿里云资源的Ansible模块集合。它包含了多个功能模块,覆盖ECS、VPC、SLB等阿里云产品,可实现云资源的创建、管理和删除。该集合支持Python 3.6及以上版本,并可通过Ansible Galaxy CLI进行安装。用户只需编写简单的YAML配置文件,即可执行复杂的云资源管理任务,有效提升运维效率。
install-poetry - 自动化安装配置Python依赖管理工具Poetry
Github开源项目Python自动化测试GitHub ActionsPoetryCI/CD
install-poetry是一个GitHub Action,用于自动化安装和配置Python依赖管理工具Poetry。它能够安装指定版本的Poetry,设置系统路径和虚拟环境,并提供多种CI/CD工作流示例。该Action支持Ubuntu和macOS环境,简化了Poetry在持续集成流程中的使用,包括测试、矩阵构建和代码覆盖率上传等常见场景。
LLM101n - 深度学习课程教你构建AI讲故事模型
Github开源项目AIPython深度学习LLMTransformer
LLM101n深度学习课程从零教授构建AI讲故事模型。内容涵盖语言建模、机器学习、Transformer架构等核心知识,指导学员开发功能完善的Web应用。课程采用Python、C和CUDA编程,适合具备基础计算机科学知识的学习者。除核心AI技术外,还包括分布式优化、量化推理、微调等高级主题,以及多模态AI应用开发。通过实践,学员将掌握AI、大型语言模型和深度学习原理,能够独立创作、优化并为小故事配图。
BEPb - 多领域编程技能与开源贡献展示
Github开源项目GitHubPython机器学习数据科学
这个项目展示了作者在多个技术领域的专长,包括Python编程、机器学习和数据科学。通过GitHub统计数据、代码分析和可视化图表,直观地呈现了作者的技术水平和开源贡献。项目还提供了多种联系渠道,方便进行技术交流。
black - Python代码风格统一的自动格式化工具
Github开源项目Python自动化工具代码格式化Black
Black是一个自动化Python代码格式化工具,能快速统一代码风格,减少代码差异,提高审查效率。它遵循PEP 8规范,支持Python 3.8+版本,安装简便。Black采用固定的格式化规则,无需复杂配置。目前已被多个知名开源项目和组织采用,有助于维护一致的代码格式。
grequests - Python异步HTTP请求库grequests
Github开源项目Python异步请求HTTP请求GRequestsGevent
grequests是一个Python库,结合Requests和Gevent实现异步HTTP请求。它提供简单的API,支持批量请求、错误处理和高效响应处理。通过map和imap功能,grequests实现高并发效率,适用于网络爬虫、API集成等大量HTTP请求场景。使用时需注意库的导入顺序,以避免潜在问题。
poetry - 现代化Python项目依赖管理工具
Github开源项目PythonPoetry依赖管理包管理pyproject.toml
Poetry是一款革新性的Python项目管理工具,通过单一的pyproject.toml文件取代了传统的多个配置文件。它提供了全面的依赖管理、版本控制、虚拟环境管理以及包构建和发布功能。Poetry简化了Python项目的开发流程,确保了依赖环境的一致性,使项目管理变得更加高效和可靠。
chalice - Python无服务器应用开发框架 简化AWS Lambda部署
Github开源项目PythonAWS LambdaChalice无服务器应用API Gateway
Chalice是一个Python无服务器应用开发框架,专为AWS Lambda设计。它提供命令行工具、装饰器API和自动IAM策略生成功能,支持快速创建REST API、定期任务、S3事件处理和SQS消息队列等。开发者可以通过简洁的代码和命令,在短时间内完成应用的部署和运行,显著提高了无服务器应用的开发效率。
hy - 融合 Lisp 和 Python 的嵌入式编程语言
Github开源项目Python编程语言HyLisp
Hy 是一种嵌入 Python 的 Lisp 方言,通过将 Lisp 代码转换为 Python 抽象语法树,实现了两种语言的融合。该项目支持交互式 REPL 环境和脚本执行,兼容 CPython、PyPy 和 Pyodide 的维护版本。Hy 为开发者提供了结合 Lisp 和 Python 优势的编程环境,适用于希望在 Python 生态系统中使用 Lisp 语法的程序员。
textual - 革新Python终端用户界面开发
Github开源项目Python终端应用Textual界面开发Rich
Textual是一款创新的Python快速应用开发框架,专注于终端用户界面。它通过简洁的API实现复杂UI设计,支持终端和浏览器运行,提供丰富的色彩、鼠标交互和流畅动画。结合Rich库特性,Textual为跨平台应用带来卓越的视觉效果和交互体验。其强大的布局引擎和可重用组件系统使开发者能轻松创建媲美现代GUI的终端应用,为Python终端界面开发开辟了新的可能性。
great-tables - 强大而简便的Python表格生成库
Github开源项目Python数据可视化DataFrameGreat Tables表格生成
Great Tables是一个功能丰富的Python库,用于创建和自定义表格。该库支持灵活组合各种表格元素,包括表头、表尾和行标签等,并提供多样的单元格格式化选项。Great Tables可处理Pandas或Polars DataFrame数据,支持在多种环境中渲染表格。其设计注重简洁性和实用性,适用于各类表格展示场景。
pprofile - Python高精度性能分析工具
Github开源项目Python统计分析性能分析pprofile线程感知
pprofile是一款纯Python实现的性能分析工具,支持行级粒度和线程感知分析。它提供确定性和统计性两种分析模式,可输出多种格式报告。pprofile适用于短时间运行的代码分析,帮助开发者快速定位性能瓶颈。
pyenv - Python多版本管理器
Github开源项目Python版本管理环境变量pyenv多版本
pyenv是一款功能强大的Python版本管理工具,可实现多个Python版本的无缝切换。它支持全局和项目级别的版本设置,并允许通过环境变量进行覆盖。pyenv采用纯shell脚本编写,独立于Python运行,通过修改PATH实现版本控制。虽不直接管理virtualenv,但可与其他工具配合使用。pyenv设计简洁,符合Unix工具单一职责的理念,为开发者提供了灵活高效的Python环境管理解决方案。
locust - 简单强大的开源性能测试工具
Github开源项目Python分布式性能测试Locust负载测试
Locust是一款开源的性能和负载测试工具,支持HTTP和其他协议。它采用开发者友好的方法,允许用户使用Python代码定义测试,并支持导入常规Python库。Locust具有分布式和可扩展性,能够支持大规模并发用户同时测试。它提供了直观的Web界面,可实时显示测试进度,并支持无UI运行以便于CI/CD测试。这些特性使Locust能够轻松适应各种复杂的测试场景。
depyf - 深入解析PyTorch编译器工作原理的开源工具
Github开源项目PythonPyTorchtorch.compile反编译depyf
depyf是一个开源工具,专注于解析PyTorch编译器torch.compile的内部工作机制。这个工具支持多个Python版本,提供简洁的API接口,能够生成详细的编译过程文档,并支持代码调试。通过depyf,机器学习研究人员和开发者可以深入理解编译过程,适应编译机制,并优化代码以提升性能。作为PyTorch生态系统的一员,depyf为用户提供了深入了解PyTorch编译器的机会。
ruff-vscode - 高效的Python代码检查与格式化VS Code扩展
Github开源项目PythonVisual Studio Code格式化代码检查Ruff
Ruff是Visual Studio Code的一款扩展,为Python开发者提供高性能的代码检查和格式化功能。该扩展支持自动修复代码问题、格式化文档和组织导入,可替代Flake8、Black和isort等多个工具。集成了Ruff 0.5.7版本,支持Jupyter Notebook,并提供Rust原生语言服务器以提升性能。开发者可通过VS Code设置灵活配置Ruff,优化Python开发流程。
pandas - Python数据分析与处理的开源利器
Github开源项目Python开源数据分析DataFramepandas
pandas是Python生态系统中的核心数据分析库,提供高性能、易用的数据结构和工具。它支持处理结构化数据,包括数据清洗、转换、合并、分组分析等操作。pandas可读写多种格式的数据源,如CSV、Excel、SQL数据库等。作为开源项目,pandas由活跃社区维护,持续优化以满足数据科学家、分析师和开发者的需求。
youdaonote-pull - 有道云笔记本地导出工具 支持Markdown转换
Github开源项目PythonMarkdown备份导出有道云笔记
youdaonote-pull是一个开源工具,用于将有道云笔记导出到本地。它支持原格式下载、Markdown转换和图片本地化。该工具在本地运行,保护数据安全。提供可执行程序,方便非技术用户使用。适合需要备份或迁移有道云笔记的用户。
data-science - 数据科学初学者实践教程集合
Github开源项目PythonJavaScript数据可视化数据分析数据科学
Data Science for Beginners项目提供了一系列Jupyter Notebooks和网页开发代码,涵盖数据科学完整工作流程。项目使用Python、HTML5和JavaScript(特别是D3.js),展示了scikit-learn和PyCaret等工具的应用。内容包括数据收集、预处理、分析、文本分析和可视化,适合数据科学初学者学习实践。项目还包含数据叙事部分,指导如何改进数据可视化,以及提供了作者Medium博客和Observable个人资料的链接,供进一步学习。
pluggy - 轻量级且高效的插件框架
Github开源项目Python插件系统pluggy钩子规范钩子实现
pluggy是一个简洁的插件系统框架,被pytest、tox和devpi等项目采用。它提供钩子规范和实现机制,支持插件开发和管理。开发者可通过pluggy构建可扩展的应用程序架构,实现模块化和可插拔的功能。该项目易用高效,文档完善,适合构建插件生态系统。
pdm - 全面支持PEP标准的Python包管理器
Github开源项目Python项目管理依赖管理包管理器PDM
PDM是一款功能全面的Python包和依赖管理工具,完全遵循最新PEP标准。它具备快速依赖解析、PEP 517构建后端和PEP 621项目元数据支持等特性。PDM还提供灵活的插件系统、多功能用户脚本,以及Python解释器安装和集中式缓存选项。这些功能使PDM成为Python开发中高效且标准化的项目管理工具。
openlogprobs - Python库实现语言模型API对数概率提取
Github开源项目Python语言模型APIopenlogprobs概率提取
openlogprobs是一个Python库,用于从语言模型API中提取对数概率。它实现了多种算法,如topk搜索、精确解和二分查找,可从OpenAI等API中提取完整概率向量。该工具支持并行处理,提高了效率。openlogprobs主要用于语言模型反演研究,为学术研究提供支持。这个库易于安装和使用,适合自然语言处理研究人员使用。
rye - 全面简化Python项目管理的开发工具
Github开源项目Python项目管理虚拟环境包管理Rye
Rye是一个全面的Python项目和包管理工具,提供统一的环境管理、项目依赖处理和虚拟环境配置体验。它支持复杂项目和单体仓库,集成了ruff、build和twine等工具,覆盖从环境搭建到项目发布的全过程。Rye简化了Python开发流程,适用于各层级开发者,提高工作效率。
scikit-learn - Python机器学习的核心工具库
Github开源项目Python机器学习数据科学scikit-learn
scikit-learn是基于SciPy构建的Python机器学习库,提供高效的数据挖掘和分析工具。支持分类、回归、聚类等多种机器学习任务,自2007年启动以来由志愿者维护,已成为广受欢迎的开源项目。其特点包括易用性、高性能和完善的文档,在学术和工业领域得到广泛应用。
python_audio_loading_benchmark - Python音频库加载性能基准测试
Github开源项目Python机器学习性能评估音频加载音频处理库
该项目评估了多个Python音频库的加载性能,包括scipy、soundfile和pydub等。测试比较了各库将不同格式音频文件加载为numpy、PyTorch和TensorFlow张量的速度,以及音频元数据获取效率。这项基准测试为机器学习模型开发者提供了宝贵参考,特别是在处理原始音频数据时。项目展示了详细的测试结果,并提供了运行基准测试的指导。
hands-on-rl - 实践驱动的强化学习进阶教程
Github开源项目Python深度学习机器学习强化学习课程
hands-on-rl项目提供一套系统化的强化学习实践教程。该教程涵盖从Q-learning到策略梯度等核心算法,通过递进难度的案例帮助学习者掌握RL技术。内容包括出租车驾驶和登月模拟等实例,并结合深度学习知识。教程提供Python代码实现和详细解释,适合希望深入学习强化学习的研究者和开发者。
python-pinyin - 多功能汉字拼音转换库
Github开源项目Python命令行工具pypinyin汉字拼音转换多音字
python-pinyin是一个开源的汉字拼音转换库,支持多音字智能匹配和多种拼音风格。该库可用于汉字注音、排序和检索,支持简繁体、注音符号和威妥玛拼音。提供简单API和命令行工具,适用于多个Python版本。开发者可通过自定义词库提高准确性,适合各类中文拼音处理任务。
harlequin - 终端内的多功能SQL开发工具
Github开源项目Python终端数据库工具HarlequinSQL IDE
Harlequin是一款运行在终端中的SQL开发工具,支持DuckDB、SQLite等多种数据库。该工具提供简易安装、灵活连接和直观界面,方便管理多个数据库文件。Harlequin跨平台兼容,支持自定义适配器,适应不同数据库环境。它为开发者提供高效的SQL编写和数据库操作体验。
pyinfra - 基于Python的高效服务器自动化部署工具
Github开源项目Python自动化部署命令执行pyinfra服务器管理
pyinfra是一款基于Python的服务器自动化工具,能将Python代码转换为shell命令并执行。支持ad-hoc命令和声明式操作,适用于SSH服务器、本地机器和Docker容器。具有快速执行、高扩展性、实时调试、幂等操作和无代理执行等特性,可轻松管理从单个到数千台服务器。pyinfra为系统管理员和开发人员提供了一个灵活高效的自动化部署解决方案。
cpython - Python编程语言的官方实现和解释器
Github开源项目Python软件开发编程语言版本更新
CPython是Python编程语言的官方实现和解释器,支持多种操作系统平台。它提供了丰富的标准库、完善的文档和活跃的社区支持。最新版本3.14.0 alpha 0引入了新特性和性能优化,支持高级编译技术如Profile Guided Optimization和Link Time Optimization。CPython为开发者提供了强大、灵活的Python开发环境。
meinheld-gunicorn-flask-docker - 基于Meinheld和Gunicorn的高性能Flask应用Docker镜像
Github开源项目PythonDockerFlaskGunicornMeinheld
该项目提供基于Meinheld和Gunicorn的Flask Docker镜像,旨在优化Python Web应用性能。镜像具备自动调优功能,简化Flask应用部署流程。支持多个Python版本,适合单服务器环境下的简单应用。然而,在Kubernetes等集群环境中,用户可能需要考虑从头构建更合适的镜像。
handson-ml - Python机器学习基础与实践指南
Github开源项目PythonTensorFlowMachine LearningScikit-LearnJupyter
该项目通过Python教授机器学习基本原理,包含《Hands-on Machine Learning with Scikit-Learn and TensorFlow》书中的示例代码和习题解答。用户可以使用Colab、Binder和Deepnote在线体验这些notebooks,或通过Anaconda在本地安装项目进行学习。详细介绍了安装步骤和常见问题解决方法,帮助用户理解和应用机器学习技术。