#Python

PyShortTextCategorization - Python短文本分类和挖掘库
短文本挖掘Python机器学习文本分类自然语言处理Github开源项目
PyShortTextCategorization是一个专门用于短文本分类和挖掘的Python库。它集成了多种文本表示方法,如主题建模和词嵌入,支持有监督和无监督学习。该库提供文本预处理、预训练词嵌入、多种分类算法和短语相似度计算等功能,为短文本分析提供了全面的工具集。适用于Python 3.8-3.11版本,具备示例数据集、文本预处理、预训练词嵌入支持等特性。它整合了多种主题模型和神经网络分类器,并提供短语差异度量和字符级序列到序列学习等高级功能。
BaiduPanFilesTransfers - 开源百度网盘资源批量转存工具
百度网盘批量转存PythonTkinter开源程序Github开源项目
BaiduPanFilesTransfers是一个基于Python和Tkinter开发的百度网盘批量操作工具。该工具支持批量转存、分享资源以及检测链接有效性,为百度网盘用户提供了高效的资源管理方式。作为开源项目,BaiduPanFilesTransfers具有操作简便、功能全面的特点。该工具主要支持Windows系统运行,其他系统用户需自行编译使用。
pythainlp - Python实现的泰语自然语言处理库
PyThaiNLP自然语言处理泰语Python开源Github开源项目
PyThaiNLP是一个专注于泰语的Python自然语言处理库,提供丰富的功能如分词、词性标注、拼写检查等。支持Python 3.7+,可通过pip安装。这个开源项目被广泛应用于工业和研究领域,为泰语NLP任务提供支持。PyThaiNLP具有命令行接口,支持额外功能的可选安装。
pythoncode-tutorials - Python编程教程与实践项目集锦
Python教程机器学习自然语言处理计算机视觉Github开源项目
该项目汇集了大量Python教程资源,内容涉及道德黑客、机器学习、自然语言处理和计算机视觉等领域。教程配有详细代码示例,适合各水平的Python开发者学习和提升技能。项目涵盖从入门到高级的多个方面,为Python爱好者提供了全面的学习平台。
ad_examples - 主动异常发现算法提升异常检测效率
PythonAAD异常检测主动学习机器学习Github开源项目
ad_examples是一个异常检测Python库,实现了主动异常发现(AAD)算法。项目包含多种检测技术,涵盖无监督、时间序列和人机交互场景。AAD算法利用专家反馈和集成学习提高检测效率。库提供详细文档和API,适合异常检测研究和应用。
conllu - Python库简化CoNLL-U格式解析和处理
CoNLL-U解析Python自然语言处理依赖树Github开源项目
CoNLL-U Parser是一个用于解析CoNLL-U格式字符串的Python库。该库无外部依赖,支持类型提示,测试覆盖率达100%。它提供parse()和parse_tree()两种方法,可将数据解析为列表或树结构。库还支持元数据解析、自定义字段处理和序列化,使CoNLL-U格式处理更加便捷。
DeepOnto - 融合深度学习的本体工程Python工具包
DeepOnto本体工程深度学习OWLAPIPythonGithub开源项目
DeepOnto是一个融合深度学习技术的本体工程Python工具包。它提供本体处理、推理、修剪等核心功能,并实现BERTMap、Bio-ML等先进工具和资源。该项目为本体工程任务提供构建模块,支持深度学习模型实现、资源构建和评估。DeepOnto由牛津大学知识表示与推理组开发,为本体工程领域研究与应用提供支持。
tsfresh - 时间序列特征自动提取和分析的Python开源工具
tsfresh时间序列特征提取机器学习PythonGithub开源项目
tsfresh是一个开源Python库,专注于时间序列数据的自动特征提取。它集成了统计学、时间序列分析、信号处理和非线性动力学的算法,并提供了特征选择机制。该工具可处理多种采样数据和事件序列,提供100多种预定义特征,并通过内置过滤程序评估特征重要性。tsfresh支持回归和分类任务,兼容sklearn、pandas和numpy,可在本地或集群环境运行,为时间序列分析提供了高效解决方案。
pmdarima - Python时间序列分析库 支持自动ARIMA建模和多种统计测试
pmdarima时间序列分析自动ARIMA统计库PythonGithub开源项目
pmdarima是一个Python统计库,旨在增强时间序列分析能力。它实现了类似R语言auto.arima的功能,提供多种统计测试、时间序列工具、转换器和特征提取器。该库支持季节性分解、交叉验证,并包含丰富的内置数据集。基于statsmodels构建,pmdarima采用类scikit-learn的接口设计,便于用户构建和部署时间序列模型。
waybackpack - 命令行工具助力获取网站完整历史版本
Waybackpack网页存档命令行工具Python下载工具Github开源项目
waybackpack是一款功能丰富的命令行工具,用于从Wayback Machine存档中获取特定URL的完整历史版本。该工具支持日期范围设置、重定向处理和重复内容跳过等功能,并允许自定义用户代理和错误处理。基于Python开发,依赖少,跨平台兼容性强,为网站历史研究和数据存档提供了高效的解决方案。
memory_profiler - Python内存剖析与优化利器
内存分析Python性能优化内存使用性能监控Github开源项目
memory_profiler是一款强大的Python内存分析工具,可实时监控进程内存消耗并进行逐行分析。它支持装饰器用法,能生成详细的内存使用报告和可视化图表。此外,memory_profiler还提供IPython集成、多进程跟踪和内存断点等高级特性,有助于开发者快速定位和优化代码中的内存问题。作为纯Python实现的工具,memory_profiler依赖psutil模块,安装和使用都十分便捷。
build - 高效可靠的Python项目构建工具
Python构建工具打包开源项目PyPAGithub
build是一个简单高效的Python项目构建工具。它能在隔离环境中构建包,生成源代码分发包和wheel文件,确保构建过程的正确性和一致性。build提供简洁的命令行接口,支持pip安装,并遵循PSF行为准则。这个工具为开发者提供了可靠的方式来打包和分发Python项目,简化了构建流程。
optuna - 自动化机器学习超参数优化框架
Optuna超参数优化机器学习Python开源框架Github开源项目
Optuna是一个面向机器学习的开源超参数优化框架。它采用define-by-run风格API,特点是轻量级、通用性强和平台无关。Optuna支持Python式搜索空间定义、高效优化算法、易于并行化和快速可视化。框架可处理多目标优化、约束优化和分布式优化等任务,适用于Python 3.7+版本,并集成多个第三方库。
prometheus-fastapi-instrumentator - FastAPI的模块化Prometheus监控instrumentator
FastAPIPrometheus监控性能指标PythonGithub开源项目
prometheus-fastapi-instrumentator是一个为FastAPI设计的Prometheus监控工具,具有高度可配置性和模块化特性。它默认收集请求总数、大小、响应大小和持续时间等指标,同时支持自定义指标添加、路由忽略和指标暴露控制。该工具提供灵活的配置选项,能够满足复杂的监控需求,适用于各种规模的FastAPI项目。它简化了Prometheus监控的实现过程,同时保持了性能优化的可能性。
pydocstyle - 已弃用的Python文档风格检查工具
pydocstyle代码风格检查Python文档字符串静态分析Github开源项目
pydocstyle是一个静态分析工具,用于检查Python文档字符串的规范性。该工具支持大部分PEP 257规范,适用于Python 3.6及以上版本。尽管pydocstyle项目已正式停止维护,但其为Python社区贡献的价值仍然显著。目前,官方推荐用户迁移到功能更全面的Ruff工具。pydocstyle的开发历程和社区参与对Python生态系统的完善产生了积极影响。
prosodic - 多语言韵律分析与文本处理工具
Prosodic解析Python韵律分析Web应用Github开源项目
Prosodic是一款基于Python的开源韵律分析工具,支持英语和芬兰语文本解析。通过发音词典或自定义函数,可轻松扩展其他语言支持。该工具提供Web界面和Python API,能分析文本的节奏、音节和音素特征,适用于文学研究、语言学分析、诗歌创作、语言教学和自然语言处理等多个领域。
babel - Python应用国际化和本地化的综合工具库
BabelPython国际化本地化web应用Github开源项目
Babel是一个专注于Python应用国际化和本地化的开源库。它提供了丰富的工具,包括消息提取、目录编译、日期时间和数字格式化等功能,特别适合Web应用开发。Babel拥有活跃的社区,支持多种语言环境,并欢迎开发者参与项目贡献。
apscheduler - Python高级任务调度系统,适用于各种规模应用
APScheduler任务调度器Python数据存储触发器Github开源项目
APScheduler是一个功能丰富的Python任务调度系统,支持多种调度方式和存储后端。它可用于小型单进程应用,也适用于跨多节点的大规模部署。APScheduler提供同步和异步API,能与Web应用集成,并支持任务持久化和分布式运行。它的灵活性和可扩展性使其成为构建可靠任务管理系统的理想选择。
python-patterns - Python设计模式和惯用法集合 提升代码质量和可维护性
设计模式Python代码示例软件架构编程技巧Github开源项目
python-patterns项目是一个综合性的Python设计模式和惯用法集合,包含创建型、结构型和行为型模式。项目提供实用代码示例和详细说明,涵盖测试性设计、基础模式等多种模式实现。开发者可通过学习和应用这些模式,提高代码质量、可维护性和可重用性。该项目还包含相关视频资源和贡献指南,适合想要深入了解Python设计模式的开发者参考。
guppy3 - Python堆分析和内存优化工具集
Guppy 3Python堆分析内存分析性能优化Github开源项目
Guppy3是一个开源的Python堆分析工具集,专注于内存分析和优化。它包含多个子包,其中Heapy工具可用于查找和显示堆中对象信息。Guppy3支持Python 3.8至3.12版本,提供简洁的API接口。该工具有助于开发者诊断内存泄漏,分析对象引用关系,从而优化程序性能。Guppy3是Python开发中实用的内存分析工具。
stqdm - Streamlit应用进度条实现利器
stqdm进度条StreamlitPython数据处理Github开源项目
stqdm是一款为Streamlit应用设计的轻量级Python库,提供简洁的进度条功能。支持主界面和侧边栏显示,可自定义样式,并与pandas操作兼容。该库简化开发流程,适用于多个Python版本,安装简单,使用方便。stqdm为Streamlit应用带来更好的交互体验,是开发者提升应用性能的实用工具。
tqdm - 轻量级Python进度条库
tqdm进度条Python命令行工具迭代器Github开源项目
tqdm是一个轻量级的Python进度条库,可为迭代过程添加智能进度显示。它具有低开销、可定制、多平台支持等特点,适用于命令行、GUI和Jupyter环境。tqdm支持手动和自动更新进度,也可作为命令行工具在管道中使用。无需额外依赖,安装简单,是可视化循环进度的实用工具。
sympy - Python开源符号数学库 用于代数计算和科学建模
SymPy符号计算Python开源数学库Github开源项目
SymPy是一个纯Python开源计算机代数系统,专注于可扩展性和易用性。它提供丰富的符号数学功能,包括微积分、代数和离散数学等,适用于交互式和程序化应用。作为科学Python生态系统中的重要组成部分,SymPy广泛应用于数学建模、物理计算和工程分析。该项目采用BSD许可证,允许自由使用和修改。
transitions - Python状态机库 轻量级实现与丰富扩展
状态机Pythontransitions库状态转换回调函数Github开源项目
transitions是一个轻量级的Python状态机库,支持Python 2.7+和3.0+版本。该库提供分层状态机、图表生成和多线程支持等扩展功能,方便用户定义状态、转换和回调。transitions设计简洁,适用于各种复杂的状态管理场景,使状态机的构建和管理变得简单高效。作为处理状态逻辑的工具,transitions在保持轻量级的同时提供了强大的功能。
texttable - Python模块用于生成ASCII文本表格
PythonASCII表格模块文本处理数据展示Github开源项目
texttable是一个Python模块,用于生成ASCII文本表格。它提供了自定义列对齐、数据类型和表格样式的功能。用户可以设置表格宽度、精度和字符样式。该模块支持CJK文本换行和基本的表情符号渲染。texttable可通过PyPI安装,并已集成到多个Linux/Unix平台的包管理系统中。
cibuildwheel - 跨平台Python wheels构建自动化工具
cibuildwheelPython跨平台构建CI/CDwheel包Github开源项目
cibuildwheel是一个自动化Python wheels跨平台构建工具。它支持在Mac、Linux和Windows系统上为多个Python版本构建wheels,并可在多个CI平台运行。该工具能自动处理依赖打包和测试运行,简化了wheels的构建和测试过程。cibuildwheel为需要跨平台分发Python包的开发者提供了高效的解决方案。
uvicorn-gunicorn-fastapi-docker - FastAPI应用的Docker自动优化部署方案
DockerFastAPIUvicornGunicornPythonGithub开源项目
uvicorn-gunicorn-fastapi-docker项目是一个基于Docker的FastAPI应用部署方案。该项目集成了Uvicorn、Gunicorn和FastAPI,实现了性能自动调优。支持Python 3.8到3.11版本,提供了详细文档和最佳实践指南。这个解决方案主要适用于简单部署和单服务器环境,为FastAPI应用提供了开箱即用的优化运行环境。
typer - Python类型提示驱动的直观命令行界面框架
TyperCLI开发Python命令行界面FastAPIGithub开源项目
Typer是一个基于Python类型提示的命令行界面(CLI)应用程序开发库。它为开发者提供直观的编写体验和简洁的代码结构,支持从简单到复杂的CLI应用开发。Typer还包含一个命令行工具,可自动将Python脚本转换为CLI应用。作为FastAPI的兄弟项目,Typer为CLI开发带来了高效便捷的体验,使开发者能够轻松创建功能强大的命令行工具。
pendulum - Python日期时间处理的高级库
PendulumPython时间处理时区转换日期时间Github开源项目
Pendulum是一个高级Python日期时间库,作为标准datetime模块的替代品,它提供了更直观的API和增强功能。该库支持时区管理、日期计算、人性化的时间表示,并能正确处理夏令时转换和日期规范化。Pendulum适用于复杂的时间操作场景,简化了Python开发者在处理日期时间相关任务时的工作。
sanic - 轻量级高性能异步Python Web服务器和框架
SanicPythonWeb框架异步高性能Github开源项目
Sanic是一个为速度优化的Python 3.8+异步Web框架和服务器。它利用async/await语法实现非阻塞高效代码,兼容ASGI标准可部署于多种服务器。Sanic提供简便方法构建可扩展的高性能HTTP服务,采用uvloop和ujson提升性能,适合快速开发RESTful API。该项目由社区维护并欢迎贡献。
Python-100-Days - Python从入门到精通的100天学习计划
Python编程学习教程GitHubGithub开源项目
这是一个系统化的Python学习项目,提供为期100天的学习计划。内容涵盖Python基础语法、面向对象编程、GUI开发、游戏制作、文件处理和数据分析等多个领域。项目通过丰富的实践案例和详细指导,帮助不同水平的学习者掌握Python技能,为未来的职业发展奠定基础。
submitit - Python函数Slurm集群提交工具
SubmititSlurmPython集群计算作业调度Github开源项目
Submitit是一个轻量级Python工具,用于在Slurm集群中提交函数进行计算。它封装了提交过程,提供结果和日志访问,支持Slurm和本地执行切换,以及超时和分区设置。Submitit适用于Python 3.8+,具备日志读取、错误处理、并发和多任务功能,简化了集群计算任务,方便从Python内部启动Slurm作业。该工具旨在为研究人员提供便捷的集群计算解决方案。
docker-selenium-lambda - AWS Lambda上的轻量级Selenium和Chrome容器方案
DockerSeleniumLambdaPythonAWSGithub开源项目
docker-selenium-lambda是一个在AWS Lambda上运行无头Chrome和Selenium的轻量级演示项目。它提供自动更新的容器镜像,包含最新版Python、Chromium、ChromeDriver和Selenium。该项目简化了Lambda上Web自动化任务的部署和运行,为开发者提供高效解决方案。借助Serverless Framework,可轻松部署和调用函数,实现Web内容抓取和自动化测试。
Zappa - 简化Python应用无服务器部署的开源工具
Zappa无服务器PythonAWS LambdaAPI GatewayGithub开源项目
Zappa是一个开源工具,用于将Python应用部署到AWS Lambda和API Gateway的无服务器架构中。它支持部署WSGI应用(如Django和Flask),实现自动扩展和零维护。Zappa提供事件驱动编程、SSL认证和全球部署等功能,简化了无服务器应用的开发流程。通过简单的命令,开发者可以快速将Python应用转换为高效且经济的无服务器应用。
django-autoslug - Django自动生成唯一且国际化友好的URL Slug
DjangoAutoSlugFieldPython数据库模型URL优化Github开源项目
django-autoslug是一个Django库,用于自动生成和管理URL友好的slug。它能从其他字段自动填充内容,确保唯一性,并支持自定义slugify函数以优化国际化。适用于Python 3.8+和Django 3.2+环境,该库简化了SEO友好URL的创建过程,有助于提升网站的可用性和搜索引擎优化。
lir - 快速计算二进制网格最大内部矩形的Python库
Largest Interior Rectangle二进制网格PythonNumba算法优化Github开源项目
lir是一个开源Python库,用于快速计算二进制网格中的最大内部矩形。该项目利用Numba编译技术提高执行速度,支持基于网格和轮廓的计算方法。lir不仅适用于二进制网格,还能处理多边形坐标列表,为图像处理和计算几何领域提供了高效解决方案。项目文档包含详细使用说明和性能优化建议,方便开发者快速上手。