#Python库

modal-client - Modal Python库实现无服务器云计算按需访问
ModalPython库serverless云计算开发工具Github开源项目
Modal是一个Python库,使开发者能够从本地Python脚本访问无服务器云计算资源。支持Python 3.8至3.12版本,可通过pip快速安装。该项目提供丰富的示例应用、详细的用户指南和API参考文档。开发者可在命令行创建或链接Modal账户,便于使用这一云计算工具。
python-markdownify - HTML到Markdown的Python转换器
MarkdownifyHTML转MarkdownPython库文本转换命令行工具Github开源项目
python-markdownify是一个用于将HTML转换为Markdown的Python库。它支持灵活配置和自定义规则,能够处理从简单文本到复杂文档的各种HTML结构。该库提供了多种选项来控制转换过程,包括标签处理、链接样式和格式化选择等。python-markdownify还具有命令行界面,方便集成到不同的工作流程中。
semchunk - 快速准确的文本语义分块Python库
semchunk文本分块Python库语义分析自然语言处理Github开源项目
semchunk是一个高效的Python文本分块库,能将文本分割成语义连贯的片段。与同类库相比,它在语义准确性和处理速度方面都有显著提升。该库采用先进的分块算法,兼容多种分词器和token计数工具,可处理单条或批量文本,并支持多进程加速。semchunk适用于大规模文本处理和各类自然语言分析任务。
fpdf2 - 功能丰富的Python PDF生成库
fpdf2PDF生成Python库开源项目文档处理Github
fpdf2是一个成熟且积极维护的Python PDF创建库,支持Python 3.7+版本。该库完全用Python编写,依赖极少,具有Unicode支持、图像嵌入、SVG导入等多种功能。fpdf2可以轻松创建包含文本、图像、链接、表格等内容的PDF文档,速度快、易于学习和扩展,适用于各种PDF生成需求。
cascades - 实现复杂语言模型组合的Python库
Cascades语言模型Python库概率编程复杂组合Github开源项目
Cascades是一个开源Python库,专注于实现复杂的语言模型组合。它支持草稿纸、思维链、工具使用和选择推理等高级AI技术。作为一个嵌入Python的通用概率编程库,Cascades为AI研究和开发提供了灵活的实验框架。该项目基于相关学术论文,尽管不是Google官方支持的产品,但为语言模型应用领域贡献了创新实现。
elevenlabslib - Python库实现ElevenLabs API全面封装
elevenlabslibAPI封装语音合成Python库音频生成Github开源项目
elevenlabslib是一个Python库,为ElevenLabs API提供封装。该库支持特定设备音频播放、控制播放时间,以及从Python内部管理播放。elevenlabslib易于安装,兼容多平台,并提供文档和示例代码。开发者可通过此库集成ElevenLabs的语音合成功能。
manim - 精确的数学动画可视化工具
Manim动画引擎数学视频Python库开源项目Github
Manim是一款开源的数学动画生成工具,专注于创建高质量的数学解释视频。基于Python 3.7+环境,集成FFmpeg、OpenGL和LaTeX支持。它提供场景创建、动画渲染和配置自定义等核心功能,方便制作精确的数学可视化内容。项目托管于GitHub,持续更新文档和功能,欢迎社区参与贡献。
drawdata - 交互式数据可视化工具 轻松绘制分析机器学习数据集
drawdataJupyter数据可视化机器学习Python库Github开源项目
drawdata是一个Python库,为Jupyter notebook提供交互式数据绘制工具。基于anywidget构建,兼容Jupyter、VSCode和Colab环境,支持ipywidgets集成。可绘制散点图并导出为pandas或polars数据框,方便用于scikit-learn机器学习任务。适用于教学和快速数据分析场景,简化数据集创建和操作过程。
p5 - Python创意编程库 简化视觉化编程学习
p5Python库可视化编程交互式艺术ProcessingGithub开源项目
p5是一个Python绘图库,提供高级功能用于快速创建模拟和交互式艺术作品。它融合Processing的视觉编程理念和Python的易读性,使初学者、教育者和艺术家更容易掌握编程。p5支持2D和3D渲染,提供详细文档和示例。该开源项目欢迎社区贡献,采用GPLv3许可证。
pyllms - 多模型连接和性能评估的Python语言模型库
PyLLMs语言模型APIPython库模型评估Github开源项目
PyLLMs是一个用于连接多种语言模型的Python库。它提供标准化响应元数据、多模型同时调用和性能基准测试功能。该库支持异步和流式处理,并可通过简单代码实现LLM连接。PyLLMs适用于自然语言处理和AI应用开发,为开发者提供了便捷的语言模型访问方式。
jusText - 智能网页正文提取工具 保留核心内容
jusText文本提取网页清理Python库开源项目Github
jusText是一个开源的网页内容提取工具,专注于保留网页中的核心文本信息。该工具可自动移除导航栏、页眉页脚等非核心内容,仅保留完整句子组成的主体文本。jusText广泛应用于语言资源构建和网络语料库创建。它支持Python、C++、Go和Java等多种编程语言,并为用户提供简洁的命令行接口和Python API,便于快速集成到现有项目中。
duckduckgo_search - 基于DuckDuckGo的多功能Python搜索和内容获取库
DuckDuckGo搜索引擎Python库CLI工具APIGithub开源项目
duckduckgo_search是一个基于DuckDuckGo搜索引擎的Python库,支持文本、图片、视频、新闻等多类型搜索。该库还提供AI聊天、即时答案查询、翻译功能,以及文件和图片下载能力。通过同步和异步API以及代理支持,满足多样化的网络搜索和内容获取需求。
python-fitparse - Python库用于解析ANT和Garmin FIT文件
python-fitparseFIT文件解析ANTGarminPython库Github开源项目
python-fitparse是一个解析ANT和Garmin FIT文件的Python库。它提供简单的API接口,可读取活动记录、设备信息等多种FIT数据。库中包含fitdump命令行工具,便于查看和转换FIT文件。支持最新FIT SDK,可处理压缩时间戳和组件字段。对于需要分析FIT文件数据的开发者来说,这是一个实用的工具库。
PyMuPDF - 多功能文档处理的Python库
PyMuPDFPython库PDF处理文档分析数据提取Github开源项目
PyMuPDF是一个高性能的Python库,用于处理PDF及其他文档格式。它支持数据提取、分析、转换和操作,兼容Python 3.8及以上版本。该库提供简洁的API,可高效处理文档页面和提取文本。PyMuPDF还支持字体子集创建和OCR等可选功能,适用于各种文档处理任务。无需额外依赖,安装便捷,是文档处理领域的实用工具。
stamina - 基于Tenacity的Python重试库 提升分布式系统弹性
stamina重试机制分布式系统Python库错误处理Github开源项目
stamina是一个基于Tenacity的Python重试库,为分布式系统提供高效的错误处理机制。该库支持自定义异常重试、指数退避、限制重试次数和总时间,可与Prometheus和structlog等工具集成。stamina具备异步操作支持,兼容Trio,并保留被装饰函数的类型提示。其设计注重易用性和正确性,有助于开发者构建更具弹性的分布式系统。
playwright-python - Python跨浏览器自动化测试库
Playwright自动化测试浏览器自动化Python库跨浏览器测试Github开源项目
Playwright是一个Python跨浏览器自动化测试库,支持Chromium、Firefox和WebKit。通过统一API实现简单高效的自动化测试,具备稳定性、功能性和高性能特点。该库适用于多种Web自动化场景,支持同步和异步编程,并提供完善的文档和API参考。
invoke - Python库Invoke 简化shell子进程管理和任务组织
InvokePython库子进程管理CLI任务shell操作Github开源项目
Invoke是一个Python库,专注于管理shell子进程和组织Python代码为CLI任务。支持Python 2.7和3.4+版本,Invoke融合了多方面的设计理念,提供了简洁而强大的功能。这个工具能够显著提升开发者在子进程管理和任务组织方面的效率,适用于各类Python项目开发。
copier - 灵活强大的项目模板渲染和管理工具
Copier项目模板代码生成CLI工具Python库Github开源项目
Copier是一款开源的项目模板渲染和管理工具,既可作为库使用,也提供CLI界面。它支持从本地路径或Git URL加载模板,能够动态替换文本文件中的内容,并生成结构化的项目代码。Copier的特色在于保护现有文件不被覆盖,同时提供简单的模板创建和项目生成机制。通过命令行或Python API,开发者可以快速搭建新项目或管理现有项目的演进,非常适合需要高效创建和维护项目的开发者。
aiosqlite - Python异步SQLite数据库接口库
aiosqliteAsyncIOSQLitePython库数据库操作Github开源项目
aiosqlite是一个Python异步SQLite数据库接口库。它在标准sqlite3模块的基础上提供异步版本的连接和游标方法,支持上下文管理器自动关闭连接和游标。通过使用共享线程,aiosqlite能在AsyncIO事件循环中与SQLite数据库交互,避免阻塞其他协程。该库支持Python 3.8及以上版本,可从PyPI安装。
datamapplot - Python库实现数据地图的高质量可视化
DataMapPlot数据可视化交互式绘图Python库数据地图Github开源项目
DataMapPlot是一个用于创建数据地图可视化的Python库。它可生成适用于演示、海报和论文的静态或简单交互式数据地图图表。用户只需标记数据点簇,库即可自动处理剩余工作。DataMapPlot提供多种自定义选项,包括暗色模式、字体和颜色映射等。其核心功能集中在create_plot和create_interactive_plot两个函数上,使用简便。该工具适合各类数据可视化需求,尤其适用于科研成果展示。
QReader - 高效稳定的Python QR码识别库
QR码识别图像处理Python库YOLOv8PyzbarGithub开源项目
QReader是一个基于YOLOv8的Python库,专门用于识别和解码复杂场景中的QR码。该库集成了先进的QR码检测模型和图像预处理技术,能够在旋转、低分辨率等困难条件下保持较高的识别率。相较于传统方法,QReader表现更为稳定,为开发者提供了可靠的QR码读取解决方案。
croniter - Python cron表达式解析与日期时间迭代库
cronitercron格式时间迭代Python库日期处理Github开源项目
croniter是一个Python库,用于解析cron表达式并进行日期时间迭代。它支持秒级重复、年份字段和哈希表达式等高级功能,可生成匹配时间、验证表达式和在日期范围内查找。该库还提供DST支持,适用于定时任务和复杂日期计算场景。
pokerkit - Python开源扑克模拟与分析库
PokerKit扑克模拟开源软件Python库统计分析Github开源项目
PokerKit是多伦多大学研究团队开发的开源Python扑克库,支持多种扑克变体模拟、手牌评估和统计分析。它提供灵活架构和高级API,可用于AI开发、工具创建和在线扑克实现。经过严格测试,代码覆盖率达99%,保证了高可靠性。PokerKit为扑克爱好者和开发者提供了强大的模拟与分析工具。
sqlbind - 是一个Python库,用于简化原始SQL查询中的参数绑定
sqlbindSQL查询参数绑定Python库数据库操作Github开源项目
sqlbind是一个Python库,用于简化原始SQL查询中的参数绑定。它支持所有DBAPI参数样式,兼容各种SQL工具。该库提供了简洁的API用于组合SQL,处理静态和动态查询,并通过条件标记、q-表达式等功能优化复杂查询构建。sqlbind作为一个轻量级解决方案,适用于需要编写原始SQL的场景,有效提高了查询构建的效率和灵活性。
pdfminer.six - Python开源PDF文本提取与分析库
pdfminer.sixPDF解析文本提取Python库文档分析Github开源项目
pdfminer.six是一个开源Python库,用于从PDF文档中提取和分析文本数据。该库能够提取文本内容及其位置、字体和颜色信息,支持PDF-1.7规范、CJK语言和垂直书写。pdfminer.six还可提取图像、目录和交互式表单,支持多种压缩和加密方式。其模块化设计便于扩展,适用于多种PDF分析场景。该项目是PDFMiner的社区维护分支,提供了全面的PDF文档分析功能。
river - 实时流数据处理的在线机器学习Python库
River在线机器学习Python库流数据算法Github开源项目
River是一个专注于在线机器学习的Python库,为处理流数据提供用户友好的工具。它实现了多种算法,包括线性模型、决策树和异常检测,支持实时学习和预测。该库适用于需要持续学习、应对概念漂移或开发接近生产环境模型的场景。River注重清晰度和用户体验,单样本处理速度快,并与Python生态系统无缝集成。
streamlink - 跨平台直播流媒体处理库和命令行工具
Streamlink流媒体视频播放Python库命令行工具Github开源项目
Streamlink是一个开源的Python库和命令行工具,用于将各种在线流媒体服务的内容传输到视频播放器。它支持Twitch、YouTube等多个主流直播平台,绕过了资源密集型网页界面。用户可通过命令行或API播放、下载或处理直播流。Streamlink采用插件架构,便于扩展新服务支持,是一个高效灵活的流媒体处理解决方案。
lineax - 基于JAX的线性求解和最小二乘优化库
Lineax线性求解JAX最小二乘法Python库Github开源项目
Lineax是基于JAX开发的线性求解和最小二乘优化库,提供多种算法解决Ax = b问题。该库支持PyTree值矩阵和向量、通用线性算子及结构化矩阵,具备高效的求解器和稳定的梯度计算。Lineax优化了编译和运行性能,支持实值和复值输入,并集成JAX的自动微分、并行计算和硬件加速等功能。
pecab - 纯Python实现的高效韩语形态素分析工具
Pecab形态素分析自然语言处理Python库韩语分析Github开源项目
Pecab是一个基于Mecab的纯Python韩语形态素分析工具,保留了Mecab的高速和准确性,同时简化了安装流程。该工具提供形态素分割、词性标注和名词提取等功能,并采用零拷贝内存映射和双数组字典树技术,显著提升了加载速度并降低了内存占用。Pecab为韩语自然语言处理提供了一个高效且易于使用的解决方案。
textract - 多格式文档文本提取工具
textract文本提取文档处理Python库开源项目Github
textract是一个开源文本提取工具,支持从多种格式文档(如PDF、Word、Excel等)中提取文本。该项目最初由Dean Malmgren创建,现由Jazzband社区维护。textract提供简单接口,具备全面的文档支持,旨在简化文本提取流程。它适用于需要从不同类型文档中批量提取文本的场景,为用户提供高效的文本提取解决方案。
TextBlob - Python自然语言处理库 轻松实现文本分析
TextBlob自然语言处理文本分析Python库NLTKGithub开源项目
TextBlob是一款Python自然语言处理库,提供简洁API实现多种文本分析任务。支持词性标注、名词短语提取、情感分析和分类等功能,集成NLTK和pattern库优势。包含分词、词频统计和拼写校正等工具,适用于广泛的文本处理场景。TextBlob设计简单直观,方便各层级开发者使用。
squirrel-core - Python机器学习数据处理和共享库
Squirrel Core数据处理机器学习Python库数据共享Github开源项目
Squirrel Core是一个面向机器学习团队的Python库,提供高效的数据共享、加载和转换功能。它支持快速数据处理、成本优化、多模态数据适配和团队协作。该库能从多种来源流式传输数据至机器学习模型,并提供丰富的API。Squirrel Core致力于解决数据处理中的常见问题,适用于各类机器学习项目。
indic_nlp_library - 全面的印度语言自然语言处理Python库
Indic NLP Library印度语言处理Python库文本处理自然语言处理Github开源项目
indic_nlp_library是一个面向印度语言的Python自然语言处理库。主要功能包括文本规范化、脚本转换、分词、分句和音节划分等。该库利用印度语言在脚本和语法上的共性,为多种印度语言文本处理提供统一解决方案。此外,库中还包含丰富的语言资源和便捷的API接口,可用于各类印度语言文本分析任务。
PyDGN - 深度图网络研究与实验的Python开源库
PyDGN深度图网络图分类机器学习Python库Github开源项目
PyDGN是一个面向深度图网络(DGNs)研究的开源Python库。该库提供自动化的数据处理、实验管理和并行计算功能,支持模型选择与风险评估。PyDGN简化了图学习实验流程,有助于快速原型设计和结果复现,为图神经网络研究提供了实用工具。它支持CPU和GPU并行计算,可同时评估多种模型配置。PyDGN适用于各类深度图网络研究,包括图分类、节点分类等任务。该库提供了完整的实验管理流程,从数据预处理到模型评估,有助于提高研究效率和结果可靠性。
tsfel - 多领域时间序列特征提取Python库
TSFEL时间序列特征提取Python库数据分析Github开源项目
TSFEL是一个开源的Python库,专门用于时间序列特征提取。该库提供超过65种特征,覆盖统计、时间、频谱和分形等多个领域。TSFEL支持在线和离线使用,具有用户友好的界面和完整的文档。它注重计算效率,并提供复杂度评估功能。TSFEL的设计易于扩展,支持添加自定义特征。这个库适用于研究人员和数据科学家,能够简化时间序列特征提取的过程。
edward - 用于概率建模、推断和模型评估的Python库
EdwardPython库概率建模推断TensorFlowGithub开源项目
Edward 是一个用于概率建模、推断和模型评估的Python库。它融合了贝叶斯统计、机器学习、深度学习和概率编程,支持多种模型,如有向图模型、神经网络、隐式生成模型和贝叶斯非参数。Edward 提供变分推断、蒙特卡罗方法、生成对抗网络等多种推断方法,并支持模型和推断的评估。构建于TensorFlow之上,支持计算图、分布式训练、CPU/GPU集成和自动微分。