Logo

#Python库

Logo of llm
llm
一款CLI工具和Python库,用于与大型语言模型交互,支持远程API和本地安装模型。可从命令行运行提示、将结果存储在SQLite中、生成嵌入等。通过插件目录,可访问更多模型。
Logo of freeGPT
freeGPT
freeGPT 提供免费下载和使用多种文本与图像生成模型,包括 gpt3 和 gpt4。通过安装并使用 Python 代码,即可轻松实现文本或图像生成。此外,还支持官方 Discord 机器人,提供更多应用实例和技术支持。
Logo of pyod
pyod
PyOD是Python领域应用广泛的异常检测工具库,自2017年起支持学术与商业用途。这个库集成了超过50种算法,涵盖从经典方法到最新的深度学习技术。它提供统一的操作界面,高性能的处理效率和快速训练预测功能,已被下载超过1700万次,得到了机器学习领域的广泛认可。
Logo of tika-python
tika-python
tika-python是Apache Tika的Python移植版,通过Tika REST Server提供强大的文档解析、文本翻译和语言检测功能。该库支持通过多个接口调用,支持gzip压缩输入输出流,并提供命令行工具。用户可配置环境变量,在无网络连接环境中使用,优化其行为。
Logo of OCTIS
OCTIS
OCTIS 提供全面的主题模型预处理、训练和评估解决方案。通过贝叶斯优化方法,找到最佳超参数。支持经典和神经主题模型,并结合多种前沿评估指标。用户可以加载自定义或预处理数据集,支持Python库和简易Web仪表盘管理实验。
Logo of blackmaria
blackmaria
Black Maria是一个用于通过自然语言进行网页抓取的Python库。用户只需导出OPEN_AI_KEY环境变量并安装blackmaria库,即可开始使用。通过guardrails提供详细指令,获取针对特定网页的结构化数据,适合开发者和数据分析师。
Logo of nnmnkwii
nnmnkwii
nnmnkwii是一款专为快速构建语音合成系统而设计的库,支持原型设计。该库可通过PyPI安装,并提供稳定版和开发版文档。依赖于PyTorch实现自动求导功能,设计灵感源于Merlin和Librosa,功能强大且灵活。
Logo of augraphy
augraphy
Augraphy是一个Python库,能够通过增强管道将文档从干净版本转换为模拟打印、传真、扫描等效果的脏旧副本,为AI/ML提供大量高质量的训练数据。
Logo of leptonai
leptonai
LeptonAI框架提供了一种Pythonic抽象方式,将研究和建模代码快速转化为AI服务。支持启动包括Llama、SDXL、Whisper等常见模型,具备自动批处理和后台作业等AI优化功能。用户可以通过Python客户端轻松调度服务,也能快速在云环境中部署。开发者可参考丰富的文档和示例库,灵活定制Photon类和Handler函数。
Logo of privacy
privacy
TensorFlow Privacy 是一个用于机器学习模型差分隐私训练的 Python 库。它实现了 TensorFlow 优化器,并提供计算隐私保证的教程和分析工具。该库兼容 TensorFlow 2.x,支持基于 Keras 的估计器。TensorFlow Privacy 持续更新,最新版本分为两个 PyPI 包:用于差分隐私模型训练的 tensorflow-privacy 和用于经验隐私测试的 tensorflow-empirical-privacy。
Logo of nevergrad
nevergrad
Nevergrad是一个Python 3.8+开源无梯度优化库,支持连续、离散变量及混合参数空间的优化。它提供简洁的API,用于函数最小化和超参数调优等任务。库中包含多种优化算法,如NGOpt,可处理高维和非凸优化问题。Nevergrad适用于机器学习、科学计算和工程领域的优化任务。
Logo of Gymnasium
Gymnasium
Gymnasium是一个用于开发和比较强化学习算法的开源Python库,提供标准API和丰富的环境集。它包括经典控制、Box2D、玩具文本、MuJoCo和Atari等多种环境类型,促进算法与环境的高效交互。作为OpenAI Gym的延续,Gymnasium现由独立团队维护,提供完善的文档和活跃的社区支持。该库采用严格的版本控制以确保实验可重复性,并提供灵活的安装选项满足不同用户需求。
Logo of tslearn
tslearn
tslearn是一个开源的Python库,专注于时间序列分析和机器学习。它提供数据预处理、分类、聚类、回归和多种距离度量方法。支持可变长度时间序列,兼容scikit-learn,包含UCR数据集和数据生成器。tslearn适用于需要进行时间序列分析的数据科学工作,支持超参数调优和管道等功能,为研究和实践提供全面工具支持。
Logo of autolabel
autolabel
Autolabel是一个Python库,利用大语言模型(LLM)自动标注、清洗和丰富文本数据集。它大幅减少手动标注的时间和成本,同时提供高准确率的标注结果。该库支持多种NLP任务,如分类、问答、命名实体识别等,兼容OpenAI、Anthropic、HuggingFace等多家提供商的LLM。Autolabel还提供信心估算、结果解释、缓存和状态管理功能,并支持使用Refuel托管的开源LLM进行标注。用户可根据具体任务配置标注指南,并通过简单的三步流程完成数据标注。
Logo of gTTS
gTTS
gTTS,一款Python库和命令行工具,能通过Google翻译API进行文本到语音转换,并输出为mp3。特色包括自定义语句分割和文本预处理,以支持长文本的准确语调处理。适用于所有需要语音合成功能的开发者。更多信息,参见官方文档。
Logo of NeMo-Curator
NeMo-Curator
NeMo Curator 是一款专为大型语言模型(LLM)设计的开源Python库,通过结合Dask和RAPIDS等技术,实现GPU加速的数据集准备与管理。其功能包括数据下载、语言识别、文本清理、质量过滤、文档去重和个人信息保护等模块,为多种LLM任务提供快速、灵活和可扩展的解决方案,显著提升数据处理效率与模型质量。
Logo of pyresparser
pyresparser
pyresparser是一个简易的简历解析工具,可以从简历中提取姓名、电子邮件、手机号码、技能、工作经验、学校名称、学位和职位等信息。支持PDF和DOCx文件,易于集成到Python项目中。该工具使用spaCy和nltk进行自然语言处理,并提供便捷的命令行界面。更多信息和安装指南,请参阅官方文档。
Logo of UnlimitedGPT
UnlimitedGPT
UnlimitedGPT是一个Python库,可以将ChatGPT网站作为OpenAI付费API的替代方案。它支持消息发送和接收、自动化操作、会话数据管理、主题和账户切换等功能,兼容Windows、Linux、macOS和Google Colab,并绕过Cloudflare的反机器人保护。需要Python 3.8或更高版本。
Logo of news-please
news-please
news-please是一个开源、用户友好的新闻爬虫工具,能够从几乎所有新闻网站提取结构化信息。该工具支持递归跟踪内部链接和读取RSS源来抓取最新及历史文章。提供网站根URL即可实现全面爬取。news-please还支持库模式,便于Python开发者集成使用,并能从commoncrawl.org新闻档案中提取文章。
Logo of repeng
repeng
repeng是一个用于表示工程的Python库,可在不到一分钟内生成控制向量,适用于各类AI和机器学习模型。支持通过预训练模型快速训练,并可生成定制数据集和进行推理。支持向量导出并在其他量化模型中使用,但不支持MoE模型。详情参阅官方博客和文档。
Logo of docarray
docarray
DocArray是一个为多模态数据提供表示、传输、存储和检索功能的Python库。这个库与NumPy、PyTorch、TensorFlow和JAX等框架无缝集成,支持各种向量数据库,也兼容FastAPI和Jina等网络和微服务框架。作为LF AI & Data Foundation的沙盒项目,DocArray提高了多模态AI应用的开发效率。
Logo of pyntcloud
pyntcloud
Pyntcloud 是一个基于Python科学计算堆栈的3D点云处理库。通过简单代码可以执行复杂3D操作,如加载PLY文件、RGB转HSV、体素网格生成等。支持与Open3D和PyVista等3D处理库无缝集成。项目文档详尽,示例丰富,方便用户快速上手。安装简单,支持conda和pip,适合开发和研究使用。
Logo of notifiers
notifiers
notifiers是一个Python库,提供统一接口发送通知至多个平台。支持Pushover、Slack、Gmail等服务,简化通知集成。开发者可通过简单API调用添加通知功能,无需单独处理各提供商API。该库还包含CLI工具和日志集成功能,是一个灵活的通知解决方案。
Logo of datacompy
datacompy
DataComPy是一个开源的Python数据比较库,支持Pandas、Spark、Polars等多种数据框架。它提供了超越简单equals()的功能,包括统计信息输出和匹配精度调整。该库可通过pip或conda安装,并支持Spark、Dask等额外功能。DataComPy为不同数据处理后端提供统一的比较接口,适用于数据分析和质量控制。
Logo of mplcyberpunk
mplcyberpunk
mplcyberpunk 是一个 Matplotlib 扩展库,能够快速为图表添加赛博朋克风格效果。该库提供暗色背景主题,支持线条发光、底部光晕等视觉特效,适用于折线图、散点图和柱状图。mplcyberpunk 还支持自定义渐变填充,可创建富有未来感的数据可视化图表。
Logo of edward
edward
Edward 是一个用于概率建模、推断和模型评估的Python库。它融合了贝叶斯统计、机器学习、深度学习和概率编程,支持多种模型,如有向图模型、神经网络、隐式生成模型和贝叶斯非参数。Edward 提供变分推断、蒙特卡罗方法、生成对抗网络等多种推断方法,并支持模型和推断的评估。构建于TensorFlow之上,支持计算图、分布式训练、CPU/GPU集成和自动微分。
Logo of DataDreamer
DataDreamer
DataDreamer 是一个功能强大的开源Python库,专为创建提示工作流、生成合成数据集和训练模型而设计。它支持复杂的多步提示工作流,适用于各种大语言模型。该工具简单易用,且达到研究级别,兼具高效性和可复现性,支持最新技术如量化和LoRA等。无论是研究人员还是普通用户,都可以轻松发布数据集和模型。
Logo of albumentations
albumentations
Albumentations, 一个高效的Python库用于图像增强,通过逾70种方法优化深度学习和计算机视觉模型性能。支持PyTorch和TensorFlow框架,适合多种视觉任务如分类、语义分割和目标检测。
Logo of mergoo
mergoo
mergoo是一款工具库,用于高效合并和训练不同领域的LLM专家。支持Mixture-of-Experts、多层合并以及多种训练平台。适配Llama、Mistral、Phi3及BERT模型,兼容CPU、MPS和GPU设备。提供灵活配置及多种训练器支持,包括Hugging Face Trainer和PEFT,以便模型合并与微调。
Logo of openai-multi-client
openai-multi-client
openai-multi-client是一个Python库,简化了对OpenAI API的高并发请求管理,支持按顺序和无序处理请求,并提供内置重试机制。它保持代码的同步性,避免了并发和死锁问题。此库特别适用于大规模数据分析等需要大量请求的任务。无需等待每个请求完成即可开始下一个,openai-multi-client能够同时发送多个请求,并自动重试失败的请求,从而提高效率。
Logo of lang2sql
lang2sql
教程教你使用OpenAI API设置自然语言到SQL代码生成器,涵盖了从用户问题到SQL查询的转换。适用于任意数据表,帮助非技术人员处理数据请求。内容包括Python应用程序设置、Docker环境配置及主要Python库的使用,适合有基础Python和SQL知识的用户。
Logo of TextDescriptives
TextDescriptives
TextDescriptives是一个基于Python的库,通过spaCy v.3管道组件和扩展计算多种文本指标。包括详细文档和Jupyter notebook教程,方便用户上手和使用功能。最新2.0版本引入全新API和组件,支持无代码提取指标的web应用。用户可设置不同参数快速提取文本指标,并将结果导出为Pandas DataFrame或字典。适合文本分析入门者,也为高级用户提供深度定制的选项。
Logo of facetorch
facetorch
Facetorch是一个Python库,使用深度神经网络进行面部检测和特征分析。它支持Hydra配置,使用conda-lock和Docker进行环境重现,并通过TorchScript加速CPU和GPU性能。该工具可扩展,允许通过Google Drive上传模型文件和添加配置文件。请谨慎使用,并遵循欧盟可信AI伦理指南。
Logo of spektral
spektral
Spektral是一个基于Keras API和TensorFlow 2的Python库,专为图神经网络(GNN)提供简单灵活的框架。该库适用于社交网络用户分类、分子性质预测、图生成、节点聚类和链接预测等任务。Spektral包含多种流行的图深度学习层,如GCN、Chebyshev、GraphSAGE、GAT等,并提供丰富的图操作工具。最新版1.0引入了新数据集、新容器、Loader类和transforms模块,简化了数据处理和模型训练。更多信息请参阅官方文档和示例。
Logo of FSL-Mate
FSL-Mate
FSL-Mate提供少样本学习的全面资源,包括FewShotPapers论文列表和PaddlePaddle基础的FSL库PaddleFSL。FSL-Mate项目持续更新,致力于简化少样本学习。最新更新涵盖了ICLR 2024、AAAI 2023、EMNLP 2023,以及ICCV和NeurIPS 2023的相关论文。
Logo of html5-parser
html5-parser
html5-parser是一个基于C语言开发的HTML 5解析器,为Python提供高性能的HTML解析功能。该解析器比纯Python实现(如html5lib)的速度快30多倍,同时严格遵守HTML 5标准。项目提供详细文档,适合需要高效处理HTML内容的Python开发者。
Logo of DnaFeaturesViewer
DnaFeaturesViewer
DnaFeaturesViewer是一款功能强大的DNA序列特征可视化Python库。它能自动生成清晰简洁的图表,即使是复杂的重叠特征和长标签序列也能完美展示。该库兼容Matplotlib和Biopython,支持多种图像输出格式。DnaFeaturesViewer可从GenBank或GFF文件读取特征,绘制核苷酸序列和氨基酸翻译,并支持多行多页绘图。它为DNA序列分析和生物学研究提供了直观高效的可视化工具。
Logo of terminaltexteffects
terminaltexteffects
Terminal Text Effects是一个开源的终端视觉效果引擎,既可作为独立应用程序使用,也可作为Python库集成。它支持256色/RGB颜色显示,实现复杂的字符移动和动画效果,以及渐变色生成等功能。该项目内置多种视觉效果,如光束、二进制路径、黑洞等,能够为终端界面带来丰富的视觉体验。Terminal Text Effects采用内联运行方式,可保留原有终端状态和工作流程,是为终端应用增添动态效果的实用工具。
Logo of agency
agency
Agency是一个Python库,基于Actor模型,为创建代理集成系统提供框架。它的API易于使用,使开发者可以灵活连接传统软件系统,具有很高的可扩展性。支持多处理和多线程并发,并包含AMQP网络代理系统支持,提供详细日志记录及权限控制。可以通过pip或poetry安装,附带多个代理示例和Docker配置,便于快速开发。
Logo of imgaug
imgaug
imgaug库为机器学习中的图像处理提供多样的增强技术,包括仿射变换、对比度调整、高斯噪点等。它优化了性能,支持多核CPU,并可轻松集成到各种媒体处理流程中,支持Python 2.7及更高版本。
Logo of instructor
instructor
Instructor是一个优化的Python库,专为简化和增强大型语言模型(LLMs)的结构化输出设计。它提供了一系列强大的功能,如自动验证、重试机制和流式处理。支持多种主流模型,是提升LLM工作流效率的理想选择。
Logo of How-to-use-Transformers
How-to-use-Transformers
该项目提供了由Hugging Face开发的Transformers库的快速入门教程,支持加载大部分预训练语言模型。教程涵盖自然语言处理背景知识、Transformers基础和实战案例,包括pipelines、模型与分词器使用、微调预训练模型及序列标注任务等。示例代码展示了句子对分类、命名实体识别、文本摘要等任务的实现,适合机器学习和NLP开发者参考。
Logo of pubmed_parser
pubmed_parser
Pubmed Parser是一个Python库,用于解析PubMed开放获取(OA)子集和MEDLINE XML数据集。该库使用lxml库将信息转换为Python字典,适用于文本挖掘和自然语言处理。功能涵盖文章信息、参考文献、图片说明、段落、表格及资助信息的解析。更多详情和应用实例,请参考API和文档。
Logo of textaugment
textaugment
TextAugment是一个Python 3库,旨在提升自然语言处理应用中的文本处理能力。借助于NLTK、Gensim和TextBlob等工具,TextAugment能生成合成数据,从而提升模型性能。这个库支持多种增强方法,如Word2vec、WordNet和RTT,并可轻松集成到PyTorch、TensorFlow和Scikit-learn等机器学习框架中。无论是词义替换还是混合增强方法,TextAugment都能为短文本分类任务提供有效的解决方案。
Logo of skops
skops
SKOPS 是一个支持scikit-learn模型分享和部署的Python库。它提供了将模型集成到Hugging Face Hub的工具,使模型可被发现和使用,无需下载或加载。主要功能包括创建模型库、生成模型卡和安全保存sklearn估算器。详细信息和使用指南请参考文档。
Logo of Auto1111SDK
Auto1111SDK
Auto 1111 SDK是一个轻量级Python库,使用Stable Diffusion模型进行图像生成、放大和编辑。它与Automatic 1111 Web UI完美集成,提供文本到图像、图像到图像、修补和外延等多种管道处理功能,支持多种采样器和模型下载。集成了Civit AI,方便直接从网站下载模型。用户可在Colab上通过示例体验该SDK,并参考官方提供的安装和快速上手指南。
Logo of pytubefix
pytubefix
pytubefix是一个功能丰富的Python库,用于下载YouTube视频。它支持高分辨率视频下载、音频提取、字幕获取、频道和播放列表处理。该库提供认证功能,可访问受限内容。pytubefix操作简便,适合快速实现YouTube内容下载。无论是个人项目还是大型应用,pytubefix都能胜任。
Logo of pedalboard
pedalboard
Pedalboard是一个功能丰富的Python音频处理库,支持多种音频格式的读写和效果器应用。内置常见音频效果如合唱、混响等,同时支持加载VST3和Audio Unit插件。该库具有优秀的线程安全性、内存管理和处理速度,可与TensorFlow等深度学习框架集成。Pedalboard在Spotify的数据增强和AI功能开发中得到应用,是音频处理领域的高效工具。
Logo of filesystem_spec
filesystem_spec
filesystem_spec为Python文件系统定义了统一的接口规范,支持多种存储后端如s3fs和gcsfs。它简化了跨平台数据操作,并提供键值存储和FUSE挂载等高级功能。项目可通过pip或conda安装,具有完善的文档和CI支持。filesystem_spec为开发者提供了一个一致、灵活的文件系统抽象层,适用于各种数据访问场景。
Logo of financial-datasets
financial-datasets
Financial Datasets是一个开源Python库,利用大型语言模型从金融文本生成问答数据集。支持从文本、PDF和10-K报告生成数据,提供灵活API。该库安装简便,可通过pip或Poetry集成。为金融分析和机器学习研究提供了便捷工具,能高效创建训练数据。