#Python库
Featuretools:自动化特征工程的开源Python库
llm
一款CLI工具和Python库,用于与大型语言模型交互,支持远程API和本地安装模型。可从命令行运行提示、将结果存储在SQLite中、生成嵌入等。通过插件目录,可访问更多模型。
autolabel
Autolabel是一个Python库,利用大语言模型(LLM)自动标注、清洗和丰富文本数据集。它大幅减少手动标注的时间和成本,同时提供高准确率的标注结果。该库支持多种NLP任务,如分类、问答、命名实体识别等,兼容OpenAI、Anthropic、HuggingFace等多家提供商的LLM。Autolabel还提供信心估算、结果解释、缓存和状态管理功能,并支持使用Refuel托管的开源LLM进行标注。用户可根据具体任务配置标注指南,并通过简单的三步流程完成数据标注。
DataDreamer
DataDreamer 是一个功能强大的开源Python库,专为创建提示工作流、生成合成数据集和训练模型而设计。它支持复杂的多步提示工作流,适用于各种大语言模型。该工具简单易用,且达到研究级别,兼具高效性和可复现性,支持最新技术如量化和LoRA等。无论是研究人员还是普通用户,都可以轻松发布数据集和模型。
agency
Agency是一个Python库,基于Actor模型,为创建代理集成系统提供框架。它的API易于使用,使开发者可以灵活连接传统软件系统,具有很高的可扩展性。支持多处理和多线程并发,并包含AMQP网络代理系统支持,提供详细日志记录及权限控制。可以通过pip或poetry安装,附带多个代理示例和Docker配置,便于快速开发。
freeGPT
freeGPT 提供免费下载和使用多种文本与图像生成模型,包括 gpt3 和 gpt4。通过安装并使用 Python 代码,即可轻松实现文本或图像生成。此外,还支持官方 Discord 机器人,提供更多应用实例和技术支持。
gTTS
gTTS,一款Python库和命令行工具,能通过Google翻译API进行文本到语音转换,并输出为mp3。特色包括自定义语句分割和文本预处理,以支持长文本的准确语调处理。适用于所有需要语音合成功能的开发者。更多信息,参见官方文档。
albumentations
Albumentations, 一个高效的Python库用于图像增强,通过逾70种方法优化深度学习和计算机视觉模型性能。支持PyTorch和TensorFlow框架,适合多种视觉任务如分类、语义分割和目标检测。
imgaug
imgaug库为机器学习中的图像处理提供多样的增强技术,包括仿射变换、对比度调整、高斯噪点等。它优化了性能,支持多核CPU,并可轻松集成到各种媒体处理流程中,支持Python 2.7及更高版本。
edward
Edward 是一个用于概率建模、推断和模型评估的Python库。它融合了贝叶斯统计、机器学习、深度学习和概率编程,支持多种模型,如有向图模型、神经网络、隐式生成模型和贝叶斯非参数。Edward 提供变分推断、蒙特卡罗方法、生成对抗网络等多种推断方法,并支持模型和推断的评估。构建于TensorFlow之上,支持计算图、分布式训练、CPU/GPU集成和自动微分。