Project Icon

labelme

Python图像标注工具,支持多种格式导出

Labelme是一个Python图像标注工具,使用Qt构建界面,支持多边形、矩形、圆形、线条和点的标注,适用于图像分类、语义分割、实例分割和视频标注。提供GUI自定义功能,并支持导出VOC和COCO格式数据集。兼容Windows、macOS和Linux平台,安装简单,资源丰富,易于使用。

ImageAI - 使用简便的代码实现深度学习和计算机视觉功能的开源Python库
GithubImageAI对象检测开源项目深度学习自定义模型训练计算机视觉
ImageAI是一款开源的Python库,帮助开发者使用简便的代码实现深度学习和计算机视觉功能。该库支持图像预测、目标检测、视频检测及对象跟踪等多种功能。新版本引入了PyTorch后端和TinyYOLOv3模型训练,提升了性能并扩展了功能。用户还可以训练自定义模型识别新对象。有关如何安装和使用ImageAI的详细信息,请参阅项目文档和指南。
MarkLLM - 支持多种算法和可视化功能的LLM水印开源工具包
GithubMarkLLMPython包大语言模型开源工具包开源项目水印技术
MarkLLM是一个开源工具包,致力于支持大规模语言模型 (LLM) 的水印研究和应用。它提供一个统一的平台,支持九种不同的水印算法,还包括自定义可视化工具和详尽的评估模块,便于研究人员和普通用户对水印技术的访问、理解和评估。
simple-ocr-opencv - 基于OpenCV和NumPy的轻量级Python OCR工具
GithubOCROpenCVPython图像识别开源项目机器学习
simple-ocr-opencv是一个基于OpenCV和NumPy的Python OCR工具。它采用矩形模型进行图像分割,使用k-NN算法实现字符分类。项目结构清晰,包含示例代码,支持自定义训练,并提供预标注训练图像和交互式标注功能。开发者可通过example.py快速上手。这个开源项目遵循GNU AGPLv3许可证,适合需要实现基础OCR功能的开发者使用。
joytag - 多标签AI图像标记模型 支持5000+标签
AI视觉模型GithubJoyTagViT架构图像标签多标签分类开源项目
JoyTag是基于ViT-B/16架构的AI视觉模型,专用于图像多标签分类。采用Danbooru标记体系,支持5000多个标签,适用于手绘和摄影等多种图像类型。模型在0.4阈值下F1分数达0.578,能为每张图像生成独立标签预测。可用于diffusion模型训练等多种应用场景。
lab2d - 高效灵活的2D网格环境创建工具,专为机器学习研究设计
DeepMind Lab2DGithub开源项目强化学习机器学习环境创建网格世界
DeepMind Lab2D是一个专为机器学习研究设计的2D环境创建系统。它通过文本地图和Lua代码定义网格世界,兼具易用性和高性能。系统支持多智能体交互,提供Python dm_env API和C API接口。适用于Linux和macOS平台,可通过pip安装或源码构建。DeepMind Lab2D为研究人员提供了一个灵活高效的2D环境开发工具。
label-sleuth - 无代码系统助力快速构建文本分类模型
GithubLabel Sleuth分类器构建开源项目文本标注无代码系统自然语言处理
Label Sleuth是一款开源的无代码文本标注与分类系统。该系统使领域专家无需依赖NLP专家即可快速创建定制NLP模型。通过直观的用户界面,系统指导用户标注数据并构建针对特定需求的模型。在用户标注示例的同时,机器学习模型在后台自动训练,对新示例进行预测,并为用户推荐下一步标注内容。Label Sleuth操作简单,无需机器学习知识,从任务定义到获得可用模型仅需数小时。
ai-assisted-annotation-client - NVIDIA AI辅助医学影像标注客户端
AI辅助标注GithubNVIDIA医学影像客户端API开源项目跨平台
NVIDIA AI辅助标注客户端是一个跨平台的C++/Python API项目,用于与AI辅助标注服务器通信。支持Linux、macOS和Windows,提供MITK和3D Slicer插件。采用客户端-服务器架构,可集成到医学影像应用中,实现3D DEXTR、分割和多边形修复等功能,提升医学影像标注效率。
DanTagGen-alpha - 高效艺术标签生成工具,支持多种模型格式
DanTagGenGithubHuggingface开源项目数据集标签生成器模型模型架构训练
DanTagGen-alpha是一款基于NanoLLaMA架构的艺术标签生成工具,拥有400M参数,支持通过llama.c和llama-cpp-python进行高效推理,并兼容FP16、量化8位和6位模型格式。该项目采用精细数据过滤和6至12亿标记训练策略,支持多种应用场景。开发中的Gradio UI和API为其他开发者提供了丰富的扩展机会。
imageio - 多功能Python图像处理库
GithubImageioPython库图像处理多格式支持开源项目跨平台
imageio是一个多功能Python图像处理库,支持读写295多种格式的图像数据,包括动画、视频和科学格式。该库跨平台兼容Python 3.8+,依赖少,易于安装使用。它提供简洁的API接口、标准化元数据处理和高级选项,适用于各种复杂图像处理任务。
lang-seg - 语言驱动的零样本语义图像分割模型
CLIPGithubLSeg开源项目计算机视觉语义分割零样本学习
LSeg是一种语言驱动的语义图像分割模型,结合文本编码器和Transformer图像编码器。它能将描述性标签与图像像素对齐,实现高效零样本分割。LSeg在多个数据集上表现出色,无需额外训练即可泛化到新类别。该模型在固定标签集上可与传统算法媲美,为语义分割任务提供了灵活有力的解决方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号