Project Icon

Rectlabel-support

图像标注工具,支持自动化标注和多格式导出

RectLabel 是一款图像标注工具,支持 Segment Anything 和 Core ML 模型的自动标注,能够识别文本、曲线、点线和骨架等。支持导出COCO、Labelme、CreateML、YOLO和DOTA格式,以及索引色和灰度掩码图像。通过自定义热键和快捷设置,提高标注效率,满足不同图像处理需求。

TextRecognitionDataGenerator - 多语言文本识别数据生成工具
GithubOCRTextRecognitionDataGenerator合成数据图像生成开源项目文本识别
TextRecognitionDataGenerator是一款开源的文本识别数据生成工具。支持多种语言如拉丁文、中文和日文等,可自定义字体、背景、文本扭曲和模糊效果。工具提供命令行界面和Python模块,便于集成到训练流程中。适用于OCR和文本识别模型的数据集制作,支持手写体文本生成功能。
markup - 基于机器学习的智能文档标注工具 提高NLP任务效率
GithubMarkup开源项目本体映射机器学习标注工具自然语言处理
Markup是一款基于机器学习的在线文档标注工具,专为自然语言处理任务设计。它通过预测性标注技术提供复杂标注建议,提高工作效率。工具集成常用和自定义本体库,支持概念映射。Markup界面友好,适合技术专家和新手使用,能快速将非结构化文档转化为结构化格式。
rich-text-to-image - 富文本格式提升文本到图像生成的精确控制
AI绘图GithubICCV 2023Rich-Text-to-ImageStable Diffusion开源项目文本生成图像
Rich-Text-to-Image项目利用富文本格式信息增强文本到图像生成的控制能力。该项目通过字体大小、颜色、样式和脚注等格式实现精确的颜色渲染、局部风格控制和详细区域合成。这种方法支持token显式重新加权,可与Stable Diffusion等主流模型集成,提供更精细的图像生成控制。项目开源了代码实现,并提供在线演示和相关论文,为文本到图像生成领域开辟了新的研究方向。
recognize-anything - 通用图像识别模型:支持开放域类别和高精度标签生成
GithubRAM++图像识别多模态开源模型开源项目零样本学习
Recognize Anything Model是一系列开源图像识别模型,包括RAM++、RAM和Tag2Text。这些模型能准确识别常见和开放域类别,支持高精度图像标签生成和全面描述。项目提供预训练模型、推理代码和训练数据集,适用于多种计算机视觉任务。模型性能优于现有先进方案,尤其在零样本识别方面表现突出。
bbox-visualizer - 精确且简便的边界框绘制与标签工具
GithubMIT许可证Python包bbox-visualizer可视化开源项目边界框
bbox-visualizer是一款简便实用的软件包,帮助用户在无需复杂计算的情况下绘制物体的边界框及添加标签。该工具支持多种标签方式,包括顶部标签、内部标签、旗帜样标签以及不透明覆盖标签。用户可以通过Python轻松安装和使用。该软件还支持绘制多个边界框及添加多个标签,非常适合计算机视觉相关任务。遵循MIT开源许可证,用户可自由使用与二次开发。
DeepLabCut - 无标记动物姿态估计工具箱
DeepLabCutGithub动物姿态估计开源工具箱开源项目神经科学应用行为追踪
DeepLabCut是一个无标记动物姿态估计工具箱。此工具适用于各类动物行为的分析,并通过TensorFlow和PyTorch加强模型训练功能。它整合了多种新技术,如MobileNetV2s与EfficientNets,有效提升了效率与准确性。项目提供多语种文档与在线课程,方便用户快速掌握实时多动物追踪及三维姿态估计技术。DeepLabCut已应用于多种场合并获得验证,通过社区持续的优化适用于从神经科学到生态研究的广泛领域。
RapidOCR - 开源多语言OCR工具 支持跨平台快速部署
GithubONNXRapidOCR多平台多语言开源OCR开源项目
RapidOCR是一个开源的多平台、多语言OCR工具,具有高速识别和广泛兼容性。该工具支持快速离线部署,采用ONNXRuntime推理引擎,识别速度显著优于PaddlePaddle引擎。RapidOCR内置中英文识别功能,同时支持其他语言的自定义转换。基于深度学习技术,RapidOCR注重轻量化设计和高效性能,适用于快速OCR部署和定制化需求场景。
edgeyolo - 优化边缘设备性能的模型,支持ONNX和TensorRT导出
COCO2017EdgeYOLOGithubHuawei AscendNvidia Jetson AGX XavierTensorRT开源项目
EdgeYOLO为边缘设备优化,在Nvidia Jetson AGX Xavier上达34FPS,并通过RH loss提升小型和中型物体检测。支持COCO2017和VisDrone2019数据集,提供多种模型格式和部署代码,包括RKNN、MNN和TensorRT。项目定期更新,并集成了SAMLabeler Pro工具,支持多人远程标注。可快速上手和训练,适配不同设备和应用场景。
deepdataspace - 开源计算机视觉数据集工具 提供可视化 标注和分析功能
DeepDataSpaceGithub开源数据集工具开源项目数据可视化数据标注模型分析
DeepDataSpace是一个开源计算机视觉数据集工具,提供交互式数据可视化、探索和智能标注功能。支持多平台和协作工作流,易于安装使用。通过直观界面帮助用户高效管理和分析大规模图像数据集,适用于CV项目开发和研究。
Pix2Text - 开源Python工具,支持高精度数学公式检测和80多种语言的文本识别
GithubOCRPix2Text开源开源项目数学公式检测表格识别
Pix2Text是一款免费开源的Python工具,主要功能与Mathpix类似,能够将复杂布局的图像、表格、文本和数学公式转换为Markdown格式。它支持超过80种语言的文本识别,包括简体中文、繁体中文、英语和越南语。最新的V1.1.1版本引入了新的数学公式检测模型,大幅提升了识别准确性。用户也可以通过在线服务和演示来体验其强大功能。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

Project Cover

天工AI音乐

天工AI音乐平台支持音乐创作,特别是在国风音乐领域。该平台适合新手DJ和音乐爱好者使用,帮助他们启动音乐创作,增添生活乐趣,同时发现和分享新音乐。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号