Project Icon

make-sense

免费跨平台图片标注工具,简化深度学习数据集准备,支持多种格式导出

makesense.ai是一个免费且跨平台的在线图片标注工具,无需复杂安装,特别适合小型计算机视觉深度学习项目。支持多种标签格式导出,如CSV、YOLO、VOC XML等,并集成先进的AI模型如YOLOv5、SSD等,以自动化标注过程。项目基于TypeScript和React/Redux构建,提供详细的文档及本地和Docker部署指引。

Github Stars GitHub release (latest by date including pre-releases) codecov Gitter Discord

makesense.ai


make sense logo

makesense.ai 是一个免费使用的在线照片标注工具。由于使用浏览器,它不需要任何复杂的安装 - 只需访问网站即可开始使用。而且,无论你使用的是哪个操作系统,我们都尽最大努力实现真正的跨平台使用。它非常适合小型计算机视觉深度学习项目,使准备数据集的过程更加简单和快捷。准备好的标签可以下载为多种支持的格式。该应用程序是用TypeScript编写的,并基于React/Redux组合。

📄 文档

你可以在新发布的文档中找到更多关于我们工具的信息 - 仍在🚧建设中。让我们知道哪些话题应该优先涵盖。

🤖 先进的AI集成

makesense.ai 努力显著减少你在照片标注上花费的时间。我们尽全力集成最新和最强大的AI模型,这些模型可以为你提供建议,并自动化重复和枯燥的活动。

  • YOLOv5 是我们目前最强大的集成。借助yolov5js,你不仅可以加载YOLOv5js-zoo的预训练模型,更重要的是,你可以加载通过YOLOv5训练并导出为tfjs格式的模型。
  • 预训练于COCO数据集SSD,它将为你在照片上绘制边界框的工作做一些工作,并在某些情况下建议标签。
  • PoseNet 是一个视觉模型,可以用于估计图像或视频中人的姿势,通过估计关键身体关节的位置。

驱动我们AI功能的引擎是TensorFlow.js - 最流行的神经网络训练框架的JS版本。这个选择不仅加快了你的工作速度,还保护了你的数据隐私,因为与其他商业和开源工具不同,你的照片不需要传输到服务器。这次AI来到你的设备上!

https://user-images.githubusercontent.com/26109316/193255987-2d01c549-48c3-41ae-87e9-e1b378968966.mov

💻 本地设置

# 克隆代码库
git clone https://github.com/SkalskiP/make-sense.git

# 进入主目录
cd make-sense

# 安装依赖
npm install

# 使用热重载在 localhost:3000 服务
npm start

为了在本地确保应用程序正常功能,需要npm 8.x.x和node.js v16.x.x版本。更多信息请见#16

🐳 Docker 设置

# 创建Docker镜像
docker build -t make-sense -f docker/Dockerfile .

# 将Docker镜像以服务形式运行
docker run -dit -p 3000:3000 --restart=always --name=make-sense make-sense

# 获取Docker容器日志
docker logs make-sense

# 访问make-sense: http://localhost:3000/

⌨️ 键盘快捷键

功能适用场景MacWindows / Linux
多边形自动完成编辑器EnterEnter
取消多边形绘制编辑器EscapeEscape
删除当前选定标签编辑器BackspaceDelete
加载上一张图片编辑器 + LeftCtrl + Left
加载下一张图片编辑器 + RightCtrl + Right
放大编辑器 + +Ctrl + +
缩小编辑器 + -Ctrl + -
移动图片编辑器Up / Down / Left / RightUp / Down / Left / Right
选择标签编辑器 + 0-9Ctrl + 0-9
退出弹出窗口弹出窗口EscapeEscape

表 1. 支持的键盘快捷键

⬆️ 导出格式

CSVYOLOVOC XMLVGG JSONCOCO JSONPIXEL MASK
线
矩形
多边形
标签

表 2. 支持的标签导出格式矩阵,其中:

  • ✓ - 支持的格式
  • ☐ - 尚未支持的格式
  • ✗ - 不适用于给定标签类型的格式

你可以在我们的Wiki上找到导出文件示例及描述和架构。

⬇️ 导入格式

CSVYOLOVOC XMLVGG JSONCOCO JSONPIXEL MASK
线
矩形
多边形
标签

表 3. 支持的标签导入格式矩阵

  • ✓ - 支持的格式
  • ☐ - 尚未支持的格式
  • ✗ - 不适用于给定标签类型的格式

🔐 隐私

我们不存储你的图片,因为我们根本不会将它们发送到任何地方。

🚀 教程

如果你刚刚开始你的深度学习冒险,并希望在此过程中学习和创造一些酷炫的东西,makesense.ai 可以帮你实现这一点。利用我们的边界框标注功能准备一个数据集,并使用它训练你的第一个最先进的物体检测模型。按照指示示例,但最重要的是,释放你的创造力。

🏆 贡献

💬 引用

如果make sense对你的研究有帮助,请在你的出版物中引用make sense。以下是一个BibTeX条目示例:

@MISC{make-sense,
   author = {Piotr Skalski},
   title = {{Make Sense}},
   howpublished = "\url{https://github.com/SkalskiP/make-sense/}",
   year = {2019},
}

🪧 许可证

本项目通过GPL-3.0许可证授权 - 有关详情,请参阅LICENSE文件。版权所有 © 2019 Piotr Skalski。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号