tesseract.js-core

Tesseract OCR引擎的JavaScript WebAssembly实现

Tesseract.js WebAssembly OCR 图像识别开源项目 Github

tesseract.js-core是tesseract.js的核心组件，将Tesseract OCR引擎从C语言编译为JavaScript WebAssembly。该项目提供跨平台的文字识别功能，适用于浏览器和Node.js环境。它包含构建脚本、JavaScript封装和第三方依赖，并对Tesseract进行了优化，增加了页面角度检测和图像旋转等功能。开发者可使用Docker构建，或运行最小示例测试其功能。

访问官网

Github

介绍相关项目

whisper-web - 浏览器端实时语音识别技术

GithubTransformers.jsWebGPUWhisper Web开源项目浏览器应用语音识别

Whisper Web是一个基于机器学习的浏览器端语音识别项目。它利用 Transformers.js 技术，在客户端实现实时语音处理，无需服务器支持。该项目提供在线演示和本地部署选项，并正在开发 WebGPU 支持以提高性能。Whisper Web 展示了 Web 技术在语音识别领域的应用潜力，为开发者提供了一个便捷的语音识别解决方案。

t3d.js - 轻量级、Web优先的可扩展3D渲染库

3D渲染GithubJavaScript库ThingJSWebGL开源项目

t3d.js是一个轻量级、Web优先的3D渲染库，既可作为ThingJS的Web3D渲染引擎，也可独立使用。它提供简洁API，支持npm和CDN导入。t3d.js具备场景管理、光照、材质和几何体处理等功能，并拥有后期效果、粒子系统和全景图等扩展工具，适用于多种3D渲染场景。t3d.js支持WebGL2渲染，提供PBR材质系统，并可通过其扩展生态实现高级渲染效果。

cornerstone3D - Web医疗影像应用开发的JavaScript框架

Cornerstone.jsGithubJavaScript库Web应用医学影像开源项目放射学

Cornerstone3D是一套用于开发Web医疗影像应用的JavaScript库。该框架采用WebGL和WebAssembly技术，实现高效图像渲染和解压缩。它允许自定义加载方案，便于连接各类图像存档。Cornerstone3D是一个开源项目，主要服务于放射学领域，支持DICOMweb标准，可用于构建OHIF Viewer等医疗影像应用。

container2wasm - 容器到WebAssembly转换工具实现跨平台容器部署

GithubWASMWebAssemblycontainer2wasm容器转换开源项目虚拟化

container2wasm是一个容器到WebAssembly的转换工具，可将容器镜像转换为WASI运行时和浏览器中可执行的WASM格式。它支持x86_64和riscv64架构，通过CPU模拟实现容器在WebAssembly环境中运行。这个项目使开发者能够将现有容器应用无需修改就直接部署到WASM平台，提高了容器的可移植性和适用范围。

google-tts - Node.js环境下的文本转语音解决方案

GithubText-To-Speechgoogle-tts-apinode.js开源项目语音合成音频转换

google-tts-api 提供Node.js环境下全面的文本转语音支持，包括多语言选项、语速调整等功能，支持输出URL或Base64编码，适合多种交互场景。

binaryen - WebAssembly编译器和优化工具链库

BinaryenGithubWebAssembly优化工具链开源项目编译器

Binaryen是一个C++编写的WebAssembly编译器和工具链库。它提供C和JavaScript API，支持WebAssembly输入，内部IR支持并行优化。其优化器可改善代码大小和性能，能作为独立编译器后端。Binaryen简化了WebAssembly的编译和优化过程。

tfjs-examples - TensorFlow.js机器学习示例集涵盖浏览器和Node.js应用

GithubJavaScriptTensorFlow.js开源项目机器学习浏览器深度学习

tfjs-examples是一个包含多种TensorFlow.js机器学习示例的项目。涵盖图像分类、文本生成、强化学习等领域,展示了TensorFlow.js在浏览器和Node.js环境中的应用。示例包括模型训练和推理部署,为开发者提供了实用的学习资源和参考案例。

ddddocr - 多功能验证码识别库支持OCR与目标检测

DdddOcrGithubOCR开源项目滑块检测目标检测验证码识别

ddddocr是一个开源的验证码识别库，支持基础OCR、目标检测和滑块识别等多种功能。该项目采用深度学习技术，无需针对特定验证码训练，具有通用性强的特点。ddddocr支持Windows、Linux和MacOS等主流操作系统，提供Python接口便于集成。项目设计注重简化配置和使用流程，为开发者提供了一个高效的验证码识别工具。

terser - ES6+ JavaScript代码压缩与混淆工具套件

ES6+GithubJavaScript压缩Terser代码优化命令行工具开源项目

Terser是一款专为ES6+设计的JavaScript代码压缩与混淆工具套件。它提供变量名混淆、属性名混淆和死代码删除等多种压缩选项，有效减小代码体积。Terser支持命令行界面和编程API，易于集成到构建流程。作为uglify-es的分支项目，Terser保持了与uglify-es和uglify-js@3的API兼容性，适用于现代JavaScript项目。

tools-ocr - Tree Hole OCR 高效本地文本识别工具

GithubPDF识别Tree Hole OCR开源项目文本识别本地OCR识别跨平台兼容

Tree Hole OCR是一款基于Paddle OCR模型的本地文本识别工具。无需联网即可快速识别文字，支持PDF、图像和截图识别等多种功能。采用Java和JavaFX开发，具有良好的跨平台兼容性，适用于Mac OS X 12.6及以上系统。该工具依赖于DJL、PyTorch等深度学习框架，集成了OpenCV图像处理库。除基本文本识别外，还支持PDF识别和快捷键截图识别。项目开源，可在GitHub或Gitee上获取源码。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号