Project Icon

tesseract.js-core

Tesseract OCR引擎的JavaScript WebAssembly实现

tesseract.js-core是tesseract.js的核心组件,将Tesseract OCR引擎从C语言编译为JavaScript WebAssembly。该项目提供跨平台的文字识别功能,适用于浏览器和Node.js环境。它包含构建脚本、JavaScript封装和第三方依赖,并对Tesseract进行了优化,增加了页面角度检测和图像旋转等功能。开发者可使用Docker构建,或运行最小示例测试其功能。

whisper-web - 浏览器端实时语音识别技术
GithubTransformers.jsWebGPUWhisper Web开源项目浏览器应用语音识别
Whisper Web是一个基于机器学习的浏览器端语音识别项目。它利用 Transformers.js 技术,在客户端实现实时语音处理,无需服务器支持。该项目提供在线演示和本地部署选项,并正在开发 WebGPU 支持以提高性能。Whisper Web 展示了 Web 技术在语音识别领域的应用潜力,为开发者提供了一个便捷的语音识别解决方案。
t3d.js - 轻量级、Web优先的可扩展3D渲染库
3D渲染GithubJavaScript库ThingJSWebGL开源项目
t3d.js是一个轻量级、Web优先的3D渲染库,既可作为ThingJS的Web3D渲染引擎,也可独立使用。它提供简洁API,支持npm和CDN导入。t3d.js具备场景管理、光照、材质和几何体处理等功能,并拥有后期效果、粒子系统和全景图等扩展工具,适用于多种3D渲染场景。t3d.js支持WebGL2渲染,提供PBR材质系统,并可通过其扩展生态实现高级渲染效果。
cornerstone3D - Web医疗影像应用开发的JavaScript框架
Cornerstone.jsGithubJavaScript库Web应用医学影像开源项目放射学
Cornerstone3D是一套用于开发Web医疗影像应用的JavaScript库。该框架采用WebGL和WebAssembly技术,实现高效图像渲染和解压缩。它允许自定义加载方案,便于连接各类图像存档。Cornerstone3D是一个开源项目,主要服务于放射学领域,支持DICOMweb标准,可用于构建OHIF Viewer等医疗影像应用。
container2wasm - 容器到WebAssembly转换工具 实现跨平台容器部署
GithubWASMWebAssemblycontainer2wasm容器转换开源项目虚拟化
container2wasm是一个容器到WebAssembly的转换工具,可将容器镜像转换为WASI运行时和浏览器中可执行的WASM格式。它支持x86_64和riscv64架构,通过CPU模拟实现容器在WebAssembly环境中运行。这个项目使开发者能够将现有容器应用无需修改就直接部署到WASM平台,提高了容器的可移植性和适用范围。
google-tts - Node.js环境下的文本转语音解决方案
GithubText-To-Speechgoogle-tts-apinode.js开源项目语音合成音频转换
google-tts-api 提供Node.js环境下全面的文本转语音支持,包括多语言选项、语速调整等功能,支持输出URL或Base64编码,适合多种交互场景。
binaryen - WebAssembly编译器和优化工具链库
BinaryenGithubWebAssembly优化工具链开源项目编译器
Binaryen是一个C++编写的WebAssembly编译器和工具链库。它提供C和JavaScript API,支持WebAssembly输入,内部IR支持并行优化。其优化器可改善代码大小和性能,能作为独立编译器后端。Binaryen简化了WebAssembly的编译和优化过程。
tfjs-examples - TensorFlow.js机器学习示例集 涵盖浏览器和Node.js应用
GithubJavaScriptTensorFlow.js开源项目机器学习浏览器深度学习
tfjs-examples是一个包含多种TensorFlow.js机器学习示例的项目。涵盖图像分类、文本生成、强化学习等领域,展示了TensorFlow.js在浏览器和Node.js环境中的应用。示例包括模型训练和推理部署,为开发者提供了实用的学习资源和参考案例。
ddddocr - 多功能验证码识别库 支持OCR与目标检测
DdddOcrGithubOCR开源项目滑块检测目标检测验证码识别
ddddocr是一个开源的验证码识别库,支持基础OCR、目标检测和滑块识别等多种功能。该项目采用深度学习技术,无需针对特定验证码训练,具有通用性强的特点。ddddocr支持Windows、Linux和MacOS等主流操作系统,提供Python接口便于集成。项目设计注重简化配置和使用流程,为开发者提供了一个高效的验证码识别工具。
terser - ES6+ JavaScript代码压缩与混淆工具套件
ES6+GithubJavaScript压缩Terser代码优化命令行工具开源项目
Terser是一款专为ES6+设计的JavaScript代码压缩与混淆工具套件。它提供变量名混淆、属性名混淆和死代码删除等多种压缩选项,有效减小代码体积。Terser支持命令行界面和编程API,易于集成到构建流程。作为uglify-es的分支项目,Terser保持了与uglify-es和uglify-js@3的API兼容性,适用于现代JavaScript项目。
tools-ocr - Tree Hole OCR 高效本地文本识别工具
GithubPDF识别Tree Hole OCR开源项目文本识别本地OCR识别跨平台兼容
Tree Hole OCR是一款基于Paddle OCR模型的本地文本识别工具。无需联网即可快速识别文字,支持PDF、图像和截图识别等多种功能。采用Java和JavaFX开发,具有良好的跨平台兼容性,适用于Mac OS X 12.6及以上系统。该工具依赖于DJL、PyTorch等深度学习框架,集成了OpenCV图像处理库。除基本文本识别外,还支持PDF识别和快捷键截图识别。项目开源,可在GitHub或Gitee上获取源码。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号