Project Icon

surya_layout2

Surya项目的专用布局引擎模型

这是一个专门为Surya开源项目开发的布局模型组件,用于优化Surya项目的布局架构设计。该模型提供了基础的布局功能支持,帮助开发者更好地使用Surya项目。

unstructured-inference - 非结构化数据布局解析工具 支持多种检测模型
AI模型Githubunstructured布局解析开源工具开源项目文档处理
unstructured-inference 是一个专注于文档布局分析的开源项目。它能够从各种文件中提取文档结构和文本内容,适用于需要高效文档处理的场景。该项目提供多种检测模型,如 Detectron2 和 YOLOX,可通过 API 与 unstructured 包集成。它支持自定义模型,为开发者提供了灵活的布局解析解决方案。
ChatLayout - 实现动态聊天界面的UICollectionView布局
ChatLayoutGithubUICollectionViewUICollectionViewCellUICollectionViewLayoutiOS开源项目
ChatLayout提供一种高度自定义的UICollectionViewLayout,用于创建动态且响应式的聊天界面。这种布局方案允许开发者完全控制UI展示,支持动态调整单元格和视图大小,有效处理键盘显示问题,且不限制使用特定的UI控件。是追求高性能和灵活性的iOS开发者的理想选择。
HorizonNet - 基于1D表示和全景拉伸数据增强的房间布局学习
GithubHorizonNet室内数据集布局预测开源项目深度学习预处理
HorizonNet项目通过1D表示和全景拉伸数据增强实现了房间布局学习,能够生成立方体或一般形状的房间布局。该项目提供纯Python实现,支持图像推断、3D布局查看、姿态校正、全景拉伸增强、2D和3D布局定量评估以及数据集准备和训练。支持PanoContext、Stanford2D3D、Structured3D和Zillow Indoor等数据集,提供预训练模型。详细的安装、推断和可视化教程使用户能够高效地使用该工具。
lilt-roberta-en-base - 多语言文档理解的语言无关布局变换器
GithubHuggingfaceLiLTRoBERTa布局转换器开源项目文档理解模型模型集成
LiLT-RoBERTa将预训练的RoBERTa模型与轻量级的布局变换器结合,适用于处理多语言的文档图像分类、解析及问答任务,适合在结构化文档理解中应用。用户可在模型库中寻找适合特定任务的微调版本。
openui - 灵活快速构建UI组件,兼容多种AI模型
API密钥DockerGithubLLMOpenUIUI组件开源项目
OpenUI简化了UI组件的构建,支持实时渲染和多框架转换(如React、Svelte)。兼容OpenAI、Groq等多种模型,并支持本地与Docker运行,适用于各种开发环境。
ComfyUI - 模块化Stable Diffusion工作流设计与执行工具
AI绘图ComfyUIGPUGithubStable Diffusion工作流开源项目
ComfyUI是一个开源的Stable Diffusion工作流设计工具。它采用图形化界面,支持通过节点和流程图创建复杂的AI图像生成流程。ComfyUI兼容多种Stable Diffusion模型,包括SD1.x、SD2.x和SDXL等。该工具具有异步队列系统和智能内存管理,优化了资源使用。ComfyUI还集成了LoRA、ControlNet等技术,可保存和加载完整工作流,为用户提供灵活的AI图像生成体验。
react-grid-layout - React网格布局系统 灵活可定制的响应式设计工具
GithubReact响应式开源项目拖拽网格布局调整大小
React-Grid-Layout是一款功能丰富的React网格布局库,支持拖拽、调整大小和响应式设计。该系统无需jQuery依赖,可用于服务端渲染,并提供多种布局选项。它广泛应用于构建动态仪表板和可视化界面,如BitMEX、AWS CloudFront和Grafana等项目。其特点包括自动布局、布局保存与恢复、静态元素支持等,为开发者提供了灵活的网格界面构建工具。
docling-models - 将PDF文档中的版式与表格结构自动识别的开源模型
DoclingGithubHuggingfacePDF文档转换TableFormer布局分析开源项目模型表结构识别
docling模型支持PDF文档的布局与表格结构分析。布局模型使用RT-DETR技术识别版式元素,如标题、脚注与图片,性能接近人类标准。TableFormer模型则在表格结构识别上表现优异,准确识别复杂表格。该项目可应用于多种需要文档处理的场景。
CabinUI - AI大模型支持的互动式UI构建工具
AI模型Cabin UIGithub交互式UI构建代码自定义实时AI驱动界面开源项目
Cabin UI是一个与AI大模型交互的工具,支持实时生成和调整UI元素,使用户可以快速设计和调整UI页面。该平台提供交互式UI构建功能,支持自定义接口和URL参数配置,内置Font Awesome图标库与一键预览功能。用户可通过互动实现代码生成和修改,满足个性化设计需求,并生成方便分享的临时链接。系统支持本地保存和自定义AI模型,保证数据的安全与灵活性。
eynollah - 结合深度学习和启发式算法的文档布局分析工具
EynollahGithub启发式算法图像处理开源项目文档布局分析深度学习
Eynollah是一款文档布局分析工具,支持多达10种分割类别,包括文本区域、页眉和图像等。它具有图像优化、文本行分割和阅读顺序检测等功能,结合了深度学习和启发式算法。Eynollah输出符合PAGE-XML标准,可作为OCR-D处理器使用。该项目主要面向历史文献分析,适用于需要精确文档布局分析的研究和应用场景。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号