Google Cloud Document AI 示例
概述
该存储库包含示例和社区示例,展示了如何使用Google Cloud Document AI分析、分类和搜索文档。
示例
- Apps Script 和 Google Drive 集成:在Google Apps Script中与Document AI集成的代码。
- Document AI Warehouse 处理(Python):该项目展示了如何通过API执行Document AI Warehouse的常见操作。
- 通过脚本批量导入Document AI Warehouse:该项目是一个辅助工具,用于将文档批量导入Document AI Warehouse。
- BQ连接器:该项目使用Document AI API处理文档,格式化结果并将其保存到BigQuery表中。
- 使用Dialogflow CX进行内容审核:该项目在对话过程中使用内容审核处理器和Dialogflow CX进行有害内容路由。
- 筛选HITL语言:该项目使用Document AI(HITL后)检测到的语言将
Document.json
文件分类到不同的Cloud Storage存储桶中。 - 欺诈检测:该项目使用Document AI发票解析器、EKG和Google Maps将文档实体存储在BigQuery中。
- JSON浏览器:一个用于浏览Document JSON响应的React工具。
- 语言提取:该项目使用Document AI API检测多页文档中的语言。
- 论文摘要:该项目使用Document AI API总结科学文章。
- PDF嵌入文本:演示如何使用OCR处理器(
v1beta3
)的原生PDF解析功能。 - 文档SQL查询:该项目展示了如何运行BigQuery SQL并从文档中提取信息。
- 税表处理流程:该项目使用Document AI API对多种文档类型进行分类、解析和计算税表。
- Web应用演示:该项目是一个全栈应用程序,使用Document AI处理不同类型的文档。该应用程序目前支持表单、发票和OCR处理器。
不在此存储库中的示例
已弃用的示例
测试文档文件
如果您需要文档文件来运行示例,可以从这个公开访问的Google Cloud Storage存储桶获取。
gs://cloud-samples-data/documentai/
您还可以在文档的示例输出页面上查看按处理器分类的示例输入/输出文件。
Codelabs
- 使用Document AI进行光学字符识别(OCR)(Python)
- 使用Document AI进行表单解析(Python)
- 使用Document AI的专用处理器(Python)
- 管理Document AI处理器(Python)
社区示例
**免责声明:**社区示例不由Google官方维护。
- PDF注释器示例:该项目使用Document AI API对PDF文档进行注释。
贡献
欢迎贡献!请参阅贡献指南。
获取帮助
请使用问题页面提供反馈或提交错误报告。
免责声明
这不是官方支持的Google产品。此存储库中的代码仅用于演示目的。