一个用Python编写的模糊收据解析器
这是一个用Python编写的模糊收据解析器。 它可以从扫描的收据中提取店铺、日期和总金额等信息。 它可以作为独立脚本运行,也可以作为我们iOS和Android应用程序的一部分使用。
依赖
receipt-parser-core
库依赖于imagemagick
。请使用你喜欢的包管理器安装imagemagick
。
使用方法
要使用tesseract将data/img/
文件夹中的所有图像转换为文本并解析生成的文本文件,请运行
make run
Docker
提供了一个包含运行程序所需所有依赖项的Dockerfile
。
要构建镜像,请运行
make docker-build
要在示例文件上运行它,请尝试
make docker-run
默认情况下,运行镜像将执行make run
命令。要使用自己的图像,请运行以下命令:
docker run -v <输入图像路径>:/app/data/img mre0/receipt_parser
历史
这个项目最初是一个黑客马拉松的想法。在trivago技术博客上了解更多信息。 另外还可以阅读HackerNews上的评论。 还有一个关于该项目的演讲。 该库现在可在PyPi上获取。