将扫描的银行对账单转换为Excel

几周前,我收到一封来自澳大利亚用户的电子邮件,上面写着“我上传了一份银行对账单,但什么也没发生,我怎样才能看到转换后的文件?”我看了看我的 Grafana 仪表板,发现这个用户上传了一个基于图像的PDF,可能是一个扫描的银行对账单。我已经回复了相当多的用户,告诉他们扫描的文档不适用。我从我的已发送文件夹中捞出一条回复,并将其发给了这个用户。

演示

他们指出了一个很好的问题,我们的网站宣传我们能将 PDF 形式的银行对账单转换为 excel 文件,而她上传的正是一个PDF 形式的银行对账单。我给他们发送了一条补充信息,解释了扫描和非扫描 PDF 之间的不同。

发送完毕后我出去跑步去了。跑到一半时,天开始下大雨,我在天桥下等待雨停。在等待的时候,我收到了用户的回复,告诉我他们因为扫描的文件不能转换而快要“崩溃了”。

演示

这时我注意到这个用户的电子邮件签名上有一个电话号码,所以我想“嗯,我一直在考虑使用 OCR 技术(光学字符识别软件)来处理基于图像的PDF,为什么不打电话给这位用户,看看他们是否可以等一两个星期让我写出这一功能”。所以我打了她的电话号码,她在澳大利亚,我在香港,电话费对我来说略微有点贵。

“……你好。”她迟疑地接起了电话

“嗨,我是 Angus,我们之前一直在邮件往来,讨论关于银行对账单网站的事”

“你从哪里打来的电话”

“香港”

“哦,好吧”

我们接着探讨了她的当前遇到的情况,她有很多客户给她发送纸质报表,如果她需要手动完成这些报表将花费她很长时间。

“我想我可以处理它们,但我需要两周时间来准备一些东西。你能等那么久吗?“

“是的是的是的!”

我们进一步聊了聊新冠和澳大利亚,我挂断了电话跑步去了。在接下来的一周里,我玩了玩 OCR 软件,写了一些基本的代码让她试用。我给她发邮件,她试了一下,但有趣的是她居然上传了一份基于文本的 PDF 文件!

演示

我们聊了大约11分钟,电话费大概是11*7.2=80美元。但这是值得的,我想能够和更多的用户在电话上聊聊。

Join The Mailing List