なぜ私が銀行明細変換を作成したのか
Posted on by Angus Cheng
私は香港で[Dragon King Creation Limited]と呼ばれる合同会社を持っています。(https://dragonkingcreation.com/). この会社には従業員はいません。私自身がディレクターであり、100%会社を保有しています。2015年にアンドロイドやiPhoneのアプリ販売の収益を管理する為にこの会社を立ち上げました。会社自体の収益はそんなにありませんが、正式な会社です。香港では毎年、合同会社は監査を通らなければいけません。この監査時に会計士から銀行明細、クレジットカード明細などの様々なファイルに関する質問が沢山来ます。
私は銀行口座2つとクレジットカード1つ保持しています。銀行口座とクレジットカードはHSBCですが、HSBCはエクセルやCSVを作成していません。PDFの銀行明細とPDFのクレジットカード明細しかありません。なので毎年2月に、オンラインバンキング口座へいき、24の銀行明細と12のクレジットカード明細をダウンロードする必要があります。そして、それを私の会計士へメールし、私の生活を続けるのです。今年は会計士へファイルを送ったら、エクセルと全ての取引情報が送られてきました。私は彼に「どうやってPDFからエクセルへ取り込んだのか?」と聞きました。
「コピー、貼り付けでデータをエクセルへ入れた」
それを聞いた私は、彼はこの仕事を全てのクライアントに行っているのか、お客様の中には一か月取引が何千件以上あると思いますし、十個以上の口座を持っている方もいる事でしょう。会計士の友達数名に同じ事をしているのか話しをしてみました。「マニュアルでデータをエクセルへ入れている」彼らは同時にPDFからエクセルへ変換するソフトを使った事もあるが、うまくいかず、ファイル処理に数分掛かると言っていました。私は「多分他の人たちも同じ問題を抱えている事だろう。銀行明細から重要な情報だけを自動で抽出してエクセルへ変換できるものを作れないかな?」と思いました。
4つの銀行明細、クレジットカード明細を取得する事ができました:
- HSBC 個人口座
- HSBC クレジットカード
- HSBC 商用口座
- Westpac 個人口座
PDFの銀行明細データは下記の様な感じです:
この様なデータへ変換したいのです
そんなに難しい事では無さそうですが、PDFの取引表の処理が難しそうです。それと、取引表の下の処理も難しそうです。加え"取引詳細"ですが、取引内容は1つなのに、コラムの行が分かれてしまっています。行を併合する場合としなくても良い場合の認識は簡単な事ではないのです。
将来的に詳細情報をおしえますが、この投稿では私がどの様にPDFの銀行明細をエクセルファイルへ変換作業を行ったのかのお話しをします。