my notebook

先日の Cloud Vision API を使う Python3 編に続いて Spring Boot Kotlin での Cloud Vision API の OCR のコード覚え書きです。

Python で既に書いたコードを Kotlin に移植しました。 Spring Boot は今まで使う機会がなかったのですが、今回使って良いと思ったのは gradlew bootJar するだけで executable な単一の jar ファイルを生成してくれることです。

ただ Python のようにスクリプトファイルひとつで処理できるような小さな処理に Spring Boot を使うのは気が重いですね。

» Read More

Google の Cloud Vision APIの機能のひとつにOCRがありこれを業務で使う機会がありました。実際に使ってみると、対象が印刷物をスキャンした画像データだったなど条件がよかったのだとは思いますがほぼOCR処理として100%に近い形でテキストに変換されました。とはいえ、100%ではないので、そこは人間が一度はすべて確認する必要がありますし、そもそもOCRで読みとったテキストをこちらが使用したい単位に整理する処理については当然OCRの守備範囲外になります。そのため、その部分のコードを書くのが相当に大変でした。

もし人間が目視＆手作業としてテキスト入力すれば、その整理部分も含めて人間が処理することになる。それがアウトソーシングとしてページ単価いくらで予算の範囲で収まるのであれば、どうなんだろう。自分ががんばって書いたコード部分は結局たいした価値があるのだろうか……という微妙な仕事になってしまった。

» Read More