本日 18 人 - 昨日 147 人 - 累計 112306 人

【無料!DX講座⑨】スキャンした「表」のイメージデータをOCRしたい!ー2

こんにちは。大阪南船場の「お節介」税理士@野口たかしです。


九州地方は、線状降水帯による豪雨が発生し、大変な被害となっています。

その地域にお住まいの方につきましては、お見舞い申し上げます。


さて、今は物価高と言われています。

買い物は、土日、カミさんとスーパーに行くのですが、確かに食料品の値上がりが目立ちますね。。。


先日、蒸し暑いので、自動販売機で缶のコカ・コーラ(250ml)を購入。110円でした。

で、いつも買い物に行くスーパーで、同じものが売っていたので、値段を見ると49円!

えぇぇ、倍以上値段が違う!!


確かに、自動販売機やコンビニってお手軽なので、ついつい利用してしまいますが、この物価高の時代、買う場所によって、こんなに値段に開きがあるのであれば、できるだけ安いお店をチョイスして購入すべきだなと思った次第。


この「無料DX講座」も同じで、アプリを購入するのが一番楽で安全ですが、WEB上には、無料で非常に便利なツールが公開されています。

それらを使って、業務の効率化ができれば、一番良いのではないでしょうか⁉


さて、今回は、前回からの続編です。

紙で提供されている情報(イメージ)を、OCRでデータ化する方法Part2ということで、スキャンした「表」をエクセルに変換する方法をご紹介したいと思います。



「表」をGoogle driveでOCRすると・・


前回、「普通の文章」(罫線を含まない文章)をOCR=データ化する方法として、Google driveをご紹介しました。

では、「表」をGoogle driveで読み込ませるとどうなるか。。。


元のデータ

画像_2023-07-11_092337583


Google driveで、OCR(ドキュメント化)すると・・・。

画像_2023-07-11_092612705



う~ん、一応、文字化されていますが、エクセルに貼り付けても、そのまま使えませんよねぇ・・。



いろんなOCRツールを試してみた


前回、WEB上無料で提供されているツールを紹介しました。

画像_2023-07-07_090548035

https://picwish.com/jp/free-online-ocr-tools.html


このHPには、OCR化するツールが7つ紹介されています。

それぞれのツールを全部試してみました。

ほとんどのツールは、Google driveと同じように、文字化はできるけれど、エクセル化は出来ないものばかりでした。


また、以前紹介した「I Love PDF」(【無料!DX講座①】PDFを何とかしたい!=その1=)でも、OCRのメニューがありますが、文字認識可能な形でのPDF化はしてくれますが、直接ドキュメント化するのは「有料」となっているし、エクセル表に変換してくれるかは不明です。



直接エクセル表に変換してくれるツールは、これだ!


WEB上で紹介されているOCRツールを全て試した結果、ひとつだけ、エクセル表に変換してくれるツールがありました!


LightPDFです!

画像_2023-07-11_095004899


操作は簡単です。OCRしたいファイルを画面上にマウスで持って行くか。「ファイルを選択」をクリックして、メニューから選択するだけです。


早速やってみましょう♪

画像


左下に「出力フォーマット」メニューがあるので、「Excel(.xlsx)」を選択して、OCRボタンを押すと、変換が始まり、次の画面に切り替わりますので、「ファイルをダウンロード」ボタンを押します。

画像_2023-07-11_095737297



では、ダウンロードしたエクセルファイルを表示させてみましょう!

画像


いかがでしょう、若干「誤読」がありますが、十分使えるツールではないでしょうか⁉

※ ただし、このサイトでのOCR変換(無料)は、1日3ファイルまでに制限されています。



【おまけ】もっと精度を上げてOCRするには!?


もっとキチンとOCRできないのか!

と思われる方もいると思います。


私もいろいろ試してみたところ、少し面倒ですが以下の方法であれば、ほぼ完璧にOCR化=エクセル表に変換してくれることがわかりました。


①「I Love PDF」のメニューから「OCR PDF」を選択して」、スキャンしたデータファイル(保存形式をPDFにしておくと楽です)を、文字認識可能なPDFファイルに変換します。

②「LightPDF」のメニューから「PDFをエクセルに変換」を選択して、①で生成したPDFファイルを読み込み、エクセルに変換する。

この場合、以下のような画面になるので、「OCR (スキャンしたPDFを編集可能なExcelファイルに変換)」を選択します。

画像_2023-07-11_101334215



編集後記


今回は、私の研究成果!?を発表した次第。

やはり、イメージデータの「表」をエクセル化するツールは限られていますね。

それだけに、今回紹介したツールは、貴重だと思っています。


このツールは、1日に3回しか変換できない制限があり、今回のブログ更新でもアッパーとなり、これ以上の変換画像はアップできませんでした。

もっと要領よく事前に画像を保存しておけばよかったのですが・・。m(__)m


まだまだ無料で使えるツールは存在してますので、当分、この「無料DX講座」を続けていきたいと思ってます。

さて、次は何を紹介しようかな。。。