【お問い合わせ】 E-mail:nog-tax@grupo.jp |
こんにちは。大阪南船場の「お節介」税理士@野口たかしです。
九州地方は、線状降水帯による豪雨が発生し、大変な被害となっています。
その地域にお住まいの方につきましては、お見舞い申し上げます。
さて、今は物価高と言われています。
買い物は、土日、カミさんとスーパーに行くのですが、確かに食料品の値上がりが目立ちますね。。。
先日、蒸し暑いので、自動販売機で缶のコカ・コーラ(250ml)を購入。110円でした。
で、いつも買い物に行くスーパーで、同じものが売っていたので、値段を見ると49円!
えぇぇ、倍以上値段が違う!!
確かに、自動販売機やコンビニってお手軽なので、ついつい利用してしまいますが、この物価高の時代、買う場所によって、こんなに値段に開きがあるのであれば、できるだけ安いお店をチョイスして購入すべきだなと思った次第。
この「無料DX講座」も同じで、アプリを購入するのが一番楽で安全ですが、WEB上には、無料で非常に便利なツールが公開されています。
それらを使って、業務の効率化ができれば、一番良いのではないでしょうか⁉
さて、今回は、前回からの続編です。
紙で提供されている情報(イメージ)を、OCRでデータ化する方法Part2ということで、スキャンした「表」をエクセルに変換する方法をご紹介したいと思います。
前回、「普通の文章」(罫線を含まない文章)をOCR=データ化する方法として、Google driveをご紹介しました。
では、「表」をGoogle driveで読み込ませるとどうなるか。。。
元のデータ
↓
Google driveで、OCR(ドキュメント化)すると・・・。
↓
う~ん、一応、文字化されていますが、エクセルに貼り付けても、そのまま使えませんよねぇ・・。
前回、WEB上無料で提供されているツールを紹介しました。
https://picwish.com/jp/free-online-ocr-tools.html
このHPには、OCR化するツールが7つ紹介されています。
それぞれのツールを全部試してみました。
ほとんどのツールは、Google driveと同じように、文字化はできるけれど、エクセル化は出来ないものばかりでした。
また、以前紹介した「I Love PDF」(【無料!DX講座①】PDFを何とかしたい!=その1=)でも、OCRのメニューがありますが、文字認識可能な形でのPDF化はしてくれますが、直接ドキュメント化するのは「有料」となっているし、エクセル表に変換してくれるかは不明です。
WEB上で紹介されているOCRツールを全て試した結果、ひとつだけ、エクセル表に変換してくれるツールがありました!
LightPDFです!
↓
操作は簡単です。OCRしたいファイルを画面上にマウスで持って行くか。「ファイルを選択」をクリックして、メニューから選択するだけです。
早速やってみましょう♪
左下に「出力フォーマット」メニューがあるので、「Excel(.xlsx)」を選択して、OCRボタンを押すと、変換が始まり、次の画面に切り替わりますので、「ファイルをダウンロード」ボタンを押します。
では、ダウンロードしたエクセルファイルを表示させてみましょう!
いかがでしょう、若干「誤読」がありますが、十分使えるツールではないでしょうか⁉
※ ただし、このサイトでのOCR変換(無料)は、1日3ファイルまでに制限されています。
もっとキチンとOCRできないのか!
と思われる方もいると思います。
私もいろいろ試してみたところ、少し面倒ですが以下の方法であれば、ほぼ完璧にOCR化=エクセル表に変換してくれることがわかりました。
①「I Love PDF」のメニューから「OCR PDF」を選択して」、スキャンしたデータファイル(保存形式をPDFにしておくと楽です)を、文字認識可能なPDFファイルに変換します。
②「LightPDF」のメニューから「PDFをエクセルに変換」を選択して、①で生成したPDFファイルを読み込み、エクセルに変換する。
この場合、以下のような画面になるので、「OCR (スキャンしたPDFを編集可能なExcelファイルに変換)」を選択します。
↓
今回は、私の研究成果!?を発表した次第。
やはり、イメージデータの「表」をエクセル化するツールは限られていますね。
それだけに、今回紹介したツールは、貴重だと思っています。
このツールは、1日に3回しか変換できない制限があり、今回のブログ更新でもアッパーとなり、これ以上の変換画像はアップできませんでした。
もっと要領よく事前に画像を保存しておけばよかったのですが・・。m(__)m
まだまだ無料で使えるツールは存在してますので、当分、この「無料DX講座」を続けていきたいと思ってます。
さて、次は何を紹介しようかな。。。