日本語OCRをつかう

PowerAutomate Desktopには英語、ドイツ語、スペイン語、フランス語、イタリア語のOCRエンジンがはじめから含まれている。日本語は含まれていないので日本語の文章のOCRを実行するためには追加の対応が必要となる。Tesseract OCRを導入することがひとつの方法だ。そのためにはTesseract OCRをPCにインストールする必要がある。無料です。インストール方法等については別のサイトに詳しくあるので省略してPower Automate Desktop上の設定内容のみご紹介。

アクション「OCRを使ってテキストを抽出」にて以下のように設定する。言語データ パスは標準的にインストールするとおそらくこのパスになると思われる。Enjoy!

 

・他の言語を使う:(オンにする)

言語コード:jpn

・言語データ パス:C:\Program Files\Tesseract-OCR\tessdata

f:id:yujihb:20211021011652j:plain