日本語OCRをつかう
PowerAutomate Desktopには英語、ドイツ語、スペイン語、フランス語、イタリア語のOCRエンジンがはじめから含まれている。日本語は含まれていないので日本語の文章のOCRを実行するためには追加の対応が必要となる。Tesseract OCRを導入することがひとつの方法だ。そのためにはTesseract OCRをPCにインストールする必要がある。無料です。インストール方法等については別のサイトに詳しくあるので省略してPower Automate Desktop上の設定内容のみご紹介。
アクション「OCRを使ってテキストを抽出」にて以下のように設定する。言語データ パスは標準的にインストールするとおそらくこのパスになると思われる。Enjoy!
・他の言語を使う:(オンにする)
・言語コード:jpn
・言語データ パス:C:\Program Files\Tesseract-OCR\tessdata