ABBY FineReader 15で複数PDFにまとめてOCRをかけるには

ABBY FineReader 15で複数PDFにまとめてOCRをかける方法です。「一つずつファイルを開いてOCRをかける」手間を省くことができます。超快適です。

なお、ABBY FineReader は最新版ではありません。最新版を持っていないので、最新版でこれができるかどうかはわかりませんのでご注意ください。(最新版でできた、という人がいたら教えてください。

まず、ABBY FIneReader 15 OCRエディタを開いてください。それから、メニューバーから「ツール」⇒「自動化ツール」を選んでください。 そうすると、自動化ツールの「タスク設定」ダイアログが表示されます。

ここで「新規」を選択すると、新しい自動化処理の作成ができるようになります。

今回やりたいことは、OCRに関わる一連の操作です。そこで、それらを一通り設定していくのですが、特に重要なのは、 「OCR対象のPDFが入ったフォルダの指定」と「OCR後ファイルの出力先」です。

というわけで、まずは「タスク設定」の左側の「タスクの手順」のリストの中から「新規OCRプロジェクトを作成する」を選択します。

次に、「画像またはPDFを開く」を選びます。

次に「このフォルダの画像またはPDFファイルを処理します」を選んで、「参照」ボタンをクリックして、PDFの入ったフォルダを選択します。

次に「タスクの手順」以下から「分析」をクリックします。この設定はとりあえず自動的に分析する、を選んでおけばよいかと思います。

次に「タスクの手順」以下から「OCR」をクリックします。これはデフォルトで大丈夫かと思います。

次に「タスクの手順」以下から「保存/送信」をクリックして、表示されたサブメニューから「ドキュメントを保存する」を選択します。 そして、「保存形式の種類」のところは「検索可能PDFドキュメント」を選びます。

次に、「ファイルの命名」以下で、「指定した名前で指定した場所に保存する」を選択して 出力フォルダを指定し、「タイムスタンプ付きのサブフォルダを作成する」にチェックを入れて、 「ファイルオプション」で「各入力ファイルを個別に作成する」を選んでください。それが終わったら「完了」ボタンをクリックしてください。

そうしたら、今作成したタスクを選択して「実行」をクリックします。

それから、16GBメモリのPCで処理した際の体感では、フォルダ内のPDFの容量の総量が合計で2GBを超えると動作がかなり厳しくなるという印象です。ですので、私は、2GB以内に小分けして作業しております。

作業が開始されると以下のような進捗表示が出ます。「○○ページ中××ページを分析しました」というメッセージの○○と××の両方が着々と増えていきます。この数字の読み方がよくわかっておらずこの処理をするたびに不安になっているのですが、まあとにかく、待っていれば終わります。

なお、これは、マニュアルをよく読んで、インターフェイスをよく見ればできることなのですが、この機能は半年~1年に一度くらいしか触らないために、時間が経つと忘れてしまって一から確認することになってしまうので、その無駄を避けるために、備忘録としてメモしているということです。図書館等でのアクセシビリティ対応がらみでこういう仕事をする人が増えているらしいということもあり、もしかしてお役に立つかもしれないと思ってブログ記事にしました。何か特別なことをしているわけではないので、ご了承ください。