ダンプリストをOCRで

フリーウェアをいくつか試しましたけど、当時のダンプリストをOCRでテキスト化してもあまりうまく行かなかった。テキスト化しても誤認識が多くて一から手打ちした方が早かったりした。久々にOCR関係の検索をしてみると、読取革命が認識率が高いという話がちらほら。パナソニックの製品で、現在はVer.15らしい。検索した記事ではVer.14が良いという話でしたが、パナソニックのページから最新版の体験版をダウンロードして試してみました。

最新版だと、ダンプリスト部分の認識が縦や横のまばらな認識で、ある程度テキスト化は出来るものの、256バイトの塊としては認識されなかった。Ver.14の体験版を探してきて、それを使ってみると問題なく塊で認識できた。しかも+1 +2とかの行も正確にテキスト化できてましたし、認識率はかなり高めです。難点は、汚れやかすみなどで文字が正常でない場合だけ。8とBの認識ミスも少なかった。1が小文字のLやIとして認識されてしまうのは仕方ないですけど。これを知ってればハッピーブッシュマンも2時間くらいで入力できたかも?って思った。アレの打ち込みは3か月かかったので、今回の認識率には本当に驚いた。
試用期間は10日なので、それまでに大物を入力しておきたいです。旧バージョンの入手も何とか考えないと。