« 県立図書館に行ってみる。 | Main | またまた全州 »

OCRソフトを試す。

ここのところ雑誌スキャンやってて、まあこれはこれでCD-RかDVD-Rにでも保存しておけば良いんだけど、これをなんか有効利用したいなあ、と思ったときにふと思ったのが文字認識。

昔ためしたときは、活字をスキャンしたやつでも、ページごとに何文字もミスが出て使い物にならなかった。今ならそれなりにうまくいくんじゃないか?と思ってまたためしてみることに。

まず、一太郎との連携が出来る「一発OCR Pro」をためしてみる。試してみる、との言葉通り、とりあえず体験版をダウンロードして。

やっぱり、あまり認識精度が良くない。ふりがなのふっている文字をふりがなごと一つの漢字として認識してしまうのが厳しい。まあ、これは字を見ながら再認識かけることが出来るのだけど、その結果が次に続かないのがなかなか。ただ、操作性はそこそこ良かった。でもまあ認識精度がないとだめだな。

次に、ずいぶん前に買っては見たものの、PDF作成能力がどうかな、と思って結局使わなかった「やさしくPDF OCR pdffactory附属版」。
これはなかなか認識する。ふりがなは時々1つの文章として認識してしまうものの、漢字と一緒になってしまうことがないのは良い感じ。ただ、文章が短いときなど、ブロックの順番を認識してくれないことがあった。あと、記号に弱い。三点リーダーの連続を認識してくれないのは困った。あと、ファイルが100ページ以上になるとときどき動作が不安定になる。

最後に、ずいぶん前にダウンロードして以来使ってもみなかった「Smart OCR」。これはこれで素早くて、けっこう正確な認識をしてくれる。ただ、ちょっとばかし設定がめんどうくさい。あと、ページの一括読み込みをどうやってやるのか結局わからなかった。そもそもSmart OCRは開発をやめてしまっているのでどうしようもない、というのも難点だ。

まだまだ、OCRをどうにか使おうと思うといろいろ壁にぶつかってしまう。ひところよりは良いけど、まだまだかなあ。

|

« 県立図書館に行ってみる。 | Main | またまた全州 »

Comments

Post a comment



(Not displayed with comment.)




TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/41298/10688961

Listed below are links to weblogs that reference OCRソフトを試す。 :

« 県立図書館に行ってみる。 | Main | またまた全州 »