HOMEリテラシー日記 >OCRの文字認識

OCRの文字認識

    現在使っているOCRソフトに,エー・アイ・ソフト(株)の“読んde!!ココ Ver.4”が加わったので,OCRソフトについて書きます。
 
これまで使ってきたOCRソフトに比べ新しいこともありますが,“読んde!!ココ Ver.4”の文字認識率は高く,おそらく現時点で最高と思われます。また画像の傾き補正機能もあり,マウスの右クリックに様々な機能が割り当てられている点も同様に便利です。私の場合,試験問題の図表もスキャナで取り込みますが,従来はどうしても図表が傾いてしまい,1度単位で回転させても補正できず,かえって画像が不鮮明になった経験があります。そのため傾き補正機能は,文字認識以外に重宝しています。またスキャナは3台使ってきましたが,現在メインで使っているスキャナ(セイコーエプソン製)のOCR用補正機能(白地以外の背景に印字された文字を読み取りやすくする機能など)に対応しているので,読み込んだ画像が鮮明です。
 
しかし,いくら認識率が向上しても認識後の文章のチェックは欠かせず,誤認識している箇所を詳細に探す必要はあります。OCRソフトによって誤認識しやすい特定の文字があり(変換する文書の字体や印字状況も影響していますが),それを把握するのがOCRソフトの使いこなしのノウハウの一つです。メーカでもその点が分かっているようで,例えば“読んde!!ココ Ver.4”では,誤認識しやすい文字を登録する機能を用意しています。
 
昔のOCRソフトでは,文書中の表の前後にある文字の認識がおかしくなりやすいという特徴がありました。また,アイウエオの「エ」と工業の「工」,カタカナの「タ」と漢字の「夕」,ひらがなの「べ」とカタカナの「ベ」,数字の「1」と英小文字の「l」,などが誤認識しやすく,チェックで注意を払うところでした。また化学の「化」を「イヒ」と誤認識しやすいOCRソフトもあり,旭化成(株)の広告はこの誤認識からヒントを得たものかとも思います。
 
それにしても,OCRソフトの認識率の向上には感心します。上記のOCRソフトでは,文字認識後に言語処理技術を応用した修正を加えているそうで,文脈解析技術がすすむにつれ,認識率はさらに高まることと思います。しかし,現状でも十分実用に足るとこまできていると思います。
 
イメージスキャナの性能ですが,画像の解像度が200〜400dpiの範囲内であれば,OCRソフトが自動的に対応し,それ以外の解像度では手動で指定するようになっています。600dpiやそれ以上の解像度で画像を読み込み,手動で指定しても認識に差はなく,画像が大きすぎて読み込めなくなるばかりです。従って,OCRソフトに見合ったイメージスキャナの光学解像度は,400dpiが事実上の上限となります。またソフトウェア補正機能がある最近のスキャナであれば,300dpiでも十分な認識結果が得られます。(1998.7)
 
 
今月のお買得商品
 

 
メニューに戻る