admin: 2010年2月アーカイブ

透明テキストPDF

|

通常、印刷物をスキャナーで取り込むとそれは画像になります。

それをPDFにしても同じく、それは画像でありテキストがあったとしても文字をコピーすることなどはできません。当然検索などでも引っかかりません。あくまで画像ですので

 

いままでもOCRと言って文字画像を読み取ってテキストデータに置き換える機能はありましたが、精度の問題で「木材」が「木木才」になったりと、やはり誤字が多く変換はあまりおすすめできませんでした。

しかし、この透明テキストPDFは、実際見えるのは画像の部分で、それに重ねるように透明のテキストデータが添付されるものです。

見たり印刷したりに一切反映されませんので誤字も全く影響はありません。
尚且つ、テキストデータができますので検索などでひっかかるようになります。

多少誤字もあり、引っかからない事もありますが、あくまで「多少ある」ことを前提で使えば、まぁ良いかなと思います。

あとはOCRの精度がどれだけ上がるかと言う点です。

私が5年前に使おうとした段階では、コピペしてつかうにはまだまだでしたが、今はかなり精度も上がってるようですね。手書きも変換できそうです。

(参考:メディアドライブ http://mediadrive.jp/products/et/


□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□
  パソコンビニ 栃木コールセンタースタッフより

  ■電話番号 0120-854-856 
  ■主な対応地域(全域対応可能)
  宇都宮市、小山市、足利市、大田原市、鹿沼市、佐野市、下野市、栃木市、日光市
  那須塩原市、那須烏山市、益子町、市貝町、芳賀町、真岡市、矢板市
  ■主な作業内容
  インターネット接続設定、トラブル診断、ソフトインストール、周辺機器設定
  ウイルス対策、バックアップ、操作指導、LAN設定、トラブル対応、リカバリー
□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□
(ET12)