yohnishi's blog (韓国語 映画他)

アクセスカウンタ

zoom RSS 韓国語対応透明テキスト付きPDF作成可能なOCRソフト

<<   作成日時 : 2008/03/15 14:56   >>

面白い ブログ気持玉 1 / トラックバック 0 / コメント 1

 紙の文書の保管は結構面倒。なので日本語の文書(新聞の切り抜きなど)はOCRソフトを通し透明テキスト付きPDF化を行って保存してる。単にOCRソフトを通すだけでは誤認識が発生するのでいちいち修正するのが面倒。透明テキスト付きPDFだと誤認識があっても元の画像も保存されるので見れば分かるのでいちいち修正しなくてもいいのである。

 それと同様に韓国語の紙の文書も透明テキスト付きPDFが作れるOCRソフトはないかと2,3年前に探してみたが、これがなかなか見つからなかった。単に韓国語を認識できるOCRソフトはいくつかある。またOCRで認識した結果を単にPDFに落とすことができるソフトもある。まぁOCRで認識した結果を仮想プリンタドライバ型PDF作成ソフトを使ってPDFに落とすことは誰だってできるわけだが。しかし韓国語で書かれた紙媒体を透明テキスト付きPDFに落とせるOCRソフトはなかなかない。
 e.Typist(Ver11)が多数の言語が認識可能で透明テキスト付きPDFも作成するとあったので、購入してみたが、なんと韓国語と中国語は透明テキスト付きPDFは作成できない(認識結果を通常のPDFに落とすことはできる)。韓国のサイトなども探してみたが、当時、透明テキスト付きPDFがつくれるOCRソフトは見つからなかった。韓国ではそもそも透明テキスト付きPDFの便利さが認識されていないのか、...と思った次第。
 当時唯一探し当てたのがI.R.I.Sという欧州メーカーが開発したリードリスプロ(Readiris Pro)というOCRソフト。これは多くの言語に対応し韓国語も透明テキストに落とせる。試用版も試してみたが申し分ない結果だった。しかしかなり高価なのである。
参考URL http://www.irislink.com/

 最近探してみると、Acrobat 8でも韓国語に対応しているのは分かったが、いかんせん高い。それ以外にクロスランゲージから2006年の秋に読取ワールドマルチランゲージ版というのが出ているということが分かった。
http://www.crosslanguage.co.jp/products/ocrv2/

 韓国語の対応についてメールで問い合わせると、透明テキスト付きPDFの場合は、韓国語の認識を指定すると日本語は文字化けするようだが対応は可能ということだったが、とりあえず購入してみるつもり。とくに他社OCRソフトを持っていれば乗り換え版で5000円前後で買えるようだ。
 ソフトウェアがきたらまた使用感などをアップしてみたいと思う。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ
気持玉数 : 1
面白い

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(1件)

内 容 ニックネーム/日時
自己コメントですが、まとめの記事を以下に載せています。
http://yohnishi.at.webry.info/200803/article_13.html
yohnishi
2008/03/23 17:12

コメントする help

ニックネーム
URL(任意)
本 文
韓国語対応透明テキスト付きPDF作成可能なOCRソフト yohnishi's blog (韓国語 映画他)/BIGLOBEウェブリブログ
文字サイズ:       閉じる