Fujitsu The Possibilities are Infinite

元のページへ戻る

ScanSnapを支える先端テクノロジー


第3回:「高付加価値な」PDF生成技術 (Windows®専用モデル)

ScanSnapを支える先端テクノロジー特集として、第3回目は「高付加価値な」PDF生成技術をご紹介します。

(1) ScanSnap で「高付加価値な」PDFを生成

ScanSnapは、第2回で紹介した「ワンプッシュ操作」で簡単にPDFファイルを生成する技術を搭載しています。ScanSnapは、更に「OCR技術」を搭載することにより、「活用・用途を広げることができる高付加価値な」PDFを生成できます。この「高付加価値な」PDFは、以下の技術で構成されます。

(A) 保存されているPDFを簡単に「検索」する「検索可能なPDF生成技術」

(B) メール添付など「軽快な操作」を可能にする「高圧縮技術」

(C) 原稿の内容を「再利用」する「Microsoft® Word/Excelデータへの変換技術」

ScanSnapは、単なる原稿を読み取り保存するだけでなく、オフィスでの利用までを「シンプルで」「簡単に」行うことができます。



(2) ScanSnapの活用を広げる高付加価値なPDF生成を支えるOCR技術

業界トップクラスの認識精度を実現するOCR技術


ScanSnapの「OCR技術」は、富士通・富士通研究所が開発した、業界トップクラスの高精度文書検索を可能とするカラー文書認識技術を搭載しています。従来の技術では困難だったカラー背景の中の文字を高精度に認識を可能にしております。原稿から文字、表、図領域を正確に抽出するレイアウト解析技術を強化しています。この技術により、文字領域を確実に識別し認識率を向上させることができ、保存されているPDFファイルの中から必要なファイルをキーワードで簡単に検索することが可能となります。

文字領域、絵柄領域、図表領域を正確に抽出し、カラー背景の中の文字を高精度に認識します。


(3) 高付加価値なPDFでオフィスの活用・用途を広げる技術

(A) 検索:保存されているPDFを簡単に検索する「検索可能なPDF生成技術」


ScanSnapは、「ワンプッシュ操作」で簡単に検索可能なPDFを生成する機能を搭載しています。更にパソコンの空き時間を監視し、その空き時間にOCR処理する技術(バックグランド処理)も搭載しております。
ScanSnapでは、キーワード指定による全文検索の精度が向上し、利用したいファイルを素早く検索することが可能となります。


検索可能なPDFファイルへ自動変換する機能で、さまざまな用途で活用できます。


(B) 軽快な操作:メール添付など軽快な操作を可能にする「高圧縮技術」


ScanSnapは、生成するPDFファイルの文字品質を維持したまま、ファイルサイズを従来の1/2~1/5に低減する「高圧縮技術」を搭載しています。この技術は、原稿に記載されている情報から「画像情報」と「文字情報」を自動的に分類し、画像情報と文字情報のそれぞれに最適な圧縮方法を採用しています。単純なJPEG圧縮に比べ、1/2~1/5に低減することができます。
ScanSnapでは、コンパクトなファイルサイズのPDFをE-mailで送信できます。また、サーバやメディアへも多くのファイルが保存できるようになります。

(ご参考:高圧縮技術の処理性能および画像品質の関係について)


文字ベースの原稿を読み取ると、文字がきれいなままファイルサイズを小さくすることができます。


(C) 再利用:原稿の内容を「再利用」する「Microsoft® Word/Excel文書への変換技術」


ScanSnapは、日本語を含め多国語に対応したWord文書又はExcel 文書への変換技術を実現しました。特に、低解像度な画像でも認識精度を落とさない技術を搭載しております。日本語の場合は、高いレイアウト解析・認識精度を持つ富士通OCR 技術を活用し、英語など多国語はABBYY 社のOCR技術を活用しています。
ScanSnapでは、この技術を使って、PDFファイルからWord文書、Excel文書への変換において、レイアウトの再現性が高く、テキストや表形式をそのまま再現することができます。入力する手間を省き、データの活用が簡単にできるようになります。


クイックメニューでWord文書やExcel文書に即変換することができます。


簡単に上手に名刺整理・管理する「名刺ファイリングOCR技術」


ScanSnapでは、名刺の整理・管理ソフト「名刺ファイリングOCR」を同梱しております。これは、ScanSnapで読み取った画像データから「氏名」「住所」「郵便番号」「電話番号」などを自動的にレイアウト解析し、文字認識技術で住所録データを生成します。更に、郵便番号や電話番号から住所や会社名を検索するデータベース技術を搭載しております。

ScanSnapは、大量の名刺を効率よく電子化して、簡単に上手に名刺データの整理・管理を行うことができます。加えて、名刺検索や宛名の印刷が可能なほか、メールソフト、PIMソフト、筆ソフトなどのさまざまなソフトと連携したり、インターネットと接続することで会社情報、株価情報、地図情報、天気情報を検索したりと、今まで以上に簡単に名刺を活用することができます。


名刺ファイリングOCRは、名刺をスキャナから読み取ってイメージデータ化し、文字を認識して名刺データベースで管理します。



(ご参考)高圧縮技術の処理性能および画像品質の関係

高圧縮技術は、画像品質や文字認識と読み取り時間にトレードオフ関係があります。圧縮率を上げると画像品質や文字認識が低下します。ScanSnapでは、原稿の読み取り直しの手間とPDFを活用するための品質と処理性能を決定しております。

圧縮率:3 自動でスキャンした例

通常の読み取り(容量:1,228KB)
圧縮率:3 (標準)
カラーモード:自動
<読み取り時間:約4秒>

圧縮率:3 カラー高圧縮でスキャンした例

ScanSnapの高圧縮(容量:229KB)
圧縮率:3 (標準)
カラーモード:カラー高圧縮
<読み取り時間:約20秒>

圧縮率:5 カラー高圧縮でスキャンした例

圧縮率を上げた場合 (容量:60KB)
圧縮率:5
カラーモード:カラー高圧縮
<読み取り時間:約5秒>


※本データは当社比較評価結果です。


以上のように、当社は、今後も、お客様と共に「ScanSnap」で読み取ったPDFをオフィスで活用する技術を進化させ続け、「より簡単で」「より安心」していただける技術と製品を提供していきます。



以下のアンケートにご協力をお願いいたします。
「ScanSnapを支える先端テクノロジー」は、役に立ちましたか?

はい  いいえ  どちらでもない