PR

PDFから画像/写真/図を抜き出し(画像抽出)

Windows

2016.06.232024.12.26

PDFから画像を取り出す

PDFファイルに含まれている画像を取り出すにはどうしたらいいでしょうか。

目次

自炊PDFからスキャンした画像を取り出したい
PDFから画像へ「変換」ではダメ
1. PDFから変換された画像は劣化している
PDFから画像を「抽出」する

自炊PDFからスキャンした画像を取り出したい

電子書籍の自炊を初めた当初はPDF形式で自炊していました。

PDFであればパソコンでもタブレットでも読めて便利だろうと思ったからです。

しかし、実際にはPerfect Viewerなどの自炊本ビューワーではPDFよりCBZのほうが扱いやすいことに気がつきました(一応、Perfect ViewerではプラグインでPDFも扱えますが)。

Perfect Viewer

商品レビュー・口コミを見る

そこでPDFファイルから画像ファイルを取り出そうとしたわけです。

電子書籍リーダーで自炊本を読む

電子書籍の自炊とは紙の本を裁断してスキャンし、電子書籍にすることです。自炊した電子書籍は「自炊本」と呼ばれます。本を裁断する紙の本を電子書籍にするためにはすべてのページを切り取る裁断という作業が必要になります。本をバラバラにするのはちょっと...

PDFから画像へ「変換」ではダメ

PDFファイルの「ページ」を画像に「変換」する方法はいろいろ存在します。

しかし、PDFの各ページを画像に「変換」してみると、変換された画像ファイルの解像度がスキャン時に設定した解像度と違っていることに気が付きました。

自炊したPDFの各ページはスキャナーが出力した画像そのままのはずです。

それなのになぜ、スキャナーが出力した画像と違うものになるのでしょうか？？？

PDFから変換された画像は劣化している

よくよく考えてみるとPDFから画像への「変換」では自炊PDFのような全ページが画像で構成されるPDFだけでなく、文字で構成されたPDFからも画像ファイルが得られます。

なぜかというとPDF中の文字を「一定の解像度で描画」した結果を画像にしているから……

たとえ自炊PDFのような画像だけで構成されたPDFであっても「一定の解像度で描画」した結果が画像ファイルになります。

ページ内の画像を一定の解像度で描画するためには少なくとも拡大縮小の処理は必須なうえ、色の調整等もされているかもしれません。

これではページ内の画像がそのまま得られるわけはなく、変換された画像は描画の過程で劣化しています。

せっかく苦労して自炊した本をこんな方法で劣化させてはダメです。

PDFから画像を「抽出」する

必要なのは自炊PDFを画像に「変換」することではなく、自炊PDFの各ページに格納されている画像を「抽出」することでした。

PDFの開発元であるAdobe純正のAcrobat Proを使えばPDFから画像を抽出できます。

ただ、Acrobat ProはCreative Cloudと呼ばれるサブスリクプション(継続して利用料金を支払うアプリ)です。

【旧製品】Adobe Acrobat 9 Pro 日本語版通常版 Windows版

商品レビュー・口コミを見る

サブスクリプションに抵抗があれば、「いきなりPDF」の抽出機能を使うとPDFファイル内の画像データを一括で抽出できます。

ソースネクスト | いきなりPDF Ver.12 COMPLETE 　(最新版) | PDF作成・編集・変換ソフト | Windows対応

ソースネクスト | いきなりPDF Ver.12 COMPLETE 　(最新版) | PDF作成・編集・変換ソフト | Windows対応

商品レビュー・口コミを見る

いきなりPDFを起動し、スタートパネルの「抽出」をクリックします。いきなりPDF スタートパネル

「対象ファイル選択」画面で画像を抽出するPDFファイルを選択します。

「処理中」画面に画像抽出の進捗状況が表示されます。

画像ファイルが保存されたフォルダが開きます。

拡張子TXTのファイルはPDF中のテキストデータです。

拡張子PNGが抽出された画像ファイルです。

ソースネクスト | いきなりPDF Ver.12 COMPLETE 　(最新版) | PDF作成・編集・変換ソフト | Windows対応

ソースネクスト | いきなりPDF Ver.12 COMPLETE 　(最新版) | PDF作成・編集・変換ソフト | Windows対応

商品レビュー・口コミを見る

コメント