[最終更新] 2017年12月25日

表題どおり。Macでpdfファイルから画像のみを抽出する手段について。検索するとなんだか怪しげなのがよく出てきて微妙に困ったので。コマンドラインでやります。
やり方
Homebrewでpopplerをインストールする。
brew install poppler
下記コマンドを実行すると、test.pdfにある画像が、testなんとか、というファイル名で画像ファイルのみ抽出される。形式はPBM(白黒)またはPPM(カラー)。
pdfimages test.pdf test
オプションとして-jをつけると、jpgに変換できるやつはjpgで出力してくれる。具体的には、JPEGで用いられる圧縮アルゴリズムDCT(Discrete Cosine Transform, 離散コサイン変換)が使われていれば、ということらしいのだが、やってみるとjpgになるファイルは多くはなかった。
pbm,ppmだと取り回しが不便なので、jpgに変換してやると使いやすい。imagemagickのconvertコマンドで。
convert *.ppm output.jpg
output-1,output-2,…という感じでファイルが出力される。
以上。
参考記事「Extracting images from a PDF」
なお、上記記事ではxpdfをインストールしている。xpdfでもできる。が、xpdfをベースに拡張したpopplerなるライブラリがあり、調べているとそちらを使うことが多いようなので、ここではそれを使った(「Poppler」)。
関連記事
Mac の記事
- [2018年3月11日] Mac mini 2018は本当に出るのかなぁ…
- [2018年3月5日] Macのターミナルでコピペ(pbcopy,pbpaste)
- [2017年12月25日] PDFから文章を抽出する
- [2017年12月18日] 見開きPDFを分割して1ページ単位のPDFにする
- [2017年12月17日] youtube-dlで音声だけ抽出
- ---本記事---
- [2017年11月28日] MacとWindowsのGoogle ドライブによる共有、また濁点でハマる
- [2017年11月17日] Mac mini 2012をEl CapitanからHigh Sierraに憂鬱なアップグレード
- [2017年11月13日] High SierraでiTunesのLocalizable.stringsをmv(リネーム)しようとしてoperation not permittedと怒られた場合の対応
- [2017年10月1日] Mac miniは五度目の夏も乗り切った
- [2017年8月28日] MacBook Pro 13インチ4コア化の可能性はあるのだろうか
スポンサーリンク