#author("2020-10-03T07:41:40+00:00","","") #topicpath ////////////////////////////////////////////////////////////////////////////// * 目次 [#a5a690c4] #contents ////////////////////////////////////////////////////////////////////////////// * Viewer [#dfa32e18] //============================================================================ ** evince [#c1a91c9d] - debian5.0でデスクトップ環境を導入すると、デフォルトで入っている。 - 起動 $ evince <pdf-file> [RETURN] //============================================================================ ** xpdf [#oaeb0d7b] - Debian5.0ではオプション扱い(?) - Install # aptitude install xpdf - 起動 $ xpdf <pdf-file> [RETURN] //============================================================================ ** Adbe Reader (Linux版) [#l322c046] - Adobe社が配布している。 -- [[ダウンロードページ>http://get.adobe.com/jp/reader/otherversions/]] - 完全なfree-softではないので、Debianでは公式パッケージに含めていない - そうはいうものの、上の2つでは正しく見られないファイルもチラホラあるので、結局これを入れておいた方がいい。 - Install # dpkg -i AdbeRdr9.1.0-1_i386linux_jpn.deb -- Intel32bit CPUで、 amd64アーキテクチャがインストールされたシステムでは、そのままではインストール出来ない。よって以下のようにする: # dpkg --force-architecture -i AdobeRdr9.1.0-1_i386linux_jpn.deb -- そのままではライブラリが不足して起動出来ない。そのため、以下を別途インストールする必要がある: ia32-libs ia32-libs-gtk - 起動 $ acroread <pdf-file> [RETURN] ////////////////////////////////////////////////////////////////////////////// * Editor [#editor] //============================================================================ ** 画像ファイルを pdf にする [#zc9684b2] - 1つまたはそれ以上の画像ファイルを、1つの pdf に出力する $ convert <in-file1> [in-file2]... <out-file> - 複数の画像ファイルを、其々1つの pdf に出力する $ mogrify -format <type> <in-file1> [in-file2]... ////////////////////////////////////////////////////////////////////////////// * PDF から画像を抽出する [#x8763607] //============================================================================ ** convert [#le91167c] - convert コマンドは、ImageMagik に含まれるコマンドの一つで、画像の変換などを行うことも出来る。 - コマンド書式 $ convert [option] <input-pdf-file> <output_file> - option -- デフォルトでは解像度が足りない場合、''-density'' を指定する -density <geometry> --- gormetry には 300 くらいを指定すると、小さい文字でも大分ボヤけなくなる。 - <output-file> -- 1回の実行で複数の画像が抽出されることがあるので、必要に応じて連番フォーマットを指定する。 --- 例:3桁10進数を指定したい場合 out-file_%03d.png -- 連番フォーマットを指定しなかった場合でも、convert コマンドで勝手に連番を振ってくれる。 //============================================================================ ** pdfimage [#r3d4a0b3] - コマンド書式 $ pdfimages [option] <input-pdf-file> [prefix-for-outpu-file] - [option] -- -f <page-number> --- 開始ページを指定する -- -l <page-number> --- 終了ページを指定する -- -j --- JPEG形式で出力する -- -png --- PNG形式で出力する -- -tiff --- TIFF形式で出力する -- -p --- 出力ファイル名にページ番号を含める -- -list --- 画像のリストを表示する -- -opw <password> --- PDFのオーナーパスワードを指定する -- -upw <password> --- PDFのユーザーパスワードを指定する -- -q --- エラーメッセージを出力しない - 入力ファイルによっては、予期せぬ細分化された多数のファイルで出力されてしまい、使い物にならない場合がある。 ////////////////////////////////////////////////////////////////////////////// * PDF からテキストを抽出する [#kd146fb6] //============================================================================ ** pdftotext [#k81cea7e] - コマンド書式 pdftotext [option] <input-pdf-file> [output-file] - [option] -- -f <page-number> --- 開始ページを指定する -- -l <page-number> --- 終了ページを指定する -- -enc <encoding> --- 文字コードを指定する(デフォルトはUTF-8) -- -listenc --- 使用できるエンコーディングを一覧表示する -- -eol <形式> --- 改行コードのスタイルを「unix」「dos」「mac」の形式で指定する(デフォルトはunixで、LFを出力) -- -nopgbrk --- ページ間で改ページコードを出力しない -- -opw <password> --- PDFのオーナーパスワードを指定する -- -upw <password> --- PDFのユーザーパスワードを指定する -- -q --- エラーメッセージを出力しない