App/pdf の履歴ソース(No.5)

履歴一覧
差分を表示
現在との差分を表示
履歴を表示
App/pdf へ行く。
- 1 (2010-04-25 (日) 17:23:52)
- 2 (2012-10-01 (月) 22:03:18)
- 3 (2019-06-10 (月) 01:59:05)
- 4 (2019-08-04 (日) 01:55:07)
- 5 (2020-10-04 (日) 01:41:40)
- 6 (2021-01-23 (土) 21:41:02)
- 7 (2021-05-24 (月) 07:08:18)
- 8 (2021-08-16 (月) 20:06:02)
- 9 (2022-02-05 (土) 05:58:02)
- 10 (2022-04-13 (水) 11:26:09)
#author("2020-10-03T07:41:40+00:00","","")
#topicpath

//////////////////////////////////////////////////////////////////////////////
* 目次 [#a5a690c4]
#contents

//////////////////////////////////////////////////////////////////////////////
* Viewer [#dfa32e18]
//============================================================================
** evince [#c1a91c9d]
- debian5.0でデスクトップ環境を導入すると、デフォルトで入っている。
- 起動
 $ evince <pdf-file> [RETURN]

//============================================================================
** xpdf [#oaeb0d7b]
- Debian5.0ではオプション扱い（？）
- Install
 # aptitude install xpdf
- 起動
 $ xpdf <pdf-file> [RETURN]

//============================================================================
** Adbe Reader （Linux版） [#l322c046]
- Adobe社が配布している。
-- [[ダウンロードページ>http://get.adobe.com/jp/reader/otherversions/]]
- 完全なfree-softではないので、Debianでは公式パッケージに含めていない
- そうはいうものの、上の2つでは正しく見られないファイルもチラホラあるので、結局これを入れておいた方がいい。
- Install
 # dpkg -i AdbeRdr9.1.0-1_i386linux_jpn.deb
-- Intel32bit CPUで、 amd64アーキテクチャがインストールされたシステムでは、そのままではインストール出来ない。よって以下のようにする：
 # dpkg --force-architecture -i  AdobeRdr9.1.0-1_i386linux_jpn.deb
-- そのままではライブラリが不足して起動出来ない。そのため、以下を別途インストールする必要がある：
 ia32-libs ia32-libs-gtk
- 起動
 $ acroread <pdf-file> [RETURN]



//////////////////////////////////////////////////////////////////////////////
* Editor [#editor]
//============================================================================
** 画像ファイルを pdf にする [#zc9684b2]
- 1つまたはそれ以上の画像ファイルを、1つの pdf に出力する
 $ convert <in-file1> [in-file2]... <out-file>
- 複数の画像ファイルを、其々1つの pdf に出力する
 $ mogrify -format <type> <in-file1> [in-file2]...


//////////////////////////////////////////////////////////////////////////////
* PDF から画像を抽出する [#x8763607]
//============================================================================
** convert [#le91167c]
- convert コマンドは、ImageMagik に含まれるコマンドの一つで、画像の変換などを行うことも出来る。
- コマンド書式
 $ convert [option] <input-pdf-file> <output_file>
- option
-- デフォルトでは解像度が足りない場合、''-density'' を指定する
 -density <geometry>
--- gormetry には 300 くらいを指定すると、小さい文字でも大分ボヤけなくなる。
- <output-file>
-- 1回の実行で複数の画像が抽出されることがあるので、必要に応じて連番フォーマットを指定する。
--- 例：3桁10進数を指定したい場合
 out-file_%03d.png
-- 連番フォーマットを指定しなかった場合でも、convert コマンドで勝手に連番を振ってくれる。

//============================================================================
** pdfimage [#r3d4a0b3]
- コマンド書式
 $ pdfimages [option] <input-pdf-file> [prefix-for-outpu-file]
- [option]
-- -f <page-number>
--- 開始ページを指定する
-- -l <page-number>
--- 終了ページを指定する
-- -j
--- JPEG形式で出力する
-- -png
--- PNG形式で出力する
-- -tiff
--- TIFF形式で出力する
-- -p
--- 出力ファイル名にページ番号を含める
-- -list
--- 画像のリストを表示する
-- -opw <password>
--- PDFのオーナーパスワードを指定する
-- -upw <password>
--- PDFのユーザーパスワードを指定する
-- -q
--- エラーメッセージを出力しない

- 入力ファイルによっては、予期せぬ細分化された多数のファイルで出力されてしまい、使い物にならない場合がある。


//////////////////////////////////////////////////////////////////////////////
* PDF からテキストを抽出する [#kd146fb6]
//============================================================================
** pdftotext [#k81cea7e]
- コマンド書式
 pdftotext [option] <input-pdf-file> [output-file]
- [option]
-- -f <page-number>
--- 開始ページを指定する
-- -l <page-number>
--- 終了ページを指定する
-- -enc <encoding>
--- 文字コードを指定する（デフォルトはUTF-8）
-- -listenc
--- 使用できるエンコーディングを一覧表示する
-- -eol <形式>
--- 改行コードのスタイルを「unix」「dos」「mac」の形式で指定する（デフォルトはunixで、LFを出力）
-- -nopgbrk
--- ページ間で改ページコードを出力しない
-- -opw <password>
--- PDFのオーナーパスワードを指定する
-- -upw <password>
--- PDFのユーザーパスワードを指定する
-- -q
--- エラーメッセージを出力しない