#author("2019-08-03T07:55:07+00:00","","")
#author("2020-10-03T07:41:40+00:00","","")
#topicpath

//////////////////////////////////////////////////////////////////////////////
* 目次 [#a5a690c4]
#contents

//////////////////////////////////////////////////////////////////////////////
* Viewer [#dfa32e18]
//============================================================================
** evince [#c1a91c9d]
- debian5.0でデスクトップ環境を導入すると、デフォルトで入っている。
- 起動
 $ evince <pdf-file> [RETURN]

//============================================================================
** xpdf [#oaeb0d7b]
- Debian5.0ではオプション扱い(?)
- Install
 # aptitude install xpdf
- 起動
 $ xpdf <pdf-file> [RETURN]

//============================================================================
** Adbe Reader (Linux版) [#l322c046]
- Adobe社が配布している。
-- [[ダウンロードページ>http://get.adobe.com/jp/reader/otherversions/]]
- 完全なfree-softではないので、Debianでは公式パッケージに含めていない
- そうはいうものの、上の2つでは正しく見られないファイルもチラホラあるので、結局これを入れておいた方がいい。
- Install
 # dpkg -i AdbeRdr9.1.0-1_i386linux_jpn.deb
-- Intel32bit CPUで、 amd64アーキテクチャがインストールされたシステムでは、そのままではインストール出来ない。よって以下のようにする:
 # dpkg --force-architecture -i  AdobeRdr9.1.0-1_i386linux_jpn.deb
-- そのままではライブラリが不足して起動出来ない。そのため、以下を別途インストールする必要がある:
 ia32-libs ia32-libs-gtk
- 起動
 $ acroread <pdf-file> [RETURN]



//////////////////////////////////////////////////////////////////////////////
* Editor [#editor]
//============================================================================
** 画像ファイルを pdf にする [#zc9684b2]
- 1つまたはそれ以上の画像ファイルを、1つの pdf に出力する
 $ convert <in-file1> [in-file2]... <out-file>
- 複数の画像ファイルを、其々1つの pdf に出力する
 $ mogrify -format <type> <in-file1> [in-file2]...


//////////////////////////////////////////////////////////////////////////////
* PDF から画像を抽出する [#x8763607]
//============================================================================
** convert [#le91167c]
- convert コマンドは、ImageMagik に含まれるコマンドの一つで、画像の変換などを行うことも出来る。
- コマンド書式
 $ convert [option] <input-pdf-file> <output_file>
- option
-- デフォルトでは解像度が足りない場合、''-density'' を指定する
 -density <geometry>
--- gormetry には 300 くらいを指定すると、小さい文字でも大分ボヤけなくなる。
- <output-file>
-- 1回の実行で複数の画像が抽出されることがあるので、必要に応じて連番フォーマットを指定する。
--- 例:3桁10進数を指定したい場合
 out-file_%03d.png
-- 連番フォーマットを指定しなかった場合でも、convert コマンドで勝手に連番を振ってくれる。

//============================================================================
** pdfimage [#r3d4a0b3]
- コマンド書式
 $ pdfimages [option] <input-pdf-file> [prefix-for-outpu-file]
- [option]
-- -f <page-number>
--- 開始ページを指定する
-- -l <page-number>
--- 終了ページを指定する
-- -j
--- JPEG形式で出力する
-- -png
--- PNG形式で出力する
-- -tiff
--- TIFF形式で出力する
-- -p
--- 出力ファイル名にページ番号を含める
-- -list
--- 画像のリストを表示する
-- -opw <password>
--- PDFのオーナーパスワードを指定する
-- -upw <password>
--- PDFのユーザーパスワードを指定する
-- -q
--- エラーメッセージを出力しない

- 入力ファイルによっては、予期せぬ細分化された多数のファイルで出力されてしまい、使い物にならない場合がある。


//////////////////////////////////////////////////////////////////////////////
* PDF からテキストを抽出する [#kd146fb6]
//============================================================================
** pdftotext [#k81cea7e]
- コマンド書式
 pdftotext [option] <input-pdf-file> [output-file]
- [option]
-- -f <page-number>
--- 開始ページを指定する
-- -l <page-number>
--- 終了ページを指定する
-- -enc <encoding>
--- 文字コードを指定する(デフォルトはUTF-8)
-- -listenc
--- 使用できるエンコーディングを一覧表示する
-- -eol <形式>
--- 改行コードのスタイルを「unix」「dos」「mac」の形式で指定する(デフォルトはunixで、LFを出力)
-- -nopgbrk
--- ページ間で改ページコードを出力しない
-- -opw <password>
--- PDFのオーナーパスワードを指定する
-- -upw <password>
--- PDFのユーザーパスワードを指定する
-- -q
--- エラーメッセージを出力しない


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS