App/OCR
の編集
[
トップ
] [
編集
|
差分
|
履歴
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
App
App/archiver
App/audio
App/audio/audacity
App/audio/mpg321
App/audio/puddletag
App/base64
App/Browser
App/column
App/diff-patch
App/downloader
App/ffmpeg
App/ffprobe
App/find
App/gimp
App/gnuplot
App/ImageMagick
App/info
App/inxi
App/LibreOffice
App/locate
App/md5
App/Music
App/Music/frescobaldi
App/Music/MuseScore
App/OCR
App/od
App/OpenOffice.org
App/pagers
App/pdf
App/QRコード
App/ripgrep
App/screen
App/script
App/sed
App/selenium
App/signal-desktop
App/skype
App/sylpheed
App/tmux
App/ttyrec
App/uniq
App/UUID
App/wget
App/xargs
App/テキスト処理
App/仮想化
App/仮想化/Docker
App/仮想化/qemu
App/仮想化/webos
AutoTicketLinkName
BracketName
CentOS
CentOS/yum
CrossCompile
Debian
Debian/kernel
Debian/kernel/ver8-or-older
Debian/Plan9関連
Debian/ver5
Debian/ver6
Debian/ver7
Debian/ver8
Debian/ver9
Debian/ver10
Debian/ver11
Debian/ver12
Debian/X
Debian/X/日本語
Debian/パッケージ管理
Deveice/Sensor/MotionSensor
Device
Device/Mouse
Device/Net/wifi
Device/Scanner
Device/Sensor
Device/Sensor/MotionSensor
Device/tty
Device/xmodmap
Editor
Editor/atom
Editor/binary
Editor/binary/beav
Editor/binary/hexedit
Editor/emacs
Editor/emacs/clang-format
Editor/emacs/flycheck
Editor/emacs/gdb-mode
Editor/emacs/github/copilot
Editor/emacs/html-mode
Editor/emacs/lisp
Editor/emacs/lsp-mode
Editor/emacs/markdown-mode
Editor/emacs/neotree
Editor/emacs/package-install
Editor/emacs/sdic
Editor/emacs/speedbar
Editor/emacs/XEmacs
Editor/emacs/ローカルビルド
Editor/emacs/多言語
Editor/fte
Editor/vi
FormattingRules
FrontPage
Help
InterWiki
InterWikiName
InterWikiSandBox
iPhone
Lang
Lang/C++
Lang/C++/Boost
Lang/C++/C++11
Lang/C++/C++11/thread
Lang/C++/C++11/コンテナ
Lang/C++/C++11/コンテナ/string
Lang/C++/C++11/初期化子
Lang/C++/C++17
Lang/C++/C++20
Lang/C++/error
Lang/C++/macro
Lang/C++/template
Lang/C++/コンテナ
Lang/C++/処理系
Lang/C-Sharp
Lang/Go
Lang/html
Lang/html/5
Lang/html/5/canvas
Lang/html/css
Lang/Java
Lang/Java/jar
Lang/Objective-C
Lang/Pascal
Lang/Perl
Lang/Perl/CGI
Lang/Perl/thread
Lang/Perl/utf-8
Lang/pike
Lang/Python
Lang/Python/Class
Lang/Python/Error
Lang/Python/import対象パス
Lang/Python/pip
Lang/Python/基本文法
Lang/Python/開発環境
Lang/Rust
Lang/sed
Lang/shell
Lang/shell/bash
Lang/shell/bash/設定
Lang/shell/bash/設定/command-not-found
Lang/Tcl_Tk_Expect
Lang/Tcl_Tk_Expect/Ctrl-キーマップ
Lang/TypeScript
Lang/xml
Mac
Memo
memo
MenuBar
midi
Multimedia
Net
Net/apache
Net/apache2
Net/dig
Net/dns/server
Net/domain
Net/http/アクセス制御
Net/iptables
Net/IRC
Net/Jenkins
Net/lighttpd
Net/mail
Net/mail/X-Face
Net/news
Net/news/gnus
Net/ntp
Net/pukiwiki
Net/pukiwiki/plugin
Net/resolv.conf
Net/SPAM
Net/ss
Net/tcpdump
Net/traceroute
Net/twitter
Net/vpn
Net/web
Net/webAPI
Net/wifi
Net/wifi/AP
Net/監視
otherlinks
PHP
Plan9
PPC
PPC/LinuxPPC
PPC/MkLinux
Prog
Prog/AI
Prog/autotools
Prog/cmake
Prog/Compiler/gcc
Prog/CrossReferencer
Prog/debug
Prog/debug/gdb
Prog/debug/lldb
Prog/debug/ltrace
Prog/debug/memory
Prog/debug/strace
Prog/formatter/clang-format
Prog/GoogleTest
Prog/Gtk
Prog/IDE
Prog/IDE/Geany
Prog/ldd
Prog/make
Prog/nm
Prog/Profiler
Prog/Qt
Prog/readelf
Prog/Sound
Prog/StaticCodeAnalysis
Prog/StaticCodeAnalysis/cppcheck
Prog/strip
Prog/TagSystem
Prog/TagSystem/cscope
Prog/TagSystem/ctags-exuberant
Prog/TagSystem/ebrowse
Prog/TagSystem/etags
Prog/TagSystem/gtags
Prog/TagSystem/id-utils
Prog/TagSystem/lctags
Prog/TagSystem/rtags
Prog/TagSystem/SilentBob
Prog/X/X11
Prog/プロセス間通信
Prog/プロセス間通信/SharedMemory
Prog/プロセス間通信/singal
Prog/人為的なシグナル
Prog/分散ビルド/distcc
Prog/逆アセンブル
PukiWiki
PukiWiki/1.4
PukiWiki/1.4/Manual
PukiWiki/1.4/Manual/Plugin
PukiWiki/1.4/Manual/Plugin/A-D
PukiWiki/1.4/Manual/Plugin/E-G
PukiWiki/1.4/Manual/Plugin/H-K
PukiWiki/1.4/Manual/Plugin/L-N
PukiWiki/1.4/Manual/Plugin/O-R
PukiWiki/1.4/Manual/Plugin/S-U
PukiWiki/1.4/Manual/Plugin/V-Z
RecentDeleted
RS232C
SandBox
Security
Security/aide
Security/chkrootkit
Security/clamav
Security/gpg
Security/pkcs
Security/ssh
Security/test
Security/パスワード解析
System
System/Audio
System/beep
System/bluetooth
System/cpu
System/dm-crypt
System/fs
System/fs/ext2-3
System/fs/mount
System/fs/nfs
System/fs/tmpfs
System/fs/xfs
System/fs/大容量のファイルを高速に作成する
System/fs/強制物理フォーマット
System/grub
System/Hardware情報
System/HDD/IDE/チューニング
System/input
System/iostat
System/Kernel
System/Kernel/Module
System/locale
System/memory
System/OpenCL
System/os
System/power/battery
System/Process
System/random
System/rpm
System/runlevel
System/signal
System/sudo
System/swap
System/USB-Boot
System/user
System/シリアル接続
System/環境変数
TeX
TeX/MusiXTeX
tools
Top/Editor/emacs/python開発環境
transcription/old
Ubuntu
VersionCtl
VersionCtl/git
VersionCtl/git/Gerrit
VersionCtl/git/Gerrit/old
VersionCtl/git/git-gutter+
VersionCtl/git/git-imerge
VersionCtl/git/magit
VersionCtl/git/magit/2.1.0
VersionCtl/git/magit/2.8.0
VersionCtl/git/magit/2.13.1
VersionCtl/git/magit/v3.2.1
VersionCtl/git/magit/v3.3.0
VersionCtl/git/subversion からの移行
VersionCtl/git/subversion とのコマンド対比
VersionCtl/git/tig
VersionCtl/git/統計
VersionCtl/hg
VersionCtl/Mercurial
VersionCtl/repo
VersionCtl/Subversion
WikiEngines
WikiName
WikiWikiWeb
Windows
Windows/cmd
X
X/DisplayManager
X/DisplayManager/gdm3
X/DisplayManager/lightdm
X/font
X/font/old
X/GNOME3
X/input
X/input/OnScreenKeyboard
X/input/キーアサインを変更する
X/input/グラゴル文字
X/input/日本語
X/input/日本語/ATOK X3
X/input/日本語/ibus
X/input/日本語/uim
X/KDE
X/remote
X/screensaver
X/terminal
X/terminal/mlterm
X/terminal/urxvt
X/terminal/uxterm
X/vnc
X/vnc/tigervnc
X/WindowManager
X/WindowManager/9wm
X/WindowManager/amiwm
X/WindowManager/awesome
X/WindowManager/CDE
X/WindowManager/cinnamon
X/WindowManager/dwm
X/WindowManager/flwm
X/WindowManager/i3
X/WindowManager/jwm
X/WindowManager/matchbox
X/WindowManager/MATE
X/WindowManager/mlvwm
X/WindowManager/qvwm
X/WindowManager/ratpoison
X/WindowManager/ude
X/WindowManager/WindowMaker
X/WindowManager/xfce4
X/xdotool
X/Xnest
X/xrdp
X/xvfb
YukiWiki
スタジオ・ホール
旅
旅/Czech
旅/三重
旅/京都・滋賀
旅/兵庫
旅/千葉
旅/各務
旅/和歌山
旅/埼玉
旅/山形
旅/岐阜
旅/岡山
旅/岩手
旅/島根
旅/愛媛
旅/新潟
旅/東京
旅/栃木
旅/神奈川
旅/秋田
旅/群馬
旅/茨城
旅/長野・山梨
旅/静岡
旅/静岡/伊豆
未整理
食
食/チェコ
食/各国
食/料理
食/激辛
食/蕎麦
食/郷土料理
#topicpath /////////////////////////////////////////////////////////////////////////////// * 目次 [#k4a7989e] #contents(); /////////////////////////////////////////////////////////////////////////////// * tesseract-ocr [#tesseract-ocr] //============================================================================= ** 環境構築 [#n9ab119f] - debian の場合は以下をインストールする: tesseract-ocr - 各国語毎の言語ファイルは別パッケージになっている。必要に応じて追加インストールする。 |~パッケージ |~言語 | |tesseract-ocr-ces |チェコ語 | |tesseract-ocr-jpn |日本語 | |tesseract-ocr-jpn-vert |日本語縦書き | |tesseract-ocr-deu |独逸語 | |tesseract-ocr-deu-frak |独逸語フラクトゥール | |tesseract-ocr-eng |英語 | |tesseract-ocr-fra |仏語 | |tesseract-ocr-all |全ての言語 | -- その他の言語については、[[debian.orgのページ>https://packages.debian.org/search?searchon=names&keywords=tesseract]] を参照。 //============================================================================= ** 実行 [#n793887d] //----------------------------------------------------------------------------- *** コマンドライン [#h22ada34] tesseract <input-image-file> <out-file> -l <lang> -psm <number> //----------------------------------------------------------------------------- *** option [#s1e08c32] - <out-file> -- 出力ファイル名。実際のファイル名はこの名前に更に ".txt" が付く。 - --tessdata-dir <path> -- 言語データファイルの場所を <path> に指定する。 - --user-words <path-to-file> -- ユーザ辞書ファイルとして <path-to-file> を指定する - -c <var>=<val> -- 設定値<var> の値を <val> にする - -l <lang> -- 使用言語を <lang> にする -- jpn, ces, etc., - --psm <number> -- Page segmentation modes: --- 0 : Orientation and script detection (OSD) only. 言語データ:osd.traineddata 必須 OSD は Orientation and script detection の略 言語の種類やテキストの傾斜角度等を xxxxx.osd に出力 --- 1 : Automatic page segmentation with OSD. 言語データ:osd.traineddata 必須 回転(90度・180度・270度)したテキストも認識する --- 2 : Automatic page segmentation, but no OSD, or OCR. テキストの傾斜角度にかかわる情報を画面に標準出力する。 ファイルは何も作成されない。 --- 3 : Fully automatic page segmentation, but no OSD. (Default) デフォルトのオプション。 水平テキスト(横書き文書)と垂直テキスト(縦書き文書)に対応 傾斜角度のあるテキストは非対応 --- 4 : Assume a single column of text of variable sizes. 可変サイズのテキストとして扱う。 --- 5 : Assume a single uniform block of vertically aligned text. ユニフォームブロックの垂直テキストと仮定する。 --- 6 : Assume a single uniform block of text. ユニフォームブロックのテキストと仮定する。 デフォルトよりも認識率が良い。 --- 7 : Treat the image as a single text line. 単一のテキスト行として扱う。 画像内に複数行が存在する場合は、画像内の文字すべてが誤認識する。 --- 8 : Treat the image as a single word. 単語として扱う。行に複数の単語がある場合は、 単語間の空白は削られて出力される。「太陽 お月様」 → 「太陽お月様」 画像内に複数行が存在する場合は、画像内の文字すべてが誤認識する。 --- 9 : Treat the image as a single word in a circle. 画像を円の中の一つの単語として扱う。(丸囲みのことか?) --- 10 : Treat the image as a single character. 1文字として扱う。2文字以上ある場合は、すべてが誤認識する。 --- 11 : Sparse text. Find as much text as possible in no particular order. 色の薄いテキスト。できるだけ多くのテキストを探す。 デフォルトで探せなかったテキストも認識する。 --- 12 : Sparse text with OSD. 言語データ:osd.traineddata 必須 上記11番、及び、 回転(90度・180度・270度)したテキストも認識する --- 13 : Raw line. Treat the image as a single text line, bypassing hacks that are Tesseract-specific. //============================================================================= ** 参考リンク [#na56b35d] - [[Pythonで書くTesseract 4の基本的な使い方。APIとCLIからOCRを実行する方法>https://valmore.work/how-to-use-tesseract4-with-python/]] - [[tesseract のオプション PSM をいじってみた | Binary Star>https://binary-star.net/tesseract-option-psm]]
#topicpath /////////////////////////////////////////////////////////////////////////////// * 目次 [#k4a7989e] #contents(); /////////////////////////////////////////////////////////////////////////////// * tesseract-ocr [#tesseract-ocr] //============================================================================= ** 環境構築 [#n9ab119f] - debian の場合は以下をインストールする: tesseract-ocr - 各国語毎の言語ファイルは別パッケージになっている。必要に応じて追加インストールする。 |~パッケージ |~言語 | |tesseract-ocr-ces |チェコ語 | |tesseract-ocr-jpn |日本語 | |tesseract-ocr-jpn-vert |日本語縦書き | |tesseract-ocr-deu |独逸語 | |tesseract-ocr-deu-frak |独逸語フラクトゥール | |tesseract-ocr-eng |英語 | |tesseract-ocr-fra |仏語 | |tesseract-ocr-all |全ての言語 | -- その他の言語については、[[debian.orgのページ>https://packages.debian.org/search?searchon=names&keywords=tesseract]] を参照。 //============================================================================= ** 実行 [#n793887d] //----------------------------------------------------------------------------- *** コマンドライン [#h22ada34] tesseract <input-image-file> <out-file> -l <lang> -psm <number> //----------------------------------------------------------------------------- *** option [#s1e08c32] - <out-file> -- 出力ファイル名。実際のファイル名はこの名前に更に ".txt" が付く。 - --tessdata-dir <path> -- 言語データファイルの場所を <path> に指定する。 - --user-words <path-to-file> -- ユーザ辞書ファイルとして <path-to-file> を指定する - -c <var>=<val> -- 設定値<var> の値を <val> にする - -l <lang> -- 使用言語を <lang> にする -- jpn, ces, etc., - --psm <number> -- Page segmentation modes: --- 0 : Orientation and script detection (OSD) only. 言語データ:osd.traineddata 必須 OSD は Orientation and script detection の略 言語の種類やテキストの傾斜角度等を xxxxx.osd に出力 --- 1 : Automatic page segmentation with OSD. 言語データ:osd.traineddata 必須 回転(90度・180度・270度)したテキストも認識する --- 2 : Automatic page segmentation, but no OSD, or OCR. テキストの傾斜角度にかかわる情報を画面に標準出力する。 ファイルは何も作成されない。 --- 3 : Fully automatic page segmentation, but no OSD. (Default) デフォルトのオプション。 水平テキスト(横書き文書)と垂直テキスト(縦書き文書)に対応 傾斜角度のあるテキストは非対応 --- 4 : Assume a single column of text of variable sizes. 可変サイズのテキストとして扱う。 --- 5 : Assume a single uniform block of vertically aligned text. ユニフォームブロックの垂直テキストと仮定する。 --- 6 : Assume a single uniform block of text. ユニフォームブロックのテキストと仮定する。 デフォルトよりも認識率が良い。 --- 7 : Treat the image as a single text line. 単一のテキスト行として扱う。 画像内に複数行が存在する場合は、画像内の文字すべてが誤認識する。 --- 8 : Treat the image as a single word. 単語として扱う。行に複数の単語がある場合は、 単語間の空白は削られて出力される。「太陽 お月様」 → 「太陽お月様」 画像内に複数行が存在する場合は、画像内の文字すべてが誤認識する。 --- 9 : Treat the image as a single word in a circle. 画像を円の中の一つの単語として扱う。(丸囲みのことか?) --- 10 : Treat the image as a single character. 1文字として扱う。2文字以上ある場合は、すべてが誤認識する。 --- 11 : Sparse text. Find as much text as possible in no particular order. 色の薄いテキスト。できるだけ多くのテキストを探す。 デフォルトで探せなかったテキストも認識する。 --- 12 : Sparse text with OSD. 言語データ:osd.traineddata 必須 上記11番、及び、 回転(90度・180度・270度)したテキストも認識する --- 13 : Raw line. Treat the image as a single text line, bypassing hacks that are Tesseract-specific. //============================================================================= ** 参考リンク [#na56b35d] - [[Pythonで書くTesseract 4の基本的な使い方。APIとCLIからOCRを実行する方法>https://valmore.work/how-to-use-tesseract4-with-python/]] - [[tesseract のオプション PSM をいじってみた | Binary Star>https://binary-star.net/tesseract-option-psm]]
テキスト整形のルールを表示する