memo.xight.org

日々のメモ

ack - 漢字コード変換プログラム

Summary

ACK はきわめて多機能な漢字コード変換プログラムです.
日本語 EUC, Shift-JIS, 7 ビット JIS 間で相互に変換可能です.
JIS カタカナ (SJIS 半角かな) にも対応しています.
入力文字列にカタカナ文字が含まれていても,漢字コードが自動的に検出されます.
その一方で,ACK は高い検出率を備えた漢字コードチェック用としても使用できます.

- 日本語を含んだ文字数のカウント

$ ack -c ChangeLog
filename code kanji kana kanji7 kana7 err ascii ctrl other
memo/ChangeLog euc 196438 0 0 0 0 647225 61770 0


wcはスペース区切りで単語をカウント

$ wc ChangeLog
  32778 74607 1103019 ChangeLog


-cオプション (man ack より抜粋)

code コードタイプ ascii,sjis,euc,jis の4種類
kanji sjis,euc 漢字の文字数
kana sjis,euc 片仮名文字数(SJIS半角仮名)
kanji7 7bit jis 漢字の文字数(2byte code)
kana7 7bit jis 片仮名の文字数(1byte code)
err sjis,euc 漢字で判定不能文字の文字数
ascii 7bit 表示可能(図形)文字(0x20〜0x7e)文字数
ctrl コントロールコードの文字数(改行,TAB含む)
other その他の文字数

Reference

Debian パッケージディレクトリ検索 (バイナリ) - ack