Summary
ACK はきわめて多機能な漢字コード変換プログラムです.
日本語 EUC, Shift-JIS, 7 ビット JIS 間で相互に変換可能です.
JIS カタカナ (SJIS 半角かな) にも対応しています.
入力文字列にカタカナ文字が含まれていても,漢字コードが自動的に検出されます.
その一方で,ACK は高い検出率を備えた漢字コードチェック用としても使用できます.
- 日本語を含んだ文字数のカウント
$ ack -c ChangeLog
filename code kanji kana kanji7 kana7 err ascii ctrl other
memo/ChangeLog euc 196438 0 0 0 0 647225 61770 0
wcはスペース区切りで単語をカウント
$ wc ChangeLog
32778 74607 1103019 ChangeLog
-cオプション (man ack より抜粋)
code | コードタイプ ascii,sjis,euc,jis の4種類 |
kanji | sjis,euc 漢字の文字数 |
kana | sjis,euc 片仮名文字数(SJIS半角仮名) |
kanji7 | 7bit jis 漢字の文字数(2byte code) |
kana7 | 7bit jis 片仮名の文字数(1byte code) |
err | sjis,euc 漢字で判定不能文字の文字数 |
ascii | 7bit 表示可能(図形)文字(0x20〜0x7e)文字数 |
ctrl | コントロールコードの文字数(改行,TAB含む) |
other | その他の文字数 |