新規記事投稿 フォロー記事投稿 記事のキャンセル
From: にあ <nir@mxa.meshnet.or.jp>
Subject: 漢字コードの見分け方
Date: 1996/07/11 21:48:05
Reference: mesh.program/00031

7月11日に、naokiさんは書きました。

>nkfはインストールしたんですがまだ使ってないです。
>でもcgiparseだけでとりあえずちゃんと日本語が送れたんですよね。
>
SJIS や EUC で送っても運が良ければ読めますが、電子メールとして送って
良いのは JIS コードだけです。

>今送られている漢字が何コードなのか分かる方法あります?
>とりあえず自分でもやってみますけど…。
>
自分に送ってみてコードを調べてみればいいのでは? (^^;;

例えば「試験です」と言う文字列を LANG を C にして od で見てみると、
3種類のコードはそれぞれ、

$ LANG=C
$ echo '試験です' | nkf -j | od -c  ← JISコード
0000000 033   $   B   ;   n   8   3   $   G   $   9 033   (   B  \n
0000017
$ echo '試験です' | nkf -s | od -c  ← SJISコード
0000000 216 216 214 261 202 305 202 267  \n
0000011
$ echo '試験です' | nkf -e | od -c  ← EUCコード
0000000 273 356 270 263 244 307 244 271  \n
0000011

の様に見えます。