新規記事投稿
フォロー記事投稿
記事のキャンセル
From: にあ
<nir@mxa.meshnet.or.jp>
Subject: 漢字コードの見分け方
Date: 1996/07/11 21:48:05
Reference: mesh.program/00031
7月11日に、naokiさんは書きました。
>nkfはインストールしたんですがまだ使ってないです。
>でもcgiparseだけでとりあえずちゃんと日本語が送れたんですよね。
>
SJIS や EUC で送っても運が良ければ読めますが、電子メールとして送って
良いのは JIS コードだけです。
>今送られている漢字が何コードなのか分かる方法あります?
>とりあえず自分でもやってみますけど…。
>
自分に送ってみてコードを調べてみればいいのでは? (^^;;
例えば「試験です」と言う文字列を LANG を C にして od で見てみると、
3種類のコードはそれぞれ、
$ LANG=C
$ echo '試験です' | nkf -j | od -c ← JISコード
0000000 033 $ B ; n 8 3 $ G $ 9 033 ( B \n
0000017
$ echo '試験です' | nkf -s | od -c ← SJISコード
0000000 216 216 214 261 202 305 202 267 \n
0000011
$ echo '試験です' | nkf -e | od -c ← EUCコード
0000000 273 356 270 263 244 307 244 271 \n
0000011
の様に見えます。