プログラム内の日本語の取り扱い

C

コンピュータ内で文字を取り扱う時には、ASCIIコードとして処理される。
ASCIIコードとは、英数字などを0~127の番号に対応させて管理している。

 

たとえば、「A」は65、「B」は66、「1」は49、「2」は50、などのように。

 

アルファベットと数字、記号を合わせても100種類程度なので、7ビットで表現される。
日本語は種類が多いので、シフトJISというコードを使う。
半角文字を表すのに1バイト、全角文字で2バイト、を表す。

 

1バイトは256種類の情報を表す。
2バイトは65536種類の情報を表す。

 

メール等に使われる日本語コードはJISコードと呼ぶ。
JISコードは1バイトのうちに7ビットを使い、はじめにシフトイン、終わりにシフトアウトという特殊なコードを用いて他のコードと区別している。

 

 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です