文字コードの種類

文字コードを特定するためのバイトコード(バイトオーダーマーク、通称BOM)は、いくつかの文字コードで使用されますが、すべての文字コードにBOMが存在するわけではありません。特に、ASCIIやISO-8859シリーズなどのシングルバイト文字コードにはBOMが存在しません。以下に、各文字コードのBOMを挙げ、BOMが存在しない文字コードについてはその旨を記載します。

BOMが存在する文字コード

  1. UTF-8: EF BB BF
  2. UTF-16 (BE): FE FF
  3. UTF-16 (LE): FF FE
  4. UTF-32 (BE): 00 00 FE FF
  5. UTF-32 (LE): FF FE 00 00
  6. GB18030: 84 31 95 33

BOMが存在しない文字コード

  1. Shift_JIS
  2. EUC-JP
  3. ISO-2022-JP
  4. ISO-2022-JP-2
  5. ISO-2022-JP-3
  6. JIS X 0201
  7. JIS X 0208
  8. JIS X 0212
  9. JIS X 0213