跳至主要內容

字符集

Sankgao约 468 字大约 2 分钟FrontendHTML5

为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。

从 ASCII 到 UTF-8

ASCII第一个 字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符。比如:!$+-()@<>

ISO-8859-1 是 HTML4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML4 同时支持 UTF-8

ANSI(Windows-1252)是原始的 Windows 字符集。ANSIISO-8859-1 相同,不同之处在于 ANSI 具有 32额外 的字符。

HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号。

HTML charset 属性

为了正确显示 HTML 页面,Web 浏览器必须知道页面中使用的字符集。

这是在 <meta> 标签中规定的:

<meta charset="UTF-8" />

如果未规定,UTF-8 则是 HTML 中的默认字符集。

ASCII 字符集

  • ASCII 使用 031(以及 127)之间的值作为控制字符
  • ASCII 使用 32126 的值表示字母、数字和符号
  • ASCII 不使用 128255 之间的值

ANSI 字符集(Windows-1252)

  • 对于 0127 的值,ANSIASCII 相同
  • ANSI 有一组专有的字符,其值从 128159
  • 对于 160255 的值,ANSIUTF-8 相同

ISO-8859-1 字符集

  • 对于 0127 的值,8859-1ASCII 相同
  • 8859-1 不使用 128159 之间的值
  • 对于从 160255 的值,8859-1UTF-8 相同

UTF-8 字符集

  • 对于 0127 的值,UTF-8ASCII 相同
  • UTF-8 不使用 128159 之间的值
  • 对于 160255 之间的值,UTF-8ANSI8859-1 相同
  • UTF-8 从值 256 继续,包含超过 10000 个不同字符