字符集
约 468 字大约 2 分钟
为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。
从 ASCII 到 UTF-8
ASCII
是 第一个 字符编码标准。ASCII
定义了 128
种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符。比如:!
、$
、+
、-
、(
、)
、@
、<
、>
。
ISO-8859-1
是 HTML4 的默认字符集。此字符集支持 256
个不同的字符代码。HTML4 同时支持 UTF-8
。
ANSI
(Windows-1252)是原始的 Windows 字符集。ANSI
与 ISO-8859-1
相同,不同之处在于 ANSI
具有 32
个 额外 的字符。
HTML5 规范鼓励 Web 开发人员使用 UTF-8
字符集,该字符集涵盖了世界上几乎所有的字符和符号。
HTML charset 属性
为了正确显示 HTML 页面,Web 浏览器必须知道页面中使用的字符集。
这是在 <meta>
标签中规定的:
<meta charset="UTF-8" />
如果未规定,UTF-8
则是 HTML 中的默认字符集。
ASCII 字符集
- ASCII 使用
0
到31
(以及127
)之间的值作为控制字符 - ASCII 使用
32
到126
的值表示字母、数字和符号 - ASCII 不使用
128
到255
之间的值
ANSI 字符集(Windows-1252)
- 对于
0
到127
的值,ANSI
与ASCII
相同 ANSI
有一组专有的字符,其值从128
到159
- 对于
160
到255
的值,ANSI
与UTF-8
相同
ISO-8859-1 字符集
- 对于
0
到127
的值,8859-1
与ASCII
相同 8859-1
不使用128
到159
之间的值- 对于从
160
到255
的值,8859-1
与UTF-8
相同
UTF-8 字符集
- 对于
0
到127
的值,UTF-8
与ASCII
相同 UTF-8
不使用128
到159
之间的值- 对于
160
到255
之间的值,UTF-8
与ANSI
和8859-1
相同 UTF-8
从值256
继续,包含超过10000
个不同字符