EASCII
(Extended ASCII
,延伸美国标准信息交换码)
ASCII字符集中只包含52
个英文字母、10
个阿拉伯数字和英式标点符号等128
个字符, 也就是说它只能用于编码现代美国英语,而且在处理英语当中的外来词如naïve
、café
、élite
等时, 所有重音符号都不得不去掉,但是去掉这些重音符号就违反了拼写规则。
为了编码更多的欧洲常用字符,IBM
首先对ASCII进行了扩展,这被称为EASCII
。
不仅IBM
对ASCII进行了扩展, 其他公司或者国家也在对ASCII
进行扩展,我们也称这些扩展为EASCII
。
各个公司各自的EASCII
互不兼容,这不利于信息交换,在这种情况下,ISO制定了一个规范,编号为ISO/IEC 8859-1。 所以把这种编码称为ISO-8859-1
编码。
ISO-8859-1
编码也叫做Latin-1
编码。
ISO-8859-1
字符集中包含:表格符号、计算符号、希腊字母和特殊的拉丁符号等128
个字符。
ISO-8859-1
编码仍然使用8 bit
表示一个字符,将最高位固定为1
, 这样,ISO-8859-1
编码也可以表示128
个字符。
ISO-8859-1
编码的字符与无符号十进制整数128 ~ 255
等价。
ISO-8859-1
编码与ASCII编码合起来, 总共可以编码256
个字符。
ISO-8859-1
编码是最常见的8 bit
字符编码。除此之外,不同的操作系统都会有它的8 bit
字符编码。