字符集整理。

##字符集整理

ASCII

最通用的信息交换标准,等同于国际标准ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符。

标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符。

ANSI

通常使用 0x00~0x7f 范围的1 个字节来表示 1 个英文字符。超出此范围的使用0x80~0xFFFF来编码。不同ANSI编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段ANSI编码的文本中。

Unicode

将世界上所有的文字用2个字节(也就是16位)统一进行编码。像这样统一编码,2个字节就已经足够容纳世界上所有的语言的大部分文字了。

UTF-8

UTF-16

GBK

GB2312

其中GB的意思其实是“国家标准”。