当前位置:网络安全 > 彻底理解字符编码:ASCII、ISO_8859、GB2312、UCS、Unicode、Utf-8

彻底理解字符编码:ASCII、ISO_8859、GB2312、UCS、Unicode、Utf-8

  • 发布:2023-10-09 20:00

-->

彻底了解字符编码:ASCII、ISO_8859、GB2312、UCS、Unicode、U

1。 ASCII:0-127(128-255未使用),美国标准

2、IS0-8859-1(latin-1): 0-255、西欧国家等

3。 GB2312:常用简体中文,双字节编码,国家标准,ASCII字符仍采用单字节编码

4。 GBK:GB2312的超集,包括繁体中文、日文和韩文,双字节编码,不是国家标准(新国标GB18030-2000是GBK的超集)

5、BIG5:繁体中文、台湾,类似GB2312

6。 SJIS:日本,类似GB2312

7、ISO10646(UCS):31位字符集,目前仅使用0x0000-0xFFFD,即使对于ASCII字符,也以16位为单位存储

8。 Unicode:兼容ISO10646,自主开发(两者都有缺陷,对于编程来说,无法读取'\0'等一些单字节特殊字符)

9、utf-8:解决unicode编码的缺陷,可变字节编码,最多6个字节,(ascii字符使用1Byte,中文3Byte)

-->

相关文章

最新资讯

热门推荐