week12:字符集和编码

快速了解

重点理解:

  • 广义的编码
  • 字符集
  • 同一字符集的不同编码

字符集:charset,character set的缩写

  • acsii
  • unicode
  • gb/gbk/big5

字符集编码:encoding,charset encoding

  • 早期字符集与编码是一对一的
  • unicode出现了多种编码
    • UTF-8
    • UTF-16/UTF-16BE
    • UTF-16LE
    • UTF-32/UTF-32BE
    • UTF-32LE

乱码:

字符集工具:

  • 查看单个字符详细信息:https://graphemica.com/
  • 命令:
    • Linux的hexdump:以16进制查看文件内容
    • Windows的Notepad++的Hex Editor插件

参考资料: