专栏名称: AI让生活更美好
分享学习C/C++编程、机器人、人工智能等领域知识。
目录
今天看啥  ›  专栏  ›  AI让生活更美好

程序员必备:彻底弄懂常见的7种中文字符编码

AI让生活更美好  · 公众号  ·  · 2024-05-28 09:44
    

文章预览

程序开发常见的ASCII、GB2312、GBK、GB18030、UTF8、ANSI、Latin1中文编码到底有何不同?如果你在业务中也曾经被乱码搞晕过,不妨一起探究一下。 点击上方“ 蓝色字体 ”关注我,选择“ 设为星标 ”! 回复“ AI ”领取超多经典计算机书籍 字符编码要做什么事情? 在计算机眼里读到的所有文字都是由0和1组成的字符串,为了能让汉字正常显示在屏幕上,我们需要做以下两件事情: 给所有的汉字一个独一无二的数字编号,做一个数字编号到汉字的mapping关系(即字符集) 把这个数字编号能用0和1表示出来 这里需要说明的是,第2件事情并不是直接把数字编号用二进制表示出来那么简单,还要处理多个字连在一起的时候如何做分隔的问题。 例如如果我把”腾”编为1号(二进制00000001,占1byte),把“讯”编为5号(二进制00000101,占1byte),汉字这么多,一定 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览