根据16进制输出所有汉字
这篇讲的是字符编码这个“底层建筑”在早期技术探索中的一个缩影。作者从看似基础的“如何用十六进制输出所有汉字”这个问题出发,实际上带我们走了一趟中文字符编码的演进小径。 文章从GBK等早期编码方案讲起,揭示了它们用两个字节表示一个汉字的原理。但真正的核心在于Unicode标准的引入——它用一个十六进制的“码点”来统一标识世界上几乎所有的字符。作者演示了如何通过码点范围(比如从`0x4E00`到`0x9FFF`)遍历输出基本汉字区,并进一步探讨了更庞大的CJK统一表意文字区。 文章最巧妙的部分在于实现思路:不仅展示了直接循环码点的方法,还点明了通过字节模式(如GBK)进行位操作来解码输出汉字的底层逻辑。这其实触及了编码转换的核心——不同编码本质上是同一字符的不同字节表示。读完这篇,你会对日常接触到的UTF-8为何能“通吃”全球文字,有一个从十六进制码点到最终字节序列的直观理解。