5
回答
不同编码下的同一个汉字字符是如何做到可以进行比较的?
终于搞明白,存储TCO原来是这样算的>>>   

这是突然想到的一个问题。
情景算起来只是如下情况:
同一个汉子字符——“狗”这个字符
在GBK编码中的十进制代表的数字是——47543
在UTF-8编码中的十进制代表数字是——15174551

情景如下:
IDE:eclipse
设置工作区间编码:utf-8


在一个java代码里面,我通过IO流获得一个使用GBK编码的“狗”那么通过GBK解码获得了“狗”这个字符,接下来我将获得的“狗”和本身java代码书写的“狗”(UTF-8的狗)进行比较。

接下来就有个疑惑的地方在于,只要解码成了字符,不论任何编码,只要它对应的字符是同一个,那么就能够说就是同一个?

毕竟GBK编码解码出来的“狗”和UTF-8编码解码出来的“狗

Eclipse
MikeDDT009
发帖于16小时前 5回/91阅
顶部