gb2312和utf8用哪個 如何區(qū)分給定的字符串是UTF8還是GB2312?
如何區(qū)分給定的字符串是UTF8還是GB2312?例如,utf8的兩個字符:e5a6a4e5a6a9對應(yīng)于GB2312的三個字符:e5a6a4e5a6a9。雖然對應(yīng)的漢字不同,但都是有效漢字。所以嚴格地
如何區(qū)分給定的字符串是UTF8還是GB2312?
例如,utf8的兩個字符:e5a6a4e5a6a9對應(yīng)于GB2312的三個字符:e5a6a4e5a6a9。雖然對應(yīng)的漢字不同,但都是有效漢字。所以嚴格地說,是不可能判斷的。但是,從utf8編碼規(guī)則來看,有幾種固定的字符串組合:110xxxxx、10xxxxxx、10xxxxxxxx1110xxxxx、10xxxxxx、10xxxxxx、10xxxxxx、10xxxxxx、10xxxxxx等,如果滿足這個條件,可以說“utf8進行字符串編碼的可能性非常大”。