python出現(xiàn)gbk編碼錯(cuò)誤 python判斷一個(gè)字符能否用gbk和utf8編碼?
python判斷一個(gè)字符能否用gbk和utf8編碼?使用chardet庫(kù)。它將猜測(cè)文本文件的編碼并返回如下結(jié)果:編碼類(lèi)型:UTF-8,置信度:0.9。也就是說(shuō),chardet得出結(jié)論,文件被UTF-8
python判斷一個(gè)字符能否用gbk和utf8編碼?
使用chardet庫(kù)。它將猜測(cè)文本文件的編碼并返回如下結(jié)果:編碼類(lèi)型:UTF-8,置信度:0.9。也就是說(shuō),chardet得出結(jié)論,文件被UTF-8編碼的概率為90%。然而,chardet的缺點(diǎn)是它不能完全確定文件的編碼類(lèi)型。目前,我的實(shí)踐是,如果置信度超過(guò)0.95,那么我認(rèn)為chardet的判斷是正確的。否則,添加一些人機(jī)交互來(lái)判斷。目前chardet庫(kù)官方網(wǎng)站提供的版本僅適用于python2。如果您使用的是python3。十、 我可以上傳另一個(gè)版本。