putty連接ssh使用教程為什么Linux系統(tǒng)默認(rèn)使用utf8編碼？

2021-03-30

2375

為什么Linux系統(tǒng)默認(rèn)使用utf8編碼？GBK是微軟為簡(jiǎn)體中文開(kāi)發(fā)的本地代碼，被工信部起訴。每個(gè)國(guó)家或地區(qū)都會(huì)制定和使用自己的地方代碼，一些企業(yè)也會(huì)制定某個(gè)國(guó)家或地區(qū)的地方代碼（GBK是微軟制定的簡(jiǎn)

為什么Linux系統(tǒng)默認(rèn)使用utf8編碼？

GBK是微軟為簡(jiǎn)體中文開(kāi)發(fā)的本地代碼，被工信部起訴。每個(gè)國(guó)家或地區(qū)都會(huì)制定和使用自己的地方代碼，一些企業(yè)也會(huì)制定某個(gè)國(guó)家或地區(qū)的地方代碼（GBK是微軟制定的簡(jiǎn)體中文代碼）。當(dāng)打開(kāi)用本地代碼編寫(xiě)的文件而不指定使用的本地代碼時(shí)，可能會(huì)看到亂碼。

為了解決本地編碼混亂的問(wèn)題，Unicode和ISO這兩個(gè)組織已經(jīng)開(kāi)始開(kāi)發(fā)一種字符編碼系統(tǒng)，可以容納不同國(guó)家的字符而不發(fā)生沖突。目前，這兩個(gè)組織相互承認(rèn)，并有兼容的編碼。

目前，許多計(jì)算機(jī)系統(tǒng)使用2字節(jié)（16位整數(shù)）或4字節(jié)（32位整數(shù)）統(tǒng)一編碼。統(tǒng)一編碼只描述每個(gè)字符的編碼，但沒(méi)有解釋如何將編碼存儲(chǔ)在存儲(chǔ)介質(zhì)上。

目前，計(jì)算機(jī)系統(tǒng)中有前高字節(jié)和前低字節(jié)兩種整數(shù)存儲(chǔ)模式，因此前高字節(jié)的數(shù)據(jù)在前低字節(jié)的系統(tǒng)中會(huì)出現(xiàn)異常，反之亦然。同時(shí)，我們知道很多編程系統(tǒng)在處理字符串時(shí)，都會(huì)把值為0的字節(jié)作為字符串的結(jié)尾，不管是前高字節(jié)還是前低字節(jié)，字符串中都會(huì)出現(xiàn)大量值為0的字節(jié)，因此傳統(tǒng)的字符串處理功能無(wú)法使用。

為了解決統(tǒng)一編碼的存儲(chǔ)和與現(xiàn)有字符串處理函數(shù)兼容的問(wèn)題，引入了utf8編碼。這種編碼規(guī)定了統(tǒng)一編碼的存儲(chǔ)方式，并確保值為0的字節(jié)仍然用作字符串的結(jié)尾，這樣就可以繼續(xù)使用原來(lái)的字符串處理函數(shù)，而不需要開(kāi)發(fā)新的集合。

當(dāng)然，utf8也有一個(gè)問(wèn)題，那就是它是可變長(zhǎng)度編碼。統(tǒng)一編碼的字符可以編碼為一個(gè)字節(jié)、兩個(gè)字節(jié)、三個(gè)字節(jié)、四個(gè)字節(jié)（版本1）或六個(gè)字節(jié)（版本2）。

wps如何設(shè)置utf-8？

在word的另存為界面中，可以將保存的文件設(shè)置為UTF-8代碼。具體操作請(qǐng)參照以下步驟。

1. 在計(jì)算機(jī)上打開(kāi)目標(biāo)word文檔，然后單擊軟件界面左上角的“office按鈕”圖標(biāo)。

2. 然后，在下拉窗口中依次單擊“另存為/其他格式”選項(xiàng)。

3. 然后在出現(xiàn)的窗口中，單擊“工具”下拉菜單中的“web選項(xiàng)”。

4. 然后在窗口的“編碼”頁(yè)中將編碼模式設(shè)置為UTF-8格式，然后單擊“確定”。

5. 完成上述設(shè)置后，可以將目標(biāo)word文檔更改為UTF-8文檔。

怎么在Python里使用UTF-8編碼？

在第一行添加#-*-編碼：UTF-8-*-告訴python編譯器PY文件是用UTF-8編碼的，這樣就可以在PY文件中插入中文字符，但是您必須確保PY文件確實(shí)是用UTF-8編碼的，這可以在一些高級(jí)文本編輯器中設(shè)置。但是，在windows的默認(rèn)編輯器中，保存的編碼實(shí)際上是GB2312。當(dāng)然，您可以在第一行添加描述，但這實(shí)際上會(huì)誤導(dǎo)編譯器，并且應(yīng)該是#-*-編碼：GB2312-*-但不建議這樣做。最好的編碼是國(guó)際通用的UTF-8

在計(jì)算機(jī)中，任何文本都以指定的編碼模式存儲(chǔ)。Java中常見(jiàn)的代碼有：UTF、iso8859-1、GBK、Unicode。

iso8859-1是一個(gè)單獨(dú)的自編碼，只能表示0~255個(gè)字符。它主要用于英文

GBK中文國(guó)標(biāo)編碼，它主要代表漢字，是雙字節(jié)編碼

Unicode標(biāo)準(zhǔn)編碼之一，它用十六進(jìn)制表示編碼。此編碼與iso8859-1不兼容

UTF編碼是可變長(zhǎng)度編碼，每個(gè)字符的長(zhǎng)度從1到6字節(jié)不等。

亂碼，主要是因?yàn)槌绦驔](méi)有處理字符編碼，比如默認(rèn)編碼是UTF，但是在程序中使用iso8859-1編碼，然后亂碼。造成亂碼的根本原因是字符編碼的不統(tǒng)一。

系統(tǒng)類可以獲取系統(tǒng)相關(guān)信息，獲取代碼的方法是public static properties getproperty（）

卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

為什么Linux系統(tǒng)默認(rèn)使用utf8編碼？

wps如何設(shè)置utf-8？

怎么在Python里使用UTF-8編碼？

相關(guān)推薦

怎么在Python里使用UTF-8編碼？