數(shù)據(jù)壓縮分為兩種類型 文件壓縮是什么原理?
文件壓縮是什么原理?文件壓縮的原理非常簡單。我舉個例子。例如,如果你是一家公司的老板,你想知道下面100名員工的工資,所以HR會給你一個excel表格。此excel有100行,第一行是姓名,第二行是相
文件壓縮是什么原理?
文件壓縮的原理非常簡單。我舉個例子。例如,如果你是一家公司的老板,你想知道下面100名員工的工資,所以HR會給你一個excel表格。
此excel有100行,第一行是姓名,第二行是相應(yīng)的薪資。HR給你每個員工的工資,這是文件本身。你開始稱贊這位員工工作認(rèn)真。第二天,一個聰明的人事專家來了。他發(fā)現(xiàn),除了第一個員工是2000元外,excel表實際上要花1000元。因此,智能人事專家重新繪制了一個excel表格,只有兩行。第一條線第一個員工2000元,第二條線其他員工1000元。這叫做壓縮。這也稱為無損壓縮。
但如果其他員工不都是1000元,有的是998元,有的是999元,有的是1002元,有的是1003元。你只是老板,不是工薪族,所以沒必要這么細(xì)心地掌握,所以這個聰明的員工還是給你一張桌子,第一行是2000,第二行是其他員工1000。雖然這張表格不夠準(zhǔn)確,但足以讓你了解整體薪資。這稱為有損壓縮。
能否把1GB的數(shù)據(jù)壓縮到1MB甚至更小的體積?
這真的是可能的。這只是一個可行的方法。沒有現(xiàn)成的技術(shù)。您可以將記錄信息的二進(jìn)制代碼轉(zhuǎn)換為10進(jìn)制,然后將小數(shù)點移到前面。這樣,就可以得到小于1的很長的小數(shù)點。理論上,可以將兩個較短的數(shù)字相除,得到以10為基數(shù)的超長十進(jìn)制數(shù)??梢杂檬S嗫臻g記錄計算方法、有限位、編碼形式等數(shù)據(jù)。但這將是對計算機(jī)計算能力的一次特殊考驗,特別是在加密計算量特別大的時候,現(xiàn)階段計算機(jī)無法完成這樣的任務(wù),我相信它會。。數(shù)據(jù)壓縮可以分為兩種類型:無損壓縮和有損壓縮。無損壓縮是指利用壓縮后的數(shù)據(jù)進(jìn)行重構(gòu)(或還原、解壓縮),重構(gòu)后的數(shù)據(jù)與原始數(shù)據(jù)完全相同;無損壓縮是指在重構(gòu)后的信號與原始信號完全一致的情況下進(jìn)行的壓縮。一個非常常見的例子是磁盤文件壓縮。根據(jù)目前的技術(shù)水平,無損壓縮算法一般可以將普通文件的數(shù)據(jù)壓縮到原來的1/2~1/4。常用的無損壓縮算法有Huffman算法和LZW(lenpel-Ziv&Welch)算法。有損壓縮是指利用壓縮后的數(shù)據(jù)進(jìn)行重建。重建數(shù)據(jù)與原始數(shù)據(jù)不同,但不影響人們對原始數(shù)據(jù)所表達(dá)信息的誤解。有損壓縮適用于重構(gòu)信號不必與原始信號完全相同的情況。例如,有損壓縮可以用于圖像和聲音壓縮,因為它包含的數(shù)據(jù)往往比我們的視覺系統(tǒng)和聽覺系統(tǒng)所能接收到的要多。一些數(shù)據(jù)可以丟失而不會誤解聲音或圖像所表達(dá)的含義,但壓縮比可以大大提高。
數(shù)據(jù)壓縮分為哪三類?
一般來說,數(shù)據(jù)壓縮方法可以分為三類:靜態(tài)、動態(tài)和混合方法。所謂靜態(tài)方法,就是在消息傳輸之前,已經(jīng)確定了源文本集和代碼子集之間的映射關(guān)系。動態(tài)方法是在消息集和隨時間變化的代碼子集之間建立映射關(guān)系。動態(tài)編碼又稱自適應(yīng)編碼,即不斷修改源消息集與碼字之間的配對關(guān)系,以更好地適應(yīng)消息集特征隨時間的變化。所有的自適應(yīng)方法都是一次性的操作方法,即只需要對源語料庫進(jìn)行一次掃描。靜態(tài)編碼需要兩個操作:第一次計算概率并確定映射,第二次傳輸碼字。當(dāng)一個算法既不是靜態(tài)的也不是動態(tài)的時,它被稱為混合方法。一種簡單的混合方法是使發(fā)送方和接收方保持包含K個靜態(tài)碼的相同碼本。每次發(fā)送消息時,發(fā)送方必須選擇事先商定的K個碼字中的一個,并通知接收方進(jìn)行解碼。
數(shù)據(jù)的壓縮方法有幾種?
事實上,多媒體信息中存在許多數(shù)據(jù)冗余。例如,一幅圖像中靜態(tài)建筑背景、藍(lán)天和綠地的許多像素是相同的。如果一點一點地存儲,會浪費(fèi)大量的空間,稱為空間冗余。再比如,在相鄰的電視和動畫序列中,只有運(yùn)動物體有微小的變化,只有差異部分可以存儲,這稱為時間冗余。此外,還有結(jié)構(gòu)冗余和視覺冗余,為數(shù)據(jù)壓縮提供了條件。
總之,壓縮的理論基礎(chǔ)是信息論。從信息的角度看,壓縮就是去除信息中的冗余,即去除某些或可推斷的信息,保留不確定的信息,即用更接近信息本質(zhì)的描述取代原有的冗余描述,其實質(zhì)是信息量。