|
摘要:介紹內(nèi)存壓縮技術(shù)和一個基于硬件的內(nèi)存壓縮系統(tǒng)模型,探討內(nèi)存壓縮技術(shù)在嵌入式系統(tǒng)中的應(yīng)用;重點(diǎn)介紹內(nèi)存壓縮系統(tǒng)的硬件要求及操作系統(tǒng)對內(nèi)存壓縮機(jī)制的支持;簡單介紹內(nèi)存壓縮中常用的算法lempel-ziv,并就內(nèi)存壓縮技術(shù)在嵌入式系統(tǒng)中的應(yīng)用問題作一些探討。 關(guān)鍵詞:嵌入式系統(tǒng) 內(nèi)存壓縮 壓縮內(nèi)存控制器 lempel-ziv算法 1 內(nèi)存壓縮技術(shù)介紹 為節(jié)省存儲空間或傳輸帶寬,人們已經(jīng)在計(jì)算機(jī)系統(tǒng)中廣泛地使用了數(shù)據(jù)壓縮技術(shù)。在磁介質(zhì)存儲數(shù)據(jù)或網(wǎng)絡(luò)傳輸數(shù)據(jù)時,人們使用基于硬件或軟件的各種壓縮技術(shù)。當(dāng)壓縮技術(shù)在各個領(lǐng)域都很流行時,內(nèi)存壓縮技術(shù)卻由于其復(fù)雜性而一直未得到廣泛使用。近年來,由于在并行壓縮一解壓算法以及在硅密度及速度方面取得的進(jìn)展,使得內(nèi)存壓縮技術(shù)變得可行。 內(nèi)存壓縮技術(shù)的主要思想是將數(shù)據(jù)按照一定的算法壓縮后存入壓縮內(nèi)存中,系統(tǒng)從壓縮內(nèi)存中找到壓縮過的數(shù)據(jù),將其解壓后即可以供系統(tǒng)使用。這樣既可以增加實(shí)際可用的內(nèi)存空間,又可以減少頁面置換所帶來的開銷,從而以較小的成本提高系統(tǒng)的整體性能。 內(nèi)存壓縮機(jī)制是在系統(tǒng)的存儲層次中邏輯地加入一層——壓縮內(nèi)存層。系統(tǒng)在該層中以壓縮的格式保存物理頁面,當(dāng)頁面再次被系統(tǒng)引用時,解壓該壓縮頁后,即可使用。我們將管理這一壓縮內(nèi)存層的相關(guān)硬件及軟件的集合統(tǒng)稱為內(nèi)存壓縮系統(tǒng)。內(nèi)存壓縮系統(tǒng)對于cpu、i/o設(shè)備、設(shè)備驅(qū)動以及應(yīng)用軟件來說是透明的,但是操作系統(tǒng)必須具有管理內(nèi)存大小變化以及壓縮比率變化的功能。 對于大多數(shù)的操作系統(tǒng)而言,要實(shí)現(xiàn)內(nèi)存壓縮,大部分體系結(jié)構(gòu)都不需要改動。在標(biāo)準(zhǔn)的操作系統(tǒng)中,內(nèi)存都是通過固定數(shù)目的物理頁框(page frame)來描述的,由操作系統(tǒng)的vmm來管理。要支持內(nèi)存壓縮,os要管理的實(shí)際內(nèi)存大小和頁框數(shù)目是基于內(nèi)存的壓縮比率來確定的。這里的實(shí)現(xiàn)內(nèi)存是指操作系統(tǒng)可的內(nèi)存大小,它與物理內(nèi)存的關(guān)系如下:假設(shè)pm是物理內(nèi)存,rm(t)是系統(tǒng)在t時刻的實(shí)際內(nèi)存,而cr(t)是壓縮比率,在給定時刻t可支持的******實(shí)際內(nèi)存為rm(t)=cr1(t)%26;#215;pm。然而,由于應(yīng)用程序的數(shù)據(jù)壓縮率是不依賴于os而動態(tài)變化的,未壓縮的數(shù)據(jù)可能會耗盡物理內(nèi)存,因此當(dāng)物理內(nèi)存接近耗盡時,操作系統(tǒng)必須采取行動來解決這個問題。 2 內(nèi)存壓縮系統(tǒng)的硬件模型 目前由于內(nèi)存壓縮的思想越來越引起人們的注意市場上也出現(xiàn)了一些基于軟件的內(nèi)存壓縮器。這些內(nèi)存壓縮器主要是通過軟件對數(shù)據(jù)進(jìn)行壓縮,但由于訪問壓縮數(shù)據(jù)帶來的延遲,它在系統(tǒng)性能方面改進(jìn)并不明顯,有些甚至降低了系統(tǒng)性能。本節(jié)介紹一種基于硬件的內(nèi)存壓縮系統(tǒng)模型。 圖1是一個典型的內(nèi)存壓縮系統(tǒng)的硬件模型,包括了壓縮內(nèi)存、l3高速緩沖、壓縮內(nèi)存控制器等硬件部分。 其中壓縮內(nèi)存(133mhz sdram)包含了壓縮數(shù)據(jù)。l3高速緩沖是一個共享的、32mb、4路組相聯(lián)、可回寫的高速緩沖,每行大小為1kb,由兩倍數(shù)據(jù)率(ddr)sdram制定。l3高速緩沖包含了未壓縮的緩沖行,由于大部分的訪問都可以在l3高速緩沖中命中,因此它隱藏了訪問壓縮主存引起的延遲。l3高速緩沖對于存儲分級體系中的上層而言就是主存,它的操作對于其它硬件,包括處理器和i/o來說都是透明的。壓縮內(nèi)存控制器是整個內(nèi)存壓縮系統(tǒng)的控制中心,它負(fù)責(zé)數(shù)據(jù)的壓縮/解壓,監(jiān)控物理內(nèi)存的使用情況以及實(shí)際地址到物理地址的尋址過程。 數(shù)據(jù)壓縮過程是這樣的:壓縮內(nèi)存控制將1kb的高速緩沖行壓縮后寫入壓縮內(nèi)存中,然后將它們從壓縮內(nèi)存中讀出后解壓。其壓縮算法就是lempel-ziv算法,我們會在下一部分介紹這個算法。壓縮機(jī)制將壓縮的數(shù)據(jù)塊以不同的長度格式存放到內(nèi)存中。壓縮內(nèi)存的存儲單元是一個256字節(jié)的區(qū)域。按照壓縮比率不同,一個1kb的內(nèi)存塊(正好是l3每行的大小)可以占據(jù)0~4個壓縮區(qū)域。 壓縮內(nèi)存控制器必須根據(jù)長度格式的不同將系統(tǒng)總線上的實(shí)際地址翻譯成物理內(nèi)存的中的物理地址。實(shí)際地址是出現(xiàn)在處理器外部總線上常規(guī)地址。篁 址用來錄十壓縮內(nèi)存的256字節(jié)區(qū)域。實(shí)際地址空間存在于l1/l2/l3高速緩沖中,用于立即訪問。而其余的內(nèi)存內(nèi)容部分以壓縮形式存在于物理內(nèi)存中。內(nèi)存控制器通過查詢壓縮翻譯表(ctt)執(zhí)行從實(shí)際地址到物理地址的翻譯,這個表被保留在物理內(nèi)存的某個位置。圖2是ctt表的格式及內(nèi)存控制器的尋址模式。 每個1kb內(nèi)存塊的實(shí)際地址映射到ctt的一項(xiàng),而ctt每項(xiàng)共16字節(jié),包括四個物理區(qū)域地址,每個地址指向物理內(nèi)存聽一個256字節(jié)區(qū)域。對于少于120位的塊,如一個全為零的塊,則使用一種特殊的ctt格式,稱為通用行格式。在這種格式中,壓縮數(shù)據(jù)全部存放在ctt項(xiàng)中,代替了四個地址指針。因此,一個1kb的通用塊僅占用物理內(nèi)存中的16字節(jié),其壓縮比率達(dá)到64:1。 壓縮內(nèi)存控制器中有一系列的寄存器用于監(jiān)控物理內(nèi)存使用。sectors used register(sur)向操作系統(tǒng)報(bào)告壓縮內(nèi)存的使用情況。the sectors used threshold registers,suthr和sutlr,用于設(shè)置內(nèi)存耗盡情況的中斷入口點(diǎn)。sutlr寄存器是pci中斷電路inta的入口,而suthr寄存器是nmi中斷的入口。當(dāng)sur超過了sutlr的值,內(nèi)存控制器產(chǎn)生一個中斷,則操作系統(tǒng)采取措施來阻止內(nèi)存消耗。 在實(shí)際地址到物理地址的轉(zhuǎn)換中,一個有用的方法是快速頁操作。它允許控制器僅修改ctt項(xiàng)的四個指針,從而將4kb的頁面內(nèi)容換出或清空??焖夙摬僮魍ㄟ^將與4kb頁面相關(guān)的ctt項(xiàng)全部修改通用行格式(即全為零),從而將這4kb頁面的內(nèi)容全部清空。同樣,一對頁面可以通過交換它們相關(guān)的ctt項(xiàng)的區(qū)域指針來交換頁面內(nèi)容。由于沒有大量的數(shù)據(jù)移動發(fā)生,快速頁面操作速度相當(dāng)快。 壓縮內(nèi)存控制器的壓縮/解壓功能是基于lempelziv算法來進(jìn)行的,因此下一節(jié)將簡單介紹一下該算法的思想。 3 內(nèi)存壓縮算法lempel-ziv 絕大多數(shù)的壓縮算法,包括用得特別流行的lempel-ziv壓縮算法家庭,都是基于對原子記錄(token)字符串的完全重復(fù)檢測。這個算法雖然不是最好的算法,但是,lempel-ziv算法強(qiáng)調(diào)的是算法的簡單與取得高壓縮率的速率,因此它還是在內(nèi)存壓縮中得到了廣泛的應(yīng)用。 lemple-ziv算法(簡稱lz)是編碼時將一個位串分成詞組,然后將數(shù)據(jù)流描述成一系列的對。每個對組成一個新的詞組,它包含一個數(shù)字(前一個詞組的標(biāo)識)和一個位(被附加到前一個詞組上)。這種編碼方式很龐大,可是一旦應(yīng)用到適合的字符串,它就是相當(dāng)有效率的編碼方式。下面舉例說明這種算法是如何編碼的。 ++表示連接(010++1=0101),u=0010001101是未被壓縮的字符串。c是壓縮后的字符串。p(x)表示詞組數(shù)x。先看一下u=0010001101發(fā)現(xiàn),它可以被寫為u=0++010001101,因此得到p(1)=p(0)++0?,F(xiàn)在繼續(xù)將其寫為u=0++02++0001101,可得到p(2)=p(1)++1?,F(xiàn)在我們已經(jīng)將p(2)描述為上一詞組和一個新的位的組合。下一步,u=0++01++00++01101,并得到p(3)=p(1)++0?,F(xiàn)在我們注意到,有u=0++01+00+011++01,而p(4)=011=p(2)++1,最后得到p(5)=p(1)++1。運(yùn)算的步驟如表1所列。 一旦創(chuàng)建了表1,就有了整個編碼的圖表。要創(chuàng)建lempel-ziv數(shù)據(jù)流,則依照公式創(chuàng)建對。如果公式是p(x)=p(a)++b,則每個對為(a++b)。因此p(1)=p(0)++0變?yōu)椋?0++0),p(2)=p(1)++0變?yōu)椋?1++0),依此類推,將所有這些對連接起來,就得到了最后的字符串,結(jié)果如表2所列。這樣,c就變成000011010101011,看來比u要長得多。但這里由于u的長度短,因此未能看出優(yōu)勢,而且包含p(0)的公式都沒有壓縮,所以也引起了長度增加。 lempel-ziv字符串的解碼是很簡單的,就是抓住其中的對,對照表1進(jìn)行重構(gòu)。 表1 編碼過程 步 驟值公 式 u 0 - p(0) 0010001101 1 0 p(1)=p(0)++0 0++010001101 2 01 p(2)=p(1)++1 0++01++00++01101 3 00 p(3)=p(1)++0 0++01++00++01101 4 011 p(4)=p(2)++1 0++01++00++011++01 5 01 p(5)=p(1)++1 0++01++00++011++01 表2 如何創(chuàng)建編碼字符串 公 式 p(1)=p(0)++0 p(2)=p(1)++1 p(3)=p(1)++0 p(4)=p(2)++1 p(5)=p(1)++1 對 00++0=000 01++1=011 01++0=010 10=++1=101 01++1=011 c 000++011++010++101++011=000011010101011 4 操作系統(tǒng)對內(nèi)存壓縮的支持 在壓縮內(nèi)存系統(tǒng)中,內(nèi)存大小指的是實(shí)際內(nèi)存大小,它比物理內(nèi)存大。在引導(dǎo)時,bios向操作系統(tǒng)報(bào)告的內(nèi)存大小就比實(shí)際安裝的物理內(nèi)存要大。例如,硬件原型安裝的是512mb的sdram,但bios向操作系統(tǒng)報(bào)告的內(nèi)存大小為1gb。當(dāng)應(yīng)用程序數(shù)據(jù)以2:1或更高的比率壓縮時,實(shí)際內(nèi)存的工作方式與一般操作系統(tǒng)的內(nèi)存工作方式是相同的。但當(dāng)應(yīng)用程序以未壓縮數(shù)據(jù)來填充內(nèi)存時(如一個zip文件不可能達(dá)到2:1的壓縮比率),由于一般的os只看到實(shí)際地址空間,因此不能意識到物理內(nèi)存已經(jīng)耗盡。例如,一個操作系統(tǒng)的實(shí)際內(nèi)存為1024mb,而牧師內(nèi)存為512mb。這時實(shí)際內(nèi)存已經(jīng)分配了600mb,系統(tǒng)顯示還有424mb的空閑內(nèi)存。但是由于已分配內(nèi)存的壓縮率很低,此時物理內(nèi)存的耗用已經(jīng)接近512mb。如果再近一步地分配內(nèi)存,那么系統(tǒng)就會因?yàn)槲锢韮?nèi)存的耗盡而崩潰,盡管它仍然顯示還有424mb的空閑內(nèi)存。這種情況下,必須由操作系統(tǒng)提供對壓縮內(nèi)存進(jìn)行管理的支持。 由于內(nèi)存壓縮是一個比較新的概念,一般的情況作系統(tǒng)都沒有這樣的機(jī)制來區(qū)分實(shí)際地址和物理地址,也不能處理“物理內(nèi)存耗盡”的情況。不過,只要對操作系統(tǒng)內(nèi)核做一些小的改動或者在操作系統(tǒng)之上增加一個設(shè)備驅(qū)動程序,即可達(dá)到目的。 一般來說,要從以下幾方面對壓縮內(nèi)存進(jìn)行管理。 (1)監(jiān)控物理內(nèi)存使用情況 通過輪詢或中斷法,查看物理內(nèi)存的使用情況,并在物理內(nèi)存耗盡前給出警告。壓縮內(nèi)存管理例程是通過壓縮內(nèi)存控制器中的一些寄存器來實(shí)現(xiàn)對物理內(nèi)存的監(jiān)控。sur報(bào)告物理內(nèi)存的使用情況,suthr和sutlr用于設(shè)置中斷臨界值。壓縮內(nèi)存管理算法是基于物理內(nèi)存使用的四種狀態(tài),分別為steady、acquire、danger和interrupt,其臨界值的關(guān)系是mc_th_acquire 5 內(nèi)存壓縮技術(shù)在嵌入式系統(tǒng)中的應(yīng)用 嵌入式系統(tǒng)是一種特殊的計(jì)算機(jī)系統(tǒng),它是一個更大的系統(tǒng)或設(shè)備的一部分。通常,一個嵌入式系統(tǒng)是駐留在單處理機(jī)底板上的,其應(yīng)用程序存儲在rom中。事實(shí)上,所有具有數(shù)字接口的設(shè)備——監(jiān)視器、微波爐、vcrs、汽車等,都使用了嵌入式系統(tǒng)。一些嵌入式系統(tǒng)包含了操作系統(tǒng),稱為嵌入式操作系統(tǒng)。為了滿足嵌入式應(yīng)用的特殊要求,嵌入式微處理器雖然在功能上和標(biāo)準(zhǔn)微處理器基本是一樣的,但和工業(yè)控制計(jì)算機(jī)相比,嵌入式微處理器具有體積小、重量輕、成本低、可靠性中,內(nèi)存仍然是珍貴的資源,因此研究內(nèi)存壓縮技術(shù)在嵌入式系統(tǒng)中的應(yīng)用具有一定的價值。 內(nèi)存壓縮的思想在一些嵌入式操作系統(tǒng)中,實(shí)際上已經(jīng)得到了體現(xiàn)。例如在vxworks中,當(dāng)操作系統(tǒng)下載到目標(biāo)機(jī)上時,其中一種方式是將引導(dǎo)程序和vxworks映像都存放在rom中。為了將其解壓后再從rom拷貝到ram。這種基于軟件的壓縮方式,可以節(jié)省rom空間,但其引導(dǎo)過程相對較慢。 以上的內(nèi)存壓縮技術(shù)在rom中得到了應(yīng)用,但對于ram來講,基于軟件內(nèi)存壓縮技術(shù),由于其訪問壓縮數(shù)據(jù)可能造成的延遲和不確定性,會對嵌入式系統(tǒng)的實(shí)時性造成和。因此它與虛擬內(nèi)存技術(shù)一樣,在嵌入式系統(tǒng)中未得到廣泛應(yīng)用。 本文所介 |