膠水雙核 - 處理器
膠水雙核是使用特殊方法將兩個或更多芯片封裝在一起制造的處理器。由于這種特殊方法像是將兩個或更多核心用膠水粘在一起,由此而得名膠水雙核。

稱呼由來
“真雙核”與“假雙核”的說法是由AMD提出來的,Intel將兩顆Pentium4核心封裝在一個基板上,組成了PentiumD,AMD認為這種架構(gòu)是假雙核,而網(wǎng)友則更具想象力,將這種雙核稱為“膠水”雙核?!罢嫠暮恕迸c“假四核”也是同樣的道理,Intel將兩顆Core2Duo粘合成為一顆Core2Quad,而AMD則重新設計了Phenom原生四核CPU,“原生”與“膠水”的論戰(zhàn)再起波瀾。
所謂“膠水”處理器并不是粘在一起,而是使用特殊方法將兩個或更多芯片封裝在一起制造的處理器。由于這種特殊方法像是將兩個或更多核心用膠水粘在一起,由此而得名。
縱觀處理器發(fā)展的一路走來,膠水處理器的作用還是不可磨滅的,它讓處理器的性能再次提升,當AMD指責Intel的產(chǎn)品是假內(nèi)核,而Intel則辯稱用戶只重視CPU性能而并不在乎CPU內(nèi)部架構(gòu)。雖然AMD在“真假雙核”之爭中獲利更多一些,但人們在經(jīng)歷了“真假雙核”的狂轟爛炸之后,選購CPU的時候更冷靜和理智了。因為在實際各種評測之中,AMD的“真四核”性能卻往往不如英特爾的“膠水黏合”。因此,我們在比較CPU的時候,應該更關(guān)注其實際性能,不要盲目聽商家搬弄概念。
發(fā)展狀況
回顧一下處理器的發(fā)展史上有哪些產(chǎn)品屬于“膠水”處理器的行列:
1.最古老的“膠水”處理器
發(fā)布于1995年的PentiumPro是首款支持超過4GB內(nèi)存的處理器,它利用36位物理地址擴展(PAE)技術(shù)最大可支持64GB內(nèi)存。這款CPU也是第一款P6架構(gòu)(酷睿2核心也源自于此)處理器,也是首次在CPU內(nèi)部集成L2緩存。
PentiumPro最大特色在于首先采用了雙核封裝。由于那時CPU的制造工藝還停留在350nm-500nm階段,高速二級緩存單元還不能像現(xiàn)在這樣直接與運算核心加工在同甘共苦晶圓顆粒上面,必須要用兩顆晶圓顆粒分別加工,即一顆晶圓加工運算核心,另一顆晶圓加工緩存,然后再將它們“膠合”在一起。其實,這在當時已經(jīng)是一種非常先進的制造方法了。別忘了,在這之前,運算核心只能和主板上的系統(tǒng)內(nèi)存交換數(shù)據(jù)。當二級緩存和運算核心被一起封存裝進CPU后,二級緩存就可以與運算核心以相同的頻率運行,不必像以前那樣和速度較慢的系統(tǒng)內(nèi)存通信,為數(shù)據(jù)通信提供了捷徑,直接提升了性能。
2.引發(fā)口水大戰(zhàn)的“膠水”處理器:Intel奔騰D雙核
其實這還是要從AMDX2系列說起:當時在AMD推出X2以后,IntelP4依然無法擺脫高熱量、高能耗、低性能,導致Intel瞬間敗北。之后Intel為了應急推出了PD雙核產(chǎn)品,這款把兩個單核處理器粘在一起的產(chǎn)品,顯然沒有達到預期的效果,面對著AMDX2的“真雙核”有備而來,Intel首款膠水雙核也是為多核之路充當了回小白鼠,也正是這樣才讓Intel開始發(fā)展自己的“真雙核”,不過“膠水”CPU也從那以后成為Intel的最愛?!罢婕匐p核”的說法從那時開始應運而生,對立雙方各執(zhí)一詞。
3.“膠水”處理器再次升級:Intel酷睿2四核
2006年對AMD和英特爾來說,雙核斗法成了貫穿全年的唯一主題。起初,AMD憑借Athlon64X2和Athlon64FX處理器的良好表現(xiàn)橫掃千軍,在市場中威風八面。不曾想,英特爾靠PD假雙核臥薪嘗膽之后,鑄劍Core2大獲成功,重奪“性能”王座,從此,攻守易幟。2007年年初的時候,Intel發(fā)布了全新的Core2QuadQ6600四核處理器。作為世界上第一款四核處理器,這款處理器再度被牽涉進了“真假”問題的紛爭當中。眾所周知,Intel的PentiumD雙核處理器,就是將兩個Prescott核心集成在一起而成為了第一代雙核心的Smithfield處理器。之后Intel的酷睿雙核回歸到了“真雙核”行列里,而到了從雙核到四核架構(gòu)過渡之時,Intel再次故技重施,將兩顆Conroe核心集成到一起,成為了Intel第一款四核心Kentsfield處理器。這樣的設計雖然簡單,并且2+2模式的也可以縮短產(chǎn)品研發(fā)周期。不過由于先進的架構(gòu)和設計的關(guān)系,這款“膠水”的性能不錯,可能是由于Intel“膠水”配方好,和“膠水”工藝提高了,使得酷睿2四核產(chǎn)品性能十分優(yōu)秀。
4.“膠水”玩上癮:功耗最低的雙核AtomN330
伴隨著“膠水”CPU一路走來的Intel,雖然在全新架構(gòu)i7中,重登真四核領(lǐng)域,但是“膠水”的理念卻已根深蒂固,這不就在低功耗領(lǐng)域明目張膽的又重操舊業(yè)玩起了“膠水”雙核。圖中就是Intel發(fā)布的雙核Atom低功耗處理器,型號為Atom330,該處理器擁有1.6GHz的主頻,采用45nm工藝,擁有2個核心,TDP僅有8W,擁有533MHz的FSB,1MB二級緩存,售價達到了43美元。
客觀評價
可以感受到,一些國際大廠為何要在最王牌尖端的芯片產(chǎn)品上使用我們俗稱的MCM“膠水”技術(shù),其實有時候膠水技術(shù)也未必是落后的象征,只是針對的實現(xiàn)目的方法而已:
1.實現(xiàn)更高的芯片間傳輸性能-例如IntelPentiumPRO是為了性能而嵌入L2Cache,或如Microsoft/ATIXenos也是為求取性能而內(nèi)嵌eDRAM,此外IBM大型主機用處理器,以及POWER4/4+/5/5+等,也都是為了性能而使用MCM“膠水”技術(shù),求性能為首要,整合度更提升則為次要。
2.更高整合、多核競賽-Intel為求在雙核、多核的推出進度上能夠加快,因此三步并兩步來加緊追趕,如此不僅使用裸晶層面的多核整合技術(shù),同時也使用封裝層面的多核整合技術(shù)。
3.為求彈性、快速發(fā)展-Xenos之所以實行嵌入式eDRAM的原因還有一個,那就是彈性發(fā)展、加速發(fā)展。由于eDRAM技術(shù)并非是ATI的專長,而是NEC的強項,雖然ATI與NEC可以更密切合作,在裸晶層面就將eDRAM與C1一同設計,進而量產(chǎn),但如此做也有部份問題要顧慮。例如,ATI與NEC必須花費更多的協(xié)同合作心力,特別是在實體電路的設計層面,且在更換實體電路制程時,雙方就必須再次對實體電路的設計進行再協(xié)同溝通與再設計。再者,除了設計協(xié)同與電路改版等溝通心力外,也會羈絆雙方在原先自有領(lǐng)域的發(fā)展進度,使原有自己擅長的本務進步動力減緩,反而使其他同業(yè)有機會追趕。
所以,還是以各自分開設計與分開發(fā)展為宜,最后再運用MCM封裝方式來加速互連,以獲得比PCB電路板層次更高的性能,但又有Die裸晶層次所不具備的發(fā)展、設計彈性。如此很明顯的:MCM將是整合度、互連性能高于板卡層,但電路發(fā)展與設計彈性又高于裸晶層的一種技術(shù),相信未來此種技術(shù)的應用將愈來愈廣泛。
真假之爭
2005年中,Intel和AMD相繼發(fā)布雙核心處理器PentiumD和Athlon64X2,雙方的產(chǎn)品是各有特色:AMD繼續(xù)保持單核Athlon64系列高效能低功耗的優(yōu)勢,而Intel繼續(xù)保持Pentium4系列高頻率高功耗的特色。
當然最大的不同還是在核心架構(gòu)方面,Athlon64X2是經(jīng)過重新設計的單一芯片原生雙核方案,而PentiumD則是兩把兩顆Pentium4核心封裝在一起而已。Intel的高頻低能與膠水雙核的確是一大軟肋,于是AMD最先發(fā)難,挑起了真假雙核之爭,下面我們就來簡單回顧下:
2005年5月,AMD宣稱,其用于服務器和臺式機的雙核處理器產(chǎn)品為“真雙核”架構(gòu),以與Intel的PentiumD產(chǎn)品進行區(qū)分。
2005年6月7日,AMD大中華區(qū)市場總監(jiān)王嫵蓉表示:我們非常尊重我們的競爭對手,無意對它進行抵毀,我們只是想說明在雙核處理器方面AMD的架構(gòu)與英特爾的架構(gòu)并不相同,AMD的產(chǎn)品在架構(gòu)上的優(yōu)勢更為明顯,性能更強。
2005年12月上旬,Intel總裁來華公關(guān),稱AMD轉(zhuǎn)讓給中國的處理器技術(shù)過時。
2005年12月中旬,AMD發(fā)起“我為雙核狂AMD真雙核體驗風暴活動”,再拋“真假雙核論”的王牌,認為自己是一個芯片上的兩個核,是真正的雙核,而Intel是一個處理器上的兩個芯片,是假雙核,并從網(wǎng)上招募電腦愛好者進行線上體驗雙核應用。同時在北京舉行的小型媒體交流會,展示AMD雙核處理器性能優(yōu)勢的大量測試數(shù)據(jù)。
Intel中國公司新聞發(fā)言人劉捷對于AMD發(fā)起挑戰(zhàn)的問題回答很簡單:“沒必要”。其表示,Intel作為首先提出雙核概念并且實現(xiàn)大范圍市場化的領(lǐng)先企業(yè),對于自己的產(chǎn)品十分有信心。沒有必要通過這種評測來證明。
2006年02月27日,Intel中國北方區(qū)總經(jīng)理曾明指出AMD在雙核上制造了一個“謊言”。這是Intel半年來第一次針對AMD雙核挑戰(zhàn)表明立場。同時,曾明還拿出一家第三方最新的評測數(shù)據(jù),稱AMD雙核產(chǎn)品在執(zhí)行多任務時的低性能。
2006年2月28日,AMD公司就Intel的系列指責做出回應,表示“此測試結(jié)果的出現(xiàn)純屬軟件原因,AMD無意攻擊競爭對手。Intel公司引用的數(shù)據(jù)是斷章取義?!辈⒈硎緩奈磳ntel的處理器稱假雙核,更沒有對Intel進行過抨擊,所謂“假雙核”的說法屬于空穴來風。
自從雙核處理器問世以來,AMD曾在美國、新加坡等地邀請英特爾“決戰(zhàn)雙核”,對此Intel一直不予理會,Intel唯一一次公開回應,使得延續(xù)一年多的“真假雙核處理器”之爭愈演愈烈。
資深的玩家應該知道,AMD在當年的確占有性能和功耗方面的雙重優(yōu)勢,所以AMD理直氣壯、咄咄逼人的態(tài)勢讓Intel無言以對。但當年Athlon64X2的價格可是高得離譜,最便宜的型號都要2000左右,而Intel則非常親民,PentiumD805還不足千元,處于劣勢的Intel擔任了雙核普及使者。
手機雙核
參賽選手亮相
首先,讓我們來看看市面上有哪些雙核心手機處理器。德州OMAP4430,三星Exynos?4210,英偉達Tegra?2,高通MSM8x60。
好,這些就是即將上陣的選手了。下面我們會依次考量它們在諸多方面的表現(xiàn),看看究竟哪個雙核名副其實,哪個雙核浪得虛名。
較量項目一:處理器核心架構(gòu)
我們知道,計算機程序,都是由一條一條的指令組成的。這些指令有很多種功能,有的是把數(shù)據(jù)從一個地方復制到另一個地方,有的是做數(shù)學運算,有的負責判斷某一個條件,有的負責從一處跳轉(zhuǎn)到另一處。編譯器會把所程序員寫出的程序編譯成一條一條順序的指令,就像電器的使用指南一樣,讓處理器遵照它去做。為了方便理解,我們假設一個程序的內(nèi)容是做一份考試卷,執(zhí)行的過程是先做完選擇題,再做完問答題;做選擇題的條件是要有鉛筆去涂答題卡,而做問答題的條件則是要有鋼筆去寫答題紙。
如果你忘了帶鉛筆,那么為了完成考卷,就必須要等到鄰座的做完了選擇題,你找他借來鉛筆,才能繼續(xù)自己的考卷,這樣就耽誤了時間。對于一顆標準處理器而言,很多時候都會遇到這類“沒有帶鉛筆”的情況,比如需要訪問的數(shù)據(jù)在內(nèi)存里,這就需要處理器通知內(nèi)存管理器,讓內(nèi)存管理器去把數(shù)據(jù)調(diào)入處理器,才能繼續(xù)執(zhí)行這一條指令。由于處理器內(nèi)部的時鐘延遲是納秒級別,而內(nèi)存的運行頻率則有數(shù)十納秒的延遲,兩者之間差了許多倍,因此處理器一般需要消耗很長的等待時間,才能繼續(xù)開始工作,最終的結(jié)果就是性能下降。
最后,我們給這些處理器的核心架構(gòu)作個評分(考慮到默認頻率):
Tegra2★★★
OMAP4430★★★★★
MSM8x60★★
Exynos?4210★★★★★
較量項目二:處理器核心的協(xié)同作戰(zhàn)能力
可能多處理器架構(gòu)這個詞對于不少讀者而言都是很陌生的,很多人可能從來都沒注意到過這方面的東西。所謂多處理器架構(gòu),就是說多顆處理器以何種模式共同運行,以怎樣的方式合作執(zhí)行程序。在PC領(lǐng)域,這個概念并不重要,因為大家看到的多處理器(多核心處理器也可以看作制作在一個芯片上的多處理器),在邏輯架構(gòu)上都是一樣的,那就是同步多處理器,英文為Synchronous?Multi-Processors,縮寫為SMP(不是對稱多處理器的那個SMP)。但是在多處理器體系剛剛出現(xiàn)的階段,曾經(jīng)也有過很多不同的邏輯架構(gòu),而在目前的手機市場上就恰恰存在著不采用SMP架構(gòu)的多處理器,那就是高通的MSM8x60。
與SMP不同,高通所采用的架構(gòu)名為ASMP,即異步多處理器架構(gòu)。所謂同步和異步,差距并不是簡單的兩個字,在具體實現(xiàn)上的區(qū)別非常大。但是在此我們并不需要了解它們之間學術(shù)上的區(qū)別,我們只從最粗略的角度來看
所謂同步多處理器,顧名思義就是同步的,即多枚處理器運行在同樣的時鐘頻率,共享同樣的緩存數(shù)據(jù),協(xié)同工作。簡單來說,同步多處理器系統(tǒng)在工作的時候,每當一個任務完成后,空閑的處理器會立刻尋找下一個新的任務,對于外部而言,這兩顆處理器是一個整體,共同完成同一個工作。
而異步多處理器則更接近于若干個獨立工作的處理器,它們之間可以運行在不同的頻率下,每個處理器維護自己私有的緩存數(shù)據(jù),最重要的是,它們之間會利用一種仲裁機制,以輪流工作的方式執(zhí)行任務。它們更像是一些互不干擾的獨立處理器,各自完成各自的事情,輪流執(zhí)行不同的工作。
看到這兒,相信大家也看出來了,同步和異步最大的區(qū)別就在于輪流工作這四個字。具體而言,就是在同一時間,只有一顆處理器可以接受任務,另一顆不論是否繁忙,都不能接受新任務??赡芄饪课淖终f明還不是那么生動,下面我們就來看幾張圖,了解一下相對于同步多處理器“誰空閑誰接單“的工作模式而言,這種輪流工作到底是怎樣進行的,又會導致怎樣的結(jié)果。
圖中每一橫行代表一個時鐘周期,我們用紅色的方塊代表正在讀取任務,綠色的方塊代表正在執(zhí)行任務,方塊中的數(shù)字代表不同的任務,而空白代表著空閑狀態(tài)。在第一張圖里,我們假設任何任務只需要一個周期就可以執(zhí)行完畢。一下這兩種架構(gòu)的工作方式。
同樣,讓我們也來針對多處理器架構(gòu),給四款雙核一個評分:
Tegra2★★★
OMAP4430★★★★★
MSM8x60★★★
Exynos4210★★★★★
較量項目三:通訊總線
關(guān)于總線的研究就到此為止了,依然按照慣例,最后給一個分數(shù):
Tegra2★
OMAP4430★★★★★
MSM8x60★★
Exynos4210★★★★★
較量項目四:多媒體
何謂多媒體擴展指令集?由于原理復雜堅澀,小編就簡單的打個比方:廠商們分析平時處理器干哪些事情最慢、又最經(jīng)常用到,然后把這些最消耗時間的事情固化成電路,做成一個額外的部分,和處理器集成到一起。使用的時候,只通過一條指令,就能夠訪問和計算多組數(shù)據(jù),把最消耗時間的事情盡快做完。在計算機詞匯里,這種指令集叫做SIMD(Single?Instruction?Multiple?Data,單指令多數(shù)據(jù))指令集。在視頻解碼方面,Tegra?2也會因為不具備NEON協(xié)處理器而受到很大的影響。因為我們知道,Tegra?2雖然號稱可以支持諸多格式的1080p全高清解碼,但是它對視頻的編碼格式有著非常嚴格的要求,例如Tegra?2的視頻解碼核心只能硬件解碼Main?Profile的H.264視頻,而對于其它的就只能靠處理器來進行軟件解壓。這時沒有NEON協(xié)處理器的幫助,視頻解壓就很難高效的進行,最終導致Tegra?2的多媒體特性縮水。
也許nVIDIA是認為NEON協(xié)處理器的授權(quán)價格過于昂貴,或者可能因為規(guī)模太大而提升制造成本,而最終選擇了放棄,但作為消費者而言,不具備NEON指令集的Tegra?2無疑會在多媒體方面的競爭中被對手遠遠甩開。好了,關(guān)于多媒體的比拼也要告一段落了,最后我們照例為每個處理器給出評分。
Tegra2★
OMAP4430★★★★★
MSM8x60★★★★★
Exynos4210★★★★★
較量項目五:3D加速
而作為曾經(jīng)參與桌面競爭、當下專注嵌入式GPU的Imagination公司,自然不愿意讓出嵌入式獨立GPU市場的性能領(lǐng)導地位。在OMAP4430上,我們看到的就是這家公司設計的PowerVR?SGX540。這是一顆大家很熟悉的GPU,因為早在單核Cortex?A8時代,三星就在代號蜂鳥的處理器中采用了這顆GPU,它強大的性能也讓采用蜂鳥處理器的機型在單核時代傲視群雄。與GeForce?ULP不同的是,PowerVR?SGX540內(nèi)并沒有單獨的頂點處理器或者像素處理器,而是包含了四組通用處理器。這種類似于桌面顯示核心統(tǒng)一渲染器的設計結(jié)構(gòu)可以讓PowerVR?GPU用最少的硬件獲取最大的性能,從而節(jié)約成本和功耗。值得一提的是,也正是由于通用處理器的設計,PowerVR?SGX540成為了當前唯一一顆支持OpenCL通用運算標準的GPU
可以看到,在規(guī)格指標方面,Exynos?4210是遙遙領(lǐng)先的,而Tegra?2緊隨其后。至于具體的性能表現(xiàn),我們在后面的測試中將簡單介紹。值得注意的是,上表中的參數(shù)未必是最終的實際性能,理論參數(shù)一般都會受到實際應用環(huán)境的強烈影響。
不過不管怎樣,我們還是要打個分的,暫時按照物理參數(shù)吧。
Tegra2★★★★
OMAP4430★★★
MSM8x60★★
Exynos4210★★★★★
誰是純爺們,四款雙核大混戰(zhàn)
上述評測,也許很多人會覺得,為什么Tegra?2如此之差。nVIDIA果然還是這方面的菜鳥??!如果這樣想你就錯了,因為在這些芯片的背后,還有一些重要的參數(shù)和取舍,之前的文章里我們并沒有提到,那就是成本上述炫目的技術(shù)分析,相信大家都累了。下面就讓我們從一些性能測試中一窺這幾顆處理器在實際產(chǎn)品中的表現(xiàn)吧。首先介紹一下采用了這四顆芯片的實際產(chǎn)品。
Exynos?4210與Apple?A5則走在了性能的極端,實際上可以說忽略了成本與功耗的表現(xiàn)。而最悲劇的依然是Tegra?2,nVIDIA片面追求低成本,導致性能方面慘不忍睹,這可能是nVIDIA在Tegra?2上需要學到的最大的教訓。
