色另类_婷婷激情四月_亚洲精品无码不卡在线播放he_欧美第七页_精品国产综合区久久久久99_青娱乐极品盛宴在线

產品分類

當前位置: 首頁 > 新聞熱點

多核設計將在消費電子領域大行其道

發布日期:2022-07-14 點擊率:46

k Madden在“多核處理器前途未卜(Multi-core processors face uncertain future)”一文中關于多核芯片的討論焦點集中于單個的通用處理器架構上,實際上這種觀點對使用多處理器來解決系統架構問題作出了不必要的限制。正如Madden所言,大型半導體和服務器處理器供應商可以提供多核的對稱多處理器,每個對稱多處理器都可以運行并行的多線程軟件程序。這些多核處理器常在運行基于SAMD(single application multiple data)模型應用的大型服務器和筆記本電腦中。SAMD應用可回溯至早期的大型機時代,當時計算機專注于航班預定系統和實時銀行系統等實時應用。


當前,嵌入式設計中對稱多處理器(SMP)架構的應用引起了業界極大的關注。實際上,很少應用是同時并行(embarrassingly parallel)的。就像Madden提及,圖像和多媒體處理是同時并行的,但是這些應用已經有專用的多媒體芯片處理了,例如IBM的Cell處理器和ATI/Nvidia的圖形處理器。因此,包括Madden在內的很多專家都認為,對稱多處理器上的并行應用已經被局限在一個很小的范圍之內。


軟件工程師不習慣并行地考慮問題


在Madden的文章中,大多關于對稱多處理器的討論都會談到開發工具的問題。實際應用中,依靠軟件工具把一個巨大的單線程應用程序自動分配給多個處理器運行是不大可能的。類似于Verilog這樣的硬件描述語言可以很容易地表達并行操作,而像C這樣的軟件語言更適用于單線程算法的實現。為了讓C語言更適用于并行編程,人們做了很多改進嘗試,比如Concurrent C、UPC、mpC、pC等。它們有些通過特殊的庫,有些通過并行的API來實現并行進程的顯式標識和進程間的通信,例如Madden的文章中提到的MPI和OpenMP技術。


還有些研究人員試圖用全新的整合了并行編程結構的軟件開發語言來替代C語言。但是業界對這些新的編程語言并不認可(例如,Ada語言和Inmos公司的Occam語言均以失敗告終)。我們已經習慣于單任務的算法描述,對大多數程序員來說,思考并行程序或多線程操作都相當困難。然而,跳出SMP的限制來擴展處理器架構,我們發現至少有兩種利用異構而非同構的并行方式。使用該兩種便捷并行(convenient concurrency)方式能充分地將軟件開發人員從并行工作的思考中釋放出來,因為不同的并行任務間的聯系并非十分緊密。


圖1:超級3G移動電話原理圖
圖1:超級3G移動電話原理圖

第一種方式


你可以稱這種并行為“組合并行”,因為這種并行操作將不同的子系統組合在一起,而每個子系統中都包含一個或多個針對特定任務優化過的處理器。在這種架構設計中,結構化的子系統間的通信只在需要時才相互影響。圖1所示的超級3G移動電話系統體現了該思想。圖中共有18個獨立的處理模塊(灰色表示部分),每個模塊都有清晰的功能定義,因此很容易將整個系統功能劃分開來用18個處理器完成設計(考慮到子任務處理的話,可能需要更多處理器)。


一些人對這種架構設計提出批評,因為處理器和門電路的效率看上去并不是很高,至少在理論上只需用幾個高時鐘頻率的通用處理器(或者是SMP多核處理器)就可以替代10個、20個或更多的處理器核。實際上這些批評并不恰當,摩爾定律繼續促使在一片芯片上可以集成更多的晶體管,而Denard經典尺度則提供速度更快、功耗更低的晶體管,但是從90nm開始,Denard理論無法繼續提供更快的速度和更低的功耗了。在90nm節點上,功耗和能耗變得很難控制,而且隨著工藝的提高問題將更嚴重。所以嵌入式系統的設計人員從現在開始就必須接受降低系統時鐘頻率以滿足預期功耗和能耗指標的設計風格。


組合并行設計具有很多優點


* 將運算任務分配給幾個片上處理器來運行是典型的增加晶體管數量換取低主頻以降低功耗和能耗的方法。這是一種很好的工程折衷,由于時鐘速度和內核工作電壓之間的緊密關系,時鐘頻率的提高將使功耗呈超線性增長。此外,較低時鐘速度的處理器不必采用最新的制程工藝。相同光刻節點情況下,采用速度較慢的低功耗制程的靜態漏電流水平比采用高性能制程的漏電流水平小三個數量級。


* 當不需用到某個專用子系統時,可以切斷其電源供應。因此,設計人員可以很容易地確定何時使用或不使用這些專用子系統。


* ASIP可以比通用處理器具備更高效的利用面積和功耗,而用作組合并行系統中的任務處理器。由于所使用的通用處理器核很少,也相應地減少了晶體管的數量。組合并行的設計避免了與SMP硬件設計和多線程代碼相關聯的子系統所需的復雜交互與同步。一個四內核的SMP系統帶有音頻、視頻和照相功能,在運行其他任務時仍不會撤消911緊急電話,因此通常需要進行大量的仿真與分析。而高層實現交互的獨立子系統能很容易地進行單獨和組合的驗證操作。基于SystemC的系統仿真工具已經可以方便地對組合并行的系統設計進行仿真。不同的子系統可以用C語言來描述,并分別進行驗證,然后利用指令集仿真器對整個系統進行仿真,這比進行RTL仿真快幾百甚至上千倍。值得注意的是,C語言已經為嵌入式程序員廣泛接受并采用,因此軟件工程師無需學習新的語言。


第二種方式


計算通??梢詣澐譃橛瑟毩⑷蝿找鏄嫵傻牧魉€,因此便捷并行的第二種方式就是流水式數據流。各個流水式任務引擎都接收、處理并輸出數據塊,一旦處理任務完成后,數據塊就被送到下一級引擎。非對稱多處理算法常常出現在信號處理和圖像處理應用上,諸如移動電話的基帶處理、視頻處理和靜態圖像處理等。流水線不但允許并行處理,而且還允許執行基于ASIP的應用,因為流水線中的每一個處理器都能高度集中于執行某一部分的任務。


上述兩種便捷并行是互補的。因此,各個子系統的非對稱多處理能和流水式設計的組合子系統進行融合。消費類、便攜式和多媒體應用產品可能需要10到100個處理器,而這些處理器都將針對產品功能的特定任務進行優化。對基于非對稱多處理器的應用進行編程要比基于對稱多處理器的容易得多,因為不必考慮太多的交互任務依賴關系。經驗表明通過這種方式能更清晰地編寫軟件,而且可以避免在同構多處理器上運行多線程應用所帶來的大量優化問題。


采用這兩種便捷并行方式可以巧妙地避開阿姆達爾定律。因為許多并行算法可分別地使用組合并行設計來加速,而單一算法的諸多部分(例如視頻編解碼)可以使用流水式設計進行加速,所以整個系統的代碼將被分解為眾多小塊以分別進行優化加速??梢钥闯?由于并無增加軟件開發的需求,所以采用多核設計得到的益處要比阿姆達爾定律預測的大得多。


當然,獲得這些益處的同時是要付出一定代價的。在多顆處理器之間進行任務劃分和算法加速會導致設計需要使用更多的晶體管,這通常是采用分治的設計方法所必需的。然而,摩爾定律此時勝過了阿姆達爾定律,它使得增加的晶體管的成本非常低。相比之下,由高主頻和高性能處理技術造成的高能耗以及多線程軟件的開發復雜度所引發的成本問題則更為嚴重。


作者:Grant Martin

      Steve Leibson

      Tensilica公司


編者按:本文反駁了2008年1月2日SCDsource出版的Patrick Madden所作“前途未卜的多核處理器”一文中的觀點。





下一篇: 谷歌與IBM合作,欲主宰

上一篇: 多核網絡處理器及其開

主站蜘蛛池模板: 国产精品久久久久不卡 | 91在线精品秘密一区二区 | 国产一级做a爰片在线 | 亚洲天堂中文字幕 | 午夜精品一区 | 人人人人干 | 亚洲韩精品欧美一区二区三区 | a视频在线观看免费 | 久久久久久免费播放一级毛片 | 97国内精品久久久久久久影视 | 日本免费观看网站 | 综合导航 | 国产欧美在线视频 | 国产精品a久久久久 | 91亚洲免费视频 | 国产高清一区 | 婷婷五月色综合 | 日韩欧美精品在线观看 | 奇米色影 | 日韩手机在线观看 | 婷婷六月天 | 伊人精品国产 | 日韩免费一区二区三区 | 欧美在线性视频 | 91精品国产色综合久久 | 国产精品视频久久久 | 五月天婷婷缴情五月免费观看 | 日韩在线免费视频 | 国产精品日韩 | 99热.com| 天天操天天射天天插 | 精品欧美日韩 | 国产精品一区av | 偷偷狠狠的日日高清完整视频 | 二性视频 | 中国妞xxx | 91看片在线 | 成人影院wwwwwwwwwww | 狠狠干成人 | 国产视频在线看 | 欧美一级视频在线观看欧美 |