芯片的PPA,還有意義嗎?

如果您希望可以時常見面,歡迎標星收藏哦~

來源:內容編譯自semiengineering,謝謝。

自 EDA 誕生以來,功率、性能和麪積 (PPA) 的優化一直是芯片設計的核心,但如果不瞭解這些芯片將如何以及在何處使用,這些指標的價值就會降低。

然而,與過去不同的是,現在的這種背景來自硬件開發之外的因素。儘管 PPA 仍然是硬件開發流程許多部分的有用代理,但各個組件的相關性往往不如過去。

多年來,人們又增加了其他關注點,尤其是能源和熱量。這些指標都是相互關聯的,因此不可能將它們視爲優化的獨立軸。複合指標(例如每瓦性能或每操作焦耳)可能更有意義。其他重要因素是可持續吞吐量或操作延遲。

隨着特定領域解決方案的激增,上下文(Context)變得越來越重要。上下文可以來自兩個獨立的學科——系統和軟件。雖然在將硬件和軟件開發與分析結合起來方面取得了一些進展,最近又將硬件和系統結合起來,但這些聯繫仍然很薄弱。儘管如此,未來的設計必須將它們聯繫起來。

雖然將這三者結合起來考慮,可以實現全局優化,但這越來越被認爲是一種奢侈,因爲軟件在人工智能等領域的變化如此之快。系統只能針對當今已知的內容進行優化。如果這些推測不正確,任何面向未來的措施都可能適得其反。

創建有效的工作流程正成爲成功的關鍵。西門子 EDA 公司電子系統工程計劃的解決方案架構師 Ahmed Hamza 表示:“硬件工程師認爲他們已經制定了很好的方法。他們認爲自己不需要系統工程師。他們一直在開發非常複雜的硬件架構。他們從系統工程師那裡得到了一些要求,這些要求被拋在一邊(見圖 1)。然後他們競相建造東西。問題是他們建造了完美的硬件,但你把軟件放在上面,一切都崩潰了。然後就開始互相指責。”

錯綜複雜的網絡

早期,芯片設計是一場性能競賽。“雖然這是跨學科的,但最典型的是 CPU 千兆赫的競賽,”Cadence 戰略與新事業部總監 Rob Knoth 說。“當移動計算出現時,它爲關注低功耗和能源的全新 EDA 技術和設計方法騰出了空間。這需要一種多學科的方法。這很難。你需要讓更多的人蔘與進來。爲了準確測量功耗,你必須討論活動。你必須考慮權衡。你必須考慮妥協。你必須考慮最佳的整體電路。”

多年來,其他因素也變得越來越重要。Arteris 產品管理和營銷副總裁 Andy Nightingale 表示:“性能仍然很重要,需要進行衡量,面積與硅片的成本直接相關。傳統值仍然非常重要,但當你將它們與與功率密度相關的熱值結合在一起時,就會影響設備的運行。如果過熱,它必須斷電,性能會隨着能耗而下降。”

每個節點都會增加更多因素。“設計收斂的目標是根據特定條件或用戶提供的輸入,跨多個變量進行優化,”Synopsys 產品管理高級總監 Manoj Chacko 表示。“除了 PPA,現在還有 R,代表可靠性或穩健性。這始於我們必須考慮影響性能的 IR 壓降。緩解這種情況的技術已經開發出來。然後我們看到了設備的可變性,以及基於鄰居及其環境而變化的設備行爲,這會影響設計的性能和功耗。”

所有這些影響都是相互關聯的。“如果你能分散活動,就能降低峰值功耗,”Innergy Systems 創始人兼首席執行官 Ninad Huilgol 說道。“從系統級角度來看,這是確定電源、電網和 IR 壓降大小時的一個重要考慮因素。分散活動可以通過在活動流中引入空閒週期或動態更改時鐘頻率來實現。結果是性能會降低,但影響熱量的平均功耗可能會增加。”

時間因素正在被延長。“熱管理對於持續的工作負載場景至關重要,例如長時間遊戲或 4K 視頻錄製,” Arm客戶端業務線產品管理高級總監 Kinjal Dave 表示。“如果設備在遊戲過程中過熱,用戶體驗就會下降,因爲它無法持續保持高速。這會導致節流,導致幀速率下降,從而降低遊戲體驗。對於持續功率分析,必須確定某些工作負載可以維持多長時間,例如長時間玩遊戲而不會降低性能。”

爲了理解這些影響,必須將更多的物理知識引入分析。“隨着 3D-IC 的出現,芯片和系統之間的聯繫更加緊密,我們需要關注以前在芯片設計領域沒有擔心過的新物理問題,”Ansys 產品管理總監 Preeti Gupta 說。“我們看到邊界條件交換方面越來越複雜。例如,電遷移分析與電流密度有關。電流與溫度有直接關係。隨着溫度升高,泄漏會呈指數級增長。”

這給優化工具帶來了更大的壓力。“與籤核的集成非常重要,無論是時序分析、IR 分析、功率分析、變異性分析還是穩健性分析,”Synopsys 的 Chacko 說。“當優化工具與分析緊密集成時,我們就有了集成流程,例如時序、集成 IR、集成功率、集成變異性。我們以自動化的方式調用這些分析引擎。優化不僅僅是開始使用一個數據點來完成它的工作。”

優化意味着儘可能接近極限。“如果你在線段上使用實際溫度,你就可以擁有更加穩健、優化的設計,”Ansys 的 Gupta 說。“我說穩健和優化是故意的,因爲有時設計團隊可能設計的最壞溫度可能低於設備可能遇到的實際最壞溫度。其次,你可能在很大程度上過度設計,大多數情況都沒有達到最壞溫度。只有一小部分達到了。你在過度設計方面放棄了大量的功率、性能和麪積。”

這就是爲什麼越來越多地使用人工智能來幫助平衡這些因素。“設計師可以嘗試各種不同類型的優化,”Synopsys 高級產品經理 Jim Schultz 說。“在許多情況下,他們依賴經驗豐富的專業設計師。他們知道該嘗試什麼。但人工智能驅動的工具擁有所有這些參數。他們可以嘗試多個參數,看看哪些參數能產生最佳結果。他們可以嘗試很大的解決方案空間。”

雖然工程師可能正在嘗試進行精細優化,但由於無法進行分析,因此會放棄更大的餘地和性能。“這一直是 EDA 設計的核心難題,”Ansys 產品營銷總監 Marc Swinnen 說。“您需要在設計流程的早期瞭解未來信息以進行優化,因此這始終是一個估算和使用更簡單的分層模型、隨着時間的推移進行改進並儘量避免迭代的問題。”

儘管這些低級因素相互關聯,但類似情況也存在於更高級別。如今,很少有系統設計爲在任何時候執行單一功能。這使得很難隔離系統級事件並對其應用指標。“可以通過測量宏觀事件消耗的功率或能量來測量系統級功率,”Innergy 的 Huilgul 說。“這些是系統級事件,例如軟件或固件中子程序的執行。特徵化的系統級功率模型可以幫助估計這一級別的功耗。這些模型可以使用耗時較長的系統級事件來表徵,以微秒或毫秒爲單位。”

新指標

雖然低級優化仍然很重要,但系統級指標正變得更加突出。“這有商業方面,也有工程方面,”Expedera 營銷副總裁 Paul Karazuba 說。“從商業角度來看,就是要了解客戶最重要的願望的排序。然後,從技術角度來看,就是要了解在這些約束條件下,在客戶目標的邊界條件下可以合理地做些什麼。”

這些目標必須以有意義的方式實現。“在現代系統的背景下,除了基準之外,現在還必須從具體用例的角度來評估 PPA,”Arm 的 Dave 說。“對於 GenAI 工作負載,可以測量諸如首次令牌時間之類的指標,或者持續工作負載的每秒令牌數。系統基準可能涉及遊戲的每秒幀數或每瓦幀數,其中這些指標可以最好地衡量電源效率和性能。安全應用程序可能會關注每個新安全功能的性能成本,強調在性能和硅片成本的同時儘量減少這筆費用。”

要達到這一水平,需要以系統爲中心。“對於人工智能來說,硬件往往由重複數百或數千次的較小核心組成,”Huilgul 說。“在人工智能硬件上運行的軟件往往很複雜。它需要學習新的做事方式。隨着軟件不斷變化,您的功耗是否仍在您最初的目標範圍內?這是一個新的重要挑戰。可以通過構建系統的高級功率模型來解決這個問題,該模型可以向您顯示軟件運行時的動態功耗。”

對於某些任務,內部指標決定了操作。“線路長度是最重要的,”Arteris 的 Nightingale 說。“這是因爲它會影響功耗、信號延遲、面積和可靠性。這與 EDP 相關,EDP 是一種結合了能量和延遲的能量測量。某件東西完成一項工作需要多長時間,在完成這項工作時消耗了多少能量?您可以從某件東西獲得相同的 EDP,它做某事非常快但耗電量很大,或者某件東西做某事需要很長時間但能源使用效率很高。現在出現了一個新術語,稱爲速度提升、功率提升和綠色提升,它們補充了這些指標。這些對於評估平衡變得越來越重要,因爲系統的性能、功率效率和現在的環境影響正在發揮作用。”

越來越多的聲音也加入進來。Cadence 的 Knoth 表示:“對於電氣工程、半導體和電子系統,隨着我們參與討論的聲音越來越多樣化,我們的工作只會越來越好。我們正在生產更高質量的系統和電路,因爲現在設計半導體的不再只是電氣工程師了。機械工程師也參與其中。軟件工程師也參與其中。功能驗證人員也參與其中。用例設計師也參與其中。真正關心產品整體壽命的人也參與其中。這一切都是爲了改進工具,以便其他聲音能夠爲討論做出貢獻。”

但是,將 EDA、系統和軟件整合在一起也存在一些問題。西門子的 Hamza 說:“如果你去系統工程社區,他們使用以圖表爲中心的工具。它是爲人設計的。在 EDA 方面,他們使用以數據爲中心的工具,你可以用它生成模型、開發用例並進行分析。當前工具的問題是系統工具無法生成足夠的保真度和確定性模型,以用於 EDA。我們需要爲系統發明新的工具。”

這些團隊之間需要交換模型和信息。“我們看到系統級人員要求提供芯片熱模型,以便他們可以在系統級環境中運行它,包括氣流和水冷,”Ansys 的 Gupta 說。“有人要求提供芯片功率模型和電源完整性模型。您正在進行封裝設計,您需要芯片的芯片功率模型,以便進行系統級電源完整性。但這種建模需要以一種更標準化的方式傳達信息,無論是熱、功率、信號信息還是時序。”

儘管如此,進展仍在繼續。“即將推出的新標準——SysML-v2——將爲系統社區提供以數據爲中心的模型,”Hamza 說。“現在,當你建立模型時,它們可以連接到 EDA 流程。另一個缺失的元素是需求並沒有從系統一直鏈接到 EDA 級別。驗證需要一直鏈接到系統,因爲如果我們驗證了某個東西並發現了問題,系統工程師不知道發生了什麼。關於驗證的知識需要一直追溯到系統級別,這樣他們才能瞭解什麼時候有什麼東西不工作,或者性能不好。然後他們可以改變它,但他們需要溝通。我們正在研究多個部分,以將 EDA 域連接到系統域。”

結論

我們衡量系統質量的方法正在發生變化。它不再能用幾個數字來定義,因爲這些數字只在特定的環境中才有意義。該環境涉及軟件和系統。

每個新節點都會增加尋找設計合適優化空間的複雜性,儘管人工智能可能能夠幫助找到單元或塊內的局部最小值,但真正的挑戰在於高抽象層次,即架構選擇。需要更多模型才能由工具自動處理。

https://semiengineering.com/is-ppa-relevant-today/

半導體精品公衆號推薦

專注半導體領域更多原創內容

關注全球半導體產業動向與趨勢

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》爲您分享的第3886內容,歡迎關注。

『半導體第一垂直媒體』

實時 專業 原創 深度

公衆號ID:icbank

喜歡我們的內容就點“在看”分享給小夥伴哦