(陳想)
當下,全球半導體產業正處在一輪深層次的技術轉型之中。隨著制程微縮逐步逼近物理極限,單純依賴工藝進步來提升性能與能效的空間不斷收窄,系統架構層面的創新正逐漸成為決定晶片競爭力的關鍵因素。在智能手機、人工智慧計算以及智能汽車等快速發展的應用領域中,GPU的角色也發生了根本性變化:它已從傳統的圖形顯示單元,演進為同時承擔圖形渲染、並行計算、AI推理與多媒體處理的核心算力平臺。應用複雜度的持續上升,使功耗、記憶體帶寬、系統延遲與可擴展性之間的權衡愈發困難。在功耗預算和晶片面積高度受限的現實條件下,如何通過架構設計釋放更高的並行效率,已成為整個產業共同面對的核心課題。
曹友銘,畢業於國立臺灣大學並取得工學博士學位,長期專注於GPU架構、計算系統架構以及多媒體處理器設計領域。目前,曹友銘擔任聯發科技本部協理,負責GPUIP研發與計算系統架構兩大功能單元的整體規劃與技術方向,覆蓋移動、計算及汽車等多個產品線。在其帶領下,超過200名GPU工程師與40餘名系統架構師協同推進新一代計算平臺的設計與實現。從系統級抽象、核心架構定義到複雜IP的工程化落地,他形成了一條從理論方法到產業實踐高度貫通的技術路徑,也因此成為兼具深厚學術背景與大型研發團隊管理經驗的架構型技術領軍人物。
在GPU微架構層面,圍繞圖形渲染效率與能效利用之間的長期矛盾,曹友銘研發了“Method For Performing Automatic Activation Control Regarding Variable Rate Shading,And Associated Apparatus”這一專利技術,系統性地探索了可變速率著色(Variable Rate Shading,VRS)在移動GPU中的自動化應用方式。該技術通過在GPU渲染管線中引入渲染分類機制,對圖形指令與場景特徵進行即時分析與識別,並據此動態決定是否啟用VRS以及對應的著色率配置,使GPU能夠在不同渲染類型和畫面區域中採用更合適的計算精度,從而在保證視覺品質的前提下有效降低計算負載與功耗。
基於這一技術思路,聯發科技在GPU平臺層面提供了對Variable Rate Shading的系統化支持,使相關能力能夠被遊戲與圖形應用直接利用。在實際應用中,該機制已被用於移動遊戲等高複雜度渲染場景,通過降低非關鍵區域的著色精度,在不影響用戶感知畫質的前提下提升整體幀率表現並改善能效表現,幫助設備在高畫質、高刷新率條件下實現更持久、更穩定的運行體驗。相比依賴開發者手動調優的傳統方式,這種由GPU內部自動完成的渲染優化路徑,不僅顯著降低了應用適配複雜度,也為平臺級圖形性能優化提供了更高的可擴展性。
也正是這些在真實產品與應用場景中的實踐回饋,使得圍繞VRS的自動化控制逐漸顯現出其更深層的架構意義。從更宏觀的行業視角看,該技術體現了GPU設計正在從單純追求峰值算力,轉向提升有效算力利用率的重要演進方向。隨著移動遊戲、XR以及高解析度顯示應用不斷推高渲染複雜度,如何在有限功耗條件下釋放更高圖形性能,已成為移動GPU面臨的核心挑戰。而曹友銘在這一方向上的持續探索,不僅推動了可變速率著色技術在移動平臺上的成熟落地,也為整個圖形處理行業在後制程時代通過架構創新提升能效表現,提供了具有現實參考價值的實踐路徑。
在GPU微架構層面的探索逐漸成熟之後,曹友銘進一步將技術視角延伸至系統層面,在其長期從事GPU與計算系統架構研究的基礎上,主導研發了“Adaptive loading-aware system management for balancing power and performance”專利技術。該技術並非著眼於單一計算單元的性能提升,而是從系統整體出發,通過即時感知運行負載、功率預算與性能需求之間的動態關係,對計算資源進行協同調度與精細化管理。在以GPU為主要負載來源的圖形渲染與遊戲場景中,這一方法能夠根據即時渲染壓力和功耗狀態,動態調整系統運行策略,在有限功耗條件下維持更穩定的性能輸出,從而緩解高複雜度應用下功耗、發熱與性能波動之間的矛盾。這一技術路徑集中體現了曹友銘在GPU與計算系統架構領域的系統性思考,即通過架構層面的協同設計,應對制程紅利減弱後日益突出的性能與能效挑戰。
在曹友銘的技術規劃與推動下,聯發科技進一步將上述專利機制產品化,形成了MediaTek Frame Rate Conversion(MFRC)。作為一套面向實際應用的系統級優化框架,MFRC通過基於Vulkan標準繪圖介面的擴充與SDK形式建立起應用與SoC底層之間的即時溝通通道,使遊戲能夠依照CPU、GPU、功耗與溫度等關鍵運行狀態,並據此動態調整繪圖的frame rate。 並利用最新的AI補針技術達到極佳的品質. 在量產產品與主流手遊中的應用實踐表明,這種負載感知式管理方式能夠在高幀率運行過程中顯著提升性能穩定性,同時有效降低功耗與機身溫度,改善長時間高負載場景下的用戶體驗一致性。MFRC提供了手機開發者強大的工具, 解決了高性能不發燙的PC等級的遊戲體驗。
除了在專利與產品層面不斷推進架構創新,曹友銘也將相關經驗上升為系統化的方法論研究,並在論文《A Novel Hybrid Pipeline Design Methodology on a Multi-Cores Streaming System for Multimedia Applications》中進行了系統總結。論文關注多核流式系統在多媒體應用中的設計難點,試圖在高效率硬體實現與軟體靈活性之間建立更加可控的平衡。為此,曹友銘提出了一套從C級演算法到RTL實現的混合流水線設計流程,將應用劃分為計算、配置與通信等不同功能層次,並通過統一的流核心和可定制橋接結構來組織數據流動。這種方法使並行性和數據局部性能夠在設計早期被充分考慮,從而減少系統瓶頸並提升多核擴展能力。通過具體案例分析,論文進一步驗證了硬體管理流式記憶體模型在多核系統中的優勢,為多媒體處理器和GPU系統的設計提供了可複用的系統級方法。
曹友銘的技術貢獻貫穿學術研究、核心專利以及產業級架構實踐,其工作始終圍繞高效計算系統的構建展開。在GPU與計算系統架構日益成為晶片競爭關鍵的當下,他所體現的系統級思維和架構設計能力,不僅直接影響著具體產品的實現路徑,也在持續塑造著半導體產業的技術演進方向。