
整理/鄭宜芬
從生成式 AI 到可自主執行任務的 AI Agent,企業數位轉型進入新階段。NVIDIA 執行長黃仁勳於 GTC Taipei 2026 宣布AI 產業已正式邁入「代理型 AI(Agentic AI)」時代,從全新 Vera Rubin 平台、專為 AI Agent 設計的 Vera CPU,到 AI Factory 基礎設施藍圖 DSX 與本地 AI Agent PC,NVIDIA 正試圖重新定義未來十年的企業運算架構。未來,企業競爭力不再只是擁有 AI 模型,而是透過建立大規模代理協作系統,讓運算能力直接轉化為營收與生產力。
[ 加入 CIO Taiwan 官方 LINE、Facebook 與 LinkedIn,與全球 CIO 同步獲取精華見解 ]
Agent = LLM + Harness 從生成內容到驅動產值
過去兩年,企業界關注的焦點在於生成式 AI 如何產生文字與圖像。這次,黃仁勳強調,「有用的 AI」已經正式抵達,關鍵在於「代理(Agent)」的應用。代理型 AI 的特點在於不僅是單一的大語言模型(LLM),而是一個包含模型、協調框架(Harness)、工具集(Tools)與執行環境(Runtime)的整合系統。
這種轉變對企業生產力具有巨大的槓桿效應。他以軟體工程為例指出,全球約 3,000 萬名軟體開發者正透過代理型 AI 將產出提升至近三倍,從原本 3 兆美元的薪資總額創造出約 9 兆美元的生產力價值。這種產能的飛躍意味著「運算即收入(Compute is Revenues)」,企業不再將運算視為成本支出,而是盈利與經濟成長的引擎。未來,建構可高效運行AI代理的基礎設施,將成為企業推動組織轉型的發展重點。
Vera Rubin 架構 專為代理年打造的系統工程
為了支撐日益複雜的代理運作,NVIDIA 推出了全新的 Vera Rubin 平台,是全方位的系統工程轉型,涵蓋了 GPU、CPU(Vera CPU)、網路(ConnectX-9、Bluefield 4)的儲存系統。
Vera Rubin 投入了 4 萬名工程師合作完成,堪稱 NVIDIA 歷史上最野心勃勃的計畫。該架構的挑戰性在於代理運算的高度「去中心化與分散式」特性。當代理進行思考時,需要透過如 Vera Rubin NVL72 等機櫃級系統進行推理;而當代理使用試算表、資料庫或編譯器等工具時,則需要高效的 CPU 與處理器進行調度。
為了提升韌性,Vera Rubin 採用了全新的模組化設計與 PCB 背板(Backplane)連接架構,捨棄了傳統雜亂的電纜,將原本需要兩小時的組裝時間大幅縮短至 5 分鐘。這種設計提升了製造效率,大幅增強了資料中心在大規模運作時的可靠性與平均故障間隔時間。
[ 推薦閱讀:Computex 開展下的兩個 AI 思考 ]

重塑 CPU 定位 從服務人類轉向服務代理
此次演講的亮點之一是專門為代理設計的「Vera CPU」。黃仁勳指出,傳統 CPU 是為人類使用者設計的,以秒為單位進行交互,並強調核心數的租賃經濟;然而,代理對於延遲極其敏感,它們生活在「納秒」的世界中,任何調度或工具調用的延遲都會阻礙其下一步行動。
Vera CPU 擁有全球領先的單線程性能,每個時脈週期可執行高達 10 條指令(IPC),並具備驚人的內外頻寬。它採用 PCI Express Gen 6 技術,內部互連頻寬高達每秒 3.6 TB,並支援 LPDDR5X 記憶體,頻寬較傳統高效能 CPU 提升了兩到三倍。
黃仁勳將Vera CPU 形容為「指揮家」,負責協調 GPU 這個「交響樂團」,處理複雜的分支邏輯、Python 執行環境、工具調用以及沙盒(Sandbox)安全執行。實測數據顯示,Vera 在處理 SQL 資料庫查詢與即時流處理任務時,效能分別提升了 3 倍與 6 倍,也就是直接轉化為更低的總擁有成本(TCO)與更高的資產壽命,因為越靈活、越強大的架構,越能適應未來幾個月內不斷更迭的軟體技術。
AI 工廠與 DSX 藍圖 基礎設施的極致效率
隨著 AI 運算規模向GW(Gigawatt,百萬瓩)級發展,建構 AI 工廠的複雜度已遠超傳統機房。NVIDIA 推出了「DSX」作為建構與運營 AI 工廠的參考設計藍圖。透過 Omniverse 數位孿生技術,企業可以在實際動工前,先在數位環境中進行佈局模擬、電力與冷卻設計驗證。
DSX 作業系統解決了能源利用率的問題。傳統資料中心通常會預留 40% 的電力緩衝,而 DSX 的動態電力分配技術(LPS)能將這些閒置電力轉向產生收入的運算任務中,並透過攝氏 45 度的熱液冷技術顯著降低冷卻能耗,有助於將每一瓦電力轉化為最大的 Token 產出價值。
[ 推薦閱讀:【專訪】聯發創新基地負責人許大山 ]
企業級代理工具包與安全性框架
在應用層面上,NVIDIA 提供了「NVIDIA 企業 AI 代理工具包」,包含模型、協調架構、工具集與執行環境四大要素。其中,「Nemotron 3 Ultra」作為最新的開源模型,採用了 SSM(狀態空間模型)與 MoE(混合專家模型)的混合架構,在思考速度上提升了 5 倍,且運行成本降低了 30%。
針對企業最關心的資料隱私與資安問題,NVIDIA 推出了「Open Shell」安全架構。這個開源的運行環境能保護代理的身份、隱私與權限,確保代理在受控的沙盒中運作,並遵守企業的安全政策。這為企業提供了將 AI 代理整合進現有工作流程,例如與 Cadence 合作的晶片設計、CrowdStrike 的資安監控或 SAP 的流程管理的安全保障。
另外,NVIDIA 與微軟合作推出 AI Agent 筆電 RTX Spark,能直接在本地運行代理任務;並且發布了 Cosmos 3 物理 AI 基礎模型與 Isaac GR00T 人型機器人參考平台,可協助企業加速開發具備自主行動能力的物理代理。
[ 推薦閱讀:COMPUTEX 2026 揭開 AI 進入「系統價值時代」百工百業將以 AI Systems 應用落地 ]
黃仁勳最後強調,運算產業在過去六個月內經歷了根本性的重啟,可用且可盈利的 AI 已經到位,運算已成為企業獲利的關鍵條件。這是一個新的起點,從資料中心到個人電腦,甚至是物理世界的機器人,代理型運算模式將無處不在。企業若能掌握這一波「運算即收入」的轉型契機,將能在未來的 AI 競爭格局中佔據先機。
(本文授權非營利轉載,請註明出處:CIO Taiwan)

