CXL 技術如何突破記憶體瓶頸

Innodisk Editor2026/05/20 7 分鐘

記憶體擴充的兩難

隨著 AI 與即時處理工作負載持續增長的趨勢下，系統越來越依賴更強大的 CPU 與加速器來處理大量資料。然而，隨著運算能力提升，系統架構師比以往更快面臨記憶體瓶頸（Memory Wall）。

為滿足不斷攀升的運算需求，系統需要更大容量、低延遲的 DRAM。然而，透過傳統DIMM 插槽進行記憶體擴充會受限於 CPU 所支援的記憶體通道數量。一旦插槽皆全數配置完成，後續要擴充記憶體容量，難度便會大幅提高。

這項挑戰在邊緣系統尤為明顯。平台尺寸、功耗預算與 DRAM 成本等因素都會進一步限制系統設計。當瓶頸逐漸轉向記憶體，加上DRAM 價格波動與供應鏈不確定性，傳統擴充方式往往難以滿足實際需求。這些限制也提醒我們，記憶體擴充需要新的解法與突破性架構思維。

傳統 DIMM 記憶體擴充的設計考量

NUMA 效應

在雙 CPU 或多插槽系統中，每個處理器都擁有自己的本地記憶體，這種架構稱為 NUMA（非均一記憶體存取，Non-Uniform Memory Access）。每個 CPU 及其所連接的記憶體共同構成一個 NUMA 節點。

CPU 可直接存取本地記憶體，但若需存取連接至另一個 CPU 記憶體，資料需經由處理器間互連通道傳輸，導致存取延遲。

若記憶體未平均分配於各節點，作業系統可能將應用程式資料置於遠端 NUMA 節點，進而拉高延遲並降低系統效能。

除了跨插槽延遲外，記憶體效能也受主機板上 DIMM 實體配置方式的影響。

DIMM 拓撲架構

記憶體配置也受 DIMM 拓撲架構的影響，即記憶體通道與插槽在主機板上的電路佈局方式。

依據主機板設計，部分主機板在優先安裝於最靠近 CPU 的 DIMM 插槽時，可獲得最佳效能；若再加裝第二條 DIMM，則可能使記憶體頻率下降。

另一些主機板則針對均衡配置優化，需在各記憶體通道間對稱安裝 DIMM；若只安裝單條 DIMM，可能無法發揮最佳效能。

為充分發揮系統效能，使用者需要了解其主機板的 DIMM 拓撲架構，並據此配置記憶體。這些設計限制也推動業界尋求新的記憶體擴充方式，而CXL正是在這樣的需求下孕育而生。

什麼是 CXL？它為何而生？

CXL（Compute Express Link）是一項開放式產業標準高速互連技術，於 2019 年首次發布，由 Intel、AMD、ARM、Samsung、Micron 等主要科技公司組成的聯盟共同支持。CXL 定義管理裝置通訊的協定層，以及建構於 PCIe 電氣介面之上的實體層。也就是說，CXL 裝置可插入標準 PCIe 插槽，同時實現截然不同的記憶體存取方式。

CXL 技術的三個子協定

CXL 定義了三個互補的子協定，協同支援不同的通訊模式：

CXL.io 負責基本裝置通訊，涵蓋裝置識別、初始化與管理，類似系統偵測並設定 PCIe 裝置的方式。簡而言之，它讓系統能夠辨識 CXL 裝置，並使其進入可用狀態。

CXL.mem 是記憶體擴充的關鍵。它允許 CPU 如同存取系統記憶體一般，存取 CXL 裝置上的記憶體。從作業系統的角度來看，這些記憶體就像額外的 RAM。

CXL.cache 則是讓 CXL 裝置快取主機 CPU 記憶體，確保 CPU 與裝置共享資料時都能存取最新資料，避免資料不一致。

Protocol	Direction	Function
CXL.io	Host ↔ Device	Device management and basic I/O
CXL.mem	Host → Device	Allows the host processor to access memory on the CXL device
CXL.cache	Device → Host	Allows devices to cache host memory with coherency

CXL 裝置類型

基於 CXL 協定的裝置依主要功能概略分為三類：Type 1 為不含板載記憶體的加速器；Type 2 為具備板載記憶體的加速器；Type 3 則專注於記憶體擴充。

CXL Type	Core Role	Common Devices
Type 1	Accelerator	SmartNIC, AI accelerator
Type 2	Accelerator + Memory	GPU, FPGA accelerator
Type 3	Memory	CXL Add-In Card (AIC), CXL Memory Module (CMM)

宜鼎 CXL product family, 包括 CXL Add-In Card (CXL AIC) 與 CXL Memory Module (CMM)，皆屬於 Type 3 裝置，可讓處理器將外部記憶體視為主機位址空間的原生延伸來存取。

宜鼎 CXL 解決方案如何突破記憶體瓶頸

宜鼎的 CXL 系列專為突破傳統記憶體架構限制而設計。CMM 每個模組提供 64GB、96GB 或 128GB 擴充容量，而 CXL AIC 則透過板卡上兩個 DIMM 插槽，最高可擴充至 256GB。

CXL Memory Module CXL Add-in-Card

除了突破主機板 DIMM 插槽數量限制之外，Innodisk CXL 解決方案也帶來多項關鍵架構優勢：

1. 記憶體池化（Memory Pooling）：解決 NUMA 挑戰

CXL技術可讓多個主機共享統一的記憶體資源池，使資源分配更具彈性，並有助於緩解 NUMA 架構中常見的延遲與資源分配不均問題。對於部署在動態且難以預測環境中的多主機邊緣伺服器而言，這項能力尤其關鍵。

在實務中，工作負載的資料處理需求經常大幅波動。根據知名的 5G 網路流量報告，每日流量尖峰可達平均負載的 2 ~ 4 倍，通常發生在傍晚時段，此時大量用戶同時串流影音、進行遊戲或存取線上服務。甚至於大型體育賽事直播等特殊事件期間，更可能將網路流量推向更高峰值。

金融交易基礎設施也有類似的負載型態。交易所資料顯示，市場活動常呈現典型的 U 型盤中交易量模式，最高活躍度出現在開盤與收盤附近。當重大市場事件發生時，交易系統的訊息處理速率可能急劇飆升，大量市場資料與交易指令需要即時處理時，甚至可能出現 10 倍的瞬間峰值。

5G Traffic Pattern Trading Message Rate

這些工作負載尖峰對系統架構設計帶來巨大的挑戰：記憶體容量必須依據尖峰需求預先配置，但在一般運作期間，其中多數資源可能長時間閒置未被充分利用。

此時，記憶體池化的價值便顯而易見。相較於讓每台伺服器各自過度配置記憶體，企業可透過共享資源提高整體利用率，同時保留因應突發工作負載高峰的能力。

2. 透過 PCIe 介面實現記憶體語意存取

儘管 CXL AIC 透過 PCIe 連接器進行連接，但記憶體語意讓 CPU 能以更接近原生記憶體的方式存取 CXL 記憶體，提供類似系統記憶體的存取體驗。

更重要的是，由於 CPU 將 CXL AIC 視為單一 CXL.mem 裝置，因此可避開傳統 DIMM 層級的拓撲限制（如頻率下降），無論主機板內部佈局為何，均可實現穩定可預測的效能與高訊號完整性。

將 CXL 從資料中心延伸至邊緣端

CXL 記憶體擴充可透過不同外形規格實現，並依不同系統架構需求進行優化。

宜鼎 CXL Memory Module (CMM) 專為資料中心環境設計，採用緊湊的 EDSFF E3.S 外形規格，提供高密度記憶體擴充。產品獲得國際多項業界獎項肯定，包括 FMS Best of Show 與 2025年台灣精品獎。

延續 CMM 的成功，宜鼎進一步以 CXL AIC 將相同的 CXL 能力延伸至邊緣部署場景。CMM 與 AIC皆透過標準 PCIe 連接器進行連接，AIC 則採用卡式設計，在系統配置與成本控制上具備更高彈性。

AIC 總擁有成本優勢

記憶體價格並非線性增長。隨著容量密度提升，每 GB 成本往往呈指數級攀升。高容量模組（如 256GB DIMM）通常伴隨明顯的「容量溢價」。

透過採用 CXL AIC，企業可取得顯著 TCO（Total Cost of Ownership，總擁有成本）優勢。舉例而言，在主機板上安裝兩條 128GB DIMM，再於 CXL AIC 上安裝兩條 128GB DIMM，其總成本通常低於單獨為主機板搭配兩條 256GB 模組。

彈性部署

CXL AIC 可在不變更既有 DIMM 配置的情況下，依實際系統需求靈活擴充記憶體，特別適合導入流程較謹慎的工業環境。

使用者可依不同目標需求選擇最佳配置:

最大容量擴充：主機 128GB ×2 + AIC 128GB ×2，可將邊緣裝置的記憶體擴充極大化
成本效益優先：主機 64GB ×2 + AIC 64GB ×2，採用主流、高性價比模組實現可觀容量，同時保留未來隨系統需求升級至更高容量的彈性
訊號完整性與低延遲優先：主機插槽留空 + AIC 128GB ×2，將記憶體工作負載全數移至 AIC，避開複雜的主機板拓撲架構，實現穩定的高速效能

除了容量配置彈性，CXL AIC 在實體部署上也具備高度彈性。可搭配宜鼎工業級 DDR5 RDIMM VLP 模組，有效縮減系統占用空間。此外，AIC採用半長（Half-Length）設計，同時支援全高（Full-Height）與半高（Half-Height）擋板，可無縫部署於邊緣伺服器與工業平台等空間受限環境。

重新思考記憶體擴充的可能性

隨著記憶體瓶頸持續挑戰現代系統，記憶體擴充已不再只是「新增更多 DIMM」的問題，而是「如何選擇正確架構」。透過CXL 技術為記憶體開啟更靈活、更具擴展性的全新路徑，而宜鼎的 CXL 解決方案將這項能力導入實際部署場景，協助您建構次世代工作負載的高效系統基礎。

主機記憶體緩衝區（HMB）：PCIe DRAM-less SSD 的智慧效能提升之道

正如電腦依賴 RAM 來暫存正在處理的資料，SSD（固態硬碟）也需要其自身形式的短期記憶體來維持高效運作。記憶體緩衝區（如 DRAM 與 SRAM）是 SSD 的效能加速器，提供高速查詢與資料暫存功能，有效強化 NAND 的固有速度，實現更快速的存取與傳輸。要了解這其中的運作原理，必須先認識 SSD 讀取運作流程，以及現代 SSD 為何如此依賴高效的元資料處理機制。

ExplainerInsights

7 分鐘

了解更多