D:高性能PCIe結(jié)構(gòu)交換網(wǎng)(例如Microchip的PAX)允許多主機(jī)共享支持單根I/O虛擬化(SR-IOV)的驅(qū)動(dòng)器,以及動(dòng)態(tài)劃分可在多個(gè)主機(jī)之間共享的GPU和NVMe SSD池。
K:PCIe®,GPUDirect
隨著圖形處理單元(GPU)的加快,(GPU)它能提供明顯更高的計(jì)算能力、存儲(chǔ)設(shè)備和GPU存儲(chǔ)器之間的數(shù)據(jù)路徑瓶頸難以實(shí)現(xiàn)最佳應(yīng)用程序性能。NVIDIA的MagnumIOGPUDirect通過(guò)存儲(chǔ)設(shè)備和存儲(chǔ)解決方案GPU實(shí)現(xiàn)存儲(chǔ)器之間的直接路徑可以極大地幫助解決這個(gè)問(wèn)題。然而,同樣重要的是使用容錯(cuò)系統(tǒng)來(lái)提高其優(yōu)秀的能力,以確保在發(fā)生毀滅性故障時(shí)備份關(guān)鍵數(shù)據(jù)。該解決方案已通過(guò)PCIe®結(jié)構(gòu)連接邏輯RAID卷,在PCIe4.在0規(guī)范下,數(shù)據(jù)速率可以提高到26GB/s。要了解如何實(shí)現(xiàn)這些優(yōu)勢(shì),首先要檢查解決方案的關(guān)鍵部件以及如何協(xié)調(diào)提供結(jié)果。
高性能PCIe結(jié)構(gòu)交換網(wǎng)(例如Microchip的PAX)允許多主機(jī)共享支持單根I/O虛擬化(SR-IOV)的驅(qū)動(dòng)器,以及動(dòng)態(tài)劃分可在多個(gè)主機(jī)之間共享的GPU和NVMe SSD池。Microchip的PAX結(jié)構(gòu)交換網(wǎng)可以將端點(diǎn)資源動(dòng)態(tài)重新分配給需要這些資源的任何主機(jī)。
這種解決方案還使用了SmartROC 3200 RAID控制器系列支持的SmartPQI驅(qū)動(dòng)程序,因此無(wú)需自定義驅(qū)動(dòng)程序。Microchip的SmartROC 3200 RAID控制器是目前惟一能夠提供最高傳輸速率(即26 GB/s)的設(shè)備。它具有極低的延遲時(shí)間,可向主機(jī)提供最多16個(gè)PCIe Gen 4通道,并向后兼容PCIe Gen 2。與Microchip基于Flashtec®系列的NVMe SSD結(jié)合使用時(shí),可在多主機(jī)系統(tǒng)中發(fā)揮PCIe和Magnum IO GPUDirect存儲(chǔ)的全部潛能??傮w而言,上述所有特性使其能夠構(gòu)建一種強(qiáng)大的系統(tǒng),該系統(tǒng)可以滿(mǎn)足AI、ML、DL以及其他高性能計(jì)算應(yīng)用的實(shí)時(shí)需求。