作者:楊培文 未經(jīng)授權(quán),請(qǐng)勿轉(zhuǎn)載。 CPU 由于最近 AMD 和 Intel 頻繁更新 CPU,因此大家選擇新款的 CPU 比較好。 CPU 與 GPU 的關(guān)系 CPU 瓶頸沒有那么大,一般以一個(gè)GPU 對(duì)應(yīng) 2~4 個(gè) CPU 核比較好,比如單卡機(jī)器買四核 CPU,四卡機(jī)器買十核 CPU。 當(dāng)你在訓(xùn)練的時(shí)候,只要數(shù)據(jù)生成器(DataLoader)的產(chǎn)出速度比 GPU 的消耗速度快,那么 CPU 就不會(huì)成為瓶頸,也就不會(huì)拖慢訓(xùn)練速度。 PCI-E 支持情況 除了核數(shù),你還需要注意 PCI-E 支持情況,一般顯卡是 PCI-E 3.0 x16,比如 i9-9820X 的 PCI-E 通道數(shù)是 44 ,配置四卡的話,只能支持 1x16+3x8+1x4,也就是單卡全速,三卡半速,一個(gè) NVMe 固態(tài)硬盤。這種情況下可以考慮選擇帶有 PLX 橋接芯片的主板。 AMD 的 2990WX 有 64條 PCI-E,但是只支持 x16/x8/x16/x8 的四卡配置。 英特爾CPU 英特爾CPU 雙卡機(jī)器選 i9-9900K,四卡機(jī)器按照預(yù)算選X系列的CPU。 主板 主板需要注意:
主板必看參數(shù) GIGABYTE X299 AORUS MASTER (rev. 1.0) 使用了 4 組 2 槽間距顯卡插槽設(shè)計(jì),支持1x16、2x16、2x16 + 1x8、1x16 + 3x8 四種配置(需要十核以上的 CPU),這里請(qǐng)參閱說明書安裝顯卡,安裝在不同位置的速度是不一樣的: GIGABYTE X299 AORUS MASTER (rev. 1.0) GIGABYTE X299 AORUS MASTER manual 帶有橋接芯片的主板 有的主板如 WS X299 SAGE 帶有 PLX 橋接芯片,可以在 CPU 沒有足夠 PCI-E 的情況下達(dá)到四卡 x16 的速度: WS X299 SAGE WS X299 SAGE User Guide 在多卡并行訓(xùn)練的時(shí)候,PCI-E 的傳輸速度決定了梯度同步的速度,如果你訓(xùn)練的的模型比較大,希望搭建多卡機(jī)器,建議選擇支持四路 PCI-E x16 的主板。 顯卡 顯卡性能表 訓(xùn)練需要 FP32 和 FP16 的性能,推斷需要 INT8 的性能。訓(xùn)練大模型需要注意顯存大小。 考慮成本可以買 RTX 2080Ti,想要高性能并且高性價(jià)比可以買 TITAN RTX,土豪可以選 Tesla V100。 RTX 2080 顯存較小,不推薦。GTX1080Ti 已經(jīng)出了太久了,網(wǎng)上都是二手卡,不推薦。 參考鏈接:
渦輪與風(fēng)扇 采購(gòu)顯卡的時(shí)候,一定要注意買渦輪版的,不要買兩個(gè)或者三個(gè)風(fēng)扇的版本,除非你只打算買一張卡。 因?yàn)闇u輪風(fēng)扇的熱是往外機(jī)箱外部吹的,所以可以很好地帶走熱量,散熱比較好。如果買三個(gè)風(fēng)扇的版本,插多卡的時(shí)候,上面的卡會(huì)把熱量吹向第二張卡,導(dǎo)致第二張卡溫度過高,影響性能。 風(fēng)扇顯卡很有可能是超過雙槽寬的,第二張卡可能插不上第二個(gè) PCI-E 插槽,這個(gè)也需要注意。 渦輪散熱 風(fēng)扇散熱 服務(wù)器推斷卡 除了用于訓(xùn)練,還有一類卡是用于推斷的(只預(yù)測(cè),不訓(xùn)練),如: 這些卡全部都是不帶風(fēng)扇的,但它們也需要散熱,需要借助服務(wù)器強(qiáng)大的風(fēng)扇被動(dòng)散熱,所以只能在專門設(shè)計(jì)的服務(wù)器上運(yùn)行,具體請(qǐng)參考英偉達(dá)官網(wǎng)的說明。 性價(jià)比之選應(yīng)該是 Tesla T4,但是發(fā)揮全部性能需要使用 TensorRT 深度優(yōu)化,目前仍然存在許多坑,比如當(dāng)你的網(wǎng)絡(luò)使用了不支持的運(yùn)算符時(shí),需要自己實(shí)現(xiàn)。 英偉達(dá)只允許這類卡在服務(wù)器上運(yùn)行,像 GTX 1080Ti、RTX 2080Ti 都是不能在數(shù)據(jù)中心使用的。
參考鏈接: https://developer./deep-learning-performance-training-inference https://www./object/where-to-buy-tesla-catalog-cn.html https://www./support/resources/gpu/ https://www./drivers/license/geforce 硬盤 硬盤類型 常用硬盤接口有三種: SATA3.0,速度 600MB/s SAS,速度 1200MB/s PCIE 3.0 x4(NVMe),速度 3.94GB/s 參數(shù)對(duì)比 下面是根據(jù)代表產(chǎn)品查詢的參數(shù): 注: 4K 隨機(jī)讀寫的隊(duì)列深度為 32 SATA3 機(jī)械硬盤沒有太好的數(shù)據(jù)來源,所以數(shù)據(jù)是經(jīng)驗(yàn)值 SATA3 固態(tài)硬盤數(shù)據(jù)來源:三星(SAMSUNG)1TB SSD固態(tài)硬盤 SATA3.0接口 860 EVO NVMe 固態(tài)硬盤數(shù)據(jù)來源:英特爾(Intel)1TB SSD固態(tài)硬盤 M.2接口(NVMe協(xié)議) 760P系 在面對(duì)大量小文件的時(shí)候,使用 NVMe 硬盤可以一分鐘掃完 1000萬(wàn)文件,如果使用普通硬盤,那么就需要一天時(shí)間。為了節(jié)省生命,簡(jiǎn)化代碼,硬盤建議選擇 NVMe 協(xié)議的固態(tài)硬盤。 如果你的主板不夠新,沒有NVMe 插槽,你可以使用 M.2 轉(zhuǎn)接卡將 M.2 接口轉(zhuǎn)為PCI-E 接口。 M.2 轉(zhuǎn)接卡 內(nèi)存 內(nèi)存容量的選擇通常大于顯存,比如單卡配 16GB 內(nèi)存,四卡配 64GB 內(nèi)存。由于有數(shù)據(jù)生成器(DataLoader),數(shù)據(jù)不必全部加載到內(nèi)存里,通常不會(huì)成為瓶頸。 電源 先計(jì)算功率總和,如單卡 CPU 100W,顯卡 250W,加上其他的大概 400W,那么就買 650W 的電源。 雙卡最好買 1000W 以上的電源,四卡最好買 1600W 的電源,我這里實(shí)測(cè)過四卡機(jī)用 1500W 的電源來帶,跑起來所有的卡以后會(huì)因?yàn)殡娫床蛔愣詣?dòng)關(guān)機(jī)。 一般墻上的插座只支持 220V 10A,也就是 2200W 的交流電,由于電源要把交流電轉(zhuǎn)直流電,所以會(huì)有一些損耗,最高只有1600W,因此如果想要支持八卡,最好不要在家嘗試。八卡一般是雙電源,并且需要使用專用的 PDU 插座,并且使用的是 16A 插口,如果在家使用,會(huì)插不上墻上的插座。 網(wǎng)卡 一般主板自帶千兆網(wǎng)卡。如果需要組建多機(jī)多卡集群,請(qǐng)聯(lián)系供應(yīng)商咨詢專業(yè)的解決方案。 機(jī)箱 如果配單卡,可以直接買個(gè)普通機(jī)箱,注意顯卡長(zhǎng)度能放下就行。 如果配四卡機(jī)器,建議買一個(gè) Air 540 機(jī)箱,因?yàn)槲艺谟眠@一款。 Air 540 顯示器 深度學(xué)習(xí)工作站裝好系統(tǒng)以后就不需要顯示器了,裝系統(tǒng)的時(shí)候使用手邊的顯示器就行。 鍵盤鼠標(biāo) 深度學(xué)習(xí)工作站裝好系統(tǒng)以后就不需要鍵盤鼠標(biāo)了,裝系統(tǒng)的時(shí)候使用手邊的鍵盤鼠標(biāo)就行。 -完- |
|