網(wǎng)上詢價(jià)編號(hào):****
項(xiàng)目名稱:****采購(gòu)AI服務(wù)器1等網(wǎng)上詢價(jià)項(xiàng)目
采購(gòu)單位:****
所屬區(qū)域:**自治區(qū)本級(jí)
預(yù)算金額(元):2,050,000.00
網(wǎng)上詢價(jià)開(kāi)始時(shí)間:2024-08-20 17:56:00
網(wǎng)上詢價(jià)截止時(shí)間:2024-08-23 17:56:00
采購(gòu)人及聯(lián)系方式:王老師 0471-****381/185****4927
采購(gòu)計(jì)劃備案書(shū)/核準(zhǔn)書(shū)編號(hào):內(nèi)政采計(jì)劃[2024]20663
采購(gòu)方式:電子賣場(chǎng)(網(wǎng)上詢價(jià))
二、項(xiàng)目要求 (一)報(bào)價(jià)須知1.所投產(chǎn)品必須為原裝正品,必須按生產(chǎn)廠家承諾的售后服務(wù)條款提供各項(xiàng)售后服務(wù)。
2.報(bào)價(jià)應(yīng)包括對(duì)投標(biāo)產(chǎn)品的運(yùn)輸、安裝、售后服務(wù)、技術(shù)支持、保險(xiǎn)、利潤(rùn)、稅金及合同包含的所有風(fēng)險(xiǎn)、責(zé)任等各項(xiàng)應(yīng)有費(fèi)用。
3.如項(xiàng)目成交,則成交供應(yīng)商依據(jù)成交確認(rèn)書(shū)在十個(gè)工作日內(nèi)與采購(gòu)人簽訂協(xié)議供貨合同;成交供應(yīng)商必須在合同簽訂之日起五個(gè)工作日內(nèi)按照采購(gòu)人指定的地點(diǎn)供貨。
4.供應(yīng)商必須響應(yīng)所有的詢價(jià)需求。
(二)答疑與咨詢采購(gòu)人聯(lián)系方式:王老師 0471-****381/185****4927
(三)其它1.所投設(shè)備型號(hào)生產(chǎn)廠家如已停產(chǎn),請(qǐng)供貨商在備注一欄內(nèi)寫明替代產(chǎn)品型號(hào)及詳細(xì)配置。
2.如果設(shè)備型號(hào)配置有歧義,請(qǐng)供貨商務(wù)必在報(bào)價(jià)前與采購(gòu)單位聯(lián)系落實(shí)或報(bào)價(jià)時(shí)明確所報(bào)設(shè)備型號(hào),否則視為廢標(biāo)。
3.供貨商在報(bào)價(jià)時(shí),報(bào)價(jià)總價(jià)不得超過(guò)預(yù)算金額,不得以低于成本價(jià)的方式謀取中標(biāo)。
三、成交原則1.報(bào)價(jià)供應(yīng)商不足三家時(shí),作廢標(biāo)處理。
2.報(bào)價(jià)供應(yīng)商滿足三家的,報(bào)價(jià)不同時(shí),以報(bào)價(jià)最低的供應(yīng)商為成交供應(yīng)商;報(bào)價(jià)相同時(shí),以報(bào)價(jià)時(shí)間最早的供應(yīng)商為成交供應(yīng)商。
3.采購(gòu)人選擇非最低報(bào)價(jià)供應(yīng)商為成交供應(yīng)商的應(yīng)說(shuō)明理由,選擇理由將在結(jié)果公示中進(jìn)行公示。
四、需求明細(xì)1 | AI服務(wù)器1 | 1 | 1,580,000.00 | 臺(tái) | 自定義 : 1.原廠正品 2.高度:≤6U機(jī)架式服務(wù)器 3.處理器:配置≥2顆Intel Xeon處理器,單顆處理器≥56核,基本主頻≥2.0GHz 4.內(nèi)存:配置≥32條64GB DDR5 4800MHz內(nèi)存 5.硬盤:配置≥2塊480G SSD硬盤,≥4塊7.68T NVME SSD硬盤; 6.RAID卡:配置≥1塊RAID卡,緩存≥2GB; 7.網(wǎng)絡(luò):配置≥2個(gè)萬(wàn)兆網(wǎng)絡(luò)接口(含SFP+光模塊),配置≥1塊雙口HDR 200Gb HCA卡及1根IB線纜; 8.GPU卡:配置≥8塊NVIDIA H20 96GB GPU卡;為滿足AI計(jì)算通信需求,要求基于bandwidthTest的Host to Device帶寬≥55GB/s、基于p2pBandwidthLatencyTest實(shí)測(cè)的GPU卡間通信帶寬≥740GB/s、基于stream實(shí)測(cè)的顯存帶寬≥3.2TB/s、基于nccl-test實(shí)測(cè)的8卡Allreduce通信性能≥420GB/s; 9.I/O擴(kuò)展槽:可擴(kuò)展≥10個(gè)PCIe 5.0 x16插槽; 10. 管理:配置AI服務(wù)器統(tǒng)一管理軟件,支持服務(wù)器全方位性能監(jiān)控,包括CPU 利用率、CPU溫度、內(nèi)存使用率、SWAP使用率,TCP重傳率,UDP連接數(shù),硬盤讀寫次數(shù)及讀寫時(shí)速率,出入風(fēng)口溫度,風(fēng)扇轉(zhuǎn)速及風(fēng)扇占空比,網(wǎng)絡(luò)發(fā)送速率、接收速率等,系統(tǒng)進(jìn)程數(shù)等;支持服務(wù)器BMC、BIOS、硬盤、RAID卡、網(wǎng)卡批量升級(jí),服務(wù)器BIOS、BMC、RAID批量配置;支持服務(wù)器硬盤故障預(yù)測(cè)、內(nèi)存故障預(yù)測(cè)功能;支持流程管理功能,包括設(shè)備上架流程、設(shè)備下架流程、問(wèn)題處理流程、測(cè)試環(huán)境變更流程、硬件變更改配流程、設(shè)備位置變更流程等; 11.AI平臺(tái):配置2個(gè)節(jié)點(diǎn)及以上的AI訓(xùn)推一體平臺(tái)軟件;支持通過(guò)平臺(tái)快速構(gòu)建交互式AI開(kāi)發(fā)環(huán)境,提供Jupyter、Webshell在線交互開(kāi)發(fā)功能,支持對(duì)接第三方開(kāi)發(fā)工具VSCode、PyCharm;支持單機(jī)或分布式訓(xùn)練任務(wù),可以提交Tensorflow、Caffe、pytorch、PaddlePaddle、MXNet框架的單機(jī)或分布式訓(xùn)練作業(yè),支持大模型訓(xùn)練容錯(cuò);****服務(wù)部署,支持基于標(biāo)準(zhǔn)模型文件、自定義Docker鏡像、yaml、Helm等多種部署方式;支持推理服務(wù)生命周期管理,支持服務(wù)上線過(guò)程中的離線測(cè)試、定時(shí)發(fā)布、流量調(diào)節(jié)、在線部署、多分桶測(cè)試、在線滾動(dòng)更新、灰度發(fā)布、在線服務(wù)評(píng)估、服務(wù)下線等全流程服務(wù)管理能力;支持GPU共享,支持GPU顯存隔離切分、GPU復(fù)用、Mig配置三種GPU共享方式;支持親和性調(diào)度策略、可基于數(shù)據(jù)集緩存位置、交換機(jī)拓?fù)洹⒐?jié)點(diǎn)親和性等親和性策略進(jìn)行調(diào)度;支持平臺(tái)內(nèi)創(chuàng)建持久卷聲明,****服務(wù)部署模式掛載持久卷聲明進(jìn)行;提供數(shù)據(jù)緩存加速機(jī)制,數(shù)據(jù)集可高速并行緩存到計(jì)算節(jié)點(diǎn)本地,并提供緩存數(shù)據(jù)的生命周期管理,支持緩存進(jìn)度查看,可進(jìn)行緩存數(shù)據(jù)的增量更新、手動(dòng)清理等。 12. 支持基于yum的模塊安裝與更新、實(shí)現(xiàn)應(yīng)用軟件及其依賴組件的高效安裝與更新。 13. 售后服務(wù):提供三年原廠售后支持服務(wù),官方網(wǎng)站查詢配置與實(shí)際供貨配置一致; 14. 電源:配置冗余電源; 15. 制造商進(jìn)行過(guò)至少1個(gè)NLP大模型如GPT2、GPT3等參數(shù)量大于10億的NLP語(yǔ)言模型的擴(kuò)展性測(cè)試,測(cè)試內(nèi)容需包含單機(jī)多卡的性能測(cè)試和多機(jī)多卡的性能測(cè)試; 16. 制造商進(jìn)行過(guò)AI多機(jī)并行加速性能測(cè)試,測(cè)試至少兩種深度學(xué)習(xí)框架,使用ImageNet圖片集,測(cè)試模型采用AlexNet,或Resnet從1個(gè)GPU卡到16個(gè)GPU卡的性能,加速比≥14x;; | 無(wú) | 無(wú) | 無(wú) | 無(wú) | 無(wú) | 無(wú) | |
2 | AI服務(wù)器2 | 1 | 470,000.00 | 臺(tái) | 自定義 : 1.原廠正品 2.高度:≤6U機(jī)架式服務(wù)器 3.處理器:配置≥2顆Intel Xeon處理器,單顆處理器≥28核,基本主頻≥2.0GHz 4.內(nèi)存:配置≥16根32GB ECC 內(nèi)存,可擴(kuò)展≥32根內(nèi)存條 5.硬盤:配置≥2塊480G SSD硬盤,≥4塊3.84T NVME SSD硬盤,支持≥12塊3.5寸硬盤擴(kuò)展; 6.RAID卡:配置≥1塊RAID卡,緩存≥2GB; 7.網(wǎng)絡(luò):配置≥4個(gè)千兆網(wǎng)絡(luò)接口,配置≥2個(gè)萬(wàn)兆網(wǎng)絡(luò)接口(含SFP+光模塊),配置≥1塊雙口HDR 200GbHCA卡及1根IB線纜; 8.GPU卡:配置≥6塊NVIDIA L20 48GB GPU卡; 9.I/O擴(kuò)展槽:滿配GPU卡后,同時(shí)支持≥4個(gè)PCIe x16插槽; 10.拓?fù)淝袚Q:支持在不斷電情況下實(shí)現(xiàn)CPU-GPU間拓?fù)淝袚Q,支持Balance/Common/Cascade三種拓?fù)洌?11. 管理:配置AI服務(wù)器統(tǒng)一管理軟件,支持服務(wù)器全方位性能監(jiān)控,包括CPU 利用率、CPU溫度、內(nèi)存使用率、SWAP使用率,TCP重傳率,UDP連接數(shù),硬盤讀寫次數(shù)及讀寫時(shí)速率,出入風(fēng)口溫度,風(fēng)扇轉(zhuǎn)速及風(fēng)扇占空比,網(wǎng)絡(luò)發(fā)送速率、接收速率等,系統(tǒng)進(jìn)程數(shù)等;支持服務(wù)器BMC、BIOS、硬盤、RAID卡、網(wǎng)卡批量升級(jí),服務(wù)器BIOS、BMC、RAID批量配置;支持服務(wù)器硬盤故障預(yù)測(cè)、內(nèi)存故障預(yù)測(cè)功能;支持流程管理功能,包括設(shè)備上架流程、設(shè)備下架流程、問(wèn)題處理流程、測(cè)試環(huán)境變更流程、硬件變更改配流程、設(shè)備位置變更流程等; 12.AI平臺(tái):配置1個(gè)節(jié)點(diǎn)(物理服務(wù)器)人工智能訓(xùn)推一體平臺(tái);支持通過(guò)平臺(tái)快速構(gòu)建交互式AI開(kāi)發(fā)環(huán)境,提供Jupyter、Webshell在線交互開(kāi)發(fā),支持對(duì)接第三方開(kāi)發(fā)工具VSCode、PyCharm;支持單機(jī)或分布式訓(xùn)練任務(wù),可以提交Tensorflow、Caffe、pytorch、PaddlePaddle、MXNet框架的單機(jī)或分布式訓(xùn)練作業(yè),支持大模型訓(xùn)練容錯(cuò);****服務(wù)部署,支持基于標(biāo)準(zhǔn)模型文件、自定義Docker鏡像、原生部署yaml、Helm部署多種部署方式;支持推理服務(wù)生命周期管理,支持服務(wù)上線過(guò)程中的離線測(cè)試、定時(shí)發(fā)布、流量調(diào)節(jié)、在線部署、多分桶測(cè)試、在線滾動(dòng)更新、灰度發(fā)布、在線服務(wù)評(píng)估、服務(wù)下線等全流程服務(wù)管理能力;支持GPU共享,支持GPU顯存隔離切分、GPU復(fù)用、Mig配置三種GPU共享方式;支持親和性調(diào)度策略、可基于數(shù)據(jù)集緩存位置、交換機(jī)拓?fù)洹⒐?jié)點(diǎn)親和性等親和性策略進(jìn)行調(diào)度;支持平臺(tái)內(nèi)創(chuàng)建持久卷聲明,****服務(wù)部署模式掛載持久卷聲明進(jìn)行;提供數(shù)據(jù)緩存加速機(jī)制,數(shù)據(jù)集可高速并行緩存到計(jì)算節(jié)點(diǎn)本地,并提供緩存數(shù)據(jù)的生命周期管理,支持緩存進(jìn)度查看,可進(jìn)行緩存數(shù)據(jù)的增量更新、手動(dòng)清理等; 13.支持基于yum 的模塊安裝與更新、實(shí)現(xiàn)應(yīng)用軟件及其依賴組件的高效安裝與更新,提供一年原廠技術(shù)支持服務(wù)。 14.電源:配置≥4個(gè)2200W電源; 15.售后服務(wù):提供三年原廠售后質(zhì)保服務(wù);官網(wǎng)查詢配置與實(shí)際供貨配置一致; 16.要求制造商進(jìn)行過(guò)至少1個(gè)NLP大模型如GPT2、GPT3等參數(shù)量大于10億的NLP語(yǔ)言模型在GPU服務(wù)器上的擴(kuò)展性測(cè)試,其中測(cè)試內(nèi)容需包含單機(jī)多卡的性能測(cè)試和多機(jī)多卡的性能測(cè)試; 17. 制造商進(jìn)行過(guò)AI多機(jī)并行加速性能測(cè)試,測(cè)試至少兩種深度學(xué)習(xí)框架,使用ImageNet圖片集,測(cè)試模型采用AlexNet,或Resnet從1個(gè)GPU卡到16個(gè)GPU卡的性能,加速比≥14x;; | 無(wú) | 無(wú) | 無(wú) | 無(wú) | 無(wú) | 無(wú) |
1 | 其他要求 | 注:投標(biāo)人報(bào)價(jià)時(shí)滿足需求清單中主要參數(shù)的同時(shí)參考附件采購(gòu)需求標(biāo)準(zhǔn)內(nèi)容。 其他商務(wù)要求: 一、1.供應(yīng)商所投產(chǎn)品必須是原裝正品。2.成交供應(yīng)商所供應(yīng)商品須和報(bào)價(jià)產(chǎn)品詳細(xì)參數(shù)一致,必須滿足所有技術(shù)參數(shù)要求。3.不接受委托第三方送貨,必須是全新未拆封的正品,拒絕拆改新、二手產(chǎn)品。到貨后硬件廠商實(shí)施軟件部署 4.如項(xiàng)目成交,則成交供應(yīng)商依據(jù)成交確認(rèn)書(shū)在10個(gè)工作日內(nèi)與采購(gòu)人簽訂協(xié)議供貨合同。合同簽訂后,10個(gè)工作日內(nèi)免費(fèi)完成運(yùn)輸、安裝、調(diào)試,達(dá)到驗(yàn)收標(biāo)準(zhǔn)。5.技術(shù)支持:7x24小時(shí);保修期:三年;服務(wù)響應(yīng)時(shí)限:報(bào)修后8小時(shí);質(zhì)保期:三年;培訓(xùn)要求:培訓(xùn)一次;是否含稅:國(guó)產(chǎn)含稅;6.售后服務(wù):提供三年原廠售后支持服務(wù),官方網(wǎng)站查詢配置與實(shí)際供貨配置一致;7.保修信息必須與采購(gòu)要求一致,驗(yàn)貨時(shí)需供貨商拆包裝箱,一機(jī)一驗(yàn)原則,同時(shí)撥打官方400/800核實(shí)配置,確保整機(jī)的穩(wěn)定性和安全性如查驗(yàn)異常,則為驗(yàn)收不合格,甲方有權(quán)拒收貨物。驗(yàn)收參照合同及相關(guān)法律、法規(guī)要求,驗(yàn)收達(dá)不到設(shè)備技術(shù)參數(shù)要求的,無(wú)條件退換不合格產(chǎn)品,涉及風(fēng)險(xiǎn)由供貨商全部承擔(dān)。 8.成交供應(yīng)商如不能按時(shí)、按需、按質(zhì)供貨,導(dǎo)致廢標(biāo),影響采購(gòu)單位使用,將根據(jù)《****政府采購(gòu)電子賣場(chǎng)管理辦法》承擔(dān)相應(yīng)責(zé)任,同****政府****財(cái)政廳,視為惡意競(jìng)標(biāo)及虛假應(yīng)標(biāo),****政府采購(gòu)黑名單。9.中標(biāo)供應(yīng)商請(qǐng)開(kāi)具增值稅專用發(fā)票。 |
AI服務(wù)器1 | AI服務(wù)器1 | 1 | 1,580,000.00 | 臺(tái) | **金貝****公司 | 1,574,000.00 | 否 | ||
******公司 | 1,574,200.00 | 否 | |||||||
******公司 | 1,576,500.00 | 否 | |||||||
**萬(wàn)德****公司 | 1,400,000.00 | 否 | |||||||
**匯鑫****公司 | 1,571,500.00 | 是 | |||||||
**潤(rùn)升****公司 | 1,575,000.00 | 否 | |||||||
**市益通****公司 | 1,453,600.00 | 否 | |||||||
******公司 | 1,485,200.00 | 否 | |||||||
****公司 | 1,520,000.00 | 否 | |||||||
**市訊業(yè)****公司 | 1,480,000.00 | 否 | |||||||
AI服務(wù)器2 | AI服務(wù)器2 | 1 | 470,000.00 | 臺(tái) | **金貝****公司 | 464,500.00 | 否 | ||
******公司 | 465,800.00 | 否 | |||||||
******公司 | 465,000.00 | 否 | |||||||
**萬(wàn)德****公司 | 430,000.00 | 否 | |||||||
**匯鑫****公司 | 463,500.00 | 是 | |||||||
**潤(rùn)升****公司 | 464,500.00 | 否 | |||||||
**市益通****公司 | 432,400.00 | 否 | |||||||
******公司 | 441,800.00 | 否 | |||||||
****公司 | 430,000.00 | 否 | |||||||
**市訊業(yè)****公司 | 408,600.00 | 否 |
1 | **** | 1,670,000.00 | 2024-08-23 09:46:27 |
2 | ******公司 | 1,798,000.00 | 2024-08-23 15:24:42 |
3 | **萬(wàn)德****公司 | 1,830,000.00 | 2024-08-23 09:59:16 |
4 | **市益通****公司 | 1,886,000.00 | 2024-08-23 11:14:24 |
5 | **市訊業(yè)****公司 | 1,888,600.00 | 2024-08-23 17:17:11 |
6 | ******公司 | 1,927,000.00 | 2024-08-23 13:15:51 |
7 | ****公司 | 1,950,000.00 | 2024-08-23 16:53:39 |
8 | **匯鑫****公司 | 2,035,000.00 | 2024-08-23 10:17:21 |
9 | **金貝****公司 | 2,038,500.00 | 2024-08-22 15:56:22 |
10 | **潤(rùn)升****公司 | 2,039,500.00 | 2024-08-23 11:11:42 |
11 | ******公司 | 2,040,000.00 | 2024-08-22 17:12:21 |
12 | ******公司 | 2,041,500.00 | 2024-08-22 17:42:48 |
元腦服務(wù)器 | 浪潮信息 | 元腦服務(wù)器NF5688-M7-A0-R0-00 | 自定義:1. 本次投標(biāo)浪潮信息元腦服務(wù)器NF5688-M7-A0-R0-00為原廠正品2.6U機(jī)架式服務(wù)器3.配置2顆Intel Xeon 8480+處理器,單顆處理器56核,基本主頻2.0GHz4.配置32條64GB DDR5 4800MHz內(nèi)存5.配置2塊480G SSD硬盤,4塊7.68T NVME SSD硬盤;6.RAID卡:配置1塊RAID卡,緩存4GB;7.網(wǎng)絡(luò):配置2個(gè)萬(wàn)兆網(wǎng)絡(luò)接口(含SFP+光模塊),配置1塊雙口HDR 200Gb HCA卡及1根IB線纜;8.GPU卡:配置8塊NVIDIA H20 96GB GPU卡;為滿足AI計(jì)算通信需求,要求基于bandwidthTest的Host to Device帶寬57.4GB/s、基于p2pBandwidthLatencyTest實(shí)測(cè)的GPU卡間通信帶寬740GB/s、基于stream實(shí)測(cè)的顯存帶寬3.3TB/s、基于nccl-test實(shí)測(cè)的8卡Allreduce通信性能431GB/s;9.I/O擴(kuò)展槽:可擴(kuò)展10個(gè)PCIe 5.0 x16插槽;10. 管理:配置AI服務(wù)器統(tǒng)一管理軟件,支持服務(wù)器全方位性能監(jiān)控,包括CPU 利用率、CPU溫度、內(nèi)存使用率、SWAP使用率,TCP重傳率,UDP連接數(shù),硬盤讀寫次數(shù)及讀寫時(shí)速率,出入風(fēng)口溫度,風(fēng)扇轉(zhuǎn)速及風(fēng)扇占空比,網(wǎng)絡(luò)發(fā)送速率、接收速率等,系統(tǒng)進(jìn)程數(shù)等;支持服務(wù)器BMC、BIOS、硬盤、RAID卡、網(wǎng)卡批量升級(jí),服務(wù)器BIOS、BMC、RAID批量配置;支持服務(wù)器硬盤故障預(yù)測(cè)、內(nèi)存故障預(yù)測(cè)功能;支持流程管理功能,包括設(shè)備上架流程、設(shè)備下架流程、問(wèn)題處理流程、測(cè)試環(huán)境變更流程、硬件變更改配流程、設(shè)備位置變更流程等;11.AI平臺(tái):配置2個(gè)節(jié)點(diǎn)的AI訓(xùn)推一體平臺(tái)軟件;支持通過(guò)平臺(tái)快速構(gòu)建交互式AI開(kāi)發(fā)環(huán)境,提供Jupyter、Webshell在線交互開(kāi)發(fā)功能,支持對(duì)接第三方開(kāi)發(fā)工具VSCode、PyCharm;支持單機(jī)或分布式訓(xùn)練任務(wù),可以提交Tensorflow、Caffe、pytorch、PaddlePaddle、MXNet框架的單機(jī)或分布式訓(xùn)練作業(yè),支持大模型訓(xùn)練容錯(cuò);****服務(wù)部署,支持基于標(biāo)準(zhǔn)模型文件、自定義Docker鏡像、yaml、Helm等多種部署方式;支持推理服務(wù)生命周期管理,支持服務(wù)上線過(guò)程中的離線測(cè)試、定時(shí)發(fā)布、流量調(diào)節(jié)、在線部署、多分桶測(cè)試、在線滾動(dòng)更新、灰度發(fā)布、在線服務(wù)評(píng)估、服務(wù)下線等全流程服務(wù)管理能力;支持GPU共享,支持GPU顯存隔離切分、GPU復(fù)用、Mig配置三種GPU共享方式;支持親和性調(diào)度策略、可基于數(shù)據(jù)集緩存位置、交換機(jī)拓?fù)?、?jié)點(diǎn)親和性等親和性策略進(jìn)行調(diào)度;支持平臺(tái)內(nèi)創(chuàng)建持久卷聲明,****服務(wù)部署模式掛載持久卷聲明進(jìn)行;提供數(shù)據(jù)緩存加速機(jī)制,數(shù)據(jù)集可高速并行緩存到計(jì)算節(jié)點(diǎn)本地,并提供緩存數(shù)據(jù)的生命周期管理,支持緩存進(jìn)度查看,可進(jìn)行緩存數(shù)據(jù)的增量更新、手動(dòng)清理等。12. 配置潮信息操作系統(tǒng)KOS,支持基于yum的模塊安裝與更新、實(shí)現(xiàn)應(yīng)用軟件及其依賴組件的高效安裝與更新。 13. 售后服務(wù):提供三年原廠售后支持服務(wù),官方網(wǎng)站查詢配置與實(shí)際供貨配置一致;14. 電源:配置冗余電源;15. 浪潮信息進(jìn)行過(guò)1個(gè)NLP大模型如GPT2、GPT3等參數(shù)量大于10億的NLP語(yǔ)言模型的擴(kuò)展性測(cè)試,測(cè)試內(nèi)容需包含單機(jī)多卡的性能測(cè)試和多機(jī)多卡的性能測(cè)試;16. 浪潮信息進(jìn)行過(guò)AI多機(jī)并行加速性能測(cè)試,測(cè)試兩種深度學(xué)習(xí)框架,使用ImageNet圖片集,測(cè)試模型采用AlexNet,或Resnet從1個(gè)GPU卡的性能,加速比14x以上 |
元腦服務(wù)器 | 浪潮信息 | 元腦服務(wù)器NF5468M6 | 自定義:1.本次投標(biāo)浪潮信息元腦服務(wù)器NF5468M6為原廠正品2.高度:4U機(jī)架式服務(wù)器3.處理器:配置2顆Intel Xeon6330處理器,單顆處理器28核,基本主頻2.0GHz4.內(nèi)存:配置16根32GB ECC 內(nèi)存,可擴(kuò)展32根內(nèi)存條5.硬盤:配置2塊480G SSD硬盤,4塊3.84T NVME SSD硬盤,支持12塊3.5寸硬盤擴(kuò)展;6.RAID卡:配置1塊RAID卡,緩存2GB;7.網(wǎng)絡(luò):配置4個(gè)千兆網(wǎng)絡(luò)接口,配置2個(gè)萬(wàn)兆網(wǎng)絡(luò)接口(含SFP+光模塊),配置1塊雙口HDR 200GbHCA卡及1根IB線纜;8.GPU卡:配置6塊NVIDIA L20 48GB GPU卡;9.I/O擴(kuò)展槽:滿配GPU卡后,同時(shí)支持4個(gè)PCIe x16插槽;10.拓?fù)淝袚Q:支持在不斷電情況下實(shí)現(xiàn)CPU-GPU間拓?fù)淝袚Q,支持Balance/Common/Cascade三種拓?fù)洌?1. 管理:配置AI服務(wù)器統(tǒng)一管理軟件,支持服務(wù)器全方位性能監(jiān)控,包括CPU 利用率、CPU溫度、內(nèi)存使用率、SWAP使用率,TCP重傳率,UDP連接數(shù),硬盤讀寫次數(shù)及讀寫時(shí)速率,出入風(fēng)口溫度,風(fēng)扇轉(zhuǎn)速及風(fēng)扇占空比,網(wǎng)絡(luò)發(fā)送速率、接收速率等,系統(tǒng)進(jìn)程數(shù)等;支持服務(wù)器BMC、BIOS、硬盤、RAID卡、網(wǎng)卡批量升級(jí),服務(wù)器BIOS、BMC、RAID批量配置;支持服務(wù)器硬盤故障預(yù)測(cè)、內(nèi)存故障預(yù)測(cè)功能;支持流程管理功能,包括設(shè)備上架流程、設(shè)備下架流程、問(wèn)題處理流程、測(cè)試環(huán)境變更流程、硬件變更改配流程、設(shè)備位置變更流程等;12.AI平臺(tái):配置1個(gè)節(jié)點(diǎn)(物理服務(wù)器)人工智能訓(xùn)推一體平臺(tái);支持通過(guò)平臺(tái)快速構(gòu)建交互式AI開(kāi)發(fā)環(huán)境,提供Jupyter、Webshell在線交互開(kāi)發(fā),支持對(duì)接第三方開(kāi)發(fā)工具VSCode、PyCharm;支持單機(jī)或分布式訓(xùn)練任務(wù),可以提交Tensorflow、Caffe、pytorch、PaddlePaddle、MXNet框架的單機(jī)或分布式訓(xùn)練作業(yè),支持大模型訓(xùn)練容錯(cuò);****服務(wù)部署,支持基于標(biāo)準(zhǔn)模型文件、自定義Docker鏡像、原生部署yaml、Helm部署多種部署方式;支持推理服務(wù)生命周期管理,支持服務(wù)上線過(guò)程中的離線測(cè)試、定時(shí)發(fā)布、流量調(diào)節(jié)、在線部署、多分桶測(cè)試、在線滾動(dòng)更新、灰度發(fā)布、在線服務(wù)評(píng)估、服務(wù)下線等全流程服務(wù)管理能力;支持GPU共享,支持GPU顯存隔離切分、GPU復(fù)用、Mig配置三種GPU共享方式;支持親和性調(diào)度策略、可基于數(shù)據(jù)集緩存位置、交換機(jī)拓?fù)?、?jié)點(diǎn)親和性等親和性策略進(jìn)行調(diào)度;支持平臺(tái)內(nèi)創(chuàng)建持久卷聲明,****服務(wù)部署模式掛載持久卷聲明進(jìn)行;提供數(shù)據(jù)緩存加速機(jī)制,數(shù)據(jù)集可高速并行緩存到計(jì)算節(jié)點(diǎn)本地,并提供緩存數(shù)據(jù)的生命周期管理,支持緩存進(jìn)度查看,可進(jìn)行緩存數(shù)據(jù)的增量更新、手動(dòng)清理等;13.配置浪潮信息KOS操作系統(tǒng),支持基于yum 的模塊安裝與更新、實(shí)現(xiàn)應(yīng)用軟件及其依賴組件的高效安裝與更新,提供一年原廠技術(shù)支持服務(wù)。 14.電源:配置4個(gè)2200W電源;15.售后服務(wù):提供三年原廠售后質(zhì)保服務(wù);官網(wǎng)查詢配置與實(shí)際供貨配置一致;16.浪潮信息進(jìn)行過(guò)1個(gè)NLP大模型如GPT2、GPT3等參數(shù)量大于10億的NLP語(yǔ)言模型在GPU服務(wù)器上的擴(kuò)展性測(cè)試,其中測(cè)試內(nèi)容需包含單機(jī)多卡的性能測(cè)試和多機(jī)多卡的性能測(cè)試;17. 浪潮信息進(jìn)行過(guò)AI多機(jī)并行加速性能測(cè)試,測(cè)試兩種深度學(xué)習(xí)框架,使用ImageNet圖片集,測(cè)試模型采用AlexNet,或Resnet從1個(gè)GPU卡到16個(gè)GPU卡的性能,加速比14x以上; |