中國信息通信研究院(簡稱“中國信通院”)正式啟動DeepSeek國產(chǎn)化適配測評工作,旨在為DeepSeek系列模型在多硬件多場景下的適配部署提供參考。一是評價模型在包括硬件芯片、計算設備、智算集群等軟硬件系統(tǒng)中的適配效果;二是反映模型在軟硬件系統(tǒng)適配過程中軟件棧及工具的適配易用性及開發(fā)部署成本。
據(jù)介紹,本次測評將面向包括芯片、服務器、集群、開發(fā)框架及工具鏈、智算設施及平臺等在內的人工智能軟硬件產(chǎn)品及系統(tǒng)開展。測試將主要圍繞表1所示的DeepSeek不同模態(tài)、不同尺寸的系列模型,面向推理、微調、訓練過程,低成本使用測試工具AISHPerf,從適配成本、功能完備性、優(yōu)化效果、性能指標等多方面開展測試評估。
