2025年5月21日,國內首個基于國產算力預訓練的視覺基座大模型——“橘洲”V1端側版在長沙上線,它在智能手機上實現(xiàn)1024×1024分辨率圖像的秒級生成,具有成本低、質量高、速度快、輕量級、可離線的特點。

據(jù)悉,“橘洲”視覺基座大模型由湖南匯視威智能科技有限公司(簡稱“匯視威”)自主研發(fā),依托中科曙光算力,在較短時間內完成了近4000萬張圖片訓練,成為全國首個在國產算力上完成整體訓練和推理過程,并實現(xiàn)移動端部署的視覺基座大模型。
視覺大模型是視覺人工智能的基礎設施,有著推理成本高、數(shù)據(jù)隱私缺少保障、帶寬和時延要求嚴苛等弊端。“橘洲”視覺基座大模型創(chuàng)新性地解決了這些痛點——其采取跨模型結構極限蒸餾技術,圖片解碼模型參數(shù)量是云端解碼模型參數(shù)量的1/50;設計了高效的文生圖預訓練方法,將訓練時間壓縮到20小時;使用加速推理訓練方法,出圖從28步壓縮至4步,能做到秒級生成高分辨率圖片。