2025年5月8日,“橫琴智匯,葡寫未來”——深繹未來葡語大模型DeeCo-Model發(fā)布會在橫琴粵澳深度合作區(qū)舉行。當(dāng)日,合作區(qū)數(shù)據(jù)跨境服務(wù)中心和大模型合規(guī)指導(dǎo)中心正式揭牌運作,在探索建設(shè)高效便利安全的數(shù)據(jù)跨境流動機制、推動人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展、服務(wù)國家高水平對外開放方面積極探索“澳琴方案”。

此次發(fā)布的深繹未來葡語大模型是國內(nèi)首個面向葡語國家市場的行業(yè)級大語言模型,由深繹未來科技研發(fā)推出。該模型將助力構(gòu)建多語言數(shù)字服務(wù)能力,推動我國人工智能技術(shù)“出?!?。深繹未來科技創(chuàng)始人兼CEO林余楚表示,公司將以此次發(fā)布為契機,在數(shù)據(jù)要素跨境流通、人工智能產(chǎn)業(yè)合規(guī)健康發(fā)展、數(shù)字經(jīng)濟生態(tài)建設(shè)等方面開展先行先試。
此次發(fā)布的“深繹未來葡語大模型”是國內(nèi)首個針對葡語國家市場的行業(yè)級大模型,具備強大核心能力。模型基于多語言、多模態(tài)的技術(shù)架構(gòu),支持文本、圖片、音視頻等多種形式的內(nèi)容處理,覆蓋金融、科技、文化等17個領(lǐng)域;具備強大的多語言處理能力,融合中葡、英葡平行語料對齊技術(shù),能更好地理解歐洲葡萄牙語(歐葡)和巴西葡萄牙語(巴葡)的語言結(jié)構(gòu),適配全球化需求。此外,模型具備輕量化部署能力,通過模型壓縮技術(shù)實現(xiàn)高效部署,具備行業(yè)專家級能力;自研深數(shù)引擎DeepDataEngine,打造以多語言多模態(tài)數(shù)據(jù)為核心的技術(shù)體系、工具鏈和眾包平臺,構(gòu)建閉環(huán)數(shù)據(jù)采標(biāo)SOP流程,并能將工作生活數(shù)據(jù)及時處理成為模型可用的知識庫。在數(shù)據(jù)語料方面,訓(xùn)練語料融合了部分現(xiàn)有的深譯科技2.04億數(shù)據(jù)資產(chǎn)包,引入中葡、英葡的雙語平行語料以及中文、葡語單語語料,從數(shù)據(jù)層面保證了模型在中文和葡萄牙語上的能力。未來,模型將加強地域與文化的匹配和場景化能力拓展,融入澳門本地的人文、歷史、旅游等特色語料,并有望擴展到其他葡語系國家具有當(dāng)?shù)匚幕厣臄?shù)據(jù)。
《橫琴粵澳深度合作區(qū)建設(shè)總體方案》明確提出要將人工智能作為“四新產(chǎn)業(yè)”的重要組成部分之一,并倡導(dǎo)“建設(shè)人工智能協(xié)同創(chuàng)新生態(tài)”。林余楚稱,深繹未來葡語大模型的推出正是該目標(biāo)的具體實踐,通過將AI技術(shù)與實際應(yīng)用場景緊密結(jié)合,加速產(chǎn)學(xué)研合作,推動AI技術(shù)在文旅、金融、醫(yī)療等多個領(lǐng)域的落地應(yīng)用。展望未來,深繹未來將以葡語大模型為起點,構(gòu)建“技術(shù)研發(fā)-場景應(yīng)用-國際合作”的全鏈條生態(tài)體系。依托橫琴粵澳深度合作區(qū)的制度和區(qū)位優(yōu)勢,推動合作區(qū)人工智能產(chǎn)業(yè)鏈協(xié)同發(fā)展,在當(dāng)前國際經(jīng)貿(mào)斗爭背景下,賦能“澳門+橫琴”打造面向葡語國家的數(shù)字經(jīng)濟樞紐。