2025年9月28日,人工智能高質(zhì)量數(shù)據(jù)集生態(tài)發(fā)展大會(huì)在重慶市永川區(qū)舉行。會(huì)上,重慶市大數(shù)據(jù)應(yīng)用發(fā)展管理局與永川區(qū)政府簽署協(xié)議,共同建設(shè)“重慶市數(shù)據(jù)集建設(shè)應(yīng)用基地”。這也是全市首個(gè)數(shù)據(jù)集建設(shè)應(yīng)用基地。

此次落戶永川的“重慶市數(shù)據(jù)集建設(shè)應(yīng)用基地”,將聚焦建強(qiáng)公共數(shù)據(jù)標(biāo)注平臺(tái),全面提升數(shù)據(jù)集建設(shè)能力。市大數(shù)據(jù)局將支持永川屬地企業(yè)參與重慶城市可信數(shù)據(jù)空間的數(shù)據(jù)集建設(shè),在資源對(duì)接、實(shí)施交付、標(biāo)注工具能力提升等方面提供支持;將支持永川建立適配超大城市現(xiàn)代化治理需求的數(shù)據(jù)標(biāo)注治理流程,提升數(shù)據(jù)標(biāo)注效率與可用性,有效支撐全市AI能力體系和業(yè)務(wù)場(chǎng)景。
會(huì)上,西部數(shù)據(jù)標(biāo)注研究院、西部數(shù)據(jù)集生產(chǎn)基地也同步揭牌成立。西部數(shù)據(jù)標(biāo)注研究院是由中國(guó)信息協(xié)會(huì)與永川區(qū)政府共同發(fā)起成立的數(shù)字技術(shù)共享平臺(tái)、數(shù)字產(chǎn)業(yè)孵化平臺(tái)及數(shù)字生態(tài)構(gòu)建平臺(tái)。研究院將聚焦人工智能與數(shù)字重慶建設(shè)雙向賦能,圍繞人工智能、高質(zhì)量數(shù)據(jù)集、數(shù)據(jù)標(biāo)注等領(lǐng)域,開(kāi)展新興技術(shù)科研創(chuàng)新、頂層設(shè)計(jì)、課題研究、標(biāo)準(zhǔn)制定、質(zhì)量評(píng)測(cè)等業(yè)務(wù),并組建專家智庫(kù),培養(yǎng)復(fù)合型數(shù)據(jù)標(biāo)注人才。西部數(shù)據(jù)集生產(chǎn)基地由中國(guó)信息協(xié)會(huì)與永川區(qū)政府共建。協(xié)會(huì)將依托會(huì)員企業(yè)資源,推動(dòng)更多數(shù)據(jù)集生產(chǎn)類企業(yè)落地永川,雙方合力促成數(shù)據(jù)要素在永川匯集,打造基地以帶動(dòng)西部、輻射全國(guó)數(shù)據(jù)產(chǎn)業(yè)。
永川作為重慶市數(shù)字經(jīng)濟(jì)發(fā)展的重要承載區(qū),近年來(lái)依托重慶云谷·永川大數(shù)據(jù)產(chǎn)業(yè)園,積極承接國(guó)家“數(shù)據(jù)要素×”行動(dòng)計(jì)劃,將數(shù)據(jù)標(biāo)注產(chǎn)業(yè)作為推動(dòng)數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)深度融合的重要抓手,至今已集聚數(shù)據(jù)標(biāo)注類企業(yè)18家,建成標(biāo)注坐席1.2萬(wàn)席,2024年相關(guān)業(yè)務(wù)營(yíng)收達(dá)13.76億元,占到了全市總量的65%,并成為西南地區(qū)最大的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)基地。
作為重慶市數(shù)字經(jīng)濟(jì)發(fā)展的重要承載區(qū),近年來(lái),依托重慶云谷·永川大數(shù)據(jù)產(chǎn)業(yè)園,永川區(qū)將數(shù)據(jù)標(biāo)注產(chǎn)業(yè)作為推動(dòng)數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)深度融合的重要抓手。自2008年從服務(wù)外包產(chǎn)業(yè)轉(zhuǎn)型以來(lái),歷經(jīng)語(yǔ)音呼叫、智能客服等階段,逐步向數(shù)據(jù)標(biāo)注、內(nèi)容審核等高附加值領(lǐng)域延伸。依托永川科技片場(chǎng),創(chuàng)新“數(shù)據(jù)標(biāo)注+影視制作”模式,完成《熊貓計(jì)劃》《狂野時(shí)代》等40余部影視作品動(dòng)作捕捉數(shù)據(jù)處理,并為《原神》《崩壞3》等游戲提供場(chǎng)景建模與貼圖標(biāo)注服務(wù),推動(dòng)影視后期制作效率提升40%。數(shù)據(jù)顯示,目前重慶云谷·永川大數(shù)據(jù)產(chǎn)業(yè)園已集聚數(shù)據(jù)標(biāo)注類企業(yè)18家,建成標(biāo)注坐席1.2萬(wàn)席,2024年相關(guān)業(yè)務(wù)營(yíng)收達(dá)13.76億元,成為西南地區(qū)重要的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)基地。
數(shù)據(jù)標(biāo)注是一個(gè)過(guò)程,指的是對(duì)原始數(shù)據(jù)(如圖片、文本、音頻、視頻)進(jìn)行加工,為其添加有意義的標(biāo)簽或注釋,以告訴機(jī)器學(xué)習(xí)模型這些數(shù)據(jù)“是什么”或“包含了什么”。核心目的是為模型提供“標(biāo)準(zhǔn)答案”或“學(xué)習(xí)資料”,讓它能夠?qū)W會(huì)識(shí)別和理解數(shù)據(jù)中的特定模式。數(shù)據(jù)集是一個(gè)集合,指的是為特定目的而收集、整理在一起的數(shù)據(jù)的總體。它是機(jī)器學(xué)習(xí)模型的“糧食”和“燃料”。數(shù)據(jù)標(biāo)注和數(shù)據(jù)集的關(guān)系是過(guò)程與結(jié)果、部分與整體的關(guān)系,二者密不可分。簡(jiǎn)而言之,通過(guò)“數(shù)據(jù)標(biāo)注”這個(gè)過(guò)程,將“原始數(shù)據(jù)”加工成有價(jià)值的“數(shù)據(jù)集”,從而喂養(yǎng)和訓(xùn)練出智能的AI模型。沒(méi)有標(biāo)注,數(shù)據(jù)就只是無(wú)意義的比特流;沒(méi)有數(shù)據(jù),標(biāo)注也就失去了對(duì)象。二者共同構(gòu)成了AI發(fā)展的基石。