基于不斷提升的大模型能力,智能體(Agent)成為2025年大模型領(lǐng)域各家最關(guān)注的方向。騰訊首次完整闡述了騰訊云的大模型戰(zhàn)略,即通過“四個加速”:加速大模型創(chuàng)新、加速智能體(Agent)應(yīng)用、加速知識庫建設(shè)、加速基礎(chǔ)設(shè)施升級。值得注意的是,這是騰訊在基礎(chǔ)模型之外,首次提到Agent(智能體)。
近期,騰訊云大模型知識引擎已經(jīng)全面升級為“騰訊云智能體開發(fā)平臺”?;隍v訊云智能體開發(fā)平臺,用戶可以讓Agent自主拆解任務(wù)和規(guī)劃路徑,主動選擇和調(diào)用工具。騰訊云副總裁、騰訊云智能負(fù)責(zé)人、騰訊優(yōu)圖實驗室負(fù)責(zé)人吳運聲在近期接受媒體采訪時,回應(yīng)了關(guān)于騰訊云智能體開發(fā)平臺的諸多思考,并直言“每個行業(yè)都值得被智能體重構(gòu)一遍”。
Agent正在快速演進
記者:Agent智能體與傳統(tǒng)軟件應(yīng)用、SaaS有什么不同?
吳運聲:Agent具備自主思考和決策能力。傳統(tǒng)的軟件開發(fā)范式(包括 SaaS)通常是開發(fā)者事先設(shè)計好流程,即使存在分支邏輯,也是開發(fā)者預(yù)先定義好的。但智能體面對的是自然語言交互,用戶的輸入是開放的,不可能窮舉所有分支。這時就需要智能體能夠自主理解、規(guī)劃、執(zhí)行任務(wù),而不是依賴于固定流程。
同時,智能體能融合確定性工作流與自主規(guī)劃機制。騰訊云智能體平臺也支持工作流組件的融合。用戶可以構(gòu)建確定性的流程來處理特定任務(wù),同時也允許智能體在其中進行自主規(guī)劃。這樣就實現(xiàn)了靈活性與確定性的結(jié)合,更好地滿足復(fù)雜多樣的企業(yè)應(yīng)用場景。
記者:現(xiàn)在開發(fā)者社區(qū)里對 Agent 有很多爭議,騰訊如何理解Agent?你們判斷目前是否正處于 Agent 技術(shù)發(fā)展的一個關(guān)鍵路口?
吳運聲:我只是從一個既做技術(shù)又做產(chǎn)品的從業(yè)者角度談?wù)勎业睦斫?。?to B 場景下,Agent 的本質(zhì)是一種新的應(yīng)用形態(tài)。它和傳統(tǒng)軟件最核心的區(qū)別在于,它具備自主規(guī)劃能力,可以根據(jù)用戶的自然語言指令,自主調(diào)用工具,甚至多個 Agent 協(xié)同完成一個復(fù)雜任務(wù)。這種范式和過去軟件預(yù)設(shè)流程有本質(zhì)不同。
從技術(shù)角度來看,我們會深入研究以下幾個核心問題:如何實現(xiàn)更精準(zhǔn)的自主規(guī)劃與執(zhí)行;如何實現(xiàn)多 Agent 協(xié)同的復(fù)雜任務(wù)處理;如何構(gòu)建更高效的工具調(diào)用機制。以工具調(diào)用技術(shù)的演進為例,它經(jīng)歷了Function Calling、ReAct 模式、Code Agent(CodeArts)幾個發(fā)展階段
舉個例子:如果你要比較中國、日本、新加坡、德國的 iPhone 15 價格,使用Function Calling 技術(shù)就是一條條查;使用ReAct 模式,則會在每一步加上“我現(xiàn)在要查價格,我現(xiàn)在要調(diào)用匯率”;而 Code Agent 會直接生成一段程序,循環(huán)遍歷各國數(shù)據(jù)、調(diào)用接口、換算匯率、返回結(jié)果——高效得多。不論是應(yīng)用范式還是底層技術(shù),Agent 都在不斷快速演進。
Agent不存在單一固定的技術(shù)路線
記者:騰訊云智能體開發(fā)平臺的產(chǎn)品定位與價值是什么?
吳運聲:我們提出“騰訊云智能體開發(fā)平臺”,因為它融合了三方面能力:過去積累下來的強大的知識管理能力;支持復(fù)雜業(yè)務(wù)邏輯的工作流編排能力;智能體本身的自主感知與決策能力。通過這些能力的整合,騰訊希望幫助企業(yè)真正用得起、用得好智能體,而不是停留在概念階段。在組織層面,堅持快速研發(fā)前沿技術(shù),同時將技術(shù)與客戶需求緊密結(jié)合,真正把 AI 能力應(yīng)用在業(yè)務(wù)場景中。
記者:從騰訊內(nèi)部來說,騰訊有個叫“元器”的產(chǎn)品,也是Agent類產(chǎn)品,和現(xiàn)在的騰訊云智能體開發(fā)平臺是什么關(guān)系?
吳運聲: “元器”是一個偏C端的產(chǎn)品,主要是跟“元寶”結(jié)合,用來為個人用戶或輕量開發(fā)者提供智能體定制能力,也支持一鍵發(fā)布到元寶或QQ智能體中?!膀v訊云智能體開發(fā)平臺”則是面向B端的企業(yè)級平臺,強調(diào)的是系統(tǒng)性構(gòu)建、數(shù)據(jù)接入、安全隔離、跨角色協(xié)作等復(fù)雜能力。
記者:從外部來看,今年很多廠商不約而同地在智能體領(lǐng)域加大投入,怎么看智能體市場發(fā)展趨勢?以及各個大廠在技術(shù)路線上的選擇?
吳運聲:一是智能體技術(shù)快速發(fā)展,尤其是智能體具備自我規(guī)劃和調(diào)用工具完成復(fù)雜任務(wù)的能力在不斷增強。二是應(yīng)用業(yè)務(wù)的發(fā)展需求隨著技術(shù)提升也在增長,智能體能夠更好地滿足客戶復(fù)雜多樣的場景需求。這兩方面共同推動了智能體的快速發(fā)展,成為一個自然且必然的趨勢。個人認(rèn)為Agent開發(fā)目前還沒有出現(xiàn)涇渭分明的路線。騰訊專注的是如何構(gòu)建能力更強、更豐富的Agent應(yīng)用,這需要調(diào)用多種已有能力和不同模型。個人認(rèn)為不存在單一固定的技術(shù)路線。
怎么看市場未來發(fā)展
記者:目前智能體的應(yīng)用已經(jīng)涵蓋了對內(nèi)對外的信息檢索與處理。從騰訊的視角看,還有哪些場景或者任務(wù)更適合用Agent來做?
吳運聲:從C端用戶的角度看,首先接觸到一些比較典型的Agent任務(wù),比如調(diào)研寫報告、生成圖片視頻、執(zhí)行指令類任務(wù)等,感受會比較直觀。但從產(chǎn)品和技術(shù)人員的角度,其實更關(guān)注的是這些Agent背后的核心能力構(gòu)建。
比如,我們把瀏覽器沙箱與瀏覽器工具集成到了騰訊云智能體開發(fā)平臺中。因為我們發(fā)現(xiàn),不管是辦公還是生活場景,瀏覽器都是非常核心的交互工具。如果Agent具備了使用瀏覽器的能力,那它的“行為邊界”就大大拓展了,可以覆蓋很多真實場景。這也是我們平臺賦予開發(fā)者和客戶“想象空間”的關(guān)鍵。
未來我們也在研發(fā)本地電腦的沙箱能力(Computer Use 插件),讓Agent可以操作本地軟件、編輯文檔、調(diào)用工具,就像一個“虛擬操作員”。你設(shè)想一下,如果一個Agent不僅能上網(wǎng)、還能幫你打開Excel自動填報表格、用Photoshop批量裁剪圖片,那它在企業(yè)內(nèi)部的價值就會非常大。
記者:目前有哪些行業(yè)或場景最適合率先落地Agent應(yīng)用?
吳運聲:這個問題讓我想起二三十年前,大家問“信息化最適合哪個行業(yè)”時的場景。其實現(xiàn)在回頭看,當(dāng)時任何確定性的回答都不太準(zhǔn)確。因為每一個行業(yè)都有自身的復(fù)雜性和轉(zhuǎn)型需求,真正能否落地還是取決于企業(yè)自身的理解和推動?,F(xiàn)在智能體的發(fā)展就像信息化起步的那個階段,不是某個行業(yè)特別適合,而是“每個行業(yè)都值得重構(gòu)一遍”。只要企業(yè)業(yè)務(wù)復(fù)雜度高、知識密度強、人力成本高,Agent技術(shù)就有用武之地。關(guān)鍵在于業(yè)務(wù)人員和企業(yè)家如何理解Agent與自己場景的結(jié)合點。
記者:怎么看智能體在企業(yè)數(shù)字化轉(zhuǎn)型過程中的增長趨勢?在企業(yè)落地過程中,當(dāng)前還有哪些現(xiàn)實挑戰(zhàn)?
吳運聲:“增長”這個詞,個人比較少提。雖然從數(shù)據(jù)上看,智能體相關(guān)的業(yè)務(wù)增長幅度非常大,但那是因為起步階段基數(shù)很低,目前正處在快速探索期,所以用“增長”來描述可能會有些誤導(dǎo)。我們更關(guān)注的是,智能體如何真正融入企業(yè)的業(yè)務(wù)流程,滿足真實的業(yè)務(wù)需求。比如在快遞行業(yè)的一個落地實踐,就整合了多項技術(shù)能力:包括語音合成、數(shù)字人能力、語音 PaaS 平臺、瀏覽器插件、多 Agent 協(xié)同等。這不是一個簡單的“產(chǎn)品交付”,而是構(gòu)建了一個高度可組合、可擴展的平臺,企業(yè)可以在上面構(gòu)建適配自己場景的復(fù)雜應(yīng)用。
騰訊面臨的挑戰(zhàn)主要來自兩個方面。首先在技術(shù)層面,目前的 Agent 框架仍在快速演進,尤其是在自主規(guī)劃(planning)這個環(huán)節(jié)上,底層模型還不能100%把復(fù)雜任務(wù)完全準(zhǔn)確地拆解并執(zhí)行。這是模型和框架協(xié)同進化的問題。其次是客戶認(rèn)知層面,很多客戶還停留在對“Agent”作為一個新概念的理解階段。但真正要用好 Agent,需要掌握它的使用方式、搭建方法和運行機制。這中間存在一個不小的“認(rèn)知與使用”的鴻溝,需要通過產(chǎn)品體驗優(yōu)化、培訓(xùn)、服務(wù)等多種方式不斷去彌合。