當(dāng)AI炒作退潮,誰(shuí)在真正交付價(jià)值?云計(jì)算一哥打響價(jià)值落地之戰(zhàn)!
作者 | ?李水青
編輯 | ?漠影
2025年的大模型產(chǎn)業(yè)正在經(jīng)歷一場(chǎng)靜默的分化。一邊,少數(shù)明星模型的參數(shù)競(jìng)賽依然激烈;另一邊,一個(gè)更根本的轉(zhuǎn)變已在基礎(chǔ)設(shè)施層悄然發(fā)生:
AI的價(jià)值實(shí)現(xiàn)路徑,正從“模型能力展示”轉(zhuǎn)向“Agent實(shí)際部署”。
亞馬遜云科技CEO馬特·加曼(Matt Garman)在今日凌晨舉辦的2025 re:Invent主題演講中直言:“Agent的出現(xiàn)使我們?cè)贏I軌跡上發(fā)生了變化——從一個(gè)技術(shù)奇跡的時(shí)代,轉(zhuǎn)向真正獲得價(jià)值的時(shí)代。”
他的判斷基于一組反差強(qiáng)烈的數(shù)據(jù):一方面,生成式AI引發(fā)全球狂歡,Amazon Bedrock已服務(wù)超過(guò)10萬(wàn)家企業(yè),其中50多家客戶處理了超1萬(wàn)億tokens;另一方面,許多企業(yè)仍未看到AI投資帶來(lái)相匹配的業(yè)務(wù)回報(bào)。
“Agent是企業(yè)從AI投資中獲得實(shí)質(zhì)性商業(yè)回報(bào)的地方?!盙arman揭示了一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn),“我相信,在未來(lái)每個(gè)公司內(nèi)部和每個(gè)可以想象的領(lǐng)域都會(huì)有數(shù)十億的Agent。”
一場(chǎng)重新定義AI價(jià)值實(shí)現(xiàn)的競(jìng)賽已經(jīng)打響。在亞馬遜云科技2025 re:Invent的舞臺(tái)上,AI芯片性能飆漲600%,構(gòu)建AI Agent的四大技術(shù)支柱同步升級(jí),Agent部署的全棧戰(zhàn)爭(zhēng)已經(jīng)升級(jí)……到底什么才是企業(yè)抓住這場(chǎng)變革紅利的抓手?
云計(jì)算一哥的一招一式,都給了我們解答Agent變革時(shí)代之問(wèn)的絕佳參考。
01.
重新定義AI Infra:
自研芯片與「AI工廠」的雙重革命
算力競(jìng)爭(zhēng)已進(jìn)入云巨頭自主可控、性能狂飆的階段。亞馬遜云科技在2025 re:Invent上亮出了其最尖端的武器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服務(wù)器正式全面推出,而下一代Trainium 4芯片的性能參數(shù)更令人震撼。
“如果看看今天在Amazon Bedrock上運(yùn)行的所有推理,大多數(shù)實(shí)際上已經(jīng)由Trainium驅(qū)動(dòng)了?!盙arman透露。更令人印象深刻的是,亞馬遜云科技已部署超過(guò)100萬(wàn)顆自研Trainium芯片,而上一代Trainium 2的量產(chǎn)速度是其此前芯片的4倍。
最新性能數(shù)據(jù)揭示了這場(chǎng)算力革命的緊迫程度:基于首款云端3nm AI芯片Trainium 3,亞馬遜云科技最新推出的Amazon EC2 Trainium 3 UltraServers服務(wù)器,最極致的配置將144顆Trainium 3芯片互連,提供362PFLOPS(FP8)算力和超過(guò)700TB/秒的總帶寬。
該服務(wù)器提供相比前代Trainium 2的4.4倍的計(jì)算性能、3.9倍的內(nèi)存帶寬提升,而能效比指標(biāo)——每兆瓦電力處理的AI token數(shù)量——提升了5倍。
更值得一提的是,對(duì)于下一代Trainium 4,亞馬遜云科技承諾了更大幅度的飛躍:預(yù)計(jì)提供6倍的FP4性能,4倍的內(nèi)存帶寬,2倍的內(nèi)存容量,并支持通過(guò)NVLink Fusion和UALink進(jìn)行擴(kuò)展,專為全球最大的模型訓(xùn)練需求而生。
但芯片性能只是故事的一半。亞馬遜云科技同時(shí)推出了更具戰(zhàn)略意義的Amazon AI Factories(AI工廠)服務(wù)——允許企業(yè)在自己的數(shù)據(jù)中心部署專用AI基礎(chǔ)設(shè)施,同時(shí)享受亞馬遜云科技的全套服務(wù)和管理。
這一舉措直擊企業(yè)生成式AI出海和全球化部署中的核心痛點(diǎn):數(shù)據(jù)主權(quán)、合規(guī)要求與性能需求的平衡。企業(yè)可以在本地維護(hù)數(shù)據(jù)控制權(quán),充分利用既有空間與電力資源;同時(shí)獲得與公有云相同的先進(jìn)AI能力,無(wú)縫接入從Trainium、英偉達(dá)GPU到SageMaker和Bedrock的全棧AI服務(wù)。
02.
模型生態(tài)的多元主義:
自研模型超GPT-5.1
中國(guó)模型占1/4席位
與追逐“萬(wàn)能模型”的潮流相反,亞馬遜云科技選擇了多元化的模型戰(zhàn)略。“我們從不相信會(huì)有一個(gè)模型統(tǒng)治一切?!盙arman明確表示,“相反,會(huì)出現(xiàn)很多偉大的模型?!?/font>
這一理念在Amazon Bedrock平臺(tái)上得到充分體現(xiàn)。過(guò)去一年,Amazon Bedrock平臺(tái)提供的模型數(shù)量翻倍,2025 re:Invent上新增的18款全托管開(kāi)源模型也包含4款中國(guó)頂尖模型,中國(guó)模型占1/4席位,包括千問(wèn)、DeepSeek、Kimi及MiniMax多家模型已上線Amazon Bedrock平臺(tái)。
對(duì)中國(guó)企業(yè)而言,這意味著在出海和全球化過(guò)程中,可以獲得更貼近本土技術(shù)特點(diǎn)的生成式AI支持。對(duì)全球用戶而言,這代表了更廣泛的技術(shù)選擇。
亞馬遜云科技最新推出的自研的Amazon Nova 2系列模型則展示了另一種可能。四款新型號(hào)覆蓋了從輕量推理到復(fù)雜多模態(tài)的全場(chǎng)景需求:
Amazon Nova 2 Lite:是一款快速且經(jīng)濟(jì)高效的推理模型,擁有不錯(cuò)的指令遵循、工具調(diào)用、信息提取、代碼生成等能力,在上述四大領(lǐng)域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等輕量級(jí)模型,僅在編程能力上略遜于GPT-5 mini。
Amazon Nova 2 Pro:是Nova系列中最智能的推理模型,支持文字、圖像、視頻、語(yǔ)音四種模態(tài)輸入和文本模態(tài)輸出,適用于高度復(fù)雜的工作負(fù)載,尤其是Agent場(chǎng)景。在兩項(xiàng)Agent基準(zhǔn)測(cè)試中,其表現(xiàn)已經(jīng)超過(guò)了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。
Amazon Nova 2 Sonic:下一代語(yǔ)音轉(zhuǎn)語(yǔ)音模型,能為AI應(yīng)用提供實(shí)時(shí)、類人的對(duì)話式AI體驗(yàn)。在語(yǔ)音理解和推理任務(wù)上,其性能已經(jīng)超過(guò)了GPT Realtime、Gemini 2.5 Flash等。
Amazon Nova 2 Omni:是業(yè)界首個(gè)支持文本、圖像、視頻和音頻輸入,并支持文本和圖像生成輸出的推理模型。不過(guò),亞馬遜云科技尚未公布其基準(zhǔn)測(cè)試成績(jī)。
可以看到,特別是在Agent關(guān)鍵能力的基準(zhǔn)測(cè)試中,Amazon?Nova 2 Pro展現(xiàn)了令人印象深刻的性能,這直接回應(yīng)了企業(yè)對(duì)于生成式AI在實(shí)際業(yè)務(wù)場(chǎng)景中可靠性的關(guān)切。
尤其是在企業(yè)出海的場(chǎng)景中,選擇至關(guān)重要(Choice Matters)。AI的未來(lái)不會(huì)僅由1個(gè)模型統(tǒng)治,過(guò)去一年Amazon Bedrock上提供的模型數(shù)量已經(jīng)翻倍,DeepSeek、Qwen等中國(guó)模型也在支持范圍之內(nèi),這位中國(guó)企業(yè)的出海業(yè)務(wù)部署Agent提供了豐富選擇。
03.
數(shù)據(jù)與模型深度融合:
開(kāi)放訓(xùn)練模型打破“RAG局限”
“你的數(shù)據(jù)是獨(dú)一無(wú)二的,這就是你與競(jìng)爭(zhēng)對(duì)手的區(qū)別。”Garman反復(fù)強(qiáng)調(diào)這一觀點(diǎn)。然而,傳統(tǒng)的數(shù)據(jù)與模型結(jié)合技術(shù)如RAG(檢索增強(qiáng)生成)只能幫助模型更有效地導(dǎo)航數(shù)據(jù),無(wú)法讓模型真正“理解”企業(yè)的深層次領(lǐng)域知識(shí),這也成為Agent價(jià)值釋放的“攔路虎”。
亞馬遜云科技的革命性的解決方案是:Amazon Nova Forge服務(wù),該服務(wù)引入了“開(kāi)放式訓(xùn)練模型(Open Training Model)”的概念。
通過(guò)這項(xiàng)服務(wù),企業(yè)可以在模型訓(xùn)練的任意階段,將自己的專有數(shù)據(jù)與亞馬遜的訓(xùn)練數(shù)據(jù)集混合,創(chuàng)建名為“Novellas”的定制模型。這一方法解決了傳統(tǒng)微調(diào)中的核心矛盾——在教授模型新領(lǐng)域知識(shí)的同時(shí),避免其“遺忘”已掌握的核心推理能力。
Amazon Nova Forge還提供了使用遠(yuǎn)程獎(jiǎng)勵(lì)函數(shù)和強(qiáng)化學(xué)習(xí)微調(diào)的能力,以進(jìn)一步改進(jìn)模型,讓企業(yè)可以將真實(shí)環(huán)境集成到訓(xùn)練循環(huán)中。由于基礎(chǔ)模型已經(jīng)理解業(yè)務(wù),這些后訓(xùn)練技術(shù)實(shí)際上會(huì)變得更加有效。
索尼是這一服務(wù)的早期采用者。通過(guò)對(duì)Amazon Nova 2 Lite模型進(jìn)行微調(diào),索尼創(chuàng)建了深度理解自身業(yè)務(wù)和運(yùn)營(yíng)的定制模型,在引用一致性和文檔依據(jù)等任務(wù)上表現(xiàn)優(yōu)于基準(zhǔn)模型,目標(biāo)是將合規(guī)審查和評(píng)估流程的效率提升100倍。
可以看到,對(duì)于尋求通過(guò)生成式AI實(shí)現(xiàn)差異化競(jìng)爭(zhēng)優(yōu)勢(shì)的企業(yè)而言,這一能力至關(guān)重要。它意味著企業(yè)可以構(gòu)建真正理解自身業(yè)務(wù)邏輯、流程和知識(shí)的Agent,而非僅僅使用通用的AI工具。
04.
回歸一件事:
沒(méi)有魔法,只有可部署的Agent
2025 re:Invent上最引人注目的發(fā)布,或許是三類“前沿Agent”的推出。這些Agent代表了AI能力的一次階躍式提升:自主、大規(guī)??蓴U(kuò)展且能長(zhǎng)期運(yùn)行,也給廣大開(kāi)發(fā)者打了個(gè)樣。
三類前沿Agent展示了AI重塑軟件開(kāi)發(fā)和運(yùn)營(yíng)的潛力:
Kiro autonomous agent徹底改變了開(kāi)發(fā)范式。它與市面上常見(jiàn)的代碼補(bǔ)全助手不同,而是能夠自主處理復(fù)雜任務(wù),如升級(jí)關(guān)鍵庫(kù)時(shí),自動(dòng)識(shí)別所有受影響服務(wù),分析使用模式,按規(guī)范更新代碼,運(yùn)行完整測(cè)試,并一次性創(chuàng)建所有合并就緒的拉取請(qǐng)求。亞馬遜內(nèi)部的一個(gè)案例顯示,原本需要30名開(kāi)發(fā)者18個(gè)月完成的重架構(gòu)項(xiàng)目,使用Kiro后僅需6人76天完成。
Amazon Security Agent是一個(gè)持續(xù)、主動(dòng)、內(nèi)置的AI安全專家。將安全實(shí)踐從“事后檢查”變?yōu)椤俺掷m(xù)嵌入”。它能在設(shè)計(jì)階段審查文檔,編碼過(guò)程中掃描漏洞,并將滲透測(cè)試從昂貴的一次性活動(dòng)轉(zhuǎn)變?yōu)榘葱璧某掷m(xù)驗(yàn)證過(guò)程,從而確保安全性。
Amazon DevOps Agent重新定義了運(yùn)維響應(yīng)機(jī)制。當(dāng)警報(bào)觸發(fā)時(shí),它能立即診斷根本原因,提供修復(fù)方案,使工程師能夠?qū)W⒂跊Q策而非排查。這一能力對(duì)于保障全球化業(yè)務(wù)的連續(xù)性至關(guān)重要。
Agent開(kāi)發(fā)的基礎(chǔ)設(shè)施同樣得到加強(qiáng)。Amazon Bedrock AgentCore自SDK預(yù)覽版發(fā)布以來(lái),5個(gè)月內(nèi)下載量超過(guò)200萬(wàn)次。新增的兩項(xiàng)功能直接應(yīng)對(duì)企業(yè)部署Agent的核心關(guān)切點(diǎn):
Amazon AgentCore Policy(預(yù)覽版):為Agent與企業(yè)工具及數(shù)據(jù)的交互提供實(shí)時(shí)確定性控制。
它允許開(kāi)發(fā)者在Amazon AgentCore Gateway工具調(diào)用運(yùn)行前攔截,使用帶有細(xì)粒度權(quán)限的策略,為Agent行為定義明確的界限,如使用哪些工具、如何使用工具,開(kāi)發(fā)者也可以通過(guò)自然語(yǔ)言創(chuàng)建標(biāo)準(zhǔn),如“報(bào)銷金額大于1000美元時(shí),就阻止退款”等。
Amazon AgentCore Evaluations(預(yù)覽版):根據(jù)實(shí)際行為持續(xù)檢查Agent質(zhì)量。
這是一項(xiàng)全托管服務(wù),開(kāi)發(fā)者可以使用內(nèi)置評(píng)估器來(lái)衡量常見(jiàn)的質(zhì)量維度,如正確性、幫助性、工具選擇準(zhǔn)確性、安全性、目標(biāo)成功率和上下文相關(guān)性,還可以創(chuàng)建基于模型的定制評(píng)分系統(tǒng),根據(jù)自己選擇的提示和模型進(jìn)行業(yè)務(wù)定制評(píng)分。
除了上述更新,Garman還在最后10分鐘公布了25個(gè)新發(fā)布,包括搭載第五代AMD EPYC處理器的X8i Instances、搭載英特爾至強(qiáng)6的C8ine Instances、EC2 M3 Ultra Mac Instances等覆蓋計(jì)算、存儲(chǔ)、數(shù)據(jù)庫(kù)、大數(shù)據(jù)、安全等多個(gè)領(lǐng)域的新品,這些都為企業(yè)Agent部署提供了穩(wěn)定堅(jiān)實(shí)的支撐。
05.
結(jié)語(yǔ):AI進(jìn)入Agent時(shí)間
價(jià)值落地之戰(zhàn)打響
當(dāng)AI進(jìn)入Agent時(shí)間,2025 re:Invent的舞臺(tái)展示了亞馬遜云科技對(duì)Agent時(shí)代的全面布局,這不再是一場(chǎng)單點(diǎn)技術(shù)的競(jìng)賽,而是全棧能力的比拼,其正在構(gòu)建一個(gè)支持Agent從實(shí)驗(yàn)到落地生產(chǎn)的完整平臺(tái)。
當(dāng)下,每個(gè)產(chǎn)業(yè)人士都在見(jiàn)證生成式AI從技術(shù)演示走向商業(yè)價(jià)值,價(jià)值落地之戰(zhàn)已打響。云巨頭的這種“全家桶”式的全棧能力,或許正是企業(yè)將AI投資轉(zhuǎn)化為實(shí)際業(yè)務(wù)回報(bào)所需要的基礎(chǔ)設(shè)施。