DeepSeek/豆包模型迭代與Agent共振，繼續(xù)布局AI

大模型迭代升級競爭加劇，Agent加快落地，繼續(xù)布局AI應(yīng)用。1月20日，DeepSeek（深度求索）發(fā)布全新大模型DeepSeek-R1，其在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù)，在僅有很少標(biāo)注數(shù)據(jù)的情況下大幅提升了模型推理能力，在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上，性能可比肩OpenAIo1正式版，且實(shí)現(xiàn)真正開源，其API服務(wù)定價(jià)為每百萬輸入tokens1元（緩存命中）/4元（緩存未命中），每百萬輸出tokens16元。

1月20日，豆包實(shí)時(shí)語音大模型正式推出并在豆包App全量開放，實(shí)現(xiàn)語音理解、生成一體化及端到端語音對話，在語音表現(xiàn)力、控制力、情緒承接方面表現(xiàn)突出，并具備低時(shí)延、對話可隨時(shí)打斷等特性，用戶整體滿意度較GPT-4o有明顯優(yōu)勢，尤其在是語音語氣自然度和情緒飽滿度方面；1月22日，全新豆包1.5Pro大模型正式發(fā)布，在知識(shí)、代碼、推理、中文等多個(gè)權(quán)威測評基準(zhǔn)上綜合得分優(yōu)于GPT-4o、Claude3.5Sonnet等業(yè)界一流模型。

此外，1月21日，階躍星辰宣布其原生端到端文本、視覺、語音三模態(tài)生成理解一體化模型Step-1o系列迎來新成員Step-1oVision多模態(tài)理解大模型；1月23日，智譜宣布其全球首個(gè)面向公眾、回車即用的電腦智能體GLM-PC開放體驗(yàn)，可“觀察”和“操作”計(jì)算機(jī)，協(xié)助用戶高效完成各類電腦任務(wù)；同日OpenAI舉行直播活動(dòng)并發(fā)布自身首款A(yù)IAgent“Operator”，可代理用戶執(zhí)行基于網(wǎng)頁的操作。

我們認(rèn)為，DeepSeek-R1基于強(qiáng)化學(xué)習(xí)再次讓“低成本+高性能”大模型成為可能，并有望引領(lǐng)模型往開源方向發(fā)展，強(qiáng)大的推理能力或助力其在教育、辦公、科研領(lǐng)域應(yīng)用加快落地；豆包、階躍星辰大模型不斷升級語音、情感、視覺理解及生成等多模態(tài)能力，在社交陪伴、影視、教育、電商、廣告等領(lǐng)域商業(yè)化或加快；智譜、OpenAI不斷推動(dòng)Agent成為ai應(yīng)用落地的重要工具。模型迭代、Agent升級、端側(cè)AI推新三方共振下，AI應(yīng)用商業(yè)化空間或不斷打開，建議繼續(xù)布局。