DeepSeek/豆包模型迭代與Agent共振,繼續(xù)布局AI
大模型迭代升級競爭加劇,Agent加快落地,繼續(xù)布局AI應(yīng)用。1月20日,DeepSeek(深度求索)發(fā)布全新大模型DeepSeek-R1,其在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有很少標(biāo)注數(shù)據(jù)的情況下大幅提升了模型推理能力,在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能可比肩OpenAIo1正式版,且實(shí)現(xiàn)真正開源,其API服務(wù)定價(jià)為每百萬輸入tokens1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens16元。
1月20日,豆包實(shí)時(shí)語音大模型正式推出并在豆包App全量開放,實(shí)現(xiàn)語音理解、生成一體化及端到端語音對話,在語音表現(xiàn)力、控制力、情緒承接方面表現(xiàn)突出,并具備低時(shí)延、對話可隨時(shí)打斷等特性,用戶整體滿意度較GPT-4o有明顯優(yōu)勢,尤其在是語音語氣自然度和情緒飽滿度方面;1月22日,全新豆包1.5Pro大模型正式發(fā)布,在知識(shí)、代碼、推理、中文等多個(gè)權(quán)威測評基準(zhǔn)上綜合得分優(yōu)于GPT-4o、Claude3.5Sonnet等業(yè)界一流模型。
此外,1月21日,階躍星辰宣布其原生端到端文本、視覺、語音三模態(tài)生成理解一體化模型Step-1o系列迎來新成員Step-1oVision多模態(tài)理解大模型;1月23日,智譜宣布其全球首個(gè)面向公眾、回車即用的電腦智能體GLM-PC開放體驗(yàn),可“觀察”和“操作”計(jì)算機(jī),協(xié)助用戶高效完成各類電腦任務(wù);同日OpenAI舉行直播活動(dòng)并發(fā)布自身首款A(yù)IAgent“Operator”,可代理用戶執(zhí)行基于網(wǎng)頁的操作。
我們認(rèn)為,DeepSeek-R1基于強(qiáng)化學(xué)習(xí)再次讓“低成本+高性能”大模型成為可能,并有望引領(lǐng)模型往開源方向發(fā)展,強(qiáng)大的推理能力或助力其在教育、辦公、科研領(lǐng)域應(yīng)用加快落地;豆包、階躍星辰大模型不斷升級語音、情感、視覺理解及生成等多模態(tài)能力,在社交陪伴、影視、教育、電商、廣告等領(lǐng)域商業(yè)化或加快;智譜、OpenAI不斷推動(dòng)Agent成為ai應(yīng)用落地的重要工具。模型迭代、Agent升級、端側(cè)AI推新三方共振下,AI應(yīng)用商業(yè)化空間或不斷打開,建議繼續(xù)布局。