標簽:LLM

阿里云推出最新通義千問 QwQ-32B 推理模型,僅 1/20 參數(shù)媲美 DeepSeek R1

阿里云通義千問官方今日宣布推出最新的推理模型 QwQ-32B。這是一款擁有 320 億參數(shù)的模型,其性能可與具備 6710 億參數(shù)(其中 370 億被激活)的 DeepSeek-R1 ...

為DeepSeek MoE模型帶來「免費午餐」加速,專家鏈可大幅提升LLM的信息處理能力

我們都知道,DeepSeek-R1 的訓練過程使用了一種名為專家混合模型(Mixture-of-Experts, MoE)的技術,而當前的 MoE 技術依然還有顯著的優(yōu)化空間。近日,美國...

斯坦福大學研究:教育水平較低地區(qū)的 AI 寫作工具使用率更高

自 2022 年底 ChatGPT 推出以來,關于人工智能語言模型將如何廣泛影響世界的討論一直存在。如今,隨著一項由斯坦福大學牽頭的新研究的發(fā)布,這一圖景逐漸清晰...

日本兒童虐待檢測 AI 系統(tǒng)項目宣告失敗,耗資十億日元開發(fā)

隨著人工智能(AI)技術的快速發(fā)展,日本企業(yè)和部分政府部門紛紛涉足這一領域,試圖通過技術手段提升效率、解決人手短缺等問題。然而,該國一項旨在保護兒童...

耶魯、劍橋等開發(fā)MindLLM,將腦成像直接轉(zhuǎn)換為文本

編輯 | 蘿卜皮 將功能性磁共振成像 (fMRI) 信號解碼為文本一直是神經(jīng)科學界面臨的一項重大挑戰(zhàn),它有望推動腦機接口的發(fā)展,并加深對大腦機制的了解。然而,...

知名分析師發(fā)文 DeepSeek爆紅后端側(cè)AI趨勢有望加速

知名分析師郭明錤日前發(fā)文指出,DeepSeek爆紅后,端側(cè)AI趨勢將加速。DeepSeek的爆紅直接提升英偉達H100的訓練需求,這證明優(yōu)化訓練方式(也可視為成本降低)有...

AI已經(jīng)越過紅線?復旦大學研究表明:在知道自己將被關閉后,AI復制了自己

AI能自己復制自己了,人類還能掌控局面嗎? 復旦大學研究人員于2024年12月9日發(fā)表的一項開創(chuàng)性研究表明,來自Meta和阿里巴巴的兩個大型語言模型(LLM)成功...

神州數(shù)碼郭為:AI驅(qū)動流程再造拓展企業(yè)價值增長點

2025年伊始,神州數(shù)碼正加快推動企業(yè)級AI應用落地的步伐。近日,由神州數(shù)碼攜手生態(tài)合作伙伴共同打造的DC·AI生態(tài)創(chuàng)新中心在深圳正式開幕。這一AI科創(chuàng)新地標集...

神州數(shù)碼加速AI應用落地 DC·AI生態(tài)創(chuàng)新中心啟幕

2025年,神州數(shù)碼開始加速AI應用產(chǎn)業(yè)落地。 1月15日,由神州數(shù)碼攜手生態(tài)伙伴共同打造的DC·AI生態(tài)創(chuàng)新中心正式啟幕。該中心位于深圳灣超總基地神州數(shù)碼國...

提升AI代理可靠性 英偉達推出容器化微服務Inference Microservices

英偉達周四推出用于加速生成式AI模型的部署的容器化微服務Nvidia Inference Microservices(NIM),希望幫助企業(yè)提高人工智能代理的信任、安全和可靠性。 ...
1234524