【財(cái)新網(wǎng)】年初DeepSeek模型出圈讓大模型創(chuàng)業(yè)公司重回技術(shù)競(jìng)賽。7月11日晚間,大模型創(chuàng)業(yè)公司月之暗面發(fā)布了首個(gè)開(kāi)源的基座大模型Kimi K2,對(duì)標(biāo)DeepSeek-V3、OpenAI的GPT-4.1等模型。截至發(fā)稿時(shí),該模型已經(jīng)是全球最大的AI開(kāi)源社區(qū)HuggingFace熱度第一的模型,發(fā)布三天就已經(jīng)獲得1.93萬(wàn)次下載,為近期熱度最高的開(kāi)源基座模型。
該模型也在海外技術(shù)圈內(nèi)引發(fā)了討論,例如大模型訓(xùn)練、推理服務(wù)商Together AI的首席科學(xué)家Tri Dao就在社交媒體上稱(chēng)其試用該模型的體驗(yàn)已經(jīng)與業(yè)內(nèi)最前沿的模型相當(dāng)。多模態(tài)模型公司Stability AI的創(chuàng)始人Emad Mostaque也發(fā)文指出,Kimi K2訓(xùn)練所需的算力已經(jīng)與DeepSeek相當(dāng),這證明了模型能力并不只能通過(guò)增加算力提升。



















京公網(wǎng)安備 11010502034662號(hào) 