【財(cái)新網(wǎng)】開(kāi)源大模型的推手Meta發(fā)新一代模型。北京時(shí)間4月19日凌晨,美國(guó)社交巨頭Meta(NASDAQ: META)宣布推出Llama 3開(kāi)源模型系列,將陸續(xù)登陸亞馬遜AWS、Databricks、谷歌云、Hugging Face等大模型平臺(tái)。Meta稱(chēng),還會(huì)在接下來(lái)數(shù)月的時(shí)間提供更強(qiáng)的長(zhǎng)文本能力、多種尺寸、多語(yǔ)言的模型,目標(biāo)是打造最好的基座模型。
具體來(lái)看,此次發(fā)布的包括80億、700億參數(shù)的兩個(gè)預(yù)訓(xùn)練語(yǔ)言模型,根據(jù)Meta的數(shù)據(jù),在考察常識(shí)能力、學(xué)科知識(shí)、代碼能力、數(shù)學(xué)能力的數(shù)據(jù)集榜單中,80億參數(shù)的版本全面領(lǐng)先谷歌的輕量開(kāi)源模型Gemma 7B–it,和歐洲大模型公司Mistral的開(kāi)源模型Mistral 7B Instruct;700億參數(shù)版本的整體得分小幅領(lǐng)先谷歌閉源模型Gemini Pro 1.5和Anthropic的閉源模型Claude 3 Sonnect。



















京公網(wǎng)安備 11010502034662號(hào) 