Meta公司推出新型大語言模型「Llama 3」

Meta公司於周四宣布,推出新一代大語言模型「Llama 3」,這款模型有80億及700億參數兩個版本,使用了24000塊GPU及150萬億個token進行訓練,並已在開源大模型領域取得領先地位。此外,Meta還在開發一個4000億參數的版本,一旦推出將是全球首個開源的GPT-4級別模型。

「Llama 3」的80億及700億參數模型均提供了預訓練和指令微調兩種版本,Meta聲稱其性能優於目前市場上的多個知名模型。這兩個版本的模型在性能上顯著超越了其前代「Llama 2」,並已成為新的業界標杆。

Meta強調,「Llama 3」的發展旨在讓全球的開發者和研究者能夠更容易接觸到先進的AI技術,並在此基礎上進行創新和實驗。公司也預計在未來幾個月推出具備多語言對話和更長上下文處理能力的模型,以進一步提升整體性能。

此外,「Llama 3」的網頁版已可在Meta AI平台免費使用,而AI模型資源平台Hugging Face的共同創辦人兼執行長表示,此模型的推出將對AI生態系統產生深遠影響。

在比較中,「Llama 3」的4000億參數版本在多語言推理和代碼能力上已可與GPT-4和其他先進模型媲美。OpenAI的共同創辦人Andrej Karpathy及其他專家均認為,這將是一個重要的里程碑,將顯著影響未來的研究方向和創新方式。

Share:

More Posts