Meta公司推出新型大語言模型「Llama 3」

Meta公司於周四宣布,推出新一代大語言模型「Llama 3」,這款模型有80億及700億參數兩個版本,使用了24000塊GPU及150萬億個token進行訓練,並已在開源大模型領域取得領先地位。此外,Meta還在開發一個4000億參數的版本,一旦推出將是全球首個開源的GPT-4級別模型。

「Llama 3」的80億及700億參數模型均提供了預訓練和指令微調兩種版本,Meta聲稱其性能優於目前市場上的多個知名模型。這兩個版本的模型在性能上顯著超越了其前代「Llama 2」,並已成為新的業界標杆。

Meta強調,「Llama 3」的發展旨在讓全球的開發者和研究者能夠更容易接觸到先進的AI技術,並在此基礎上進行創新和實驗。公司也預計在未來幾個月推出具備多語言對話和更長上下文處理能力的模型,以進一步提升整體性能。

此外,「Llama 3」的網頁版已可在Meta AI平台免費使用,而AI模型資源平台Hugging Face的共同創辦人兼執行長表示,此模型的推出將對AI生態系統產生深遠影響。

在比較中,「Llama 3」的4000億參數版本在多語言推理和代碼能力上已可與GPT-4和其他先進模型媲美。OpenAI的共同創辦人Andrej Karpathy及其他專家均認為,這將是一個重要的里程碑,將顯著影響未來的研究方向和創新方式。

蔡正信-數位教練

我是一位專精於數位轉型與AI應用的教練,致力於協助中高齡族群與企業主有效運用科技工具提升生產力。

蔡教練聯繫方式:https://rdcoach.pse.is/62uqz2

手機:0988-515-413

Line官方帳號2.0 : @rd.coach https://lin.ee/n4T9CGA
群英企業管理顧問股份有限公司
資訊顧問電子郵件:hi@rd.coach

跨代際溝通 × AI賦能教學:
結合AI應用、數位工具教學與熟齡學習經驗,專注於中高齡與中小企業的數位轉型輔導,擅長從0到1建構數位素養。

實戰導向 × 客製培訓:
15年數位教學經驗,服務鴻海、1111人力銀行、台南大學、瓦城集團等,設計實用導向的教學模組,強調易學、可複製。

工具整合 × 工作流設計:
善用Evernote、Heptabase、Telegram等多款工具,打造AI第二大腦與一元筆記系統,協助學員從資訊收集到知識轉化。

行動導向 × 教學有感:
500+場講座與工作坊,專注學員實作與成果回報,推動「數位生活力」與「AI生活實驗室」教學風格。

預見未來 × 實踐智慧:
關注生成式AI與數位倫理發展,推動AI工具於科研、商業、教育場域的實作應用,擘劃AI助理與智慧工作未來藍圖。

Share:

More Posts