LLM大型語言模型動物園

因為 ChatGPT 的關係,LLM開始進入我們的生活,LLM是大型語言模型,這陣子有很多LLM的名字是 LLaMA、Alpaca、Vicuna

LLaMA:llama(拉馬)是一種生活在南美洲的哺乳動物,屬於駝科。

Alpaca:羊駝

Vicuna:是南美洲的一種駝科動物,是世界上最小的駝科動物。

Chimera:命名的哲學:LLM 最大的障礙是我們沒有足夠的候選名稱,因為 LLAMA、Guanaco、Vicuna 和 Alpaca 已經被使用,而駱駝家族中已經沒有更多成員。因此,我們在希臘神話中找到了一種類似的混種生物 Chimera,由不同的Lycia和小亞細亞動物部分組成。巧合的是,它是 DOTA(以及魔獸爭霸 III)中的英雄/角色。因此,它可以用來記憶在高中和大學時期通宵玩遊戲的一段時間。

LLM大型語言模型動物園:https://github.com/FreedomIntelligence/LLMZoo

LLaMA:https://github.com/facebookresearch/llama

該存儲庫中的LLaMA模型是可最小化、可hack、可讀的範例,用於加載LLaMA模型並運行推理。使用提供的腳本下載權重和令牌器,然後在GPU上運行提供的示例類別以進行推理。在獲取權限後,您將獲得下載所需文件的鏈接。這些模型分為不同的尺寸,並且需要不同的GPU數量來運行。存儲庫還包括了用於參考的文獻和模型卡。


Alpaca:https://github.com/tatsu-lab/stanford_alpaca

Stanford Alpaca是一個指令跟隨的LLaMA模型項目,旨在建立和共享這個模型。該項目包含用於微調模型的52000個數據、產生數據的程式碼和從已發布的重量差異中恢復Alpaca-7B的代碼。然而,目前Alpaca還在開發中,有很多限制需要解決,並且尚未被微調為安全無害的,使用時請謹慎。此外,使用該數據集訓練的模型不應在研究目的以外使用。詳細資訊請閱讀他們的發布博客文章。


Vicuna:https://github.com/lm-sys/FastChat

Vicuna是一個開源聊天機器人,以90%的ChatGPT質量令GPT-4印象深刻。使用Vicuna,你可以訓練、提供服務和評估基於大型語言模型的聊天機器人。你也可以使用命令列介面進行推論,使用Web GUI服務,或通過API來使用Vicuna。Vicuna權重以delta權重的形式發布,你可以將delta加入原始的LLaMA權重中獲得Vicuna權重。如果你的CPU RAM不足,你可以試著降低重量轉換的CPU RAM要求。


更多LLM介紹影片:【生成式AI】窮人如何低資源復刻自己的 ChatGPT – YouTube

Share:

More Posts