LLaMA
大语言模型 / 維基百科,自由的 encyclopedia
LLaMA(英語:Large Language Model Meta AI,直譯:大語言模型元AI)是Meta AI公司於2023年2月發佈的大型語言模型。它訓練了各種模型,這些模型的參數從70億到650億不等。LLaMA的開發人員報告說,LLaMA運行的130億參數模型在大多數NLP基準測試中的性能超過了更大的、具有1750億參數的GPT-3提供的模型,且LLaMA的模型可以與PaLM和Chinchilla等最先進的模型競爭[1]。雖然其他強大的大語言模型通常只能通過有限的API訪問,但Meta在非商業許可的情況下發佈了LLaMA的模型權重,供研究人員參考和使用。[2][3] [4] 2023年7月,Meta推出 Llama 2,這是一種可用於商業應用的開源 AI 模型。[5]