大语言模型与羊驼

Description
Published
April 11, 2023
Tags
AI
OpenSource

大语言模型与羊驼

LLaMA

Feb 24, 2022 Meta 正式开源 LLaMA,包含 7B、13B、33B、65B 四个不同参量的版本。
全称为 Large Language Model Meta AI(简称 llama 义为羊驼,故各路社区中常见 🦙)
作为一个基础模型,LLaMA 未针对特定任务比如对话进行调优,如果照搬 ChatGPT 的用法,则只会得到无效答案。需要调整使用思路,将基础 LLM 视作一个基于输入文本预测后续文本并进行输出的机器,告知上文,令其续写下文。举例而言,比起对话式的「生命的意义是什么?简介回答」,你应该向 AI 发送「我觉得生命的意义是…」,就能听到 AI 所理解的生命之意义了。
值得一提的是,Meta 是以非商业授权的形式放出 LLaMA,GitHub 仓库主要为加载运行模型的示意代码,下载模型权重文件还需要在一个 Google 表格登记申请。
 
 
 

Stanford Alpaca

斯坦福大学的研究团队在 LLaMA 模型的基础上,通过数据训练调优(fine-tuning),使用与 ChatGPT 类似的 instruction 训练方式,从而使模型更能理解对话和指令中的真实意图。
其模型名 alpaca 是另一种羊驼,比平均身高与成年男性接近的 llama 矮一半;前者短脸、耳朵竖直,后者长脸、耳朵弯弯像香蕉;llama 常用于驮物,alpaca 则主要被养来剪毛。
稍加细品,便要对 Alpaca 团队在模型命名上的造诣深表折服。