6 个月前

Llama 3 模型群

Abhimanyu Dubey Abhinav Jauhri Abhinav Pandey Abhishek Kadian Ahmad Al-Dahle Aiesha Letman Akhil Mathur Alan Schelten Amy Yang Angela Fan

摘要

现代人工智能（AI）系统由基础模型驱动。本文介绍了一组新的基础模型——Llama 3。这是一组原生支持多语言、编程、推理和工具使用的语言模型集合。我们最大的模型是一个参数量达4050亿的密集型Transformer模型，上下文窗口长度最高可达128,000个token。本文对Llama 3进行了全面的实证评估，结果表明，Llama 3在众多任务上的表现可与GPT-4等领先语言模型相媲美。我们已公开发布Llama 3，包括4050亿参数语言模型的预训练版本和后训练版本，以及用于输入与输出安全防护的Llama Guard 3模型。此外，本文还展示了通过组合式方法将图像、视频和语音能力集成到Llama 3中的实验结果。我们观察到，该方法在图像、视频和语音识别任务上已达到与当前最先进水平相竞争的性能。目前，这些集成多模态能力的模型仍处于开发阶段，尚未进行广泛发布。

代码仓库

zhuzilin/ring-flash-attention

pytorch

GitHub 中提及

willemsenbram/mention-detection-vgd

GitHub 中提及

wenet-e2e/west

pytorch

GitHub 中提及

zechenli03/sensorllm

pytorch

GitHub 中提及

ziye2chen/LLMs-for-Mathematical-Analysis

GitHub 中提及

https://llama.meta.com

基准测试

基准	方法	指标
answerability-prediction-on-peerqa	Llama-3-IT-8B-32k	Macro F1: 0.2881
answerability-prediction-on-peerqa	Llama-3-IT-8B-8k	Macro F1: 0.3112
multi-task-language-understanding-on-mmlu	Llama 3.1 8B (CoT)	Average (%): 73.0
multi-task-language-understanding-on-mmlu	DBRX Instruct 132B (5-shot)	Average (%): 73.7
question-answering-on-peerqa	Llama-3-IT-8B-8k	AlignScore: 0.1098 Prometheus-2 Answer Correctness: 3.1102 Rouge-L: 0.2295
question-answering-on-peerqa	Llama-3-IT-8B-32k	AlignScore: 0.1016 Prometheus-2 Answer Correctness: 3.1673 Rouge-L: 0.2286

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI超神经

算力平台

6 个月前

Llama 3 模型群

查看论文详情查看代码

Abhimanyu Dubey Abhinav Jauhri Abhinav Pandey Abhishek Kadian Ahmad Al-Dahle Aiesha Letman Akhil Mathur Alan Schelten Amy Yang Angela Fan

摘要

代码仓库

zhuzilin/ring-flash-attention

pytorch

GitHub 中提及

willemsenbram/mention-detection-vgd

GitHub 中提及

wenet-e2e/west

pytorch

GitHub 中提及

zechenli03/sensorllm

pytorch

GitHub 中提及

ziye2chen/LLMs-for-Mathematical-Analysis

GitHub 中提及

https://llama.meta.com

基准测试

基准	方法	指标
answerability-prediction-on-peerqa	Llama-3-IT-8B-32k	Macro F1: 0.2881
answerability-prediction-on-peerqa	Llama-3-IT-8B-8k	Macro F1: 0.3112
multi-task-language-understanding-on-mmlu	Llama 3.1 8B (CoT)	Average (%): 73.0
multi-task-language-understanding-on-mmlu	DBRX Instruct 132B (5-shot)	Average (%): 73.7
question-answering-on-peerqa	Llama-3-IT-8B-8k	AlignScore: 0.1098 Prometheus-2 Answer Correctness: 3.1102 Rouge-L: 0.2295
question-answering-on-peerqa	Llama-3-IT-8B-32k	AlignScore: 0.1016 Prometheus-2 Answer Correctness: 3.1673 Rouge-L: 0.2286

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

Llama 3 模型群

Abhimanyu Dubey Abhinav Jauhri Abhinav Pandey Abhishek Kadian Ahmad Al-Dahle Aiesha Letman Akhil Mathur Alan Schelten Amy Yang Angela Fan523 more

摘要

代码仓库

基准测试

用 AI 构建 AI

Hyper Newsletters

Command Palette

Llama 3 模型群

Abhimanyu Dubey Abhinav Jauhri Abhinav Pandey Abhishek Kadian Ahmad Al-Dahle Aiesha Letman Akhil Mathur Alan Schelten Amy Yang Angela Fan523 more

摘要

代码仓库

基准测试

用 AI 构建 AI

Hyper Newsletters

Abhimanyu Dubey Abhinav Jauhri Abhinav Pandey Abhishek Kadian Ahmad Al-Dahle Aiesha Letman Akhil Mathur Alan Schelten Amy Yang Angela Fan

Abhimanyu Dubey Abhinav Jauhri Abhinav Pandey Abhishek Kadian Ahmad Al-Dahle Aiesha Letman Akhil Mathur Alan Schelten Amy Yang Angela Fan