大模型 Mistral Large 2 发布,媲美 GPT-4 和 Claude Opus 3

法国初创公司 Mistral AI 发布了新的大语言模型 Mistral Large 2。它在代码生成、数学和推理方面有显著提升。Mistral 还为 Large 2 增加了改进的多语言支持和高级函数调用功能。Mistral Large 2 模型拥有 1230 亿参数,可在单个 H100 节点上高吞吐量运行,且支持法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语。在编码方面,它支持 80 多种编程语言,包括 Python、Java、C、C++、JavaScript 和 Bash。在编码基准测试中,Mistral Large 2(123B)的性能可与 OpenAI 的 GPT-4、Claude Opus 3 以及最近发布的 Meta 的 Llama 3.1 405B 相媲美。在 Wild Bench、Arena Hard 和 MT Bench 基准测试中,Large 2 的表现优于 Llama 3.1 405B 和 Claude 3 Opus。在广受欢迎的 MMLU 基准测试中,这个新模型优于 Llama 3.1 70B,并与 Llama 3.1 405B 相当。Mistral Large 2 现已开放权重,但仅供研究和非商业用途免费使用。商业用途需要获得模型许可。Mistral 正在扩大与 Google 的合作,在 Google Cloud 上提供 Mistral 模型。

Mistral 正在整合其模型组合。它将有两个通用模型 Mistral Nemo 和 Mistral Large,以及两个专业模型 Codestral 和 Embed。Mistral 将在未来停止 Apache 模型(Mistral 7B、Mistral 8x7B 和 8x22B、Codestral Mamba、Mathstral)。

大模型Mistral Large 2发布,媲美GPT-4和Claude Opus 3
(0)
志锋的头像志锋

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注