大模型 Mistral Large 2 发布，媲美 GPT-4 和 Claude Opus 3

法国初创公司 Mistral AI 发布了新的大语言模型 Mistral Large 2。它在代码生成、数学和推理方面有显著提升。Mistral 还为 Large 2 增加了改进的多语言支持和高级函数调用功能。Mistral Large 2 模型拥有 1230 亿参数，可在单个 H100 节点上高吞吐量运行，且支持法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语。在编码方面，它支持 80 多种编程语言，包括 Python、Java、C、C++、JavaScript 和 Bash。在编码基准测试中，Mistral Large 2（123B）的性能可与 OpenAI 的 GPT-4、Claude Opus 3 以及最近发布的 Meta 的 Llama 3.1 405B 相媲美。在 Wild Bench、Arena Hard 和 MT Bench 基准测试中，Large 2 的表现优于 Llama 3.1 405B 和 Claude 3 Opus。在广受欢迎的 MMLU 基准测试中，这个新模型优于 Llama 3.1 70B，并与 Llama 3.1 405B 相当。Mistral Large 2 现已开放权重，但仅供研究和非商业用途免费使用。商业用途需要获得模型许可。Mistral 正在扩大与 Google 的合作，在 Google Cloud 上提供 Mistral 模型。

Mistral 正在整合其模型组合。它将有两个通用模型 Mistral Nemo 和 Mistral Large，以及两个专业模型 Codestral 和 Embed。Mistral 将在未来停止 Apache 模型（Mistral 7B、Mistral 8x7B 和 8x22B、Codestral Mamba、Mathstral）。

本站电报频道 / 电报群

大模型Mistral Large 2发布，媲美GPT-4和Claude Opus 3

大模型 Mistral Large 2 发布，媲美 GPT-4 和 Claude Opus 3

发表回复