国内首家!百川智能 Baichuan 3 夺得最新中文大模型测评冠军

人工智能 2024-04-30 19:52 阅读:15

4 月 30 日,国内大模型评测机构 SuperCLUE 发布了最新的《中文大模型基准测评 2024 年度 4 月报告》,Baichuan 3 在国内大模型中排名第一,超越了智谱 GLM-4、通义千问 2.1、文心一言 4.0、Moonshot (Kimi) 等大模型。同时,国外同行的 GPT-4、Claude3 也被Baichuan 3 超越。

SuperCLUE 是国内通用大模型综合性测评基准,通过多维度多视角多层次的评测体系以及对话的形式,模拟大模型应用场景,真实有效的考察模型生成能力。Baichuan 3 在知识百科、逻辑推理、计算、代码、工具使用等能力上表现出色,成绩稳居国内前列,获得了国内首个最新中文大模型测评冠军。