新浪科技讯 4月30日下午消息,百川智能今日披露了一份由国内大模型评测机构SuperCLUE发布的评测报告,结果显示,在报告选取的国内外具有代表性的32个大模型4月份的版本中,通过多维度综合性测评,Baichuan 3在国内大模型中排名第一,在知识百科能力上Baichuan 3以82分的成绩超越了GPT-4-Turbo,位列第一。
SuperCLUE是国内知名通用大模型综合性测评基准,其前身是第三方中文语言理解测评基准CLUE(The Chinese Language Understanding Evaluation)。据介绍,为更真实反映大模型通用能力,SuperCLUE本次测评由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等,题目为多轮开放式简答题,评测集共2194题。
(责任编辑:)关键词: