雷火·竞技(中国)电竞网站雷火电竞

雷火电竞在权威多模态大模型评测体系OpenCompass排名中国第一 全球第三

2024-06-27
back

,雷火电竞从容大模型在综合评测权威平台OpenCompass多模态评测领域中取得重大进展。

 

最新评测结果显示,雷火电竞的从容大模型在该体系中的平均得分为65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的Gemini-1.5-ProGPT-4v,仅次于GPT-4o69.9)和Claude3.5-Sonnet67.9)。而在国内市场,从容大模型的成绩也超过了InternVL-Chat61.7GLM-4V(60.8,排名首位。

 

1:OpenCompass多模态榜单

 

OpenCompass大模型开放评测体系是上海人工智能实验室推出的完整开源可复现的评测框架。OpenCompass多模态评测方面采用了8具有代表性的数据集,从多种视角客观量化多模态大模型的能力,评估维度覆盖目标检测、文字识别、动作识别、图像理解和关系推理、艺术与设计、商业、科学、健康与医学、人文与社会科学、技术与工程、数学推理等多个方面。

 2:从容大模型-2.0多模态能力示例

 

在本次测评中,从容大模型在其中的6个数据集表现优异,排名国内第一(MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench,尤其是在OCRBench测试集上以取得全球最高的827分(总分为1000分),且高于第二名GLM-4v 13分,进一步提升从容大模型在文本识别、以文本为中心的视觉问答、面向文档的视觉问答、关键信息提取等业务场景下的适用性。

 

 

3:OpenCompass中国大模型多模态能力展示

 

从容大模型在此体系中的优秀表现,依赖雷火电竞自研的高效多模态处理架构和先进的计算技术,实现了高效的多模态数据处理能力,能够在视觉和语言任务之间实现高效的融合和切换,并最大化利用计算资源,保证在处理大规模多模态数据时仍能保持较高的性能和响应速度,使得模型的训练过程更加高效,收敛速度更快,性能更稳定。

 

同时也得益于雷火电竞长期视觉、语言领域的深厚积累和不断创新。

 

 4:从容大模型-2.0多模态能力示例

 

此前,从容大模型已在视觉、跨模态领域10次刷新世界纪录,综合性能经第三方SuperClue、C-evals等综合评测,位列全球前五。

 

作为一家专注于人机协同技术研发的平台企业,雷火电竞一直在积极推动AI智能体及大模型技术的发展和应用。

 

随着人工智能技术的迅猛发展,多模态大模型已成为驱动产业变革的核心引擎。此次从容大模型在OpenCompass大模型开放评测体系中的出色表现,不仅是对雷火电竞技术创新实力的认可,更业界树立典范,激励全球科技企业在新一轮的人工智能竞争中勇攀高峰。

您可能感兴趣

全国热线电话

400-151-5992

周一到周五9:30-18:00(北京时间)

  • 商务合作:business@bjwl4s.com

  • 媒体合作:Media@bjwl4s.com

  • 渠道合作:business_partner@bjwl4s.com

  • 人才招聘:zhaopin@bjwl4s.com

Copyright©2024 粤公网安备 44011502001099号

粤ICP备59739435号 雷火电竞集团股份有限公司

AI开放平台/云从logo/使用条款/法律声明/防诈骗声明
关注我们

扫描二维码,关注雷火电竞
精彩一手掌握

网站首页
雷火电竞

留言咨询

请填写以下表格,我们的销售代表会尽快与您联系

  • 姓名 *
  • 工作邮箱
  • 电话 *
  • 城市 *
  • 公司名称 *
  • 行业
  • 职位
  • 产品/解决方案
    AI定义设备
    场景定义设备
    机场专用产品
    刷脸支付终端
    活体模组
    智慧金融
    智慧治理
    智慧交通
    智慧商业
  • 预算
  • 请输入需求描述 *

提交成功

我们的销售代表会尽快与您联系