MLPerf Mobile Android v4.0 基准测试结果重磅发布

MLCommons 组织近日公布了 MLPerf Mobile v4.0 for Android 的最新基准测试结果,这是移动设备 AI 性能评估领域的里程碑式更新。该基准聚焦 Android 平台,模拟真实用户场景,帮助厂商优化硬件并加速 AI 应用部署。

基准测试概述

MLPerf Mobile v4.0 Android 版引入了七项核心任务,覆盖计算机视觉、自然语言处理和生成式 AI 等关键领域:

  • Image Classification (ResNet50):图像分类,使用 ImageNet 数据集。
  • Object Detection (SSD-MobileNet):目标检测,基于 COCO 数据集。
  • Super Resolution (EDSR):图像超分辨率,提升低分辨率图片质量。
  • Speech Recognition (RNN-T):语音识别,支持实时转录。
  • 3D-UNet:医疗图像分割任务。
  • BERT Squad:问答任务,评估 NLP 能力。
  • Stable Diffusion:首次引入文本到图像生成,测试生成式 AI 性能。

测试强调低功耗和高吞吐量,适用于智能手机和平板等设备。

顶级性能表现

本次提交来自 Qualcomm、Samsung、MediaTek 和 Google 等厂商。以下是部分亮点结果(以 Offline 场景为例,单位:Samples/second):

  • Qualcomm Snapdragon 8 Gen 3 在 ResNet50 上达到 1,200+ 的峰值吞吐量,多项任务夺冠。
  • Samsung Galaxy S24 Ultra(搭载 Snapdragon 8 Gen 3)在 Stable Diffusion 任务中表现出色,生成速度领先。
  • MediaTek Dimensity 9300+ 在语音识别任务中紧追其后。
  • Google Tensor G3 在 BERT Squad 上展现强劲 NLP 能力。

完整结果表格可在 官方页面 查看,支持 SingleStream、Server 和 Offline 三种场景。

意义与展望

此次更新优化了基准框架,支持更多 NPU 和 GPU 加速器,推动 Android 生态 AI 标准化。Stable Diffusion 的加入标志着生成式 AI 向移动端渗透。随着结果公开,开发者能更好地选择硬件,预计将加速 on-device AI 创新,如实时图像生成和智能助手。

MLPerf Mobile 继续引领行业,推动高效、可持续的移动 AI 发展。

本文来自 MLC 博客,赢政天下(winzheng.com)进行了全文翻译。 点击这里查看原文 如果转载中文,请注明出处,谢谢支持!