Beta version: *Information might not be fully accurate. Please report any discrepancies.

Google DeepMindVerifiedOpen Weights14 benchmarks

Gemma 4 26B A4B IT

Released 2026-04-0325.2B total (3.8B active) Architecture

Training: 2025-01

Verified Model Card

Latest Data

2026-04-03

Context Window

256k

tokens

Input Cost

$0.06

per 1M tokens

Output Cost

$0.33

per 1M tokens

Parameters

25.2B total (3.8B active)

model footprint

Benchmark Provenance

Performance Analysis // Verified Benchmarks

MMLU-ProScience

82.6/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

A more robust and harder version of MMLU, focusing on complex reasoning and STEM subjects.

HLE-FullScience

8.7/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Humanity's Last Exam full evaluation without tools.

HLE-Full (w/ tools)Science

17.2/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Humanity's Last Exam full evaluation with tool access enabled.

AIME 2026Math

88.3/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Future prediction of AIME performance levels.

CodeforcesCoding

1718/ 4000

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Competitive programming rating based on problem solving.

LiveCodeBench v6Coding

77.1/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Contamination-free coding benchmark using recent problems.

GPQA DiamondSTEM

82.3/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Graduate-Level Google-Proof Q&A Benchmark.

MRCR v2Long Context

44.1/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Multi-Round Context Retrieval - 8-needle test.

MMMLUMultilingual

86.3/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Massive Multilingual Language Understanding.

BigBench Extra HardReasoning

64.8/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Extra-hard subset of BIG-bench focusing on challenging reasoning and knowledge tasks.

MathVisionVision

82.4/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Comprehensive mathematical vision benchmark.

MMMU-ProVision

73.8/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Professional level MMMU expansion.

OmniDocBench 1.5Vision

0.149/ 1

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

OCR benchmark measuring edit distance (lower is better).

MedXPertQA MMVision

58.1/ 100

Verified

Last Verified: 2026-04-03Gemma 4 Announcement

Multimodal medical question answering benchmark.