Beta version: *Information might not be fully accurate. Please report any discrepancies.

DeepSeekVerifiedOpen Weights7 benchmarks

DeepSeek V4 Pro

Released 2026-04-241.6T MoE (49B activated) Architecture

Verified Model Card

Latest Data

2026-04-24

Context Window

1.0M

tokens

Input Cost

$0.43

per 1M tokens

Output Cost

$0.87

per 1M tokens

Parameters

1.6T MoE (49B activated)

model footprint

Benchmark Provenance

Performance Analysis // Verified Benchmarks

SWE-bench VerifiedCoding

80.6/ 100

Verified

Last Verified: 2026-04-24DeepSeek V4 Announcement

Resolving real-world GitHub issues. Verified subset ensures solvable issues.

GSM8KMath

92.6/ 100

Verified

Last Verified: 2026-04-24DeepSeek V4 Announcement

Grade school math word problems requiring multi-step reasoning.

MMLU-ProScience

87.5/ 100

Verified

Last Verified: 2026-04-24DeepSeek V4 Announcement

A more robust and harder version of MMLU, focusing on complex reasoning and STEM subjects.

HLE-FullScience

37.7/ 100

Verified

Last Verified: 2026-04-24DeepSeek V4 Announcement

Humanity's Last Exam full evaluation without tools.

GPQA DiamondSTEM

90.1/ 100

Verified

Last Verified: 2026-04-24DeepSeek V4 Announcement

Graduate-Level Google-Proof Q&A Benchmark.

Terminal-Bench 2.0Agentic

67.9/ 100

Verified

Last Verified: 2026-04-24DeepSeek V4 Announcement

Agent performance in realistic terminal workflows (v2.0 leaderboard).

SWE-bench ProAgentic

55.4/ 100

Verified

Last Verified: 2026-04-24DeepSeek V4 Announcement

Higher-difficulty SWE-bench subset for frontier coding agents.