Beta version: *Information might not be fully accurate. Please report any discrepancies.

AlibabaVerifiedOpen Weights21 benchmarks

Qwen3.6 35B A3B

Released 2026-04-2735B total (3B active) Architecture

Verified Model Card

Latest Data

2026-04-27

Context Window

262k

tokens

Input Cost

$0.16

per 1M tokens

Output Cost

$0.97

per 1M tokens

Parameters

35B total (3B active)

model footprint

Benchmark Provenance

Performance Analysis // Verified Benchmarks

SWE-bench VerifiedCoding

73.4/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Resolving real-world GitHub issues. Verified subset ensures solvable issues.

MMMU (Multimodal)Multimodal

81.7/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Multi-discipline Multimodal Understanding and Reasoning.

MMLU-ProScience

85.2/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

A more robust and harder version of MMLU, focusing on complex reasoning and STEM subjects.

AIME 2026Math

92.7/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Future prediction of AIME performance levels.

HMMT Feb 2026Math

83.6/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Harvard-MIT Mathematics Tournament 2026 - High difficulty competition math.

LiveCodeBench v6Coding

80.4/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Contamination-free coding benchmark using recent problems.

GPQA DiamondSTEM

86/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Graduate-Level Google-Proof Q&A Benchmark.

MathVista (mini)Vision

86.4/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Compact MathVista split for faster multimodal reasoning checks.

MMMU-ProVision

75.3/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Professional level MMMU expansion.

RealWorldQAVision

85.3/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Real-world visual question answering.

MMStarVision

80.7/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Elite multimodal model evaluation.

CountBenchVision

96.1/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Visual object counting and identification.

ERQAVision

61.8/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Environment Reasoning and Question Answering.

CharXiv-RQVision

78/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Chart-based reasoning from arXiv papers (Reasoning QA).

Terminal-Bench 2.0Agentic

51.5/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Agent performance in realistic terminal workflows (v2.0 leaderboard).

SWE-bench ProAgentic

49.5/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Higher-difficulty SWE-bench subset for frontier coding agents.

SimpleVQAVision

58.9/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Short-form visual question answering with verifiable responses.

VideoMMMUVideo

83.7/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Video variant of MMMU for multimodal understanding and reasoning.

VideoMMEVideo

86.6/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Video multimodal evaluation benchmark for perception and reasoning.

MLVUVideo

86.2/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Multi-task long video understanding benchmark.

MVBenchVideo

74.6/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Comprehensive video understanding benchmark across multiple tasks.