Beta version: *Information might not be fully accurate. Please report any discrepancies.

AlibabaVerifiedOpen Weights22 benchmarks

Qwen3.6 27B

Released 2026-04-2727B Architecture

Verified Model Card

Latest Data

2026-04-27

Context Window

262k

tokens

Input Cost

$0.50

per 1M tokens

Output Cost

$2.00

per 1M tokens

Parameters

27B

model footprint

Benchmark Provenance

Performance Analysis // Verified Benchmarks

SWE-bench VerifiedCoding

77.2/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Resolving real-world GitHub issues. Verified subset ensures solvable issues.

MMMU (Multimodal)Multimodal

82.9/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Multi-discipline Multimodal Understanding and Reasoning.

MMLU-ProScience

86.2/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

A more robust and harder version of MMLU, focusing on complex reasoning and STEM subjects.

AIME 2026Math

94.1/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Future prediction of AIME performance levels.

HMMT Feb 2026Math

84.3/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Harvard-MIT Mathematics Tournament 2026 - High difficulty competition math.

LiveCodeBench v6Coding

83.9/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Contamination-free coding benchmark using recent problems.

GPQA DiamondSTEM

87.8/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Graduate-Level Google-Proof Q&A Benchmark.

MathVista (mini)Vision

87.4/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Compact MathVista split for faster multimodal reasoning checks.

MMMU-ProVision

75.8/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Professional level MMMU expansion.

RealWorldQAVision

84.1/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Real-world visual question answering.

MMStarVision

81.4/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Elite multimodal model evaluation.

CountBenchVision

97.8/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Visual object counting and identification.

ERQAVision

62.5/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Environment Reasoning and Question Answering.

CharXiv-RQVision

78.4/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Chart-based reasoning from arXiv papers (Reasoning QA).

Terminal-Bench 2.0Agentic

59.3/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Agent performance in realistic terminal workflows (v2.0 leaderboard).

SWE-bench ProAgentic

53.5/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Higher-difficulty SWE-bench subset for frontier coding agents.

SimpleVQAVision

56.1/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Short-form visual question answering with verifiable responses.

VideoMMMUVideo

84.4/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Video variant of MMMU for multimodal understanding and reasoning.

VideoMMEVideo

87.7/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Video multimodal evaluation benchmark for perception and reasoning.

AndroidWorldAgentic

70.3/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Mobile device control and task completion benchmark.

MLVUVideo

86.6/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Multi-task long video understanding benchmark.

MVBenchVideo

75.5/ 100

Verified

Last Verified: 2026-04-27Qwen3.6 Announcement

Comprehensive video understanding benchmark across multiple tasks.