Phi-3 Medium vs Grok 2

Side-by-side comparison of Phi-3 Medium (Microsoft) and Grok 2 (xAI) — benchmarks, pricing, and capabilities.

Share:

	Phi-3 Medium Microsoft	Grok 2 xAI
Category	LLMs	LLMs
Specifications
Context Window	128K	128K
Pricing (per 1M tokens)
Input Cost	Free	$2.00
Output Cost	Free	$10.00
Performance
Overall Score	78.2	89.0
ARC-Challenge	—	85.2
BigBench Hard	68.0	—
Chatbot Arena ELO	—	1152.0
DROP	70.0	—
GSM8K	78.0	83.7
HumanEval	70.0	88.4
MATH	48.0	76.1
MMLU	78.0	84.9
TruthfulQA	52.0	54.8
WinoGrande	—	78.0
Community
User Rating	★ 4.2	★ 4.4
Reviews	312	380

Open in Interactive Comparison Tool View Phi-3 Medium View Grok 2

People Also Compare

Phi-3 MediumvsGPT-o1 Grok 2vsGPT-o1

Phi-3 MediumvsGPT-4o Grok 2vsGPT-4o

Phi-3 MediumvsDeepSeek R1 Grok 2vsDeepSeek R1

Phi-3 MediumvsClaude 3.5 Sonnet Grok 2vsClaude 3.5 Sonnet

Phi-3 MediumvsGemini 1.5 Pro Grok 2vsGemini 1.5 Pro

Phi-3 MediumvsClaude 3 Opus Grok 2vsClaude 3 Opus