Phi-3 Medium vs Llama 3.1 405B

Side-by-side comparison of Phi-3 Medium (Microsoft) and Llama 3.1 405B (Meta) — benchmarks, pricing, and capabilities.

Share:

	Phi-3 Medium Microsoft	Llama 3.1 405B Meta
Category	LLMs	LLMs
Specifications
Context Window	128K	128K
Pricing (per 1M tokens)
Input Cost	Free	Free
Output Cost	Free	Free
Performance
Overall Score	78.2	88.4
ARC-Challenge	—	95.8
BigBench Hard	68.0	82.3
Chatbot Arena ELO	—	1229.0
DROP	70.0	82.0
GSM8K	78.0	91.0
HumanEval	70.0	85.0
MATH	48.0	70.1
MMLU	78.0	84.2
TruthfulQA	52.0	61.0
WinoGrande	—	81.7
Community
User Rating	★ 4.2	★ 4.4
Reviews	312	420

Open in Interactive Comparison Tool View Phi-3 Medium View Llama 3.1 405B

People Also Compare

Phi-3 MediumvsGPT-o1 Llama 3.1 405BvsGPT-o1

Phi-3 MediumvsGPT-4o Llama 3.1 405BvsGPT-4o

Phi-3 MediumvsDeepSeek R1 Llama 3.1 405BvsDeepSeek R1

Phi-3 MediumvsClaude 3.5 Sonnet Llama 3.1 405BvsClaude 3.5 Sonnet

Phi-3 MediumvsGemini 1.5 Pro Llama 3.1 405BvsGemini 1.5 Pro

Phi-3 MediumvsClaude 3 Opus Llama 3.1 405BvsClaude 3 Opus