Phi-3 Medium vs GPT-4o mini

Side-by-side comparison of Phi-3 Medium (Microsoft) and GPT-4o mini (OpenAI) — benchmarks, pricing, and capabilities.

Share:

	Phi-3 Medium Microsoft	GPT-4o mini OpenAI
Category	LLMs	LLMs
Specifications
Context Window	128K	128K
Pricing (per 1M tokens)
Input Cost	Free	$0.15
Output Cost	Free	$0.60
Performance
Overall Score	78.2	85.0
ARC-Challenge	—	92.7
BigBench Hard	68.0	76.2
Chatbot Arena ELO	—	1118.0
DROP	70.0	76.8
GSM8K	78.0	86.1
HumanEval	70.0	78.5
MATH	48.0	62.0
MMLU	78.0	80.2
TruthfulQA	52.0	73.2
WinoGrande	—	80.1
Community
User Rating	★ 4.2	★ 4.5
Reviews	312	2100

Open in Interactive Comparison Tool View Phi-3 Medium View GPT-4o mini

People Also Compare

Phi-3 MediumvsGPT-o1 GPT-4o minivsGPT-o1

Phi-3 MediumvsGPT-4o GPT-4o minivsGPT-4o

Phi-3 MediumvsDeepSeek R1 GPT-4o minivsDeepSeek R1

Phi-3 MediumvsClaude 3.5 Sonnet GPT-4o minivsClaude 3.5 Sonnet

Phi-3 MediumvsGemini 1.5 Pro GPT-4o minivsGemini 1.5 Pro

Phi-3 MediumvsClaude 3 Opus GPT-4o minivsClaude 3 Opus