🤖 LLM ベンチマーク比較

MiniMax M2.5 vs GLM-5 vs Claude Sonnet 4.5 vs Opus 4.6

🏆 コストパフォーマンス BEST
MiniMax M2.5
$0.4-1/M tokens (Opusの1/20)
📊 SWE-Bench Verified スコア
Claude Opus 4.680.8%
80.8%
MiniMax M2.580.2%
80.2%
GLM-577.8%
77.8%
Claude Sonnet 4.577.2%
77.2%
MiniMax M2.5 🆕 New!
80.2%
SWE-Bench
200K
Context
$0.4
1M tokens
中国発の新星。Opus 4.6とほぼ同等の性能でコストは1/20。「Architect Mindset」で設計から始める。
💰 $0.4-1/M (Opusの1/10-1/20)
Claude Opus 4.6 👑 最高性能
80.8%
SWE-Bench
1M*
Context
$15
1M tokens
Anthropic最高峰。Adaptive Thinking、1M tokenコンテキスト(β)。長文検索でSonnetの4倍。
💰 $15 in / $75 out / 1M tokens
GLM-5 📦 OSS
77.8%
SWE-Bench
200K
Context
$0.5
1M tokens
744Bパラメータ (MoE, 44B活性)。MITライセンスで商用OK。DeepSeek Sparse Attention採用。
💰 $0.5-2/M (OSS & API)
Claude Sonnet 4.5 ⭐ バランス
77.2%
SWE-Bench
200K
Context
$3
1M tokens
Claudeシリーズのバランスモデル。Opusより安価で実用的。高計算で82.0%到達可能。
💰 $3 in / $15 out / 1M tokens
🎯 おすすめ用途
日常開発・コスト重視 → MiniMax M2.5
商用OSS要件 → GLM-5
バランス型 → Sonnet 4.5
最重要タスク・最高品質 → Opus 4.6