LLM Leaderboard

Comprehensive benchmarks for large language models, sorted by intelligence index.

Open Source

Live data | — models

Intelligence: Overall capability index

Coding: Code generation quality

Math: Mathematical reasoning