Русский ASR-лидерборд

Площадка для честного сравнения моделей распознавания русской речи. Мы считаем WER и CER на единых тестовых наборах и сортируем модели по среднему WER (ниже — лучше). Наведите курсор на значение WER в колонке датасета, чтобы увидеть CER. Все метрики указаны в процентах.

Ранг Модель Тип модели Средний WER ⬇️ Средний CER ⬇️ RuLS CV 22.0 Webinars Books Speak Sova
🥇 openai/whisper-large-v3 Открытая 10.16 4.04 11.62% 7.51% 7.24% 12.19% 2.74% 19.65%
🥈 bond005/whisper-podlodka-turbo Открытая 10.36 3.97 11.91% 6.36% 15.21% 8.96% 3.14% 16.55%
🥉 openai/whisper-large-v3-turbo Открытая 11.07 4.50 11.88% 8.17% 9.89% 13.29% 2.80% 20.37%
4 bond005/whisper-large-v3-ru-podlodka Открытая 11.62 4.98 10.24% 7.80% 15.93% 10.31% 3.23% 22.21%
5 nvidia/canary-1b-v2 Открытая 13.55 4.86 20.16% 9.12% 13.71% 11.45% 4.97% 21.89%
6 VOSK-model-ru-0.42 Открытая 13.96 5.73 12.06% 11.87% 27.29% 10.80% 2.61% 19.15%
7 GigaAM-ASR-V2-RNNT Открытая 18.21 14.39 5.24% 2.85% 80.03% 8.06% 3.08% 10.01%
8 GigaAM-ASR-V2-CTC Открытая 18.74 14.49 5.26% 3.42% 80.19% 7.72% 3.01% 12.86%