
Русский ASR-лидерборд
Площадка для честного сравнения моделей распознавания русской речи. Мы считаем WER и CER на единых тестовых наборах и сортируем модели по среднему WER (ниже — лучше). Наведите курсор на значение WER в колонке датасета, чтобы увидеть CER. Все метрики указаны в процентах.
Ранг | Модель | Тип модели | Средний WER ⬇️ | Средний CER ⬇️ | RuLS | CV 22.0 | Webinars | Books | Speak | Sova |
---|---|---|---|---|---|---|---|---|---|---|
🥇 | openai/whisper-large-v3 | Открытая | 10.16 | 4.04 | 11.62% | 7.51% | 7.24% | 12.19% | 2.74% | 19.65% |
🥈 | bond005/whisper-podlodka-turbo | Открытая | 10.36 | 3.97 | 11.91% | 6.36% | 15.21% | 8.96% | 3.14% | 16.55% |
🥉 | openai/whisper-large-v3-turbo | Открытая | 11.07 | 4.50 | 11.88% | 8.17% | 9.89% | 13.29% | 2.80% | 20.37% |
4 | bond005/whisper-large-v3-ru-podlodka | Открытая | 11.62 | 4.98 | 10.24% | 7.80% | 15.93% | 10.31% | 3.23% | 22.21% |
5 | nvidia/canary-1b-v2 | Открытая | 13.55 | 4.86 | 20.16% | 9.12% | 13.71% | 11.45% | 4.97% | 21.89% |
6 | VOSK-model-ru-0.42 | Открытая | 13.96 | 5.73 | 12.06% | 11.87% | 27.29% | 10.80% | 2.61% | 19.15% |
7 | GigaAM-ASR-V2-RNNT | Открытая | 18.21 | 14.39 | 5.24% | 2.85% | 80.03% | 8.06% | 3.08% | 10.01% |
8 | GigaAM-ASR-V2-CTC | Открытая | 18.74 | 14.49 | 5.26% | 3.42% | 80.19% | 7.72% | 3.01% | 12.86% |