Перевод аудио или видео в текст — адская работа. На транскрибацию 10-15 минут может уйти до одного часа или больше при нормальной скорости печатанья. Если лень самим этим заниматься, можно обратиться к фрилансерам по 500 рублей за 30 минут, а иногда и больше сумма. А можно сделать то же самое совершенно бесплатно и за пару минут.

AI Transcription — сервис для автоматической транскрибации, который преобразовывает аудио и видео файлы (MP3, WAV, MP4 и MOV) в текстовые документы. Фактически, это нейросеть Whisper, которую ребята из Riverside (Riverside позволяет легко записывать удаленные подкасты и видеоинтервью, которые выглядят и звучат так, как будто они были записаны в студии стоимостью в миллион долларов. Riverside была основана в 2020 году двумя братьями Gideon и Nadav. Родом из Амстердама, сейчас штаб-квартира находится в Тель-Авиве.) обернули в удобный интерфейс. Поддерживает более 100 языков, отделяет речь разных людей (в диалоге) и проставляет таймкоды, что удобно. Прекрасно справляется с русским языком и даже проставляет знаки препинания. Подобного качества автоматической транскрибации мы еще не встречали.

Что умеет AI Transcription от Riverside:

  1. Точное преобразование (ну почти точное) аудио и видео файлов в текст на более 100 языках
  2. Идентификация говорящего в многоголосых записях
  3. Проставление таймкодов (время разговоров, диалогов)
  4. Сохранение в формате субтитров или в текстовом формате (блокнот)

Самое главное, доступен бесплатно без регистрации, но по сути регистрация занимает буквально минуту, если у вас есть почта gmail. Загружаешь файл к ним на сервер и вуаля, через пару минут получаешь расшифровку.