Содержание
Нейросеть для перевода аудио в текст. Транскрибация от OpenAI: Whisper. Запись конференций и заметки по ним. Для быстрой работы whisper нужна видеокарта от Nvidea
1. Скачать и установить Python
C:\Users\kosenkov>python --version Python 3.13.7
2. Скачать и установить PyTorch
C:\Users\kosenkov>python -m pip install torch torchvision Successfully installed MarkupSafe-3.0.2 filelock-3.19.1 fsspec-2025.9.0 jinja2-3.1.6 mpmath-1.3.0 networkx-3.5 numpy-2.3.3 pillow-11.3.0 setuptools-80.9.0 sympy-1.14.0 torch-2.8.0 torchvision-0.23.0 typing-extensions-4.15.0
Дополнение — версия с CPU выдает 1 строку в 10-15 секунд, это очень плохая производительность,
Для видеокарт:
C:\Users\kosenkov>python -m pip install torch torchvision --index-url https://download.pytorch.org/whl/cu126
FFmpeg
Converting video and audio скачиваем версиюWindows builds by BtbN
-> ffmpeg-master-latest-win64-lgpl.zip
- Разархивировать
- Зайти в директорию bin
- Скопировать все файлы
- Вставить файлы в директорию
Scripts
для по месту установкиPython
, у меня это:C:\Users\kosenkov\AppData\Roaming\Python\Python313\Scripts
- В системную переменную среды
Path
добавитьC:\Users\kosenkov\AppData\Roaming\Python\Python313\Scripts
- Проверить в cmd (перезапустите)-
ffmpeg
C:\Users\kosenkov>ffmpeg ffmpeg version N-121164-gced4a6ebc9-20250922 Copyright (c) 2000-2025 the FFmpeg developers built with gcc 15.2.0 (crosstool-NG 1.28.0.1_403899e)
Git
Обязательно указать в системной переменной Path
путь до установленного git до директорий: bin
и cmd
. Это можно сделать автоматически при установке.
C:\Users\kosenkov>git -v git version 2.51.0.windows.1
Whisper
python -m pip install -U openai-whisper
Successfully installed certifi-2025.8.3 charset_normalizer-3.4.3 colorama-0.4.6 idna-3.10 llvmlite-0.45.0 more-itertools-10.8.0 numba-0.62.0 openai-whisper-20250625 regex-2025.9.18 requests-2.32.5 tiktoken-0.11.0 tqdm-4.67.1 urllib3-2.5.0
Использование
В имени файла не должно быть пробелов или же название видео или аудио должно быть взято в двойные кавычки, например «Тестовое видео.mp4»
Приведет к ошибке, так как в имени файла пробел
C:\Users\kosenkov\Videos>whisper C:\Users\kosenkov\Videos\2025-07-08 14-03-03.mp4 100%|█████████████████████████████████████| 1.51G/1.51G [00:43<00:00, 37.4MiB/s]
А вот этот код отработает:
whisper 2025-07-08_14-03-03.mp4