Оффлайн нейронка для перевода видео в текст Whisper

Ai

Нейросеть для перевода аудио в текст. Транскрибация от OpenAI: Whisper. Запись конференций и заметки по ним. Для быстрой работы whisper нужна видеокарта от Nvidea

1. Скачать и установить Python

C:\Users\kosenkov>python --version
Python 3.13.7

2. Скачать и установить PyTorch

PyTorch

C:\Users\kosenkov>python -m pip install torch torchvision
Successfully installed MarkupSafe-3.0.2 filelock-3.19.1 fsspec-2025.9.0 jinja2-3.1.6 mpmath-1.3.0 networkx-3.5 numpy-2.3.3 
pillow-11.3.0 setuptools-80.9.0 sympy-1.14.0 torch-2.8.0 torchvision-0.23.0 typing-extensions-4.15.0

Дополнение — версия с CPU выдает 1 строку в 10-15 секунд, это очень плохая производительность,

Для видеокарт:

C:\Users\kosenkov>python -m pip install torch torchvision --index-url https://download.pytorch.org/whl/cu126

FFmpeg

Converting video and audio скачиваем версию
Windows builds by BtbN -> ffmpeg-master-latest-win64-lgpl.zip

  1. Разархивировать
  2. Зайти в директорию bin
  3. Скопировать все файлы
  4. Вставить файлы в директорию Scripts для по месту установки Python , у меня это:
    C:\Users\kosenkov\AppData\Roaming\Python\Python313\Scripts
  5. В системную переменную среды Path добавить C:\Users\kosenkov\AppData\Roaming\Python\Python313\Scripts
  6. Проверить в cmd (перезапустите)- ffmpeg
C:\Users\kosenkov>ffmpeg
ffmpeg version N-121164-gced4a6ebc9-20250922 Copyright (c) 2000-2025 the FFmpeg developers
built with gcc 15.2.0 (crosstool-NG 1.28.0.1_403899e)

Git

Git

Обязательно указать в системной переменной Path путь до установленного git до директорий: bin и cmd. Это можно сделать автоматически при установке.

C:\Users\kosenkov>git -v
git version 2.51.0.windows.1

Whisper

python -m pip install -U openai-whisper
Successfully installed certifi-2025.8.3 charset_normalizer-3.4.3 colorama-0.4.6 idna-3.10 llvmlite-0.45.0 more-itertools-10.8.0 numba-0.62.0 openai-whisper-20250625 regex-2025.9.18 requests-2.32.5 tiktoken-0.11.0 tqdm-4.67.1 urllib3-2.5.0

Использование

В имени файла не должно быть пробелов или же название видео или аудио должно быть взято в двойные кавычки, например «Тестовое видео.mp4»

Приведет к ошибке, так как в имени файла пробел

C:\Users\kosenkov\Videos>whisper C:\Users\kosenkov\Videos\2025-07-08 14-03-03.mp4
100%|█████████████████████████████████████| 1.51G/1.51G [00:43<00:00, 37.4MiB/s]

А вот этот код отработает:

whisper 2025-07-08_14-03-03.mp4

Оцените автора
Kosenkov.Pro
Добавить комментарий