Python скрипт для транскрибации аудио в текст OpenAI Whisper
Audio Transcription with OpenAI Whisper
Скрипт для автоматической транскрибации аудиофайлов в текст с использованием OpenAI Whisper API.
Возможности
- Транскрибация аудиофайлов в текстовый формат
- Поддержка различных аудиоформатов (mp3, mp4, wav, m4a, webm)
- Автоматическое определение языка
- Сохранение результата в текстовый файл
Требования
- Python 3.7+
- OpenAI API ключ
- Аудиофайл размером до 25 MB
Установка
- Клонируйте репозиторий или скачайте файл main.py
- Установите зависимости:
pip install openai python-dotenv
- Создайте файл .env в корневой директории проекта:
OPENAI_API_KEY=ваш_api_ключ_здесь
Использование
- Поместите аудиофайл audio.mp3 в ту же директорию, что и скрипт
- Запустите скрипт:
python main.py
- Результат будет сохранен в файл transcription.txt
Структура проекта
. ├── main.py # Основной скрипт ├── .env # Файл с API ключом (не коммитить!) ├── audio.mp3 # Входной аудиофайл ├── transcription.txt # Выходной файл с транскрипцией └── README.md # Этот файл
Настройки
Вы можете изменить следующие параметры в main.py:
- Имя входного файла: измените audio_path = "audio.mp3" на нужное
- Имя выходного файла: измените output_path = "transcription.txt"
- Формат вывода: измените response_format="text" на:
- "json" - для получения детальной информации с временными метками
- "srt" - для субтитров в формате SRT
- "vtt" - для субтитров в формате WebVTT
Ограничения
- Максимальный размер файла: 25 MB
- Поддерживаемые форматы: mp3, mp4, mpeg, mpga, m4a, wav, webm
- Стоимость: Примерно, $0.006 за минуту аудио
Получение API ключа
- Зарегистрируйтесь на platform.openai.com
- Перейдите в раздел API Keys
- Создайте новый ключ и скопируйте его
- Добавьте ключ в файл .env
Безопасность
- НЕ коммитьте файл .env в репозиторий
- Добавьте .env в .gitignore
- Храните API ключ в безопасном месте
Пример вывода
Транскрибация файла: audio.mp3 Транскрипция успешно сохранена в: transcription.txt Предпросмотр транскрипции: Здравствуйте, это пример транскрибированного текста...
Решение проблем
Ошибка: OPENAI_API_KEY не найден
- Убедитесь, что файл .env существует и содержит правильный ключ
Ошибка: Файл audio.mp3 не найден
- Проверьте, что аудиофайл находится в той же директории, что и скрипт
Ошибка при транскрибации
- Проверьте баланс вашего OpenAI аккаунта
- Убедитесь, что размер файла не превышает 25 MB
- Проверьте формат аудиофайла
Бесплатный скрипт
Вы можете скачать этот скрипт бесплатно