Конвертация PDF-книг в аудиокниги с MiniMax и Google Drive
Шаблон n8n преобразует PDF-книги в аудиокниги MP3 с помощью MiniMax TTS и сохраняет их на Google Диске.
Целевая аудитория
- Студенты — для создания аудиоучебников.
- Профессионалы — для прослушивания документов в дороге.
- Создатели контента — для переработки текстов в аудиоформат.
- Люди с нарушениями зрения — для доступности контента.
- Энтузиасты автоматизации — для настройки персональных решений.
Решаемая проблема
Чтение длинных PDF-документов неудобно, а ручная конвертация в аудио занимает много времени. Этот шаблон автоматизирует создание аудиокниг из PDF.
Что автоматизируется
- Загрузка PDF: Пользователь загружает PDF через веб-форму.
- Извлечение текста: Текст извлекается из PDF-файла.
- Разделение текста: Текст делится на части по 500 символов.
- Конвертация в аудио: MiniMax TTS преобразует части текста в аудиофайлы.
- Объединение аудио: FFmpeg объединяет аудиофайлы в один MP3.
- Сохранение: Готовая аудиокнига загружается на Google Диск.
Используемые сервисы
- Form Trigger : Принимает PDF-файл через веб-форму.
- Extract From File : Извлекает текст из PDF.
- Code Nodes : Делят текст на части и присваивают индексы аудиофайлам.
- Split In Batches : Обрабатывает текст партиями по 5 фрагментов.
- MiniMax TTS (HTTP Request) : Преобразует текст в аудио с настройкой голоса.
- Wait Node : Добавляет паузу для соблюдения лимитов API.
- FFmpeg (Execute Command) : Объединяет аудиофайлы в один MP3.
- Read/Write File : Сохраняет временные аудиофайлы и список для FFmpeg.
- Google Drive : Загружает итоговую аудиокнигу в папку «Audiobook».
Сложность настройки
Сложная
Время настройки: 4–5 часов (включая установку FFmpeg и настройку API).
Что нужно для запуска
- n8n: Только локальный экземпляр (не работает в облаке из-за FFmpeg).
- FFmpeg: Установлен в среде n8n (через Docker или вручную).
- Replicate (MiniMax): API-ключ для доступа к TTS.
- Google Drive: Учетная запись с OAuth2 и папкой «Audiobook».
- Настройка:
- Установите FFmpeg (sudo apt-get install ffmpeg для Linux, brew install ffmpeg для macOS).
- Импортируйте JSON шаблона в локальный n8n.
- Настройте учетные данные для Replicate (Bearer Token) и Google Drive (OAuth2).
- Создайте папку «Audiobook» на Google Диске и укажите её ID в узле.
- Протестируйте, загрузив PDF через форму, и проверьте аудиокнигу на Диске.
Примеры использования
- Студент: Преобразует учебник по биологии в аудиокнигу для прослушивания перед экзаменом.
- Создатель контента: Переводит статьи из PDF в подкасты для публикации.
- Менеджер: Конвертирует отчеты в аудио для прослушивания в дороге.
Результат
- Экономия времени : Сокращает часы ручной конвертации текстов в аудио.
- Качество звука : Естественный голос с настраиваемыми эмоциями и скоростью.
- Удобство : Аудиокниги доступны на Google Диске для прослушивания в любое время.
- Доступность : Делает контент удобным для людей с нарушениями зрения.
- Гибкость : Поддерживает настройку голоса и обработку больших книг.
Теги для поиска
#автоматизация #аудиокниги #GoogleDrive #MiniMax #PDF #контент #доступность
А получить workflow «Автоматизируем создание аудиокниг из PDF: готовый workflow для n8n» и другие шаблоны для n8n (более 1000 готовых сценариев автоматизации) вы можете в нашем Закрытом Нейроклубе по кнопке ниже:
Также рекомендуем подписаться на наш Telegram-канал AI Мастерская.
Там выходят подробные разборы популярных сценариев для n8n, реальные кейсы автоматизации бизнеса и примеры, где рутинную работу полностью берут на себя роботы, а не человек.
Напишите в комментариях, какой шаблон для n8n вам нужен и какие задачи он должен выполнять. Я подберу подходящее решение или добавлю новый workflow.


