Автоматизация генерации речи из текста
Преобразование текста в аудио и его хранение
Этот шаблон генерирует из текста аудио с естественным звучанием, загружает его на Google Drive и регистрирует подробности в Airtable.
Для кого?
- Контент-креаторы: Для озвучки видео или подкастов.
- Маркетологи: Создание аудио для рекламы или IVR.
- Разработчики: Интеграция голосовых ответов в приложения.
Что решает?
Создание аудиоозвучки вручную требует времени и ресурсов, а также требует технических навыков и приводит к несогласованности файлов в разных сервисах.
Шаблон автоматизирует генерацию и хранение аудиофайлов.
Что автоматизируется?
- Получение текста, голоса и языка через форму.
- Преобразование текста в аудио с Google Text-to-Speech API.
- Конвертация аудио из Base64 в файл.
- Загрузка аудиофайла в Google Drive.
- Получение длительности аудио через fal.ai API.
- Проверка статуса обработки длительности.
- Сохранение данных (URL, длительность, описание) в Airtable.
Как работает?
- Пользователь вводит текст, выбирает голос и язык в форме.
- Текст форматируется и отправляется в Google Text-to-Speech API.
- Полученный Base64-аудио конвертируется в файл.
- Аудиофайл загружается в Google Drive.
- Запрос длительности аудио через fal.ai API.
- Проверка статуса обработки (при необходимости ожидание).
- Сохранение URL, длительности и описания в Airtable.
Используемые сервисы
- Form Trigger: Сбор текста, голоса и языка от пользователя.
- Google Text-to-Speech: Генерация аудио из текста.
- Google Drive: Хранение аудиофайлов.
- fal.ai: Получение длительности аудио.
- Airtable: Логирование данных об аудиофайлах.
Сложность настройки
- Уровень: Средний
- Время: ~20-30 минут
Что нужно для запуска?
- Аккаунты:
- Google Cloud (OAuth2 для Text-to-Speech и Drive).
- fal.ai (для API ffmpeg).
- Airtable (Personal Access Token).
- API-ключи:
- Google OAuth2 credentials (Text-to-Speech и Drive).
- fal.ai API Key.
- Airtable Personal Access Token.
- Требования:
- Включить Text-to-Speech API в Google Cloud Console.
- Создать папку в Google Drive (указать folderId).
- Настроить таблицу в Airtable с полями: Asset Name, Description, URL, WebView URL, Content Type, Duration.
- Убедиться, что n8n имеет доступ к API и сервисам.
Примеры использования
- Подкастер: Создание аудиоверсий статей для публикации.
- Маркетинговое агентство: Генерация голосовых приветствий для IVR.
- Разработчик чат-бота: Добавление голосовых ответов в приложение.
- Call-центр: Генерация аудиоответов для IVR-систем
Результат
- Аудиофайлы на Google Drive и записи в Airtable с метаданными.
- Польза:
- Экономия 1-2 часов на создании и обработке аудио.
- Организованное хранение аудиоактивов.
- Готовые голосовые файлы для контента или приложений.
Теги
#автоматизация #аудио #контент #маркетинг #интеграция #TextToSpeech #Airtable
А получить workflow «Автоматизируйте создание голосового контента: шаблон n8n для генерации аудио из текста» и другие шаблоны для n8n (более 1000 готовых сценариев автоматизации) вы можете в нашем Закрытом Нейроклубе по кнопке ниже:
Также рекомендуем подписаться на наш Telegram-канал AI Мастерская.
Там выходят подробные разборы популярных сценариев для n8n, реальные кейсы автоматизации бизнеса и примеры, где рутинную работу полностью берут на себя роботы, а не человек.
Напишите в комментариях, какой шаблон для n8n вам нужен и какие задачи он должен выполнять. Я подберу подходящее решение или добавлю новый workflow.


