Многомодальный AI-ассистент в Telegram с Gemini и генерацией голоса/изображений
Шаблон создаёт умного чат-бота Simran в Telegram, который обрабатывает текст/голос, генерирует изображения, напоминания и хранит память.
Для кого
- Основатели и агентства, автоматизирующие общение
- Маркетинговые команды для персонализированных ответов
- Разработчики, создающие ботов с мультимедиа
- Пользователи, желающие умного ассистента
Проблема
Обработка сообщений в Telegram требует ручной работы, а добавление голоса/изображений усложняет.
Шаблон автоматизирует чат-бота, делая общение умным и естественным.
Что автоматизируется
- Получение текста или голоса в Telegram.
- Транскрипция голоса через AssemblyAI.
- Анализ намерения сообщения с помощью Gemini.
- Маршрутизация: чат, изображение, напоминание или память.
- Генерация ответа в режиме «подружки» или стандартном.
- Создание изображений через Together.xyz.
- Установка напоминаний в Google Calendar/Tasks.
- Хранение памяти в MongoDB с суммированием.
- Генерация голосового ответа через edge-TTS.
- Отправка ответа текстом, голосом или изображением.
Сервисы
- Telegram Trigger: Запускает процесс при сообщении.
- AssemblyAI: Транскрибирует голос в текст.
- Google Gemini: Анализирует намерения и генерирует ответы.
- Together.xyz: Генерирует изображения по промпту.
- Google Calendar/Tasks: Устанавливает напоминания и задачи.
- MongoDB: Хранит историю бесед и память.
- Google Cloud Natural Language: Определяет настроение сообщений.
- Google Sheets: Хранит режим «подружки» для пользователей.
- Edge-TTS: Преобразует текст в голос.
Сложность настройки
- Уровень: Сложный
- Время: ~60-90 мин
Что нужно
- Аккаунты:
- Telegram-бот с токеном
- AssemblyAI с API-ключом
- MongoDB с базой данных
- Google (Calendar, Tasks, Sheets, Natural Language) с OAuth2
- Google Gemini с API-ключом
- Together.xyz с API-доступом
- Требования:
- n8n (локально или в облаке)
- Edge-TTS на сервере n8n
- MongoDB с коллекциями: user_memory, memory_auto
- Google Sheets для GF-режима
- Подключение всех API в n8n
- Тестирование голоса, изображений и напоминаний
Примеры использования
- Личный ассистент: Пользователь говорит: «Напомни позвонить маме завтра в 4 вечера». Бот устанавливает напоминание в Calendar.
- Поддержка клиентов: Клиент спрашивает: «Как вернуть товар?». Бот отвечает на основе базы знаний.
- Креатив: Пользователь просит: «Сгенерируй изображение кошки в космосе». Бот создаёт и отправляет картинку.
Результат
- Умный чат-бот с памятью для естественных бесед.
- Экономия часов на ручных ответах и напоминаниях.
- Генерация изображений и голоса для мультимедиа.
- Снижение ошибок благодаря анализу настроения.
- Адаптация под сайт, Slack или Discord.
Теги
#автоматизация #чатбот #Telegram #Gemini #RAG #интеграция #AI
А получить workflow «Умный Telegram-бот с памятью и мультимедиа: шаблон workflow для n8n» и другие шаблоны для n8n (более 1000 готовых сценариев автоматизации) вы можете в нашем Закрытом Нейроклубе по кнопке ниже:
Также рекомендуем подписаться на наш Telegram-канал AI Мастерская.
Там выходят подробные разборы популярных сценариев для n8n, реальные кейсы автоматизации бизнеса и примеры, где рутинную работу полностью берут на себя роботы, а не человек.
Напишите в комментариях, какой шаблон для n8n вам нужен и какие задачи он должен выполнять. Я подберу подходящее решение или добавлю новый workflow.


