Закончил созвон с клиентом, закрыл ноутбук, пошёл наливать чай. Через 15 минут в личку в Telegram прилетает сводка по звонку: в заголовке — тема встречи, а внутри две идеи для контента и тезисы с цитатами из живой беседы. Всё это делает моя автоматизация процессов в make, которую я собрал сам (как обычно, без единой строчки кода).

Ключевое преимущество этой автоматизации в том, что она отлично справляется с созвонами до 1.5–2 часов, в отличие от большинства представленных в сети сценариев. Ну и обходится она в $17 в месяц (это подписка Zoom, всё остальное — копейки на API в районе 100 рублей в месяц).

В этой статье расскажу, как работает эта автоматизация через make, почему почти все ютуб-туториалы на тему make для автоматизации Zoom ломаются на первом же реальном созвоне, и где взять файл blueprint (для прямого импорта этой схемы на ваш аккаунт make.com), чтобы не собирать это вручную.

Коротко, в двух словах

  • Большинство туториалов по транскрибации Zoom строятся вокруг Whisper API.
  • Whisper API не принимает файлы больше 25 МБ, поэтому рабочие созвоны в него просто не влезают.
  • Zoom Pro сам отдаёт бесплатный VTT-транскрипт, что в разы лучше, чем Whisper API.
  • Фильтр по теме звонка («консультация», «консалтинг») позволяет гибче настраивать сценарии.
  • Цена: ~$17 в месяц на всё. Готовый блюпринт импортируется в make.com за 2 минуты.

Почему вы скорее всего не найдёте рабочей автоматизации Zoom в сети

На YouTube куча гайдов и туториалов про «контент-завод из Zoom за 5 минут». Откройте любой и увидите, как автор с умным видом начинает запись Zoom, 15 секунд что-то говорит в камеру в формате «вот смотрите, щас проверю», и ему тут же прилетает расшифровка этих самых 15 секунд. Неискушенные зрители ликуют, ставят лайк и подписываются, чтобы получить эту волшебную схему.

Только вот эта схема сломается ровно в тот момент, когда созвон продлится больше 20 минут.

А это 99% нормальных рабочих встреч.

Почему это не будет работать? Потому что почти все эти «рабочие схемы» гонят аудио через OpenAI Whisper, который умеет транскрибировать аудио в текст. Только вот Whisper API не принимает файлы больше 25 МБ.

Whisper API не принимает файлы больше 25 МБ

Запись часовой Zoom-планёрки в нормальном качестве весит 40–80 МБ. Двухчасовая — за 100 МБ. Для типовой рабочей встречи Whisper вернёт вам ошибку, и автоматизация упадёт на первом же боевом созвоне.

Обойти это можно — нарезать файл на куски, транскрибировать частями, потом склеивать. Но в make.com или Zapier такой нарезчик в три клика не построишь: нужны ffmpeg, временные хранилища, обработка ошибок. Ломаться будет регулярно и настойчиво.

Поэтому рабочую схему автоматизации мне пришлось собирать самому. Без Whisper, к слову. И да, схемой я с вами коненчо же поделюсь. Ведь 94% маркетологов уже используют ИИ в создании контента, вот и вы начнёте.

Как работает автоматизация процессов в Make: 6 модулей

Вся автоматизации make com умещается в 6 модулей, которые передают данные друг другу по цепочке.

Выглядит это так:

Схема автоматизации Zoom транскрипций

  1. Zoom делает запись встречи и отправляет в make.com сигнал о том, что новая встреча записана.

  2. Make.com скачивает VTT-файл с серверов Zoom. VTT-файл — это файл прямой транскрибации от Zoom.

  3. Этот файл с сырой транскрибацией чистит первая нейронка (Gemini 2.0 Flash Lite). Убирает таймкоды, слова-паразиты, «э-э-э», «ну кароче» и т.д.

  4. Вторая нейронка (GPT-4o-mini) анализирует уже чистый текст и готовит для вас анализ встречи и идеи и тексты постов.

  5. Всё получившееся добро вам в личку отправляет телеграм-бот.

Кроме того, в логику вшито два решения, которые неочевидны, пока не соберешь парочку граблей в процессе работы автоматизации.

1. Как включить бесплатный транскрипт из Zoom Cloud Recording? У Zoom Pro в настройках есть галка Audio Transcript — как только облачная запись готова, Zoom сам отдаёт VTT-файл с расшифровкой. Никаких отдельных API для speech-to-text, никакой оплаты за минуты транскрипций.

2. Фильтр по теме встречи. Я называю свои рабочие созвоны «Консультация такая-то» или «Консалтинг с тем-то». Автоматизация в make.com срабатывает только на записи, где в теме есть слово «консультация» или «консалтинг». Личные звонки, Zoom с командой, тестовые созвоны логика не трогает.

Фильтр по теме встречи в автоматизации

Сколько стоит автоматизация через Make в месяц

КомпонентЗачем нуженЦена
Zoom ProОблачная запись + автотранскрипт VTT$17/мес
make.comОркестрация, 6 модулей в цепочкеБесплатный тариф
Gemini 2.0 Flash Lite (API)Первый LLM — чистит сырой VTT в диалогЦенты за созвон
OpenAI GPT-4o-mini (API)Второй LLM — пишет посты из диалогаЦенты за созвон
Telegram BotДоставляет готовый пост в личкуБесплатно

Итог: ~$17 в месяц. А именно подписка Zoom Pro и копейки на API двух нейронок. Gemini Flash Lite и GPT-4o-mini — самые дешёвые рабочие модели, они не пробивают даже $2 за месяц активной работы, если у вас не десять созвонов в день, конечно.

Для сравнения: Whisper API стоит около $0.36 за час аудио (и это в лучшем случае — файл больше 25 МБ он, как я говорил выше, вообще не принимает).

Цены на API Whisper OpenAI

Даже если научитесь нарезать большие видео, 15 созвонов в месяц — это $5-10 сверху, плюс ffmpeg, плюс временное хранилище, плюс обработка ошибок. И всё ради той же расшифровки, которую Zoom Cloud Recording отдаёт вам бесплатно вместе с готовым VTT-файлом.

Готовый блюпринт

Собирать всё вышеописанное руками — это пара часов, если у вас раньше был опыт с make.com, и полдня, если не было. Поэтому я выкладываю готовый блюпринт — JSON-файл сценария, который импортируется в make.com за 2 минуты. Внутри — все 6 модулей с уже настроенными фильтрами, регуляркой и промптами. Останется только подставить свои доступы: аккаунт Zoom, API-ключ Gemini, API-ключ OpenAI и токен Telegram-бота.

Три шага, чтобы запустить автоматизацию через make у себя

  1. Скачайте блюпринт в моём боте в Telegram — @Bokorew_bot. Запустите бот и напишите ему слово zoom, он пришлёт файл в ответ.
  2. Активируйте подписку Zoom Pro и включите Audio Transcript, чтобы Zoom начал отдавать VTT-файлы прямых транскрипций.
  3. Импортируйте блюпринт в Make.com и подставить свои ключи. Нужно подключить Zoom, OpenAI API, Gemini Api и токен Telegram-бота.

Делаете это один раз — и дальше мейк автоматизация живёт сама по себе, а вы получаете идеи постов в личку телеграма.

Эти же идеи, кстати, отлично превращаются в идеи для рилс. И сами рилс можно потом создавать с помощью цифрового аватара, как в нашем кейсе. Получится полностью закрытый контентный контур с ИИ.

Для продвинутых. Вы можете зайти в блок «Тезисы для поста» в make.com и отредактировать промт нейронки под что угодно для себя.

Редактировать промт в разделе автоматизации

Чтобы ИИ на основе транскрибации встречи делал вам сценарий, набор шуток (мало ли вдруг) или вообще оформлял в кейс всё, что происходило. По умолчанию там стоит вот такой промпт:

Промпт

Ты — профессиональный копирайтер с опытом 15 лет, который специализируется на ведении телеграм-каналов для экспертов.

Я скину тебе расшифровку бизнес-консультации эксперта. Тебе нужно выделить 1-2 самые интересные для владельцев бизнеса темы, которые обсуждали эксперт и его клиент.

Темы должны стать основой для поста в телеграм-канале эксперта, проводящего консультацию.

Тема должна быть лёгкой для восприятия, короткой по содержанию, конкретной и применимой.

К каждой теме нужно написать список ключевых тезисов с описанием.

Избегай общих тезисов и описаний. Выделяй под каждым тезисом конкретные факты, цифры, примеры, цитаты, кейсы, конкретные решения и ситуации.

Придерживайся лексики расшифровки. Чаще вставляй цитаты, цифры, рекомендации и кейсы из расшифровки.

Вот расшифровка:

Вы его можете отредактировать уже под себя.

Работает ли схема с Яндекс.Телемост, МТС Линк и Google Meet

Эта конкретная схема — только под Zoom. Она заточена под Zoom Cloud Recording и бесплатный VTT, который у Zoom есть «из коробки» на Pro-подписке.

Для Яндекс.Телемост, МТС Линк и Google Meet логика остаётся та же: получить запись или транскрипт → очистить → прогнать через два LLM-шага → отдать в Telegram. Но входной модуль будет другой. У Телемоста и МТС Линк нет нативного автотранскрипта в make.com — придётся либо скачивать запись вручную, либо гонять аудио через Whisper API, либо использовать Tactiq/Fireflies как источник текста. У Google Meet есть транскрипция Gemini, но добраться до неё через API тоже не так удобно, как в Zoom.

Частые вопросы

Важно запомнить

Сколько реально стоит автоматизация контента из Zoom в месяц?+

$17 на Zoom Pro — единственная обязательная строка. Gemini 2.0 Flash Lite и GPT-4o-mini на типичной нагрузке (10–20 созвонов в месяц) уходит $1-2. Make.com на бесплатном тарифе будет достаточно (1000 операций). Telegram-бот бесплатный. Итого — ~$17/мес + мелочь на API нейронок.

Работает ли схема с встречами дольше 1 часа?+

Да. Я стабильно гоняю её на созвонах 1–1.5 часа. Если созвон больше 2 часов — лучше разбить запись на две части и прогнать каждую отдельно. Gemini 2.0 Flash Lite и GPT-4o-mini оба имеют большой контекст, но качество генерации начинает проседать на очень длинных транскриптах.

Нужен ли платный Zoom, или можно бесплатный?+

Нужен платный. Cloud Recording и Audio Transcript доступны только на Zoom Pro и выше. На бесплатном Zoom есть только локальная запись, и автотранскрипта у неё нет — вся схема теряет главный плюс (бесплатную расшифровку).

Можно ли собрать эту схему не на make.com, а на n8n или Zapier?+

Можно. Логика (6 модулей, два LLM-шага, фильтр по теме, регулярка для тайм-кодов) одинаково ложится на n8n и Zapier. Разница — в названиях модулей и синтаксисе. Мой готовый блюпринт собран под make.com, для других платформ придётся пересобирать руками самостоятельно.

Чем make для автоматизации лучше Zapier и n8n именно для контент-задач?+

Make.com даёт визуальный конструктор сценариев с честным бесплатным тарифом на 1000 операций — этого хватает на 30–50 созвонов в месяц без оплаты. Zapier на бесплатном тарифе ограничен 100 операциями и одношаговыми сценариями, а n8n требует self-hosting. Для контентных задач автоматизация процессов make — оптимальный баланс: бесплатно + не нужен сервер + визуальный билдер.

Какие именно нейросети используются для расшифровки встречи и генерации постов?+

Расшифровку делает сам Zoom (VTT-файл, бесплатно). Очистку диалога — Gemini 2.0 Flash Lite. Генерацию постов — GPT-4o-mini.

Почему не Whisper? Все ведь делают через него+

Потому что у Whisper API есть жёсткий лимит: файл не должен превышать 25 МБ. А часовая запись рабочего созвона в нормальном качестве весит 40–80 МБ, двухчасовая планёрка — за 100 МБ. Whisper просто не принимает типовой файл рабочей встречи — возвращает ошибку, и автоматизация встаёт.

Безопасно ли отдавать расшифровку Zoom-встречи в OpenAI и Google?+

OpenAI на API-запросах не обучает модели по умолчанию — это закреплено в их политике использования API. Google на Gemini API так же. Формально отдавать можно. Но если на созвоне обсуждаются чувствительные данные (NDA, персональные данные клиентов, коммерческая тайна), рекомендую фильтровать такие встречи по теме.