AI-сервис · Транскрибация

LEXIMEDIA AI

Отправьте запись — получите готовый протокол. Транскрибация аудио и видео на локальных нейросетях: ваши файлы не покидают сервер.

100% Локально
До 10 Спикеров
DOCX SRT · TXT · MP3
Large-v3 GPU · RTX

Конфиденциальность — не опция

Большинство сервисов транскрибации отправляют ваш файл на облачные серверы OpenAI, Google или Microsoft. Это неприемлемо для интервью, переговоров, юридических записей и любых материалов под NDA.

☁️

Облачные сервисы

  • Файл загружается на серверы OpenAI / Google / AWS.
  • Данные могут использоваться для обучения моделей.
  • Нарушение 152-ФЗ при работе с персональными данными.
  • Запрещено в корпоративных и государственных контурах.
🔒

LexiMedia AI

  • Обработка только на локальном сервере — никаких внешних API.
  • Исходные файлы удаляются сразу после сдачи работы.
  • Подходит для юристов, психологов, NDA-материалов.
  • Работает без подключения к интернету на стороне обработки.

Как сделать заказ

Всё через Telegram — никаких регистраций и форм.

1
Напишите боту @lexi_media_ai_bot
Отправьте /start или просто опишите задачу. Принимаются файлы до 2 ГБ: mp4, mp3, wav, webm, m4a и другие форматы.
2
Укажите параметры
Количество участников, нужен ли DOCX с именами или просто SRT-субтитры, срочность. Можно прислать ссылку на видео — скачаем сами.
3
Ожидайте готовности
Нейросеть обрабатывает запись в фоне. Время зависит от длины: 1 час записи ≈ 10–15 минут обработки на GPU.
4
Получите архив — пароль после оплаты
Бот пришлёт ZIP-архив с готовым результатом. Файл уже готов, но защищён паролем. Оплачиваете по QR — пароль для распаковки сразу в чат.
LexiMedia AI
LexiMedia AI
● онлайн
🎬
meeting_april.mp4
312 MB · 1:04:22
Запись совещания, 3 участника
14:23
✅ Файл получен!
Запускаю обработку с диаризацией на 3 спикера. Готовность ~15 мин.
14:23
📦 Готово! Архив с результатом — во вложении. Пароль придёт после оплаты.
🔒
meeting_april.zip
52 KB · защищён паролем
14:38
Оплата · СБП
QR оплата
Пароль придёт в течение 5 мин. после перевода.
14:38

Что умеет система

👥

Разделение по спикерам

Автоматическая идентификация голосов. До 10 участников в одной записи. Итог — реплики подписаны именами, а не «Спикер 1».

Точные таймкоды

Каждая реплика привязана к временной метке с точностью до слова. DOCX содержит таймкоды — легко найти любой момент в записи.

📄

Форматы экспорта

DOCX — официальный протокол с форматированием. SRT — субтитры для видео. TXT — в базу знаний. MP3 — аудио из видео.

🔇

Шум и плохое качество

Работаем с записями из Zoom/Teams (эхо, артефакты сжатия), диктофонов, телефонных переговоров и полевых интервью.

🔗

Приём по ссылке

Можно прислать ссылку на YouTube, VK Видео или другой хостинг — скачаем и обработаем. Не нужно самостоятельно скачивать и пересылать тяжёлые файлы.

🌍

Русский и другие языки

Основная специализация — русский. Также поддерживаются английский и большинство европейских языков через мультиязычную модель Whisper.

Система в работе

Реальный результат: подкаст с 4 спикерами, загруженный по ссылке с Rutube. Система автоматически определила голоса, разметила реплики цветом и привязала к таймкодам.

LexiMedia AI — localhost
Интерфейс LexiMedia AI — транскрипт с диаризацией

Доставка результата

Вы получаете готовый файл до оплаты — и можете убедиться, что работа выполнена.

1
Работа выполнена
Транскрипция готова. Бот отправляет вам ZIP-архив — файл уже внутри, но защищён паролем.
2
Оплата по QR
Бот пришлёт QR-код прямо в чат — перевод через СБП. Сумма согласована в переписке.
3
Пароль — в течение 5 минут
После перевода пароль для распаковки придёт в чат — в течение 5 минут. Исходный файл удаляется.
🎁 Первые 2 минуты — бесплатно. Пришлите фрагмент, оценим качество перед заказом.

Почему качество выше облачного

В основе системы — открытый конвейер WhisperX с максимальной моделью large-v3, которую облачные сервисы используют только на платных тарифах. Здесь это стандарт для каждого заказа.

🧠

Whisper Large-v3

Лучшая публичная модель распознавания речи от OpenAI. Запускается локально — без ограничений по объёму и без очередей.

GPU-ускорение

Обработка на NVIDIA RTX с CUDA. Скорость транскрибации в 4–6 раз быстрее реального времени — час записи готов за 10–15 минут.

🎙

Диаризация голосов

Нейросетевая идентификация каждого спикера на уровне фонем. Результат — «Александр сказал...», а не «SPEAKER_00 сказал...».