Как понять, что собеседник в видеозвонке — не настоящий человек
Опубликовано: 28.05.2026
Мошенничество через видеосвязь перестало быть сюжетом из научной фантастики. За последний год зафиксированы десятки случаев, когда criminals подменяли лица в реальном времени во время звонков в Zoom, Skype или Telegram. Цели варьируются: от запроса перевода денег от имени начальника до шантажа с использованием скомпрометирующих материалов, сгенерированных из открытых фотографий. Технология deepfake porn maker https://slygen.ai/ru/features/generate-video, изначально созданная для создания фейковых откровенных видео, дала толчок развитию алгоритмов подмены лиц, которые теперь применяются далеко за пределами своей первоначальной ниши.
Разница между старыми видеомонтажами и текущими дипфейками в том, что последние работают в реальном времени. Человеку на другом конце провода не нужно быть похожим на жертву — достаточно базовой модели лица и нескольких секунд обработки. Понять, что перед вами не живой собеседник, можно по ряду визуальных и поведенческих маркеров.
Проблемы с контуром лица и границами
Самый очевидный дефект текущих дипфейков — нестабильность границ подменённого лица. Алгоритм накладывает одну текстуру на другую, и на стыке возникают артефакты. В статичном кадре это незаметно, но при движении начинают проявляться микросдвиги.
На что смотреть:
- Контур челюсти и подбородок. Если край лица словно «плавает» относительно шеи или воротника одежды — это тревожный сигнал. Особенно заметно, когда собеседник поворачивает голову в профиль.
- Область ушей. Уши часто остаются от оригинального лица, потому что их сложно подменить без явных искажений. Если форма ушей резко меняется при повороте головы — перед вами генерация.
- Волосы на лбу и висках. Чёлка и пряди, пересекающие границу лица, обычно обрезаются или дублируются неестественным образом.
Попросите собеседника слегка наклонить голову вперёд и назад. При таких движениях большинство реал-тайм дипфейков выдают себя рваными границами или «проваливанием» фона в область лица.
Освещение и отражения, которые не сходятся
Живое человеческое лицо отражает свет сложным образом: блики на лбу, носу и скулах зависят от положения источника света, текстуры кожи и микрорельефа. Дипфейк накладывает плоскую текстуру на трёхмерную модель, поэтому освещение часто не соответствует сцене.
Типичные признаки:
- Блик на очках не совпадает с направлением света на лице. Если свет падает слева, а блик в очках — справа, что-то не так.
- Отсутствие теней в естественных местах: под носом, в складках вокруг рта, в углублениях у глаз.
- Лицо выглядит слишком «гладким» или, наоборот, имеет равномерную зернистость, не зависящую от освещения.
Если в комнате есть несколько источников света (окно + настольная лампа), живое лицо покажет сложную игру теней. Дипфейк обычно упрощает эту картину до одного доминирующего направления.
Синхронизация губ и звука
Липсинк — исторически слабое место любой подмены лиц. Несмотря на прогресс, в реальном времени алгоритмы всё ещё ошибаются на определённых звуках. Русский язык с его обилием шипящих, аффрикат и редуцированных гласных создаёт особые трудности для генеративных моделей.
Обратите внимание на моменты, когда собеседник произносит слова с сочетаниями «шч», «ст», «цв», «вз». Губы могут двигаться с запаздыванием или, наоборот, опережать звук. Ещё один характерный баг — «залипание» губ в одной позиции на несколько миллисекунд, прежде чем перейти к следующему звуку.
Метод проверки: задайте вопрос, который требует развёрнутого ответа с цифрами или техническими терминами. Когда человек произносит незнакомые или сложные для него слова, артикуляция становится менее автоматической — и именно здесь дипфейк ошибается сильнее всего.
Мимика, которая не дотягивает до живой
Человеческое лицо совершает десятки микровыражений в секунду, большинство из которых мы не осознаём. Морщинка у внутреннего угла глаза при искренней улыбке, лёгкое напряжение круговой мышцы рта при сомнении, едва заметное прищуривание — всё это формирует ощущение «живого» лица.
Дипфейки в видеозвонках обычно работают с ограниченным набором базовых выражений. Результат выглядит как актёр с ботоксом: основные движения есть, но тонкой мимики нет. Лицо перемещается между состояниями «нейтральное», «улыбка», «серьёзное» без промежуточных переходов.
Особенно показательно поведение во время пауз. Живой человек в моменты обдумывания ответа моргает, слегка смещает взгляд, шевелит губами. Дипфейк в паузе часто замирает в неестественно статичной позе — алгоритм не знает, какое выражение применить, и удерживает предыдущий кадр.
Реакция на неожиданные действия
Самый надёжный способ проверить подлинность собеседника — сделать то, чего алгоритм не ожидает. Не нужно устраивать провокации, достаточно простых действий, выходящих за рам типичный сценарий звонка.
- Попросите поднять руку и показать пальцы. Дипфейк подменяет только лицо, и руки останутся от исходного видео или будут отсутствовать. Если собеседник отказывается под предлогами — это не доказательство, но повод насторожиться.
- Задайте вопрос о чём-то за кадром. «Что у тебя на полке за спиной?» или «Какого цвета у тебя кружка?» Живой человек обернётся или хотя бы переведёт взгляд. Дипфейк продолжит смотреть прямо в камеру, потому что алгоритм привязан к положению лица относительно объектива.
- Включите дополнительный источник света. Резкая смена освещения собьёт баланс теней, и артефакты станут заметнее.
Контекстные красные флаги
Технические признаки важно дополнить контекстным анализом. Мошенники, использующие дипфейки, работают по сценариям, и эти сценарии имеют узнаваемые паттерны.
Срочность. Звонок с неожиданной просьбой перевести деньги, подписать документ или поделиться конфиденциальной информацией — классический приём. Дипфейк добавляет к этому иллюзию личного контакта, которая снижает критичность мышления.
Необычный канал связи. Если руководитель, с которым вы обычно общаетесь в мессенджере, внезапно звонит по незнакомому номеру в Zoom — это аномалия. Уточните через привычный канал, действительно ли он звонил.
Отказ от альтернативной верификации. Предложите подтвердить личность через код в SMS, повторный звонок по знакомому номеру или вопрос, ответ на который знает только настоящий человек. Мошенник будет уходить от таких проверок, ссылаясь на спешку или технические проблемы.
Ограничения текущих технологий
Стоит понимать, что качественный дипфейк в реальном времени требует серьёзных вычислительных ресурсов. Мошенники среднего уровня используют относительно простые модели, которые легко распознать при внимательном рассмотрении. Высококачественная подмена, которую не distinguить невооружённым глазом, существует, но её применение ограничено стоимостью и сложностью настройки под конкретную цель.
Практический вывод: если у вас есть основания сомневаться в подлинности собеседника, и вы замечаете хотя бы один-два описанных выше признака — вероятность мошенничества высока. Не стоит пытаться «разоблачить» собеседника прямо в звонке. Лучше прервать разговор и связаться с человеком через независимый канал.
Технологии подмены лиц продолжают улучшаться, и то, что сегодня выглядит неестественно, через пару лет может стать неотличимым. Но пока алгоритмы догоняют реальность, внимательность к деталям остаётся самым доступным инструментом защиты.