МОСКВА, 2 дек -. Российские ученые научат ИИ распознавать атаки мошенников с поддельными документами — для этого они объединили 8 тысяч изображений с поддельными удостоверениями личности РФ, СНГ и других стран в датасет, рассказали в Smart Engines.
«Исследователи российской ИИ-компании Smart Engines представили первый в России масштабный датасет с поддельными документами – MIDV-DM. Он включает 8 тысяч изображений с удостоверениями личности РФ, СНГ и других стран. Вошедшие в набор образцы были изготовлены с помощью наиболее распространенных у мошенников методов подделки. Датасет позволит разработчикам со всеми мира обучать, тестировать и совершенствовать антифрод-системы на базе ИИ», — сказали в компании.
В основу датасета легли образцы внутреннего паспорта РФ, национальные паспорта и ID-карты Азербайджана, Латвии, Эстонии, Финляндии и других государств. Также разработчики использовали такие манипуляции с документами, как вставка текстовых полей или фото из «донорского» документа, «маскирование» отдельных полей документа, склеивание разных фрагментов в один образ, вставка посторонних объектов – эмблем, голограмм и др.
Такой набор данных, отметили в компании, позволит повысить точность антифрод-решений, что актуально на фоне участившихся случаев мошенничества с поддельными документами. Согласно данным ежегодного исследования специалистов Smart Engines и юридической фирмы Intellect, количество уголовных дел по фальсификации, изготовлению и обороту подделок (ст. 327 УК РФ) увеличилось на 34% и составило 3,9 тысячи в 2024 году.
«В датасет вошли подделки с изменением подписи, фотографии держателя и отдельных полей документа – то есть полный спектр типичных атак, с которыми на практике сталкиваются банки, МФО и госструктуры. Это позволит ИИ-системам учиться с повышенной точностью видеть не только замененные ФИО, но и сложные структурные несоответствия в документе», – прокомментировал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
В дальнейшем компания планирует развивать собственную антифрод-систему «Шерлок 2о», которая способна одновременно работать с изображениями документов из оптического ультрафиолетового и инфракрасного спектров, текстовыми полями, данными NFC-чипа, штрих-кодами, метаданными и сигнатурами.
Источник: РИА Новости
