Все материалы Назад
Публикации

Марианна Данилина, АФТ: сейчас все больше инструментов, включая нейросети, используется во всех направлениях банковского бизнеса — от первичного отбора до глубокого изучения аспектов бизнеса клиентов

Марианна Данилина, АФТ: сейчас все больше инструментов, включая нейросети, используется во всех направлениях банковского бизнеса — от первичного отбора до глубокого изучения аспектов бизнеса клиентов
Данные из соцсетей и экосистем, анализ по фото, галлюцинирование и китайский путь. РБК поговорил с разработчиками и финансистами, которые занимаются ИИ в банках, — они объяснили, что ИИ знает о клиентах и какие данные анализирует при принятии решений.

Данные из соцсетей и экосистем, анализ по фото, галлюцинирование и китайский путь. РБК поговорил с разработчиками и финансистами, которые занимаются ИИ в банках, — они объяснили, что ИИ знает о клиентах и какие данные анализирует при принятии решений.

Искусственный интеллект все глубже внедряется и в глобальный, и в российский финансовый сектор. Банки отдают на аутсорс ИИ анализ клиентов, делятся с ним данными о пользователях и даже доверяют принятие решений. Наряду с технологическими компаниями именно банки активно встраивают эту технологию в свои процессы, и именно для их клиентов результаты работы ИИ могут быть наиболее заметны (например, при принятии решений по заявкам на кредит или ипотеку).

Массовое внедрение ИИ в экономику уже неизбежно, заявил в интервью телеканалу РБК глава Сбербанка Герман Греф: «Для России, мне кажется, у нас просто другого выхода нет. Экономика может расти либо когда растет население, либо когда резко повышается эффективность труда. С ростом населения у нас все понятно — нам не грозит это в ближайшие десятилетия. У нас остается только один путь — повышение производительности. И более уникальных возможностей, чем сделать это с помощью ИИ, просто не существует. Поэтому мы обречены на то, чтобы массово внедрять искусственный интеллект, компенсируя тем самым нехватку рабочей силы».

РБК поговорил со специалистами по искусственному интеллекту в сфере финансов, чтобы разобраться:

  • что знает ИИ о банковских клиентах и какую роль играют данные из соцсетей, экосистем и поиска;
  • какие решения он принимает и может ли ошибиться;
  • что делать с галлюцинированием ИИ;
  • по какому пути в контроле за технологией стоит идти России;
  • а также нужно ли финансистам опасаться, что ИИ заберет у них работу.

Чем занимается ИИ в банках

Алексей Каширин, глава Центра продвинутой аналитики Альфа-банка:

«Сейчас весь наш розничный кредитный процесс покрыт моделями. И если вначале задача сводилась к так называемой бинарной классификации, то есть решению о том, выдавать кредит или нет, то сейчас это целый комплексный портфель моделей. В него входит и бинарная классификация, и подбор персональных условий, потому что данные позволяют оценить, какую сумму мы можем дать, на какой срок, на каких условиях каждому конкретному заемщику».

Марианна Данилина, руководитель управления стратегии, исследований и аналитики Ассоциации ФинТех:

«В большинстве российских банков 70–90% решений по кредитам принимаются автоматизированно, особенно по небольшим кредитам и кредитным картам. Для крупных займов или корпоративных кредитов в таком масштабе автоматизированные скоринговые модели не используются в связи с уникальностью сделок и подходов к клиентам. Однако сейчас все больше инструментов, включая нейросети, используется во всех направлениях банковского бизнеса — от первичного отбора до глубокого изучения аспектов бизнеса клиентов».

Александр Троицкий, лидер направления «Продукты для бизнеса на основе ИИ» банка «Точка»:

«Скоринг для кредитов на мелких чеках в крупных технологических банках в основном автоматизирован почти на 100%. Размер таких чеков в каждом банке определяется индивидуально: где-то мелкий чек может быть до 5 млн руб., а где-то — значительно больше. Крупнейшие банки, где больше капитала и меньше концентрация рисков, зачастую могут себе позволить автоматизацию на гораздо более высоких суммах в отличие от более маленьких финансовых организаций.

Однако почти во всех банках есть та высокая сумма чека, где в процесс обязательно подключается андеррайтер или кредитный комитет из нескольких человек. Такой комитет принимает во внимание анализ нейросетей, но также и много другой информации, которой нет в публичном доступе и на которой нейросеть обучать невозможно. Окончательное решение на больших суммах выносится на основе фактов, которые машина просто не может учесть».

Что именно считать ИИ

Хотя публичные компании часто используют понятие «искусственный интеллект» при описании своих технологических разработок, далеко не каждый такой продукт и не каждое решение работают на основе того ИИ, который приобрел популярность в последние годы. Например, технологии больших данных и машинного обучения, которые работают с большими массивами информации, начали разрабатываться еще с 2000-х, а особое распространение получили в 2010-х годах.

Поворотным моментом стало создание компанией Google нейросетевой модели в 2018 году для обработки естественного языка (Natural language processing, NLP). Теперь банки все больше используют нейросети на базе NLP для анализа большого массива данных. Именно NLP умеет анализировать текстовую информацию в скоринговом процессе.

Тренд именно последних лет — генеративный искусственный интеллект, более доступный широкой аудитории и фактически позволяющий пользователю разговаривать с ИИ (например, если это ассистент или ИИ-агент). Но в отличие от предыдущих поколений ИИ генеративная технология хуже работает со строгими параметрами и числовыми данными, а также может галлюцинировать — фактически додумывать ответы на вопросы, на которые не знает ответа. С каждой новой версией масштаб этих проблем становится меньше, но полностью они пока не решены.

Откуда берутся данные для оценки клиента

Покупки и переводы

Алексей Каширин: «Одним из самых ценных и информативных источников для банков являются транзакционные данные. Транзакции — это не табличные, а последовательные данные, поэтому, для того чтобы их полноценно использовать, как раз нужны нейросети. Классическое машинное обучение с ними уже не справится».

Разговоры и текст

Особый писк моды последних лет — это мультимодальные данные, то есть, когда банки используют не только числа из табличек или транзакционные данные, но и текстовые, аудио-, фото- и видеоданные. В перспективе сценарии их использования будут самыми разнообразными, например использование записи разговора клиента с call-центром.

Текстовые источники — это всё что угодно, например данные операторов фискальных данных. Их можно получать через разные каналы, в том числе от ФНС. Также анализируемыми данными может быть история коммуникации клиента в чате поддержки. Всё это мы начали использовать при скоринге физических лиц. Это новый уровень сложности, который ещё года три-четыре назад был недоступен».

Информация с маркетплейсов

Александр Троицкий: «Также ценными для банков стали данные селлеров на маркетплейсах: остатки на счетах, продажи товаров, возвраты и т.п. В передаче таких данных заинтересованы сами селлеры, потому что они хотят получить лучший кредит на лучших условиях и для этого им нужно предоставить о себе как можно больше информации».

Социальные сети, экосистемы, история поиска и «цифровой след»

Марианна Данилина: «Источниками информации могут быть социальные сети, транзакции на маркетплейсах, «цифровой след клиента», история поиска на сайтах, собственные экосистемы и т.п. Раньше банки получали эти данные через партнёров (в первую очередь БКИ и телеком-операторов), а теперь могут анализировать их напрямую с помощью ИИ через собственные экосистемные решения».

Персонализация скоринга строится на базе анализа «цифрового следа» и всех транзакций конкретного клиента на сторонних платформах. Это могут быть и платежи на «Госуслугах», и данные «Яндекса», «Авито», «Озона», WB. Если в связке посмотреть на все эти данные, то можно сделать вывод по активности физических лиц и спрогнозировать, какие именно продукты будут востребованы конкретным клиентом».

Красные флаги

Марианна Данилина: «Если человек посещает сайты, которые связаны с игровой активностью, ставками на спорт, это может быть признаком лудомании и причиной для отказа в кредите. Если человек посещает заблокированные сайты или сайты из чёрных списков, то это также может быть определённым триггером для отказа в кредитовании».

Может ли ИИ ошибиться

Александр Троицкий:

«Безусловно, нейросети могут ошибаться при выдаче кредита, но от таких же ошибок не застрахованы и андеррайтеры. Ведь, даже если вы проанализировали тысячу компаний со схожими показателями и все они были дисциплинированными заемщиками, никто не застрахован от того, что появится 1001-я компания, которая станет аномальным исключением из статистики.

Для оценки работоспособности модели банки смотрят на коэффициент Джини: 100% предсказательной силы означает, что модель идеально предсказала всех заемщиков, кто выплатит кредит, а кто столкнется с дефолтом. 0% означает, что модель предсказывает поведение заемщиков рандомно. Нормальный средний коэффициент Джини для банков — это 50% плюс. Но в зависимости от сегментов клиентов показатель может отличаться. Для физических лиц, допустим, 60% плюс, для МСП — 50% плюс, для корпоративного бизнеса — 80%, а в сегменте «строительная отрасль» или ИП получить 40% уже будет неплохо».

Алексей Каширин:

«Особенность любого ИИ заключается в том, что это вероятностный математический алгоритм. С одной стороны, решение может быть проверено с помощью соответствующих математических тестов, с другой — вероятностная природа означает, что время от времени любой алгоритм будет ошибаться. Без исключения.

Любая модель, которую мы используем, будет пропускать тех заемщиков, которые не вернут долг, и одновременно с этим отсекать тех, кто теоретически был бы хорошим заемщиком. Доля таких ошибок зависит от качества моделей и заданных человеком внешних правил. Роль человека во всем этом процессе — поставить цель и задать внешние правила, исходя из цели, например в соответствии с риск-аппетитом банка. На основе этих правил можно проверять решения, принятые ИИ: находятся ли заданные показатели по объему выданных кредитов, просрочки и т.п. на заданном уровне или есть какие-то отклонения».

Риски «чёрного ящика»

Алексей Каширин:

«При использовании ИИ для анализа данных важно иметь в виду одну особенность — практически все полученные таким образом выводы неинтерпретируемы. В мире есть интересные эксперименты, когда в том же кредитном скоринге начали использовать даже фотографии клиентов. Звучит максимально контринтуитивно — какую информацию можно получить из фотографий? Или в случае с текстом — что в нём может повлиять на решение ИИ одобрить кредит или отказать в выдаче?

Объяснить это практически невозможно, однако это может работать. Для людей это неприятная особенность — один из барьеров внедрения искусственного интеллекта в бизнес-процессы, потому что невозможно объяснить, почему нейросеть дала тот или иной ответ».

Марианна Данилина:

«То, как появился результат работы модели, сложно интерпретировать человеческими способностями, поэтому зачастую это “чёрный ящик”. В банковском скоринге модель на базе ИИ может принять решение об отказе в выдаче кредита клиенту в случае, если он окажется полным тёзкой человека из какого-то чёрного списка. Или дискриминировать клиентов из-за ошибочных данных в алгоритмах или использования непрозрачных критериев. Поэтому такие риски всё равно должны закрывать люди на финальной стадии одобрения или в случае нестандартных кейсов».

Опасно ли внедрять галлюцинирующий ИИ

Марианна Данилина:

«Вокруг генеративного ИИ и особенно больших языковых моделей российских разработчиков много хайпа. Однако при пилотировании этих инструментов часто выясняется, что ИИ-модели обучены на недостаточном количестве данных в отличие от зарубежных аналогов и их еще предстоит дообучать и настраивать».

Алексей Каширин:

«Есть процессы, куда я бы вообще максимально осторожно внедрял генеративный ИИ. Взять тот же кредитный скоринг: там генеративный ИИ появится в последнюю очередь, потому что эта технология может галлюцинировать. Вопрос с галлюцинациями генеративного ИИ глобально не решен. Сейчас если генеративный ИИ галлюцинирует, то это невозможно выявить каким-то автоматическим способом. Это существенно ограничивает использование технологии в разных чувствительных процессах».

Например, до появления генеративного ИИ все чат-боты были сценарные, то есть работали по сценарию возможного диалога, который определяли люди. Худшее, что могло случиться в таком диалоге, — чат-бот просто не решит проблему клиента. В случае же с генеративным ИИ никакого сценария нет. И теоретически генеративный искусственный интеллект может ответить всё что угодно, нарушая все нормы морали, этики, законодательства и так далее. Гарантировать, что этого не произойдёт, сейчас не может ни одна компания. Именно поэтому возникает необходимость цензурирования.

Должны ли власти зарегулировать ИИ

Алексей Каширин:

«Наш регулятор (Банк России. — РБК) занимает максимально конструктивную позицию. Он понимает, что готового ответа о регулировании ИИ нет, и поэтому находится в диалоге с рынком. Пока ИИ законом не зарегулирован, но уже появился кодекс этики разработки искусственного интеллекта, и там регулятор принимал самое активное участие. То есть, с одной стороны, это не закручивание гаек, чтобы не стопорить развитие технологий, а с другой стороны, руку на пульсе держать надо».

Марианна Данилина:

«По-хорошему, регулировать ИИ не надо, если нет рисков. И просто так делать это никто не будет. Но если такие риски появятся, то появится и соответствующее регулирование».

Существуют несколько показательных примеров регулирования ИИ, которое неразрывно связано с данными. В Китае законодательно закреплена ответственность разработчиков за ошибки в данных, а государство является их владельцем и оператором обмена. Это создаёт прозрачные условия для управления, но для нас Китай не является примером — вряд ли вы захотите жить под таким строгим контролем.

Во Франции законодательство о данных ещё более жёсткое — оно ничего не запрещает, но в то же время очень сложно соответствовать регуляторным требованиям с точки зрения использования клиентских данных. Это препятствует развитию финтеха.

В США действуют очень жёсткие законы, которые касаются именно персональных данных, но отсутствует регулирование ИИ. Поэтому там ИИ, в том числе генеративный, очень активно развивается. Но при этом существует очень много рисков, связанных с дипфейками, мошенничеством и прочим.

На мой взгляд, Россия рано или поздно пойдёт по китайскому пути, потому что появляется очень много мошеннических схем с данными. В перспективе такого мошенничества будет становиться всё больше и больше. Все осознают, что надо защищаться, и появятся более жёсткие законы о регулировании.

Отнимет ли ИИ работу в банках

Алексей Каширин:

«Есть популярная страшилка, что ИИ отнимет рабочие места у людей. На самом деле автоматизация процессов не отнимает существующие рабочие места, а позволяет делать больше задач текущими ресурсами. Потому что в России сложился дефицит кадров и зачастую просто некого нанимать. Если бы не было ИИ, то нам нужен был бы такой ручной ресурс, которого не существует в природе».

Марианна Данилина:

«Сегодня все крупные банки развивают внутреннюю IT-разработку, и зачастую доля IT-специалистов составляет 20–25% от общей численности компании. Избавляться от ценных и квалифицированных IT-кадров на этапе их дефицита крупный бизнес, конечно же, не спешит. Тем более что практические кейсы внедрения LLM (большие языковые модели. — РБК) и GPT-моделей не показывают такого потенциала, чтобы массово сокращать сотрудников.

Потенциал сокращения вовлечения людей в работу, может быть, в первую очередь в операционных процессах, маркетинге, документообороте. Особенно в последнем: уже вся документация распознаётся путём оптического распознавания на базе инструментов ИИ, и за последние десять лет банки действительно сократили или переместили внутри компании около 60% сотрудников, которые раньше работали с документами. Однако в целом использование ИИ влияет на структуру поиска новых кадров и на то, чем сотрудники занимаются внутри банка».

Ещё один аргумент в пользу того, что ИИ не заменит всех сотрудников в банках, — это экономическая целесообразность. Разработка решений на основе ИИ и их внедрение могут стоить дороже, чем поддержание штата из нескольких человек. Например, внедрение решения может стоить 500 млн руб., а десять сотрудников с зарплатой 200 тыс. руб. обходятся примерно в 24 млн руб. в год. В данном случае экономически нецелесообразно внедрять технологию.

Как ИИ меняет функционал сотрудников

Алексей Каширин:

«Например, промпт-инжиниринг (работа с ИИ-системами) — профессия, которой ещё два года назад вообще не было, а сейчас все технологичные компании массово нанимают таких специалистов. Поэтому с развитием ИИ запрос на человеческий ресурс никуда не денется, более того, он будет очень быстро видоизменяться, поэтому крайне важно, чтобы система образования успевала реагировать на новые вызовы».

Марианна Данилина:

«Остаётся большой запрос на людей, которые руководят проектами по разработке, импортозамещению, оптимизации процессов, а также на специалистов для взаимодействия с премиальными клиентами. Люди устали разговаривать с роботами. Особенно премиальные клиенты и корпоративный бизнес хотят общаться только с живым человеком. Поэтому дальше клиентская поддержка будет развиваться по двум направлениям: для премиальных и крупных корпоративных клиентов оставят персональных менеджеров, а для массового сегмента банки будут персонализировать виртуальных помощников».

Авторы:

Евгения Чернышова, Антон Фейнберг

Источник: РБК Pro

Подпишитесь на новости

Подпишитесь на новости

И узнавайте о последних событиях и мероприятиях ассоциации