Назад

Big Parta, или работа с большими данными со студенческой скамьи

  • Автор Алима Умутбек
  • Дата публикации 16.08.17 14:30
  • 292 Просмотров

Первое кредитное бюро и Университет Нархоз заключили меморандум о совместной работе в области Big Data Science. Данная синергия является весьма эффективной, так как Нархоз стал первым университетом, внедрившим официальный факультет Big Data Science в Казахстане, а ПКБ является одним из крупнейших дата-хабов страны с глубокой экспертизой в вопросах хранения, обработки и использования данных.

«Сейчас мы готовим два основных проекта для студентов Университета. Это обмен опытом в части геоданных и биометрии. Студентам будут предложены отдельные задачи, а специалисты ПКБ будут помогать в их решении. Помимо этого, для работ студентов будет выделен отдельный модуль облачного сервиса FCB Visual Analytics, и результатами могут пользоваться аналитики финансовых и консалтинговых компаний в свободном доступе,» - поясняет Руслан Омаров, Генеральный директор Первого кредитного бюро.

«С сентября 2016 года мы начали активно обучать наших сотрудников и преподавателей по направлению Data Science. Была создана команда специалистов, которые прошли обучение на онлайн курсах Стэнфорда и MIT, а также на интенсивных курсах от специалистов из Европы и Сингапура. Понятно, что, зная только теоретические основы Data Science, хорошую образовательную программу не построить. Именно поэтому руководством Нархоза было решено начать работу по построению системы сбора и анализа внутренних данных. Так мы работу над такими проектами как, например, построение моделей для предсказания академических успехов обучающихся на основе среднесрочных показателей и других факторов, которые могут повлиять на это. Результаты таких моделей помогают нам понять на каком этапе возникают проблемы у студента, как мы можем помочь студенту перейти на уровень выше в обучении.

Также, в 2015-2016 году университет изменил формат выпускных квалификационных работ. С 2016 года студенты выпускного курса готовят не дипломные работы, которые в прошлом были не самого высокого качества, а дипломные проекты, включающие решение реальных проблем из бизнеса. Используя и сравнивая данные выпускников, мы также анализируем эффективность внедрения данной практики с помощью моделей Data Science.

Еще один проект, который мы реализовываем внутри ВУЗа, это проверка справедливости решения HR комитета в отношении повышения заработной платы профессорско-преподавательского состава. Исследование показывает, что в целом, компьютер принимает более справедливые решения в этом отношении нежели люди.

Мы не хотим останавливаться на достигнутом, поэтому считаем, что совместная работа с ПКБ будет для нас следующим важным этапом в работе большими данными», - прокомментировала Асылжан Акынова, Координатор проекта Data Science Университета Нархоз.

Аналитический и R&D центры ПКБ также ведут несколько проектов по изучению влияния ряда данных на финансово-кредитную дисциплину. Так, ПКБ находится в стадии завершения первого в Казахстане тестирования по использованию данных мобильных операторов в верификации и скоринге клиентов. Практика соседней России показывает хорошую применимость данных телекомоператоров – плюс 5%-7% к эффективности текущих скоринговых карт. Специалисты ПКБ полагают, что пилот будет достаточно успешен и у нас. Конечно, более успешный результат возможен при подключении всех операторов к этому сервису.

«Меньший оптимизм внушают сейчас данные коммунальных служб. Сложность корректного свода данных, слабое определение принадлежности коммунального долга к конкретному заемщику, разрозненность данных по хозяину и другим проживающим на объекте показывают низкий результат. Подобные данные мы в ПКБ для построения скормоделей пока не используем,» - отмечает Асем Нургалиева, Директор по развитию бизнеса Первого кредитного бюро.

Полезны для скоркарт и данные социальных сетей. Но и здесь аналитики сталкиваются с так называемым низким «матчболлом» - количеством успешно идентифицированных пользователей в социальных сетях. Сейчас около 2,3 млн. активных аккаунтов в Instagram,  560 000 – в сети Facebook и более 1 млн. активных аккаунтов Vkontakte. (данные по Казахстану от SMM Agency Agarty). Аккаунты могут быть заведены на разные имена, и сложно опознаваемы. Поэтому в вопросе эффективности «социального скоринга» идентификация пользователей играет важную роль. Практика показала, что скоринг на данных социальных сетей может применяться как добавочный коэффициент, когда уже использованы данные кредитной истории, платежеспособности, мобильного телефона.

Психометрические параметры – одни из самых стабильных. Психометрический скоринг применяется для клиентов без кредитной истории и каких-либо других, кроме социодемографических параметров, данных. Ответив на массив специально составленных вопросов, модель может быть предсказать вероятность выхода в дефолт заемщика.

Всего в активе ПКБ свыше 50 проектов разной модификации и сложности. Оценивается поведение клиента в Интернете, геоданные, кадровая история и многие другие факторы. Все они направлены на минимизацию кредитных и иных рисков фининститутов, технологичность процессов и предложение готовых сервисов предиктивной аналитики. Рыночная капитализация (goodwill) ПКБ составляет свыше 12  млрд. тенге.   

 

 


Поделись с друзьями :


Комментарии
Отслеживать URL:

Пока нет комментариев. Будь первым.