Робокозел, порно и анализ данных

Что заставляет молодых специалистов по анализу данных проводить воскресные вечера в обществе друг друга

The following two tabs change content below.
    Татьяна Чернова

    Алексей Натекин из DM Labs (Петербург) рассказывает о том, что заставляет студентов и аспирантов технических вузов, а также молодых специалистов по анализу данных   проводить воскресные вечера в тихом обществе друг друга.

    Я жду, когда на меня обратят внимание. Компания DM Labs проводит открытую «полу-учебную» лабораторию на Казанской, 7. В помещении еще люди, но все поглощены происходящим в своих лэптопах, в которых, видимо, кипит жизнь. За пределами экранов жизнь не кипит, даже муха не летает, которая всегда летает в кино, когда режиссер хочет передать сплин происходящего. Здесь время замерло и без мухи.

    «Мы занимаемся тем, что находится за кадром визуализаций: обработкой данных, алгоритмами. Все эти люди работают над своими проектами и задачами, — Алексей Натекин решил обратить на меня внимание, и я могу, наконец, взять в руки ручку. – Мы собираемся на абсолютно добровольных началах, здесь в офисе компании «ВКонтакте», в Москве – в офисе Deloitte. По возможности стараемся кооперироваться по принципу «Питер-Москва», то есть питерцы работает в связке с москвичами. Получается не всегда, но прецеденты есть».

    project-pic

    Специалисты, студенты, все, кому интересны big data, data science, в общем, анализ данных, собираются по воскресеньям, чтобы вместе работать над проектами. Некоторые из них, возможно, превратятся в научные статьи, другие – в интересные исследования, а часть, и это неизбежно, поскольку так и задумано, — в поводы к веселью и развлечению. Фразу «чтобы хорошенько угареть» Алексей повторяет довольно часто, каким-то образом умудряется выглядить при этом серьезным человеком.

    Алексей рассказывает о том, кто чем сейчас занимается. Хорошенькая Лера из Яндекса анализирует теги порнороликов, размещенных на сайте Xhamster, чтобы понять какие тэги жарнов порно с какими странами ассоциируются. Будучи изначально проектом Александра Семенова, исследователя из ВШЭ, ранее получалось, что вместе с тегом “Russian” чаще всего встречался тег «baby-sitter». Сейчас же выяснилось, что russian ближе к teens. Арабы с немцами оказались одиноки, а скандинавы — любителями винтажа. Ниже можно посмотреть на то, что получилось на прошлой встрече, и самостоятельно решить как трактовать предпочтения жителей средиземноморья.

    2

    «Мы делаем реальные проекты, а не устраиваем групповую психотерапию, — продолжает объяснять происходящее Алексей. Мы не против лекций, где все приходят послушать да поболтать, а если кто-нибудь хочет что-то рассказать и провести лекцию, то это даже приветствуется. Но сейчас мы ориентированы именно на практику. Тем более, нет лучшего формата для обучения анализу данных, чем практика.

    Один из проектов лаборатории – научиться управлять козлом. Для этого, в рамках эксперимента, ему нацепили камеру GoPro, а в скором будущем планируется к голове подвести электроды, чтобы сопоставить то, что животное видит и то, что у него происходит в голове. Следующий шаг — повесить на него шлем виртуальной реальности, чтобы с помощью подаваемых на шлем образов козлом можно было управлять. «Представьте, — смеется Алексей, — у Вас есть собственный радиуправляемый козел! Было бы клево, если бы получилось. По крайней мере нам не жалко потратить время на то, чтобы получить кучу веселья!».

    goatpro goatpro2

    Я чувствую, что демонстрирую полнейшее отсутствие чувства юмора, пытаясь разобраться в целеполагании ребят, или хоть бы как-то рационализировать их потраченные часы на обработку собранных козлом видео «от первого лица».

    Другой пример, уже более прикладного проекта, это то, чем занимается Володя. Он пишет алгоритм, который бы автоматически извлекал бы mind maps (карты знаний, — тут же переводит себя Алексей) из кучи текстов. Сейчас он применется к текстам студенческих эссе, собранных в рамках одного из конкурсов сайта kaggle. Для этого алгоритм должен проанализировать тексты, построить иерархию тем и подтем, проведя кластеризацию… В результате, после визуализации за считанные минуты можно будет увидеть о чем эти тексты. «Например, у меня есть гипотеза, что пропустив через такой алгоритм Библию, мы увидим, что тематически Бог и Дьявол будут близки друг к другу». Но пока алгоритм в разработке. А следующей его жертвой будет не Библия, а цикл книг Джорджа Мартина, по которому сейчас снимается сериал «Игра Престолов».

    Наш разговор прерывается, впереди skype-сеанс с Москвой. Мы договариваемся снова пересечься.

    Техническая справка

    Алексей Натекин – со-основатель компании DM Labs, аспирант матмеха СПбГУ и Технического университета Мюнхена. В 2014 году совершил тур по городам России в качестве участника science slam.

    фото 1 фото 2 фото 3 фото 4

    Похожие новости: