Data Scientist — это эксперт по аналитическим данным, который обладает техническими навыками для решения сложных задач, а также любопытством, которое помогает эти задачи ставить. Они частично математики, частично компьютерные ученые и частично трендспоттеры.
Data Scientist требует реальных и практических знаний методов статистического анализа данных, навыков построения математических моделей (от нейронных сетей до кластеризации, от факторного до корреляционного анализов), работы с большими массивами данных и уникальной способности находить закономерности. Но это все лирика. Давайте теперь по делу.
Как сказал DJ Patil, бывший главный научный сотрудник отдела научно-технической политики Соединенных Штатов, — «Data scientist — это специалист с уникальным сплавом навыков, который делает удивительные находки и воплощает фантастические истории — и все это благодаря данным».
Пример из жизни Data Scientist: «Джонатант Голдман, физик из Стэнфорда, устроился на работу в социальную сеть LinkedIn, и начал заниматься чем-то, что нельзя было измерить в KPI или посмотреть на конечный результат: сайт, исправление бага, внедрение фичи. Пока команда разработчиков ломала голову над тем, как модернизировать сайт и справиться с наплывом посетителей, Голдман строил прогностическую модель, которая подсказывала владельцу аккаунта LinkedIn, кто еще из пользователей сайта может оказаться его знакомым. Убедив руководство компании опробовать его новую модель, Голдман приносит соцсети миллионы новых просмотров и значительно ускоряет ее рост».
- Сбор большого количества неуправляемых данных и преобразование их в более удобный формат.
- Решение бизнес-задач с использованием данных.
- Работа с различными языками программирования, включая SAS, R и Python.
- Работа со статистикой, включая статистические тесты и распределения.
- Использование аналитических методов, таких как машинное обучение, глубокое обучение и текстовая аналитика.
- Сотрудничество с ИТ и бизнесом в равной мере.
- Поиск порядка и шаблонов данных, а также выявление тенденций, которые могут помочь в достижении конечного бизнес-результата.
А вот термины и технологии, которые надо знать будущему Data Scientist:
- Визуализация данных: представление данных в графическом формате, чтобы их можно было легко проанализировать.
- Машинное обучение: отрасль искусственного интеллекта, основанная на математических алгоритмах и автоматизации.
- Глубокое обучение: область изучения машинного обучения, которая использует данные для моделирования сложных абстракций.
- Распознавание образов: технология, которая распознает шаблоны в данных (часто используется взаимозаменяемо с машинным обучением).
- Подготовка данных: процесс преобразования необработанных данных в другой формат, чтобы их было проще потреблять.
- Текстовая аналитика: процесс анализа неструктурированных данных для получения ключевых бизнес-идей.
Помимо прочего, нужно знать и понимать:
- Статистику и машинное обучение.
- Языки программирования SAS, R или Python.
- Базы данных MySQL и Postgres.
- Технологии визуализации данных и отчетности.
- Hadoop and MapReduce.
Сайт https://indigo.co.ua/data-science/ предлагает Вам профессиональных специалистов по аналитическим данным. Все Ваши задачи будут решены. Зайдите на удобный, а главное, интуитивно понятный сайт, ознакомьтесь с ценами и услугими.
Комментарии: