В этом модуле вы узнаете, как агрегировать и сводить в единую таблицу данные из разных таблиц, чтобы находить более глубокие и неочевидные инсайты.
Сводные таблицы
Сводные таблицы — это просто функциональность, которая позволяет агрегировать данные, чтобы отвечать на какие-то вопросы. Пожалуй, это ключевой инструмент для аналитики в Excel, настоящая киллер-фича.
Вместо этого инструмента можно использовать функции SUMIF COUNTIF — то есть подсчитать сумму, если данные удовлетворяют определенным условиям. Однако это займет очень много времени.
Что можно делать с помощью сводных таблиц: считать суммы, максимальные, минимальные, средние значения, количество уникальных значений, общее количество значений, медианы, стандартные отклонения.
Например, у нас есть такие данные: город, выручка, количество покупок и месяц, за который были произведены эти покупки. К нам приходит руководитель и спрашивает: «А сколько суммарно товаров в Москве мы продали за последние два месяца?»
Да, можно сделать это с помощью небольшой формулы. Однако если нам надо выбрать такие данные по 250 городам, задача станет сложнее. Вот как это выглядит в Google Spreadsheets:
Задание для самостоятельной работы
Эти задания помогут закрепить теорию. Выполнять их необязательно, но очень желательно — только практика делает знание настоящим. Задания для самостоятельной работы не проверяются, но вы можете обсуждать их с опытными знакомыми и коллегами, а также в закрытом сообществе в Slack.
Мы подготовили учебную Google-таблицу с данными про объявления московской недвижимости. С помощью этой таблицы вы сможете закрепить знания: подготовить данные, соединить таблицы, получить основные инсайты о рынке московской недвижимости.
Каждая запись в таблице — объявления о продаже апартаментов. В них содержатся следующие характеристики:
- возраст дома, в котором расположена квартира;
- расстояние до метро;
- расстояние до центра города;
- количество комнат;
- размер квартиры;
- этаж;
- наличие первого жилого этажа в доме;
- городской округ;
- тип дома;
- сервис, в котором объявление было выставлено;
- стоимость квартиры.
Также в документе есть три словаря, которые нужны для задания: справочник округов, справочник по типу дома, справочник по названиям сайтов, на которых может быть выставлено объявление.
Вопросы, на которые надо ответить — от простого к сложному:
- Где средняя цен на однокомнатную квартиру самая низкая?
- В каком округе больше всего объявлений?
- В каком округе самый старый дом?
- В каком типе дома двухкомнатная квартира стоит дороже?
- Сколько % от всех объявлений выставлены на Яндексе?
- Можно ли сказать, что источник объявления и средняя стоимость квартиры связаны? Если да, то в каком сервисе (Яндекс, ЦИАН и т.д.) в среднем квартиры дороже?
- Какова максимальная цена квартиры, выставленной на ЦИАНе, при условии, что квартира находится в западном административном округе, в доме с количеством этажей от 5 до 10 и первым этажом, а площадь квартиры больше 50 квадратных метров?