Подготовительные работы полностью закончены. Осталось только построить сводные таблицы и диаграммы.
Что такое сводная таблица? Вопрос довольно интересный. В литературе в интернете сводные таблицы часто сравнивают с OLAP-кубами. Сводная таблица представляет собой многомерный куб, к которому применяются операции агрегирования (суммы, среднего и т.д.). Другими словами, сводная таблица - таблица, построенная по требованию пользователя, где в качестве строк, столбцов и результирующих данных выступают значения столбцов исходного списка. Сводная таблица строится на списке данных и представляет собой некоторую проекцию списка в многомерное пространство. К сводной таблице можно применять разные фильтры.
Сводная таблица представляет собой таблицу:
| область фильтров | |
| область столбцов | |
| область строк | Область данных |
Вставка сводной таблицы происходит выделением данных (подготовленный список) и самой вставки на отдельный лист сводной таблицы. Потом в интересующие области вставляются названия столбцов исходного списка. В результате сводная таблица имеет в областях: строк, данных, фильтров, столбцов данные из столбцов исходного списка.
Почему пришли к понятию сводная таблица? Во-первых список не является наглядным. Во-вторых, это не очень быстрое представление результатов. По сути, сводная таблица может представить данные в виде привычной таблицы.
Рассмотрим на примере. Пусть требуется подсчитать по АЗС 1 суммарные продажи за период 2010 – 2011 года в разрезе месяцев.
Целевую таблицу, удобную для презентации и анализа, хотелось бы получить в таком формате:
| Товарооборот | 2010 год | 2011 год | ||||||
| АЗС/месяц | 1 | 2 | .. | 12 | 1 | 2 | .. | 12 |
| АЗС 1 | 10 | 12 | .. | 10 | 11 | 14 | .. | 14 |
Такую таблицу можно легко построить как сводную таблицу. В область строк поместить АЗС, в область столбцов поместить сначала год, потом месяц. В область данных поместить товарооборот. К товарообороту применить операцию суммирования (суммирование происходит по всем продуктам, которые продаются в 1 АЗС). Осуществить фильтрацию по АЗС 1. В результате получим следующее:
| Сумма по полю Товарооборот | 2010 | 2010 общий итог | 2011 | 2011 общий итог | ||||||
| Названия строк | 1 | 2 | .. | 12 | 1 | 2 | .. | 12 | ||
| АЗС 1 | 10 | 12 | .. | 10 | ∑ | 11 | 14 | .. | 14 | ∑ |
| Общий итог | 10 | 12 | .. | 10 | ∑ | 11 | 14 | .. | 14 | ∑ |
Получилась практически в точности требуемая таблица, где «1» в названиях строк это АЗС 1. Осталось отключить подведение итогов по строкам и столбцам. В результате мы имеем готовую таблицу.
Рассмотрим еще один пример целевой таблицы:
| Филиал | АЗС | 2010 год | 2010 общий итог | |||
| 1 | 2 | .. | 12 | |||
| 1 | АЗС 1 | 10 | 12 | .. | 10 | ∑ |
| АЗС 2 | 20 | 27 | .. | 15 | ∑ | |
| … | .. | .. | .. | .. | ∑ | |
| Общий итог по филиалу 1 | ∑ | ∑ | ∑ | ∑ | ∑ | |
Такую таблицу можно легко построить как сводную таблицу. В область строк поместить сначала филиал, потом АЗС, в область столбцов поместить сначала год и потом месяц. В область данных поместить товарооборот. К товарообороту применить операцию суммирования. Осуществить фильтрацию по филиалу 1.
Что такое сводная диаграмма? Это диаграмма, построенная по сводной таблице. К ней применимы все те же операции, что и к сводной таблице. Сводная диаграмма позволяет оперативно строить графики, необходимые для анализа (проецируя OLAP-куб на координатные оси, которые представляют собой данные из списка). Скорость построения серии графиков очень высокая.
| область фильтров | |
| Поля легенды(область столбцов) | |
| Поля осей (область строк) | Значения (область данных) |
В результате мы можем ответить очень оперативно, отвечать на вопросы с 1 – 7 (без квартальной разбивки). (Ссылка, где рассматривали вопросы)
Операции суммирования по списку можно произвести с использованием сводных таблиц.
Процесс этот довольно простой, и не требует колоссальной работы по перестроению самого списка. Например, поставленные в задаче 1 добавление нового показателя и добавление нового товара.
Добавление нового товара и АЗС не требует никакой дополнительной работы со списком. Ввод нового товара или АЗС соответствует добавлению новой строчки в список. Если мы используем шаблон для добавления, то откорректировать шаблон (добавив недостающие АЗС и товар).
Добавление нового параметра требует тоже не очень много работы (например выручки или квартала). Требуется добавить новый столбец в имеющийся список (столбец квартал или выручки) и заполнить значения. Далее по новому списку откорректировать диапазон данных сводной таблицы.
В проекте «Общий список» показана возможность решения задачи №1 силами офисного пакета. Анализ результатов для проекта составляет порядка 2-3 часов, после поступления данных. Для анализа требуется последовательно строить графики по всем интересующим объектам и целенаправленно отвечать на поставленные вопросы. Основным спасательным кругом данного проекта является работа со сводными таблицами и диаграммами. Проект может уложиться в установленные требования задачи №1.
Использование проекта обоснованно при небольшом количестве параметров (2-3) и объектов анализа. Большее количество параметров, делают практически не применимым использование проекта по ряду причин:
И для самых терпиливых предлагаю скачать файлы (Проекты по теме), которые основаны на данных Foodmart (база данных по магазину, которая является тестовой для проектов Pentaho CE. Более подробную информацию по БД можно найти в интерене или в разделе Pentaho CE). В каждом файле показана возможная схема реализиции проектов. Форматирование и красоту не стал наводить, так как более интересно показать, как это устроено изнутри.
