PDI

Готовим "PostgreSQL Bulk Loader" на PDI

Сегодня разберемся как максимально быстро загрузить данные в Postgresql при помощи PDI. Это делается при помощи шага "PostgreSQL Bulk Loader". В статье разберем тонкости настройки вставки данных и сравним скорости вставки обычным методом и Bulk Loader.

Что такое система PDI?

PDI (Pentaho Data Integration) - это ETL сервер, который написан на Java и разрабатывается компанией Pentaho.

Парсин сайта средствами PDI

Парсинг сайтов сегодня стал обязательным для многих информационных систем. Обычными задачами парсинга является извлечение цен конкурентов.

Готовим геокодирование от Яндекса на PDI

Сегодня разберемся, как получать геоданные объектов по их названию.

Готовим "Яндекс.Метрику".

Сегодня разберемся, как получать данные из "Яндекс.Метрики".

Пожалуй, самым интересным способом обработки данных является интеграция PDI + Н2.

Миграция по-быстрому

В данной статье пойдет речь, как перенести структуру и данные из одной БД в другую. Этот способ позволяет переносить данные между различными СУБД (Oracle, PostgreSQL, Mysql, h2 и другие). Практика не займет и 5 минут.

Готовим Google Analytics на PDI

У PDI есть интересная возможность - брать данные из аккаунта Google Analytics. В этом уроке рассмотрим работу плагина и произведем его настройку.