1. Что такое ETL?
ETL — это процесс транспортировки данных, при котором информацию из разных мест преобразуют и кладут в новое место. Аббревиатура расшифровывается как extract, transform, load, то есть «извлечь, трансформировать, загрузить».
2. Где используются ETL-процессы?
ETL-процессы используют аналитики и инженеры данных в IT-компаниях, столкнувшихся с проблемами большого объема данных и их расположения в разных источниках.
3. Какие преимущества и недостатки имеет ETL?
Преимущества ETL:
Недостатки ETL:
4. Чем отличается ETL от ELT?
В отличие от ETL, в ELT данные загружаются в хранилище целиком («raw data»), а уже там приводятся в порядок. Таким образом, в ELT сохраняется весь объем исходных данных, но возрастает стоимость хранения больших объемов сырых данных.
5. Какова последовательность этапов ETL-процесса?
Процесс состоит из шести основных шагов: