Перейти к содержанию

Языки

Два языка, с которых начинается дата-инженерный стек: SQL для запросов к хранилищам, Python для ETL-скриптов и автоматизации.


SQL

Страница Описание
Основы и SELECT Таблицы, фильтрация, сортировка, LIMIT, NULL
JOIN и связи INNER/LEFT/RIGHT/FULL JOIN и соединение таблиц
Агрегаты и CASE COUNT/SUM/AVG, GROUP BY, HAVING и условия CASE
Подзапросы и CTE IN/EXISTS, коррелированные подзапросы, WITH и рекурсия
Оконные функции ROW_NUMBER, RANK, LAG/LEAD, фреймы
Операции над наборами UNION ALL, UNION, INTERSECT, EXCEPT
DML и транзакции INSERT/UPDATE/DELETE, RETURNING, BEGIN/COMMIT/ROLLBACK

Python

Страница Описание
Основы для DE Виртуальные окружения, работа с файлами, библиотеки DE-стека
pandas DataFrame, чтение CSV/Parquet/SQL, merge, дедупликация
Работа с API requests, авторизация, пагинация, retry, JSON → DataFrame