Языки
Два языка, с которых начинается дата-инженерный стек: SQL для запросов к хранилищам, Python для ETL-скриптов и автоматизации.
SQL
| Страница |
Описание |
| Основы и SELECT |
Таблицы, фильтрация, сортировка, LIMIT, NULL |
| JOIN и связи |
INNER/LEFT/RIGHT/FULL JOIN и соединение таблиц |
| Агрегаты и CASE |
COUNT/SUM/AVG, GROUP BY, HAVING и условия CASE |
| Подзапросы и CTE |
IN/EXISTS, коррелированные подзапросы, WITH и рекурсия |
| Оконные функции |
ROW_NUMBER, RANK, LAG/LEAD, фреймы |
| Операции над наборами |
UNION ALL, UNION, INTERSECT, EXCEPT |
| DML и транзакции |
INSERT/UPDATE/DELETE, RETURNING, BEGIN/COMMIT/ROLLBACK |
Python
| Страница |
Описание |
| Основы для DE |
Виртуальные окружения, работа с файлами, библиотеки DE-стека |
| pandas |
DataFrame, чтение CSV/Parquet/SQL, merge, дедупликация |
| Работа с API |
requests, авторизация, пагинация, retry, JSON → DataFrame |