#Airflow

AbracaDataabracadataspace
2026-02-13

in is like a self-driving car: that still needs you at the wheel.

Maxime Beauchemin, creator of Apache and Apache , explains why aren't ready to go full autopilot and how we can embrace smart assistance instead. Because 90% isn’t good enough.

🎥 Watch now! abracadata.space/sessions/2025

The semantic layer as guardrails

Dame un docker-compose y moveré el mundo


Haciéndome el experto en #Airflow simplemente porque sé levantar el docker-compose que te da #Apache

2026-01-23

Как мы мигрировали с Zeppelin и что из этого вышло. Часть 1. Рассылки

Для задач аналитики Zeppelin - это чуть ли не находка. Он может в одной книжке исполнять код на любом языке (был бы интерпретатор), выводить его в виде красивых табличек, графиков и в любом другом виде, который удобен. И на Хабре есть много статей , посвященных плюсом данного решения для задач аналитики. В результате в аналитический отдел ТКБ Инвестмент Партнерс данный инструмент проник достаточно глубоко: на нем писались аналитические отчеты для разных отделов, расчетные таблицы, которые затем отсылались в дашборды, также данными книжками могли пользоваться все, кто знал какие-либо языки программирования. И мы попали в зависимость от него. Панацея, которая должна была стать легким решением для (почти) любой задачи превратилась в наше проклятие. Из-за проблем с данной системой на нас приходило по 5-7 тикеров в неделю, а также потерей доверия к нашим сервисам. Как мы с этим справились?

habr.com/ru/articles/988386/

#airflow #zeppelin #миграция #рассылки #devops

2026-01-22

Как мы разгрузили базу данных в проде и не сломали систему

Наверное, всем знакома ситуация, когда собираешь красивый отчет в BI-системе, пользуешься им полгода, а потом он с каждым днем тормозит все сильнее? Графики обновляются дольше обычного, таблицы медленно грузятся. А все потому, что BI работает на одной базе на пределе своих возможностей из-за перегруженности. Пример классической схемы, с которой начинают почти все компании: BI + база данных. Пока стартапы не могут позволить себе дорогостоящее озеро данных или DWH, они устанавливают базу данных, заполняют ее и прикручивают рядом BI-систему. Вот только данные в растущей компании имеют свойство прибывать. К примеру, у стартапа в первые месяцы работы было пять заказов в день, затем 100, 1 000 и еще больше. День за днем, год за годом все данные складываются в одну базу данных, и в итоге получается тяжелая, медленная система, которой банально неудобно пользоваться. Можно увеличить мощность базы данных, но это лишь отложит проблему на время, а не решит ее. А можно снять нагрузку с базы и доверить обработку накопленных данных другим инструментам и системам хранения. В этой статье я расскажу, как решить проблему с базой данных, которая трещит по швам, с помощью облачных managed-сервисов.

habr.com/ru/companies/cloud_ru

#хранение_данных #bi #s3 #база_данных #хранение_данных_в_облаке #trino #metastore #airflow

2026-01-16

Hello #Fediverse! Looks like I’m an #introduction away from joining the conversation so here goes!

I lead data teams for a healthcare system in New Mexico. My healthcare path started in acute care nursing before moving into #Informatics. These days, I’m deep into #Python, #Airflow, and #LLMs. I also love #Soccer (#Football), #Sailing, and doing anything my kids let me tag along for.

Looking to connect on #HealthIT, #DataEngineering, and #DataScience or just chat about other interests.

2026-01-09

There are better, but after designing and printing my own fan shroud for a case fan to add better airflow for my gpu, I'm kinda proud of myself, thats a 10C difference. #gpu #burn #airflow #3dprint #Temperature

Screenshot of Konsole running gpu burn for 10 minutes on rtx 3080 with steady 67 degrees C
2026-01-09

Join our Weekend Workshop: #Apache #Airflow - Basics to Advanced

Airflow is a leading task orchestration tool, widely used in the industry. Although it's often linked with data engineering, its capabilities extend far beyond.

Dates: 14 - 15 Feb

prelude.tech/upcoming_workshop

Use the code GIFT25 to enjoy a 25% festive discount! Offer valid until 11 January.

Promotional banner for an Apache Airflow workshop titled "Basics to Advanced," featuring stylized tree and circuit graphics, dated 14–15 February.
2026-01-08

💡 Apache Airflow 2025 Recap

2026 has arrived which marks a great opportunity to review and assess the changes the last year has brought to the ever evolving landscape of open source data tools.

In our new #blog post we look at Apache Airflow and how the leading open source orchestration platform has changed in the last year with the bit v3 major release.

🔗 nextlytics.com/blog/apache-air

#apacheairflow #airflow #opensource #dataengineering #datascience

2026-01-05

If you have any new years resolutions that involve learning, then come learn with us :) We're running some holiday specials! prelude.tech/upcoming_training

Offer valid until 11 January!

#django #htmx #alipinejs #airflow #tailwindcss #git #playwright

Give the Gift of Growth this Festive Season!
Invest in your team's potential with substantive, lasting learning

25% off upcomming workshops
Code: GIFT25

24+25 January
- Modern frontend development with Django, HTMX, Tailwind, Playwright and AlpineJS
- Understanding Django by Integrating AllAuth

14+15 February
- Apache Airflow - Basics to advanced
- Getting Git: A Beginner’s Guide to Version Control and the Terminal
2025-12-31

If you have any new years resolutions that involve learning, then come learn with us :) We're running some holiday specials! prelude.tech/upcoming_training

Offer valid until 11 January!

#django #htmx #alipinejs #airflow #tailwindcss #git #playwright

Give the Gift of Growth this Festive Season!
Invest in your team's potential with substantive, lasting learning

25% off upcomming workshops
Code: GIFT25

24+25 January
- Modern frontend development with Django, HTMX, Tailwind, Playwright and AlpineJS
- Understanding Django by Integrating AllAuth

14+15 February
- Apache Airflow - Basics to advanced
- Getting Git: A Beginner’s Guide to Version Control and the Terminal
2025-12-30

I've been thinking about learning #n8n so I can automate a few things in my life. I keep hearing how cool it is. After poking around a bit, I think #Airflow is a better fit for me. It's way more flexible (because Python) and scalable.

I think people misunderstand what Airflow really is. It's not a data pipelining tool. It's a task orchestrator.

Recce - Trust, Verify, ShipDataRecce
2025-12-28

Hearing Max explain how he told Airbnb he would not work without building Airflow is a masterclass in knowing your leverage as an engineer. Watch: youtube.com/shorts/-n8335QlDRI

Miguel Afonso Caetanoremixtures@tldr.nettime.org
2025-12-26

"The release served as a crucial turning point for the project. Downloads from its GitHub repository increased, and more enterprises adopted the software. Encouraged by this growth, the team envisioned the next generation of Airflow: a modular architecture, a more modern user interface, and a “run anywhere, anytime” feature, enabling it to operate on premises, in the cloud, or on edge devices and handle event-driven and ad hoc scenarios in addition to scheduled tasks. The team delivered on this vision with the launch of Airflow 3.0 last April.

“It was amazing that we managed to ‘rebuild the plane while flying it’ when we worked on Airflow 3—even if we had some temporary issues and glitches,” says Jarek Potiuk, one of the foremost contributors to Airflow and now a member of its project-management committee. “We had to refactor and move a lot of pieces of the software while keeping Airflow 2 running and providing some bug fixes for it.”

Compared with Airflow’s second version, which Koka says had only a few hundred to a thousand downloads per month on GitHub, “now we’re averaging somewhere between 35 to 40 million downloads a month,” he says. The project’s community also soared, with more than 3,000 developers of all skill levels from around the world contributing to Airflow."

spectrum.ieee.org/apache-airfl

#AirFlow #ApacheAirflow #AirBnB #OpenSource #FLOSS #WorkflowOrchestratror #Python #DataPipelines

Recce - Trust, Verify, ShipDataRecce
2025-12-22

We sat down with Max Beauchemin, creator of Airflow and Superset. Here are the takeaways: 🧵

2025-12-16

If you have any new years resolutions that involve learning, then come learn with me :) I'm running some holiday specials! prelude.tech/upcoming_training

#django #htmx #alipinejs #airflow #tailwindcss #git #playwright

Decorative poster with the following information:

Give the gift of growth this festive season
Invest in your team's potential with sustainable, lasting learning 
25% off upcoming workshops while stocks last,  use the code GIFT25 

24+25 January
- Modern Frontend Development with Django, HTMX, Tailwind, Playwright and AlpineJS
- Understanding Django by Integrating AllAuth

14+15 February
- Apache Airflow: Basics to Advanced 
- Getting Git: A Beginner's Guide to Version Control and the Terminal
2025-12-16

dag_generator: лоукод-генерация гетерогенных Airflow DAG

Многие команды сейчас меняют проприетарное ПО на открытые аналоги. Под «открытостью» мы понимаем не только миграцию с платного софта на бесплатный, но и новый подход к построению data-платформ, где каждый продукт развивает свой сегмент платформы с помощью релевантного стека технологий. Полноценных open-source-альтернатив, которые закрыли бы все наши потребности, не нашлось. Поэтому мы решили создать свой «мультитул» — low-code-фреймворк для генерации гетерогенных Airflow DAG с незамысловатым названием dag_generator. Цель этой статьи — поделиться опытом внедрения подобного инструмента. Генерация выполняется по старинке, так что про ИИ здесь пока ничего не найдете.

habr.com/ru/companies/gazpromb

#etl #airflow #python #dbt #sql

2025-12-11

Your case airflow is BACKWARDS (probably)

2025-12-05

I have a few exciting workshops coming up early next year, covering #Airflow, #Django's internals, #AllAuth, #HTMX, #AlpinJS, #Tailwind and #Playwright.

I'll be donating a significant portion of my income to #PyConNamibia.

Use the code PYCON_NAMIBIA to get 20% off, I'll donate a further 30% to #PyConNamibia

prelude.tech/upcoming_training

2025-12-02

От CSV к дашбордам: гибкая отчетность на Postgres, Airflow и Superset

Привет, Хабр! Я Дмитрий Смотров, тружусь бэкендером в Astra Linux в команде продукта ACM — микросервисной системе, разворачиваемой на клиентских мощностях. Мы позволяем удаленно управлять клиентской инфраструктурой. Сначала я разрабатывал функциональность снятия инвентаризации и удаленного выполнения команд установки и удаления ПО, но в один момент моя жизнь резко изменилась. На проекте возникла необходимость в функциональности красивой и настраиваемой отчетности, в чем я увидел возможность проверить себя в новой для себя области. Я вызвался разобраться и помочь продукту стать еще лучше. Под катом расскажу о том, с какими трудностями столкнулся в процессе, как я их решал и что в итоге получилось. Приятного чтения :)

habr.com/ru/companies/astralin

#backendразработка #python #airflow #data_engineering #superset #postgresql

2025-12-01

Единый вход для ML-стека на примере Keycloak

Привет! Я Саша Абакумов, DevOps-инженер в KTS . Нашей команде часто приходится поднимать инфраструктуру под ML-проекты. Со временем число ML-инженеров и разработчиков на таких проектах росло, и логиниться в каждый по отдельности становилось все больнее. Чтобы упростить коллегам жизнь, мы интегрировали Single Sign-On (SSO) в стек одного из наших проектов, состоящий из JupyterHub, Airflow и MLflow. SSO позволяет единообразно аутентифицироваться во всех инструментах под одной учетной записью. Помимо очевидного удобства, нам это также дало возможность централизованно управлять доступом и внедрить RBAC — сопоставление ролей в инструментах с группами или ролями в IdP. В качестве инструмента для реализации SSO я использовал OIDC-провайдер Keycloak, наверняка многим хорошо знакомый. Ниже я расскажу о том, как с его помощью настроить SSO для JupyterHub, MLflow и Airflow (все компоненты разворачиваются с помощью Helm-чартов).

habr.com/ru/companies/kts/arti

#ml #mlflow #sso #sso_аутентификация #jupyterhub #airflow #keycloak

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst