Сегментация клиентов методом K-Means на стороне БД
Привет, Хабр! Сегодня мы рассмотрим, как заставить PostgreSQL самостоятельно крутить K-Means для сегментации клиентов, не вытаскивая данные наружу. Пройдемся по циклу: нормализуем фичи в materialized view, напишем функцию PL/PythonU, которая дергает scikit-learn, сохраняем cluster_id обратно в таблицу и закрываем гештальт отчётом «доход по кластеру» чистым SQL.
https://habr.com/ru/companies/otus/articles/930506/
#python #sql #кластеризация #postgresql #нормализация_данных #хранимая_процедура