#data_management

2026-01-07

We are hiring! SPecifically, a PostDoc for data management and connectomics as part of a large clinical research group. The details can be found here: linkedin.com/posts/epiconn_ope

Please apply if you are interested in up to four years in Vienna, one of the most liveable cities in the world!

#university #medicaluniversityofvienna
#research #vienna #austria #ismrm #mri #7Tesla #epilepsy #connectomics #data_management

2025-04-10

⏰ The clock is ticking — only 3 weeks left to register and submit talk ideas for #distribits2025 (deadline 01 May): distribits.live/.

We want to hear from YOU about the technologies for #distributed #data_management in your life. We also hope you’ll join us for a collaborative #hackathon to further network with other people who get excited about #rdm and #opendata. 😎

When? 🗓️ 23-25 October, 2025
Where? 📍 Düsseldorf, Germany (and online)
Cost? 💰 Nothing — it’s free!

@datalad #gitAnnex

distribits 2025 mini logo
2025-04-09

Data Governance и Бизнес: как найти общий язык

«Data Governance — это дополнительная надстройка, которая увеличивает сложность и длительность процессов. Это тормозит бизнес!» «Нам нужны качественные данные, а вы все про свои процессы!» «Data Governance – это IT-шная история, пусть они и занимаются. Причем здесь бизнес?!» Эти фразы часто звучат, когда речь заходит о внедрении Data Governance. Бизнес и Data \ IT могут по-разному смотреть на роль DG: для команды управления данными это фундамент прозрачности и управления, а для бизнеса — дополнительные шаги, которые могут замедлять процессы. Но ведь цель Data Governance (DG) — не процесс ради процесса, а создание ценности для бизнеса за счёт качественных, управляемых данных. Почему же возникают разногласия? Из моего опыта можно выделить несколько ключевых факторов, которые влияют на восприятие DG в бизнесе: 1.Неочевидная связь между DG и бизнес-результатами. Если Data Governance не подкреплён показателями, влияющими на прибыль (P&L, снижение затрат, ускорение процессов), для бизнеса его сложно воспринимать как приоритетную задачу. 2.Бизнес хочет скорость, а не контроль. Как правило новые процессы и роли означают изменение привычных моделей работы, а это что требует времени и затраты энергии на адаптацию. Поэтому новые процессы начинают казаться бизнесу фактором, замедляющим их работу. 3.Долгий цикл внедрения. Когда DG запускается с прицелом на долгосрочную выгоду, интерес к DG снижается, так как бизнесу нужны быстрые результаты, бизнесу нужно решать задачи уже сегодня. Как же выстроить эффективный диалог между DG и бизнесом?

habr.com/ru/articles/899080/

#data_governance #data_management #data #управление_данными #data_quality #качество_данных #data_catalog #dwh

2025-02-03

Модерация: ручная, автоматическая или гибридная? Делимся опытом Data Light

А вы знали, что 55% бизнесов сталкиваются с убытками из-за мошенничества, вызванного плохим контролем публикаций? А о том, что 88% пользователей доверяют отзывам как личным рекомендациям, и, столкнувшись с фейковым контентом, редко возвращаются на платформу? Только налаженная система модерации способна предотвратить такие ситуации и обеспечить безопасный и качественный контент. Технологии предлагают автоматические решения для блокировки недопустимого контента, однако не всегда можно полагаться только на них. Почему крупные компании все еще предпочитают ручную или гибридную модерацию? Вадим Болотов объясняет, как выстроить правила модерации и выбрать оптимальный тип для вашего бизнеса.

habr.com/ru/companies/data_lig

#data_management #модерация #модерация_контента #модерация_сообществ #модерация_объявлений

2024-11-19

Ускоряем запросы в PostgreSQL, оптимизируя оператор GROUP BY

Пользователи PostgreSQL нередко оперируют аналитическими запросами , при выполнении которых данные сортируются и группируются по разным правилам. За счёт оптимизации вычисления агрегатов и сортировок можно значительно сократить время и стоимость выполнения запросов. Об одной из таких оптимизаций — выборе порядка колонок в выражении GROUP BY — расскажем в этой статье. Postgres уже умеет перестраивать список группируемых выражений в соответствии с порядком колонок из условия ORDER BY , чтобы исключить дополнительную сортировку и сэкономить вычислительные ресурсы. Мы пошли дальше, реализовали свою идею в дистрибутивах Postgres Pro Standard и Enterprise и вынесли патчи на обсуждение сообщества Postgres ( первое и второе ) в надежде, что они войдут в ближайшую версию ванильного PostgreSQL.

habr.com/ru/companies/postgres

#postgresql #sql #database_optimization #data_management #efficiency #оптимизация_запросов #сортировка_запросов

RedPacket SecurityRedPacketSecurity
2024-08-29
2023-12-05

FineBI-g brother is still watching: как мы усовершенствовали мониторинг

Привет, Хабр! На связи BI-команда Tele2. Ранее мы уже рассказывали о нашем опыте перехода на Fine BI и подходе к анализу действий пользователей на платформе. В нашем случае мониторинг пользователей и объектов на платформе – вопрос жизненной необходимости. Fine BI пользуется популярностью у бизнес-пользователей, также мы активно развиваем подход self-service: лицензия Сreator предоставлена 300 сотрудникам, всего опубликовано около 400 дашбордов, а неопубликованных пользовательских ad-hoc дашбордов насчитывается несколько тысяч, доступ к платформе есть более чем у 2,5 тыс человек, а MAU стремится к 2000 пользователей. Под катом про то, как мы усовершенствовали объединение таблиц из FineDB и LogDB в один датасет, решили проблему потери логов из-за замены уже опубликованных дашбордов и углубили возможности мониторинга действий пользователей и взаимосвязей пользовательских действий с объектами.

habr.com/ru/companies/tele2/ar

#finebi #dashboard #visualization #dataset #data #data_management #data_storage

2022-08-13

Three Easy Pieces on Schema Mappings for Tree-Structured Data
(2017) : Claire David and Filip Murlak
url: hal.archives-ouvertes.fr/hal-0

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst