#%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B9

2026-02-03

Как веб-камера и нейросеть помогают удалённо измерять частоту дыхания

Российская ИТ-компания «Криптонит» продолжает развивать технологии дистанционного мониторинга показателей жизнедеятельности человека. В своей новой работе специалист отдела перспективных исследований компании «Криптонит» Алексей Протопопов представил бесконтактный метод определения частоты дыхательных движений (ЧДД) с высокой точностью. В этом методе применяется обычная веб-камера и алгоритм, использующий нейросеть на одном из этапов обработки видеосигнала. Традиционные способы измерения частоты дыхания требуют физического контакта с пациентом. Например, для этого применяют нагрудный ремень или датчики у носа. Это не всегда удобно, особенно когда важны скорость или свобода движений. Существующие бесконтактные подходы либо работают исключительно в идеальных условиях, либо дают значительную погрешность — до 13%, что вызвано недостаточной способностью отфильтровывать естественные движения человека. Метод Алексея Протопопова решает эту проблему. В его основе лежит сегментация изображения тела нейросетью и продвинутая фильтрация помех. Метод протестировали на видеозаписях 14 добровольцев: 8 мужчин и 6 женщин в возрасте от 20 до 65 лет. Общая продолжительность записей превысила 2,5 часа. Принцип работы В основе метода лежит анализ естественного смещения грудной клетки при вдохе и выдохе. Главная сложность — выделить именно дыхательные движения на фоне другой физической активности: разговора, жестов, поворотов и смены позы. Для решения этой задачи в предложенном методе нейронная сеть MediaPipe выделяет на каждом кадре области груди и живота. Тем самым она создаёт «маску» для анализа изображения. Этот этап называется «сегментация». Он самый ресурсоёмкий и занимает более 90% времени обработки. Сегментация позволяет алгоритму самостоятельно определять часть кадра, по которой нужно проводить измерения, поэтому смена позы почти не влияет на результат.

habr.com/ru/companies/kryptoni

#телемедицина #частота_дыхания #мониторинг_здоровья #вебкамера #алгоритм #анализ_изображений #анализ_видео

2026-01-26

Рентген может не отличить опасное от безобидного: как работает досмотр багажа и зачем там ИИ

Задача автоматического анализа рентгеновских изображений багажа на первый взгляд кажется прямолинейной. Есть изображение, есть опасные предметы, значит можно научить систему их находить. На практике всё оказывается сложнее. Ограничения физики, особенности данных, человеческий фактор и реальная работа ИИ накладывают множество условий и компромиссов. В этой статье я попытался разобрать эту задачу целиком и собрал основные ограничения, с которыми приходится сталкиваться при работе с интроскопами и алгоритмами компьютерного зрения. Сдать багаж на проверку

habr.com/ru/articles/988918/

#искусственный_интеллект #анализ_изображений #рентгеновское_излучение #интроскоп #досмотр_багажа #данные #компьютерное_зрение

2026-01-21

Искусственный интеллект и клетки крови

Болезни и травмы являются вечными спутниками любого живого организма на протяжение всей его истории существования. Будь то десять тысяч, сто лет или сейчас, мы сталкиваемся с ними, пытаемся понять и излечить, а еще лучше избежать. За века исследований наше понимание собственного теле и всех его функций стало намного более обширным, однако уверенно заявить, что мы знаем абсолютно все, мы не можем. Понимание того, как работают клетки, в частности клетки крови, является крайне важным для предотвращения и/или успешного лечения множества заболеваний. Ученые из Кембриджского университета (Великобритания) разработали систему искусственного интеллекта, которая способна точнее докторов определять нарушения морфологии клеток крови. Как именно работает система, насколько она точнее человеческого взгляда, и каково ее будущее? Ответы на эти вопросы мы найдем в докладе ученых.

habr.com/ru/companies/ua-hosti

#машинное_обучение #искусственный_интеллект #кровь #клетки #морфология #биология #медицина #диагностика #здоровье #анализ_изображений

2025-12-04

Нейронки (не) плохо понимают юмор

Суть мини исследования в названии. С момента как нейронки стали мультимодальными прошло уже прилично времени. Но, по моему субъективному мнению, нейронки как раньше, так и сейчас плохо справляются как с пониманием того, что именно изображено на картинках. Примечание: в итоге автор переобулся. Чтобы это доказать, я сделал мини-тест. Отобрал 25 изображений/мемов и попросил нейронки объяснить, что они видят. В свои тесты я осознанно отобрал и немного пошлые мемы и легкий черный юмор, чтобы посмотреть есть ли влияние цензуры на интеллект нейронок. От нейронки в своем тесте я требую не просто понять, что картинка смешная/не смешная, но и объяснить почему оно так.

habr.com/ru/articles/973138/

#анализ_изображений #chatgpt #grok #qwen #gemini #llm

2025-11-12

Сравнение технологий аппаратного транскодирования

Можно ли чем-то заменить Nvidia? Если уж не для нейросетей, то для транскодирования видео, которое в медиапроизводстве занимает очень значительное место и требует больших вычислительных ресурсов. В этой статье попытаемся выяснить, есть ли у аппаратной платформы NVIDIA альтернативы в задачах обработки и кодирования видео, и можно ли заменить NVIDIA чем-то более доступным во всех смыслах: и по возможности закупки на рынке РФ, и по цене.

habr.com/ru/companies/habr_rut

#видео #транскодирование #качество #анализ_изображений #кодеки #h264 #nvidia

2025-01-29

Janus Pro от DeepSeek: стоит ли она внимания? Сравнение генерации и объяснений с Dalle-3 и SD3

Появились первые тесты новой нейросети Janus — эта модель не только генерирует изображения, но и анализирует их, объясняя детали и делая осмысленные комментарии. В этой статье мы разберёмся, как Janus Pro (7B) справляется с генерацией изображений по сравнению с Stable Diffusion 3 (Medium) и Dall-3 , а также кто лучше анализирует и комментирует изображения — Janus Pro или Dalle-3 . Ну что, готовы? Тогда погнали!

habr.com/ru/companies/bothub/a

#ai #ии #janus #deepseek #генерация_изображений #анализ_изображений #texttoimage #imagetotext

2024-10-10

Как научить LLM понимать видео? Обзор подходов

Всем привет! Сегодня поговорим про задачу понимания видео и эволюцию подходов к обучению мультимодальных больших языковых моделей для этой задачи. Video Understanding — направление на стыке компьютерного зрения (CV) и обработки естественного языка (NLP), включающее в себя множество разнообразных задач на восприятие и интерпретацию видео. От базового распознавания предметов и объектов в видеоряде, локализации объектов в пространстве или во времени, подсчета предметов и людей, до генерации кратких или развернутых описаний видео и задач на рассуждения о причинах происходящего на видео, требующих глубокого понимания мира — от человеческой психологии до физических свойств объектов.

habr.com/ru/companies/sberbank

#большие_языковые_модели #llm #машинное+обучение #анализ_видео #анализ_изображений #мультимодальность

2024-08-28

Как научить компьютер различать цвета?

Привет, Хабр! Думаю, все заметили, что технологии компьютерного зрения и искусственного интеллекта появились во многих сферах нашей жизни. Аналитика изображений применяется на производстве, в медицине, в системах управления, в географии. В сфере спорта также не обошлось без компьютерного зрения. Современные технологии используются для анализа игр и стратегий, предоставляя тренерам и спортсменам ценную информацию, которую сложно или невозможно получить вручную. В частности, в футболе компьютерное зрение используется для трекинга, детектирования действий игроков, вычисления их скоростей и решения многих других задач. Аналитика матча вручную может занимать много времени и требует внимания квалифицированных специалистов, а технологии компьютерного зрения позволяют значительно автоматизировать и оптимизировать процессы. Одна из задач, которая была поставлена в рамках нашего проекта по футбольной аналитике, заключается в определении команды, к которой принадлежит конкретный игрок. Для человеческого глаза эта задача — проще некуда. Достаточно посмотреть на цвет формы игрока, чтобы понять, в какой он команде. Однако как научить компьютер автоматически понимать цвет? Оказалось, что в общем случае эта задача совсем не тривиальна. Изначально были попытки обучить на размеченных данных классические детекторы объектов, например, YOLO. Однако оказалось, что модель сильно усложняет задачу — начинает ориентироваться на расстановку игроков, и из-за этого точность становится невысокой. Поэтому возникла идея попробовать более классические и, соответственно, более простые алгоритмы.

habr.com/ru/companies/ppr/arti

#компьютерное_зрение #анализ_изображений #алгоритмы #нейросети #нейронные_сети

2024-08-12

Рецензия на книгу “Прикладное машинное обучение и искусственный интеллект для инженеров” Джеффа Просиза

Хорошая новость — все больше книг по машинному и глубокому обучению теперь доступны и в русском переводе. Очередная рецензия будет на книгу «Прикладное машинное обучение и искусственный интеллект для инженеров» (Applied Machine Learning and AI for Engineers) автора Джеффа Просиза от O'Reilly Media, в переводе от БХВ Петербург. В отличие от многих других введений и пособий на эту тему, книга Дж. Просиза избегает упора на излишне сложную математику, делая акцент на практическое применение ML и DL технологий. Прежде чем перейти к разбору книги “

habr.com/ru/companies/ssp-soft

#data_mining #data_engineering #data_analysis #ml #machine_learning #deeplearning #анализ_данных #анализ_изображений #книги_по_программированию

2024-03-15

Искусственный интеллект и прогнозирование метастазов

Использование искусственного интеллекта в различных областях деятельности человека становится все более обыденным делом. Хоть ИИ и далек от многогранности человеческого мозга, в некоторых ситуациях он все же весьма полезен. Особенно если речь идет об анализе данных. Ученые из медицинского факультета Вашингтонского университета (США) разработали алгоритм машинного обучения, способный быстро и точно прогнозировать потенциальный риск метастазирования мозга по данным биопсии пациентов с немелкоклеточным раком легких на ранней стадии. Как именно работает данный алгоритм, и насколько он эффективен? Ответы на эти вопросы мы найдем в докладе ученых.

habr.com/ru/companies/ua-hosti

#онкология #рак_легких #метастазы #мозг #медицина #здоровье #машинное_обучение #искусственный_интеллект #алгоритмы #анализ_изображений #глубокое_обучение #сверточные_нейронные_сети

2023-12-07

Распознавание пользовательского интерфейса в медицине

В процессе тестирования пользовательского интерфейса мы распознаем его на скриншотах тестируемого устройства. Говоря о распознавании, часто имеют ввиду нейросети и другие алгоритмы машинного обучения. Однако, применительно к нашей задаче машинное обучение имеет недостатки. Поэтому мы с его помощью решаем лишь некоторые части задачи распознавания GUI. В остальном, мы разбираем изображение по правилам, написанным вручную.

habr.com/ru/companies/auriga/a

#тестирование #автоматическое_тестирование #медицина #анализ_изображений #распознавание #testing #automation_testing #ui_testing #recognition #image_analysis

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst