Here are some thoughts on how #softwarearchitecture needs to course correct subtly now that #agentic_ai writes most of the code. https://www.exploravention.com/blogs/soft_arch_agentic_ai/
Here are some thoughts on how #softwarearchitecture needs to course correct subtly now that #agentic_ai writes most of the code. https://www.exploravention.com/blogs/soft_arch_agentic_ai/
Clawdbot / Moltbot: o que vcs acham do hype que supostamente tá rolando?
Fiz post:
https://www.memedecarbono.com.br/sociedade_cibernetica/inteligencia_artificial/clawdbot-moltbot/
The paper argues that agent systems can’t solve problems like the travelling salesman problem because of fundamental limits. That sounds impressive, but it’s really just computer science 101. The travelling salesman problem is NP-hard, which means no computer can efficiently solve every possible case unless P = NP, a question that is still unsolved.
👉 This limitation applies to all computing, not just agents or language models👈 .
In the real world, nobody tries to solve every case perfectly. Practical programs use shortcuts: heuristics, approximations, and clever pruning. That’s how routing software, logistics systems, and scheduling tools work. They don’t find the perfect answer every time, but they find good answers fast enough to be useful. Agentic systems do exactly the same thing.
👉 The paper also mixes up two different ideas👈 . Computational difficulty explains why some problems are slow to solve perfectly. It does not explain why a system might confidently give a wrong answer. Those errors come from lack of checking, missing information, or bad assumptions, not from NP-hardness.
So the core claim is: hard problems are hard for everyone. That’s true, but it’s not a special weakness of #agentic_ai systems, and it doesn’t really explain the kinds of failures the paper is trying to blame on theory.
TLDR: The paper is shit, thats why no one serious peer-reviewed it. What is super embrassing that #Wired and #Futurism parroted it.
I expect to keep encountering reposts of this shite for the next 6 months like that "AI atriphies your critical reasoning" preprint from MIT.
There is plenty to hang dogs on #AI and #LLM, no need to make silly arguments against it.
#RegulateAI
Как я научил AI анализировать AI: observability для LLM-агентов с Langfuse
Как я построил систему мониторинга LLM-приложений и научил AI анализировать собственные ошибки AI-ассистенты в IDE стали незаменимыми помощниками разработчиков, но остаются чёрными ящиками. Мы не видим что они делают "под капотом", сколько это стоит и где теряется время. В статье покажу как построить системуobservability для AI-агентов: от Cursor IDE до production, с AI-анализом трейсов и открытым исходным кодом.
https://habr.com/ru/articles/987230/
#AI_observability #LLM_monitoring #langfuse #cursor #agentic_ai
[Перевод] Рекурсивные языковые модели (RLM) – парадигма 2026 года
Команда AI for Devs подготовила перевод большого исследовательского материала о рекурсивных языковых моделях (RLM). Авторы разбирают, почему простое увеличение контекстного окна больше не решает проблему долгоживущих агентов, и показывают альтернативу: обучение моделей активному управлению собственным контекстом через context folding и под-LLM. Статья основана на обширных экспериментах и даёт практический взгляд на то, каким может быть следующий шаг в развитии LLM-агентов.
GPT-4o: технический разбор модели, которая взрывает людям мозги
Разбираем архитектуру, не пугаем. LLM — полезный инструмент при адекватном использовании. Но если марафоните сутками — это сигнал. Кризисная линия: 8-800-2000-122 (анонимно, 24/7).
RAG — это не память. Разбираем архитектуру персистентных AI-агентов
Почему векторной базы/RAG недостаточно для качественной памяти ИИ-агентов. Приближаем поведение агента к человеческому с помощью архитектурных решений поверх LLM
Исследование ИИ экосистемы разработки 1С
В статье приведен результат опроса сообщества 1С разработчиков на предмет применения ИИ в своей текущей деятельности. На конец 2025 года был проведен опрос сообщества на предмет исползования ИИ. Цель - понять какие технолгии\модели\подходы\практики обрели популярность. Какие технологии "прижились" среди 1С разработчиков, а какие пока воспринимаются с опаской. Так получилось, что моя деятельность во многом связана с продвижением ИИ в среде 1С. Так вот, главный интерес заключается в том что получилось а что нет. А может некоторые практики и технологии упущены. Также достаточно интересно с какой стороны и кто занимается внедрением практик работы с ИИ в компаниях. "Снизу" или "сверху". Поэтому аудиторию, пожалуй, нельзя считать среднестатистической, хоть попытки и были. Вообщем приступим:
https://habr.com/ru/articles/981194/
#1с #ии #ai #cursor #разработка_с_ии #вайбкодинг #вайбкодинг #agentic_ai #ииагенты #llm
Как поднять точность RAG-агента: чек-лист и инструменты. Часть 2. Финал
В первой части я разбирал архитектуру AI-агента, выбор между RAG и GraphRAG на примере AI-юриста для техподдержки. Если пропустили – https://habr.com/ru/articles/975230/ Во второй части решил уделить внимание тому, как добиться нормального качества поиска и точности ответов. Чтобы AI-агент не остался в песочнице и не превратился в очередной эксперимент "мы попробовали, не взлетело". Надеюсь мой опыт будет полезен и вы сэкономите себе деньги, нервы и время. А может быть и вовсе откажетесь от идеи создания агента — это тоже нормальный исход. Я уже писал про чанки, RAGAS, бенчмарки и инструменты отслеживания качества. Сегодня остановимся детально на каждом артефакте, расскажу плюсы и минусы, и почему именно их я использовал для AI-юриста. Погнали
https://habr.com/ru/articles/977018/
#openai #claude #agentic_ai #agentic_rag #ragas #qwen25max #ииассистент #ai
📢 OWASP dévoile le Top 10 des risques pour les applications agentiques
📝 Source : OWASP (via PRNewswire), Wilmington, Delaware — Le 10 décembre 2025, OWASP GenAI...
📖 cyberveille : https://cyberveille.ch/posts/2025-12-13-owasp-devoile-le-top-10-des-risques-pour-les-applications-agentiques/
🌐 source : https://www.prnewswire.com/news-releases/owasp-genai-security-project-releases-top-10-risks-and-mitigations-for-agentic-ai-security-302637364.html
#Agentic_AI #OWASP #Cyberveille
От RAG-Движка к AI Агенту за 5 Дней
Как я взял готовый state-of-the-art RAG-прототип и превратил его в многофункциональную AI-платформу с помощью FastMCP и внешних интеграций.
ИИ-ученые 2025: SR-Scientist, DeepEvolve и Kosmos — чем отличаются и зачем. И почему выстрелил Kosmos
За год ИИ-Ученые выросли из демо в рабочие инструменты: одни вынимают законы из данных, другие эволюционируют код под бенчмарки, третьи связывают литературу и анализ в проверяемые отчеты. Разбираем 3 характерных подхода: SR-Scientist , DeepEvolve и Kosmos , для чего они нужны и в чем различны. И почему именно вокруг Kosmos столько шума.
https://habr.com/ru/articles/964254/
#нейросети #AI_scientist #искусственный_интеллект #ИИученые #agentic_ai #автономные_агенты #Kosmos #Edison_Scientific #world_models #symbolic_regression
[Перевод] Управление “libraries" как “apps" используя Agentic Executable framework
Представьте, что библиотеки можно устанавливать / настраивать и удалять (на любом языке и в любом фреймворке) так же легко, как любое приложение или игру на телефоне или компьютере? Эта статья о том, как мы можем это сделать. Или другими словами, framework Agentic Executables (далее - "AE") рассматривают библиотеки как исполняемые программы со структурированными, понятными для AI агента инструкциями. Вместо того чтобы полагаться на документацию написанную для людей, AI-агенты следуют стандартизированным .md файлам для автономной установки, настройки, интеграции, обновления и удаления библиотек. Я решил разделить статью на несколько частей:
https://habr.com/ru/articles/955844/
#vibecoding #agentic_executable #agentic_coding #agentic_ai #agentic_protocol #ии_агент #многомодульный_проект #modular_system
[Перевод] Актуальные вопросы по ИИ и перспективным технологиям
Эксперты Gartner дают краткие ответы на свежие вопросы клиентов о перспективных технологиях. Фокус на принятии решений: когда инвестировать в агентный ИИ и DSLM, какие метрики измерять и как масштабировать без потери контроля.
https://habr.com/ru/articles/954788/
#ai #claude_sonnet_45 #genai #mcp #agentic_ai #llm #reasoning #reasoning_models #gpt5 #domain_model
Google AI Mode agentic features go live for some https://www.seroundtable.com/google-ai-mode-agentic-features-live-40163.html via @glenngabe @SERPalert
Почему ИИ в программировании спотыкается в реальной работе: новый бенчмарк показал всю правду
Казалось бы, ИИ в программировании уже уверенно прописался в наших кодовых репозиториях: он чинит баги, предлагает патчи и с легкостью проходит тесты на привычных бенчмарках. Отсюда и растет ощущение, что полноценные ИИ-программисты — вот‑вот станут реальностью. Но как только дело доходит до задач из настоящей индустрии, вся сияющая картинка начинает трещать по швам. Новый бенчмарк SWE-Bench Pro устроил моделям суровый экзамен и показал, насколько велика пропасть между вежливым автокомплитом и работой инженерного уровня. Что именно не так — и почему даже самые продвинутые системы вдруг оказываются не у дел, если попросить их разобраться в большом и сложном проекте? Статья про честную проверку возможностей ИИ в мире реальных задач.
Почему бокс — это мультиагентная система
Привет! Наверняка уже все видели как ИИ-агентов ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл. В этой статье я расскажу о действительно полезном применении концепции агентов и попробую доказать, почему любой боксерский поединок является мультиагентной системой. Поговорим про system design бокса, про RLHF, адаптивные алгоритмы, всевозможный вызов tools типа джебов или клинча, очереди сообщений и гарантию их доставки, graceful degradation и выведем метрики эффективности нашей мультиагентной системы.
https://habr.com/ru/articles/946576/
#llm #agent #agentic_ai #агенты_ии #агенты #машинное+обучение #машинное_обучение #языковые_модели #большие_языковые_модели #ии_агенты
[Перевод] PCW — новая метрика продуктивности разработчиков с ИИ
Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы утверждают: PCW надёжнее привычных показателей вроде acceptance rate и отражает, насколько продукт действительно помогает разработчикам. А как вы думаете — можно ли измерить ценность ИИ в цифрах?
[Перевод] Развенчиваем мифы об AI-агентах: от фантазий к реальности
По мере роста возможностей искусственного интеллекта наш понятийный аппарат с трудом успевает за технологическим прогрессом. До недавнего времени под AI-ассистентами понимали чат-ботов и голосовых помощников, реагирующих на прямые пользовательские команды вроде «позвони маме», «какой рост у Леди Гаги?» или «запусти Spotify». Сегодня в обиход входят новые термины: AI-агенты и agentic AI . Это отражает сдвиг в сторону более автономных и интеллектуальных систем, способных принимать решения. Проблема в том, что единых представлений о сути этих понятий нет, они часто используются неточно или трактуются ошибочно. Чтобы прояснить ситуацию и разграничить хайп и реальность, мы побеседовали с техническими специалистами из разных отраслей, которые в реальной работе имеют дело с agentic-системами. В этой статье мы разбираем, что такое agentic AI и AI-агенты, приводим практические примеры, а также исследуем их перспективы и текущие ограничения.
https://habr.com/ru/articles/936390/
#ai #ai_agent #ai_assistant #agentic_ai #ии #ииассистент #ии_чатбот #ииагенты #llm #rag