#SAE

The Kpop Abuela 🪷abuelaskpop@apobangpo.space
2026-02-11

Abuela's Song of the Day (Feb 11)

SAE - AMANECER youtu.be/i6-ydt5gtHM
cw: lens flares (mild)

I've been so bad about SotD, that quoting Monty Python right now would feel extra ridiculous, so let's just accept a bit of flamenco guitar to start/end your day, yes?

As a former flamenco dancer, I can perfectly picture a partnered routine and it actually makes me sad that I can't transmit that dance to anyone else. Sigh. The limitations of reality.

#Music #Kpop #SAE #KAcoustic

2026-02-05

Что нашли внутри Claude, когда заглянули ему в голову

Мы привыкли, что нейросети — это «черный ящик»: на входе данные, на выходе ответ, а внутри магия. Но что, если этот ящик можно сделать прозрачным? Команда Anthropic провела масштабное препарирование Claude 3 Sonnet, чтобы найти конкретные «фичи», отвечающие за концепции — от Золотых Ворот до уязвимостей в коде. Разбираемся, как устроены мысли нейросети и почему это открытие меняет наше представление о безопасности ИИ.

habr.com/ru/articles/993384/

#Claude #Anthropic #LLM #нейросети #sparse_autoencoders #SAE #искусственный_интеллект #машинное_обучение #безопасность_ИИ

Kpop News Hubkpopnewshub
2026-01-23
Kpop News Hubkpopnewshub
2026-01-20
2026-01-12

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

В этой статье разберём исследование от компании Anthropic, которое демонстрирует практическую возможность вскрытия «черного ящика» больших языковых моделей для обеспечения их контролируемости и безопасности с помощью разреженных автоэнкодеров (SAE - Sparse AutoEncoders). И в конце, попробуем поуправлять поведением модели - заставим думать, что она Санта Клаус 🎅.

habr.com/ru/articles/981964/

#Сезон_ИИ_в_разработке #LLM #interpretable_ml #interpretability #interpretable_AI #искусственный_интеллект #ai_security #Steering #SAE #Sparse_AutoEncoder

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst