fly51fly (@fly51fly)
논문 'Reuse your FLOPs'는 매우 오프-폴리시(prefix) 조건화 기법을 활용해 계산 자원(FLOPs)을 재활용함으로써 어려운 강화학습 문제에서 확장성을 높이는 방식을 제안합니다. FAIR(Meta) 소속 연구로, 오프-폴리시 접두사를 활용한 샘플 효율 개선과 스케일링 전략을 다룹니다.
fly51fly (@fly51fly)
논문 'Reuse your FLOPs'는 매우 오프-폴리시(prefix) 조건화 기법을 활용해 계산 자원(FLOPs)을 재활용함으로써 어려운 강화학습 문제에서 확장성을 높이는 방식을 제안합니다. FAIR(Meta) 소속 연구로, 오프-폴리시 접두사를 활용한 샘플 효율 개선과 스케일링 전략을 다룹니다.
Die Tech Tops und Flops 2024!
Exposition "Flops" au Musée des Arts et Métiers.
"Je ne dirais pas que c'est un échec mais... " #ÇaNaPasMarché #Flops #ArtsEtMétiers #Projets #Produits ... Certains ont une transformation réussie !
@ArtsetMetiers
Technologisch zu bedauern gab es im Jahr 2025 also einiges. Hier sind ausgewählte bemerkenswerte Entwicklungen, die wir uns lieber erspart hätten.
GPU là cốt lõi cho huấn luyện mô hình ngôn ngữ nhờ xử lý song song và tính toán ma trận nhanh. Bài viết phân tích kiến trúc GPU, phân biệt vs CPU, vai trò của CUDA/Tensor Cores, và quản lý VRAM. Hiệu suất GPU được đo lường bằng FLOPS, quyết định tốc độ huấn luyện. #AI #ML #GPU #MôHìnhNgônNgữ #CôngNghệ #ParallelComputing #DeepLearning #CUDA #VRAM #FLOPS #HiểuGPU #MachineLearningVietNam
https://www.reddit.com/r/LocalLLaMA/comments/1pk1hyp/day_4_21_days_of_building_a_small_language/
Hôm nay khám phá kiến thức về GPU – linh hồn của mô hình ngôn ngữ. GPU xử lý siêu song song, lý tưởng cho matrix multiplication trong ML nhờ hàng nghìn CUDA và Tensor Cores. So sánh CPU (lõi mạnh, xử lý tuần tự) vs GPU (nhiều lõi, song song). VRAM quan trọng để lưu trọng số/activations, thiếu gây lỗi training. FLOPS đo tốc độ tính toán, nhưng phụ thuộc bandwidth và hiệu suất Tensor Cores. Hiểu GPU để tối ưu hiệu quả huấn luyện mô hình!
Newest: The Paula Poundstone Show (10/30/1993, 11/6/1993) #90stv #flops #1990s
https://saleintothe90s.wordpress.com/2025/11/04/514-the-paula-poundstone-show-10-30-1993-11-6-1993/
Essen : le récap'
Et pour retrouver nos 6h de contenus produits sur place, la playlist est ici : https://www.youtube.com/playlist?list=PLKxEG9zcr0pIGhvnH9TKqMsrYF6TZ_Ith
#Essen #spiel25 #jeu #jeux #jds #j2s #jeuxdesociete #salon #retours #livecoverage #tops #flops #recap
« #flops », l’exposition qui célèbre les échecs de la #tech, de la science et du marketing https://www.lemonde.fr/pixels/article/2025/10/18/flops-l-exposition-qui-celebre-les-echecs-de-la-tech-de-la-science-et-du-marketing_6647939_4408996.html
This week (8/13/2025 at 4pm EDT) we'll have Danny Laursen on the stream to talk about his awesome flower tools. We'll look at the logic behind the HDAs, and then go into the tool's functions. Hope to see you there!
🤓 Ah, yes, the classic "let's scale reinforcement learning algorithms to mind-boggling #FLOPs and expect something magical" pitch. 🚀 Apparently, all it takes is sprinkling some next-token prediction dust on the entire Internet, and voilà! Genius-level #AI, because clearly, the web is a treasure trove of high-quality reasoning. 🙄
https://blog.jxmo.io/p/how-to-scale-rl-to-1026-flops #reinforcementlearning #magic #techinnovation #mindbending #HackerNews #ngated
How to scale RL to 10^26 FLOPs
https://blog.jxmo.io/p/how-to-scale-rl-to-1026-flops
#HackerNews #scaleRL #FLOPs #reinforcementLearning #AIresearch #optimization
12 #Actors Who Never Recovered From #BoxOffice #Flops
https://www.slashfilm.com/1842976/actors-never-recovered-box-office-flops/
Security Week 2506: атака по сторонним каналам на процессоры Apple
На прошлой неделе исследователи из Технологического института Джорджии в США и Рурского университета в Бохуме, Германия, опубликовали сразу две научные работы, посвященные аппаратным уязвимостям в новейших процессорах компании Apple. Проблемы были обнаружены в двух методах спекулятивного выполнения команд, известных как Load Address Predictor и Load Value Predictor. В первом случае производится попытка предсказать адрес, к которому произойдет следующее обращение в ходе выполнения программы. Во втором случае система предсказания пытается угадать и значение, которое будет прочитано из памяти. Атаки, эксплуатирующие уязвимости в этих технологиях предсказания, назвали, соответственно, SLAP и FLOP. Данные технологии и связанные с ними уязвимости — относительно свежие. Предсказание адресов было внедрено начиная с процессоров Apple M2 для компьютеров и Apple A15 для мобильных устройств. Load Value Predictor появилась в процессорах M3/A17. Это была бы еще пара уязвимостей, отдаленно похожих на уже давно известные проблемы Spectre/Meltdown, но у нового исследования есть важное отличие. Авторы продемонстрировали один из худших сценариев реализации подобной атаки: с кражей приватных данных из браузера, после того как потенциальную жертву заманили на подготовленную веб-страницу.
Just how deep is #Nvidia's #CUDA moat really?
Not as impenetrable as you might think, but still more than Intel or AMD would like
It's not enough just to build a competitive part: you also have to have #software that can harness all those #FLOPS — something Nvidia has spent the better part of two decades building with its CUDA runtime, while competing frameworks for low-level #GPU #programming are far less mature like AMD's #ROCm or Intel's #OneAPI.
https://www.theregister.com/2024/12/17/nvidia_cuda_moat/ #developers