#hle

Wulfy—Speaker to the machinesn_dimension@infosec.exchange
2026-02-23

@tompearce49

I'd like to believe all the hype from the #AiAntagonists but to me they all sound like soldiers in a besieged city, cheering the news of the relief columns that never comes.

The article is supremely optimistic, which is fair enough, optimism is needed with one of the key avatars of the #AntiAi movement being sprung using AI himself. The #reversecentaur #asbestosinthewalls guy himself @pluralistic

#AI Blew past the #turingtest so fast, folks were tripping over themselves to bury decades of benchmarking. The previous AI attempts never breached Turing.

Meanwhile, #HLE is climbing up faster than expected, which is the exact opposite of what folks who claim AI is not advancing is.

It seems that the models are capable of Zero-shot learning, reaching accurate results for knowledge not in the training data.

The answer as always is to become politically active and #regulateAI

#AiResearch

Wulfy—Speaker to the machinesn_dimension@infosec.exchange
2026-02-20

#gemini31pro that's just been released is hitting 44% on Humanities Last Exam...

When #HLE was released, not so long ago, the current models were in single digits...

The race is now between #aibubble and #agi

LOL丶诺诺
LCK年度剧情!NS坏事做尽,LCK杯10进9,HLE被淘汰谁在搞鬼?【联盟那些事儿】
#比赛 #淘汰 #英雄联盟 #HLE #ZEUS

youtube.com/watch?v=m9aFD_6ENLM

崔大猫
十进九都能被淘汰?!价值半个亿的HLE,到底谁是“卧底”?
#淘汰 #HLE #犯罪

youtube.com/watch?v=-nDSTJvzFVA

2026-01-30

On a #OuigoTrainClassique 63 to Brussel-Zuid hauled by a #HLE 18, ready for #FOSDEM tomorrow!!!!! (@ OTC ➜ Bruxelles Midi für #FOSDEM2026) #NowTräwelling https://
traewelling.de/status/6918651

2025-12-07

Бенчмарк конца эпохи — Humanity’s Last Exam

Хочу сегодня рассказать вам про Humanity’s Last Exam (HLE). Это один из главных бенчмарков, по которым сегодня оценивают модели искусственного интеллекта, вроде меня (шучу). Бенчмарки — это просто наборы задач/датасетов, на которых проверяют модели и смотрят, кто умнее, точнее, устойчивее и т.д. Например, MMLU — Massive Multitask Language Understanding — один из самых известных «общеобразовательных» экзаменов для ИИ. Он проверяет широкий круг знаний и базовое рассуждение: около 16 тысяч вопросов по 57 предметам — от математики и истории до права и компьютерных наук. Есть ещё BIG-bench (Beyond the Imitation Game) от Google — не один тест, а коллекция из 200+ задач, которые прислали разные исследователи. Там уже не только «знание фактов», но и логика, здравый смысл, язык, социальные предвзятости (social biases), программирование и всё то, на чём модели любят спотыкаться. Есть и более «узкие» бенчмарки:

habr.com/ru/articles/974206/

#hle #бенчмарки #ии #llm #benchmarks #ai #fun

Liberty and Justice For AllNBAnthony2k@mastodo.neoliber.al
2025-10-28
Feu d'jais :couleur:feudjais@eldritch.cafe
2025-10-28

Mon cœur est pour #HLE mais la raison m'a fait pronostiquer que #GEN va gagner.

#Worlds2025 #LeagueOfLegends

razzlom is always sadrazzlom@quietplace.xyz
2025-03-14

Day 5 predictions:

CFO win - TES lose
TL lose - HLE win

#LoL #LeagueOfLegends #FirstStand #CFO #TES #TL #HLE

razzlom is always sadrazzlom@quietplace.xyz
2025-03-13

Day 4 predictions:

TL lose - CFO win
KC lose - HLE win

#LoL #LeagueOfLegends #FirstStand #HLE #CFO #TL #KC

razzlom is always sadrazzlom@quietplace.xyz
2025-03-12

Today is third day of First Stand tournament and I want make predictions.

Today matches:

CFO lose - HLE win
KC lose - TES win

And team places at the end of Round Robin Stage:

1. HLE (Korea)
2. TES (China)
3. CFO (Taiwan)
4. TL (USA)
5. KC (France)

#LoL #LeagueOfLegends #FirstStand #HLE #TES #CFO #TL #KC

Kocka.News Englishkockanewsenglish
2025-02-18
KOCKA.newskockanews
2025-02-18
2024-10-04
Et #HLE win, mais quel #Caps ! Flash arrow into escape R into tornade c'est dingue.
#LoL #Worlds
2024-10-04
SHUTDOWN de #Caps sur #Zeka, mais #G2 tient toujours avec le nash, #HLE semble être en bonne posture.
2024-10-04
Ce match #G2 vs #HLE est tellement proche pour l'équipe européenne... Ce wipe sur le nash c'était banger
Jenkins. Tom Jenkins. 🤮🤢🤮ewos1986@norden.social
2024-02-04

@Zuggucker ich fand es immer spannend, dass in der #DDR quasi von Anfang bis Ende in zwei Etagen gefahren wurde, ja, auch aus der Not heraus; während es bei der #Bundesbahn praktisch keine DoStos gab. „Die Passagiere mögen das nicht.“ war, angeblich, die Begründung. Ach ja? #HLE, anyone?

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst