Un modèle dont personne ne connaît l'auteur, sans API disponible, sans annonce officielle, vient de prendre la première place du leaderboard Image-to-Video d'Artificial Analysis. ELO 1403, sur 6308 samples. Devant ByteDance, xAI et Kling.
L'arena d'Artificial Analysis fonctionne à votes humains : deux vidéos générées à partir du même prompt, un humain choisit celle qu'il préfère. 6000 comparaisons plus tard, HappyHorse-1.0 écrase la concurrence.
Ce que dit le leaderboard
L'écart de 48 points sur Seedance 2.0 de ByteDance est significatif à cette échelle. Sur un leaderboard ELO à votes humains, 48 points représentent une différence perceptible en conditions réelles, avec des intervalles de confiance à 95% de ±9 points. Le classement tient.
Ce qui rend le tableau encore plus parlant : les modèles qu'il dépasse ont des prix API connus. Kling 3.0 Omni 1080p Pro facture $13.44 par minute de vidéo générée. grok-imagine-video tourne à $4.20/min, PixVerse V6 à $5.40/min. HappyHorse-1.0 affiche "API coming soon". Aucun pricing, aucun accès, aucun créateur déclaré.

Quatre prompts qui ne pardonnent pas
Artificial Analysis a choisi des prompts délibérément difficiles pour les comparaisons avec audio. Un hula hoop qui monte vers la poitrine puis descend aux genoux. Une balle de golf qui tourne trois fois sur le rebord avant de tomber. Un chat qui tape la surface chromée d'un grille-pain et voit son reflet taper en retour. Un barista dont le poignet fait des mouvements oscillants précis pour créer une rosetta.

Ce type de prompt teste trois choses simultanément : la compréhension causale (la balle tombe parce qu'elle a fait trois tours), la cohérence physique dans le temps, et la correspondance audio. Ce sont exactement les points où les modèles vidéo actuels se cassent la figure le plus souvent.


Un modèle pseudonyme en tête
"HappyHorse" comme nom, logo générique, identité inconnue. Artificial Analysis précise explicitement que le modèle est pseudonyme et que des détails suivront. Ce pattern ressemble à deux scénarios possibles.
Premier scénario : un labo stealth qui teste la réception de son modèle avant une annonce publique. Soumettre en pseudonyme à un arena indépendant est une façon propre de valider sans créer d'attente. Si le modèle performe, l'annonce est facile. Si ça déçoit, rien n'a filtré.
Second scénario : un grand acteur qui teste une version non encore annoncée d'un modèle existant. Google, Stability, Runway, voire un des acteurs chinois avec un modèle non encore lancé en Occident. Le leaderboard d'Artificial Analysis compte déjà des modèles de Google Veo, MiniMax, Alibaba, quelqu'un dans cet écosystème a accès au pipeline de soumission.
Dans les deux cas, l'absence d'API disponible confirme que c'est une validation de perf, pas un lancement commercial.
Ce que ça change pour un pipeline vidéo IA
Si tu construis un workflow de génération vidéo aujourd'hui, AI UGC, contenu social, vidéo produit, le classement actuel te donne une grille de lecture utile, même sans accès à HappyHorse.
Kling 3.0 Pro reste le choix "safe" avec API disponible et une qualité documentée, mais à $13.44/min c'est cher pour du volume. grok-imagine-video à $4.20/min représente un meilleur ratio si tu travailles dans l'écosystème xAI. PixVerse V6 à $5.40/min avec un ELO de 1322 est compétitif pour les cas d'usage sans audio prioritaire.
On avait creusé le choix de modèle pour des pipelines AI UGC dans le playbook LATAM, le nouveau leaderboard change directement les recommandations de cette stack. Et pour les cas où tu veux contrôler le persona visuel sur la durée, l'approche Anchor Image reste pertinente quel que soit le modèle de génération retenu.
Combien de temps avant qu'on sache qui c'est ?
Artificial Analysis a annoncé "further details coming soon". Soit le créateur lève le voile rapidement pour capitaliser sur la performance, soit il attend d'avoir une API prête à ouvrir.
Un modèle vidéo capable de battre ByteDance et xAI sur des prompts complexes avec audio, en avril 2026, vient de quelqu'un qui a sérieusement investi dans l'architecture. L'écart de 71 points sur Kling 3.0 Pro, qui coûte $13.44/min et représente l'état de l'art commercial accessible, suggère une génération d'avance sur ce qui est actuellement vendable. La fenêtre entre "meilleur modèle du monde" et "disponible via API à prix raisonnable" se réduit, Higgsfield en open source il y a quelques semaines, HappyHorse en pseudonyme cette semaine.
Classement ELO complet de 70+ modèles vidéo avec prix API, dates de release et intervalles de confiance.



