Toutes les études de cas

Création de vidéos highlights sportifs par IA

Comment nous avons construit un pipeline multimodal — audio, vision et transcription — capable de détecter les moments clés d'un match et de générer des vidéos highlight au format TikTok, entièrement en serverless.

Clients

Red Star FC · FC Tokyo · FC93

Stack

Python · AWS Lambda · OpenCV · Whisper · FFmpeg

Résultat clé

Highlight prêt à poster en < 3 min

Vidéo highlight d'un match généré automatiquement par IA pour Red Star FC

Le contexte

Les clubs de football vivent d'engagement. Après chaque match, l'équipe com' doit sortir des contenus — les buts, les actions spectaculaires, les célébrations — avant que l'algorithme ne passe à autre chose. Sauf que monter un highlight manuellement prend du temps : récupérer la vidéo brute, identifier les moments, couper, sous-titrer, reformater en vertical. Souvent plusieurs heures pour quelques secondes de contenu.

Red Star FC nous a contactés avec un problème simple : leurs matchs du vendredi soir généraient peu d'engagement sur les réseaux parce que les highlights arrivaient le lendemain matin. Ils voulaient poster dans les minutes qui suivent le coup de sifflet final — sans embaucher un monteur supplémentaire.

Les défis techniques

01

Détecter les moments clés sans annotation humaine

Un match dure 90 minutes. Identifier automatiquement un but, un arrêt décisif ou une action spectaculaire nécessite de croiser plusieurs signaux : un pic sonore dans la foule, un changement brutal de dynamique visuelle sur le terrain, et le cri du commentateur. Aucun signal pris isolément n'est suffisant — c'est leur fusion qui permet une détection fiable.

02

Reformater en vertical sans couper l'action

Le format TikTok / Reels est 9:16, les vidéos de match sont 16:9. Il ne s'agit pas de rogner bêtement — il faut suivre le ballon et les joueurs en temps réel pour recadrer dynamiquement sans perdre l'action principale. Nous avons utilisé du tracking de saillance visuelle frame par frame pour décider du crop optimal à chaque instant.

03

Absorber la charge du jour de match en serverless

Le traitement ne s'étale pas sur la semaine — tout se passe dans les 5 minutes suivant le coup de sifflet. Maintenir une infrastructure allumée 24h/7j pour quelques pics d'activité hebdomadaires n'avait aucun sens économique. Nous avons conçu un pipeline entièrement déclenché par événement sur AWS Lambda, capable de paralléliser le traitement des segments vidéo à la demande.

La solution

Pipeline vidéo automatisé

Le système analyse le flux vidéo complet du match pour en extraire automatiquement les séquences clés. Un premier passage par Grounding DINO (Computer Vision) et analyse sonore (Audio AI) détecte les événements significatifs — changements de dynamique sur le terrain, célébrations, regroupements de joueurs, réactions des supporters. Ces séquences candidates sont ensuite évaluées par Gemini (LLM multi-modal) qui confirme la nature de l'action, la classe par importance et génère le découpage final. Le résultat : des clips prêts à poster, sans visionnage humain.

Reformatage intelligent pour les réseaux sociaux

Chaque highlight est automatiquement converti du format 16:9 (broadcast) au format 9:16 (TikTok/Reels). Un algorithme de tracking de saillance visuelle recadre dynamiquement frame par frame en suivant le ballon et les joueurs — évitant le crop statique qui coupe systématiquement l'action. Les sous-titres sont générés via Whisper et incrustés directement dans la vidéo.

Architecture serverless et scalable

L'ensemble du pipeline tourne sur une architecture événementielle AWS. Les jobs de traitement vidéo sont distribués via SQS vers des workers asynchrones sur Lambda et ECS Fargate. Les vidéos brutes et les highlights sont stockés sur S3 avec optimisation de l'encodage, puis distribués via CDN pour une diffusion instantanée. Coût infra hors jour de match : zéro.

La stack technique

Computer Vision Grounding DINO · OpenCV
Transcription OpenAI Whisper
Traitement vidéo FFmpeg
Orchestration AWS Lambda · ECS Fargate · SQS · AI Agent (Google Gemini)
Stockage & CDN AWS S3 · CloudFront
Langage Python

Les résultats

< 3 min

Du coup de sifflet au highlight posté

5 clubs

dont Red Star FC · FC Tokyo · FC93

Coût ~0

comparé à un monteur humain

Le Red Star FC a vu son taux d'engagement sur les posts matchday multiplié par 2,8 en l'espace de deux mois — simplement parce que les vidéos arrivaient pendant que les supporters étaient encore dans les gradins. FC Tokyo a utilisé la solution pour alimenter son compte TikTok JP avec des highlights en japonais, sous-titrés automatiquement via Whisper.

L'architecture serverless s'est révélée particulièrement adaptée au rythme du football : coût quasi nul en semaine, burst massif le samedi soir, retour à zéro le dimanche matin.

Un projet similaire en tête ?

Parlons-en