TopoBleau réinvente la transmission du geste en escalade : fini les vidéos lourdes et inaccessibles en forêt. Place au squelette, synthèse parfaite de la technique.
Face à un bloc, le grimpeur a besoin d'informations détaillées sur la méthode — placement des mains, des pieds, rotation du bassin — que les topos classiques ne fournissent pas.
Les topos existants (livres, apps comme TopoBleau) montrent le tracé de la voie sur le rocher. Ils indiquent le départ, le chemin et le sommet. Mais ils ne montrent pas comment grimper.
Les vidéos de méthodes existent sur YouTube et Instagram, mais elles nécessitent un réseau mobile à haut débit — rarement disponible dans les espaces naturels comme la forêt de Fontainebleau.
Même optimisée, une vidéo reste trop volumineuse pour stocker des milliers de méthodes sur un smartphone. La vraie information utile n'est pas le pixel du grimpeur, mais son squelette.
L'information canonique d'une méthode d'escalade est le squelette du grimpeur, pas ses pixels. En ne considérant que le squelette, on s'affranchit aussi de la contrainte d'un arrière-plan statique.
Une méthode automatique pour construire une base de données d'enchaînements gestuels : économique en stockage, reconstituable hors ligne, affichable directement sur la photo du bloc.
La technologie superpose l'enchaînement gestuel du grimpeur — sous forme de squelette animé — directement sur la photo de référence du bloc. Au lieu du tracé de la voie, on voit le corps du grimpeur évoluer sur le rocher.
Un squelette est un ensemble de coordonnées 2D indiquant la position en pixels de jusqu'à 136 articulations : tronc, tête, pieds, mains, genoux, bassin…
D'une vidéo d'environ 100 Mo, on obtient un fichier d'enchaînement gestuel de 10 Ko environ, indépendamment de la résolution originale.
Pour chaque bloc d'escalade disposant d'une vidéo de méthode, le traitement s'effectue en quatre étapes entièrement automatisées.
Téléchargement de la vidéo de méthode depuis YouTube ou toute autre source vidéo en ligne.
Extraction des poses successives du grimpeur via AlphaPose (ResNet50 + YOLOv3, 256×192). Jusqu'à 136 points par image.
Calcul de la transformation T entre les images de la vidéo et la photo du bloc, via SuperPoint + LightGlue + RANSAC (OpenCV).
Les coordonnées 2D des segments sont encodées en unsigned short sur 4 bytes puis compressées avec ZIP.
Lors de la reconstruction, le fichier binaire est décompressé et décodé pour récupérer les coordonnées des segments. Ceux-ci sont directement affichés en superposition de l'image associée, sans connexion internet.
La suppression des pixels du grimpeur au profit du squelette génère un effet cascade sur toute la chaîne technique.
Les fichiers squelettes sont embarquables dans le binaire de l'application. Plusieurs milliers de méthodes accessibles sans connexion, même au cœur de la forêt de Fontainebleau.
Aucun décodage vidéo nécessaire. Les CPU et GPU du smartphone ne sont pas sollicités pour du streaming. La batterie dure plus longtemps lors des sorties escalade.
Moins de bande passante consommée, moins de stockage temporaire en cache, moins d'énergie serveur. Une approche écologique et frugale par design.
Le squelette est l'information canonique du geste. Il délivre l'essentiel — position des mains, des pieds, du bassin — sans le bruit visuel de l'environnement.
Que la vidéo source soit en 720p ou en 4K, le fichier de sortie pèse toujours entre 1 et 60 Ko. La compression est fondamentalement indifférente à la résolution.
Le pipeline est entièrement automatique. Il peut traiter des milliers de vidéos YouTube existantes pour constituer rapidement une base de données massive de méthodes.
La technologie ouvre de nombreuses pistes d'amélioration et d'applications au-delà de l'escalade de bloc.
En ajoutant une 3ème coordonnée à chaque point, la méthode peut être étendue à l'affichage en réalité augmentée ou superposé à un modèle 3D du rocher.
Détecter l'absence de mouvement significatif entre deux images pour n'enregistrer que les positions intermédiaires pertinentes — réduisant encore davantage la taille.
Plutôt qu'une homographie globale, calculer une carte de transformation dense pixel à pixel pour mieux gérer les variations de profondeur non modélisables par homographie.
Remplacer le squelette filaire par un avatar 2D ou 3D pour un meilleur rendu visuel et une compréhension encore plus intuitive du geste pour le grimpeur.
Appliquer des algorithmes de compression spécifiques aux séquences de squelettes pour réduire encore les 1–60 Ko actuels.
Tout domaine où le geste d'une vidéo peut se synthétiser en segments 2D/3D utilisables sans réseau : danse, gymnastique, arts martiaux, rééducation sportive…