
tech
SmolVLA : un modèle vision-langage-action efficace entraîné sur les données de la communauté Lerobot
SmolVLA révolutionne l'IA multimodale avec un modèle compact capable d'interpréter vision, langage et actions. Entraîné sur un corpus communautaire inédit, il allie performance et efficience, ouvrant de nouvelles perspectives pour la robotique et l'interaction homme-machine.
5 min
18 mai · 19h46