
tech
VibeVoice : le nouveau modèle speech-to-text de Microsoft intègre la diarisation des locuteurs
Microsoft dévoile VibeVoice, un modèle audio open source de transcription vocale avec identification des locuteurs intégrée. Ce système MIT licensed rivalise avec Whisper tout en facilitant l’analyse multi-intervenants, une avancée majeure pour les applications francophones.
5 min
28 avr · 00h21