
tech
TurboQuant : l’algorithme de Google pour compresser efficacement les clés-valeurs des LLM et moteurs de recherche vectorielle
Google lance TurboQuant, une suite d’algorithmes avancés pour la quantification et la compression des modèles de langage et moteurs vectoriels, optimisant la recherche augmentée (RAG). Une innovation clé pour alléger les ressources et améliorer la performance des systèmes LLM.
6 min
13 mai · 02h13