
tech
SimpleQA : le nouveau benchmark d’OpenAI pour évaluer la factualité des modèles de langage
OpenAI dévoile SimpleQA, un benchmark innovant conçu pour mesurer la capacité des modèles de langage à répondre à des questions factuelles courtes. Cette avancée permet d’évaluer précisément la véracité des réponses générées par les IA.
7 min
17 mai · 01h37