Mindblown: a blog about philosophy.

  • GPT-4 e valutazioni professionali: la risposta sbagliata alla domanda sbagliata

    OpenAI ha enfatizzato le prestazioni di GPT-4 nei test di licenza professionale, ma potrebbe aver testato il modello sui dati di addestramento. Inoltre, i benchmark umani sono inadatti per valutare i bot. GPT-4 ha ottenuto risultati impressionanti nei test professionali, come il 90° percentile nell’esame da avvocato. Tuttavia, ci sono due problemi principali con questi…

Vuoi raccomandare qualche libro?