Méthodes d’entraînement des agents conversationnels : RLHF ou DPO 23/10/2024 par Nelly Pailhé | Aucun commentaire Éduquer les modèles de langage, dans Sciences et avenir, n° 933, novembre 2024, pp. 38-39