Reprise du message précédent :
J'ai l'impression que tout le monde s'en tape du train - val - test qu'on nous a enseigné en école
L'IA moderne c'est prendre toutes les données possibles et train aussi longtemps que ton budget GPU te le permet
Ensuite la commu teste ton modèle sur différents benchmarks
C'est un truc que je faisais depuis longtemps à mon taf, jvoyais pas pk je devais me faire chier à split localement alors qu'on a des milliers et des milliers de samples de test dans des datasets isolés pour le regulatory (FDA etc)
Tu train sur tout et tu balances ça sur le test direct basta
Avis éclairés ?