| |||||
| Auteur | Sujet : [Topic Unique] Machine Learning & Data Science |
|---|---|
Profil supprimé | Posté le 21-09-2017 à 15:26:40 ![]() Reprise du message précédent : |
o_BlastaaMoof_o | Parce que c'est de la merde. |
Profil supprimé | Posté le 21-09-2017 à 15:48:49 ![]() Développe, ça m'intéresse |
Darmstadtium Pipoteur grotesque | Personnellement je suis pas fan de R passé l'étape d'exploration de données et prototypage.
--------------- Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets |
Darmstadtium Pipoteur grotesque | Sinon je suis intéressé par la team Kaggle aussi mais je sais pas si j'aurai le temps de beaucoup m'investir. Niveau : XP pro en data science et R&D en ML + je commence un doctorat en ML Message édité par Darmstadtium le 21-09-2017 à 16:12:10 --------------- Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets |
Profil supprimé | Posté le 21-09-2017 à 19:29:36 ![]() Ok thank's !
|
Bébé Yoda | EN fait si tu boucles de manière aléatoire à chaque fois, tu ne pourras jamais avoir fait le training sur l'ensemble de tes données. |
Profil supprimé | Posté le 21-09-2017 à 19:40:39 ![]() Ouaip d'où mon doute. Mon prof avait commencé à implémenter ça comme ça... |
TiDom | Comme disait Rontgen, la K-folds cross validation permet d'obtenir une estimation de la performance future d'un classifieur/regresseur.
|
Profil supprimé | Posté le 21-09-2017 à 21:10:23 ![]()
|
Rasthor |
|
Profil supprimé | Posté le 22-09-2017 à 10:50:47 ![]() Ok merci, je vais recoder ça alors |
o_BlastaaMoof_o | Pourquoi implémenter ça soi-même au fait ? |
Bébé Yoda | Pour mieux comprendre comment ça marche je suppose. |
Profil supprimé | Posté le 22-09-2017 à 12:58:59 ![]() Car je suis étudiant, j'aimerais comprendre les outils dont je me sers. En stage ou en taf j'utiliserai bien sur les fonctions déjà existantes |
TiDom | Ce que propose BlastaaMoof, la validation croisée "stratifiée", est adaptée aux problèmes de classification supervisée : en gros, dans chaque fold, on essaie de garder la même distribution de classes que dans la base d'apprentissage. Selon, les expériences et la conclusion de R. Kohavi : Par contre le problème de non-compliant est un problème de régression. La validation croisée stratifiée ne peut être utilisée comme telle. Je n'arrive pas à retrouver une réf sur le sujet mais l'idée est de construire des folds avec la même moyenne de la variable à prédire. Message édité par TiDom le 22-09-2017 à 13:08:58 |
TiDom | @non-compliant : Message édité par TiDom le 22-09-2017 à 13:26:26 |
Profil supprimé | Posté le 22-09-2017 à 13:28:09 ![]()
|
Profil supprimé | Posté le 22-09-2017 à 15:16:03 ![]() createFolds() du package caret fait exactement ce que je voulais faire |
blacksad |
Pour nuancer un peu le propos :
|
o_BlastaaMoof_o | Du PySpark... Y a-t-il au moins une réelle problématique Big Data ? Parce que sinon, on a aussi vite fait de faire du bon vieux SQL avec un bon vieux SGBD relationnel.
|
TiDom |
|
Rasthor | A Guide For Time Series Prediction Using Recurrent Neural Networks (LSTMs)
|
zairo | A la louche je dirais que j'aurais 500 mo de données (j'ai pas finis l'extraction)
|
zairo | ok pour pandas, je vais voir de ce côté là |
Bébé Yoda |
À mon avis ça doit pouvoir se faire tranquillement oui. |
Rasthor | Y'avait d'ailleurs un article pour comment gerer des centaines de Mo dans Pandas: Message édité par Rasthor le 02-10-2017 à 00:47:25 |

| Sujets relatifs | |
|---|---|
| [Topic unique] Veille IA - Actu, lectures, podcasts & documentaires | [Topic Unique] Claude by Anthropic |
| [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co | |
| Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science | |




