[Topic Unique] Machine Learning & Data Science

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 .. 132 133 134 135 136 137 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic Unique] Machine Learning & Data Science

mystiko

Reprise du message précédent :

MTiger a écrit :

j'ai une question bete [:794]

j'entraine mon rn sur des données et j'obtiens des résultats corrects sur le set d'entrainement

puis j'essaie de faire un predict sur des sous échantillons des données d'entrainement et ca donne des erreurs bien supérieures aux résultats juste au dessus

comment c'est possible ? parce que à priori j'applique les mêmes poids aux mêmes inputs?

doit y avoir une feinte qq part mais je capte vraiment pas [:psywalk]

welcome dans la problématique n°1 d'un DS et qui apportera un algo naze en prod
Overfitting à gérer
et/ou
analyse des predictions (avec shap par exemple) pour voir pourquoi il fait de la merde sur les predictions

Message cité 1 fois

Publicité

NotCompliant

Non c'est pas de l'overfitting je pense ?

Il comprends pas pk il a des bons resultats en evaluant son training set mais des mauvais resultats sur ces meme elements isoles du training set

Ptet la distribution de ton training set avec certains elements qui surperforment et biaisent les resultats vers le haut quand t'evalues le set dans son ensemble

Ou ptet un bug dans ton code et dans ta logique d'evaluation (genre oublie de model.eval() en pytorch jsp)

Message cité 1 fois
Message édité par NotCompliant le 13-02-2024 à 16:05:57

MTiger

NotCompliant a écrit :

Non c'est pas de l'overfitting je pense ?

Il comprends pas pk il a des bons resultats en evaluant son training set mais des mauvais resultats sur ces meme elements isoles du training set

Ptet la distribution de ton training set avec certains elements qui surperforment et biaisent les resultats vers le haut quand t'evalues le set dans son ensemble

Ou ptet un bug dans ton code et dans ta logique d'evaluation (genre oublie de model.eval() en pytorch jsp)

ca serait de l'overftting si j'étais sur un ensemble différent de mon training

ptet un bug mais je vois pas lequel [:delarue3]

je fais juste du
x= x1,x2
y = y1,y2
xtrain,xtest,ytrain,ytest = train_test_split(x,y)

nn.fit(xtrain,ytrain)
nn.predict(x1)

et les erreurs du predict sont bien plus grandes que sous le fit (et c'est valable pour les erreurs sur le traning ou le test set.....)
et je vois pas comment c'est possible

Message cité 3 fois
Message édité par MTiger le 14-02-2024 à 13:37:11

Trefledepique_W

mystiko a écrit :

Soyons raisonnables, l'approche la plus commune c'est d'investir du temps dans un bon powerpoint et la démo live qui donne des résultats incroyables pour que le client accepte l'algo tel quel

fazero

Salut c'est Ralph

MTiger a écrit :

ca serait de l'overftting si j'étais sur un ensemble différent de mon training

ptet un bug mais je vois pas lequel [:delarue3]

je fais juste du
x= x1,x2
y = y1,y2
xtrain,xtest,ytrain,ytest = train_test_split(x,y)

nn.fit(xtrain,xtest)
nn.predict(x1)

et les erreurs du predict sont bien plus grandes que sous le fit (et c'est valable pour les erreurs sur le traning ou le test set.....)
et je vois pas comment c'est possible

Non pour plusieurs raisons. Notamment parce que souvent l'entraînement se fait avec du dropout

Message cité 1 fois

---------------
Agent immobilier sur Paris 16

TiDom

MTiger a écrit :

non mais on est d'accord qu'une fois le modèle entrainé les poids sont fixés et donc quand je fais du predict sur un sous ensemble du traning, les memes poids appliqués aux memes inputs devraient donner les memes résultats ?

ca serait de l'overftting si j'étais sur un ensemble différent de mon training

ptet un bug mais je vois pas lequel [:delarue3]

je fais juste du
x= x1,x2
y = y1,y2
xtrain,xtest,ytrain,ytest = train_test_split(x,y)

nn.fit(xtrain,xtest)
nn.predict(x1)

et les erreurs du predict sont bien plus grandes que sous le fit (et c'est valable pour les erreurs sur le traning ou le test set.....)
et je vois pas comment c'est possible

Mais les paramètres de ton fit ne semblent pas bons.
Ça devrait être dans ton cas xtrain,ytrain
https://scikit-learn.org/stable/tut [...] orial.html

Message cité 1 fois

fazero

Salut c'est Ralph

Ah oui wtf y a deux fois du x dans le train là

---------------
Agent immobilier sur Paris 16

NotCompliant

MTiger a écrit :

ca serait de l'overftting si j'étais sur un ensemble différent de mon training

ptet un bug mais je vois pas lequel [:delarue3]

je fais juste du
x= x1,x2
y = y1,y2
xtrain,xtest,ytrain,ytest = train_test_split(x,y)

nn.fit(xtrain,xtest)
nn.predict(x1)

et les erreurs du predict sont bien plus grandes que sous le fit (et c'est valable pour les erreurs sur le traning ou le test set.....)
et je vois pas comment c'est possible

Ta premiere phrase est pas claire en vraie et jsp ce que tu cherches a faire

Si tu fais model.eval(training test) et que t'obtiens une accuracy de 95% ca veut pas dire que model.eval(premiers 200 exemples du training test) te donneras aussi 95%

Si tu iteres comme ca par paquet de 200 et que tu stores les paires predictions / GT et que tu computes manuellement tes metriques normalement tu devrais retomber sur tes pieds oue, si c'est pas le cas y'a un bug qq part

Si t'es surpris du fait que model.eval(premiers 200 exemples du training test) te donnes une accuracy degueulasse, t'as ptet un jeu de donnee IMBALANCED (KEYWORD HERE) et que ton modele a juste appris a predire la classe dominante etc

Vu ton code jpense t'as surtout pas fait correctement ton split de donnees, y'a pas de garanties que x1 soit entierement dans xtrain, pour ca que nn.predict(x1) te donne pas une erreur similaire a nn.predict(xtrain)

BITEEEEEEEEEEEEE

Message cité 1 fois
Message édité par NotCompliant le 14-02-2024 à 03:33:26

MTiger

TiDom a écrit :

Mais les paramètres de ton fit ne semblent pas bons.
Ça devrait être dans ton cas xtrain,ytrain
https://scikit-learn.org/stable/tut [...] orial.html

j'ai pas fait du copier/collé de mon code j'ai tapé à l'arrache et c'est une coquille
corrected

Message édité par MTiger le 14-02-2024 à 13:36:51

MTiger

NotCompliant a écrit :

Ta premiere phrase est pas claire en vraie et jsp ce que tu cherches a faire

Si tu fais model.eval(training test) et que t'obtiens une accuracy de 95% ca veut pas dire que model.eval(premiers 200 exemples du training test) te donneras aussi 95%

BITEEEEEEEEEEEEE

c'est pas une classification, j'essaie de prédire une variable continue ou l'erreur est continue donc
si je calcule l'erreur maximale (ie l'erreur la plus haute obtenue sur l'ensemble des données xtrain ET xtest), mettons que j'obtiens une erreur e
maintenant si je calcule l'erreur maximale lors du predict avec x2, l'erreur maximale obtenue est e2 avec e2>>>> e
donc ya une couille dans le patée
meme avec des données imbalanced, je devrais pas avoir une erreur maximale supérieure sur un sous ensemble des données

en très gros si j'affiche le predict avec xtrain et sur xtest et que je compare avec ytrain et ytest, j'obtiens une erreur maximale e
et si je faisd un predict x1 j'obtiens une erreur maximale e2 >>>>e
ce qui me parait dafuk

x= x1,x2
y = y1,y2
xtrain,xtest,ytrain,ytest = train_test_split(x,y)

nn.fit(xtrain,ytrain)
e = max(nn.predict(xtrain) - ytrain, nn.predict(xtest) - ytest)
e2= max(nn.predict(x1)- y1)

e2>e

au passage c'est pas juste un maximum, globalement les erreurs sont en général un bon cran supérieures sur le nn.predict(x1)- y1 que sur les deux autres predict de xtrain et xtest
globalement l'erreur e est acceptable et on se dit que le réseau marche au moins sur les données d'entrainement alors qu'e2 est juste dégueulasse ....
plus clair comme ça ? [:ma muse]

Message édité par MTiger le 14-02-2024 à 14:10:44

Publicité

MTiger

fazero a écrit :

Non pour plusieurs raisons. Notamment parce que souvent l'entraînement se fait avec du dropout

les quelques dropouts ca peut vraiment faire changer les résultats comme ça ?
ok je vais vérifier

NotCompliant

En faisant comme ca

x= x1,x2
y = y1,y2
xtrain,xtest,ytrain,ytest = train_test_split(x,y)

Tu controles pas quel % de x1 est dans ton jeu d'entrainement et dans ton test (c'est un split aleatoire)

Message cité 1 fois

MTiger

NotCompliant a écrit :

En faisant comme ca

x= x1,x2
y = y1,y2
xtrain,xtest,ytrain,ytest = train_test_split(x,y)

Tu controles pas quel % de x1 est dans ton jeu d'entrainement et dans ton test (c'est un split aleatoire)

oui je sais MAIS je compare l'erreur de x1 avec le max de l'erreur d'à la fois du jeu d'entrainement ET du jeu test

donc je vois pas pourquoi ce serait important quel % de x1 se retrouve dans le train ou le test puisque je prends l'erreur max des deux et donc le max de l'erreur de x1 forcément incluse dans l'un de ces deux éléments : e = max(nn.predict(xtrain) - ytrain, nn.predict(xtest) - ytest)

Message édité par MTiger le 14-02-2024 à 21:28:09

mystiko

Ton X1 il est choisi comment?
Si tu mets une valeur absolue sur ton erreur, tu enlèves ce probleme ou pas?

Message cité 1 fois

MTiger

mystiko a écrit :

Ton X1 il est choisi comment?
Si tu mets une valeur absolue sur ton erreur, tu enlèves ce probleme ou pas?

c'est ce que je cherche à modéliser
en gros c'est une suite de processus similaires obtenus dans des conditions différentes, dans le code j'ai x1,x2,.....,xn, j'ai simplifié en x1,x2 pour le forum
c'est pour ça, je cherche à voir si ca marche pour prédire ce qu'il se passe lors d'un truc particulier
a terme, faudra passer en lstm car c'est un processus temporel mais déjà je commence par un nn classique
non la valeur absolue change rieng

Message édité par MTiger le 14-02-2024 à 21:34:52

NotCompliant

Plop

Quelqu'un ici a de l'exp positive avec du semi-supervise pour des videos ? Mon setup c'est le plus simple qui soit, une variable continue a predire (qui peut s'estimer visuellement par un expert donc a priori faisable par un reseau, experiences preliminaires en full supervised qui vont dans ce sens), des tas de videos de bonne qualite sans annotations, quelques milliers avec les bonnes annotations

J'ai un peu fouille paperswithcode mais rien trouve de fou / qui a l'air simple a implementer

Des conseils ?

Message édité par NotCompliant le 21-02-2024 à 03:39:54

MassiveAttack

Bonjour à tous,

J'ai posté épisodiquement sur ce feed il y a quelques temps suite à ma réorientation en data science, et j'ai de nouveau besoin de vos services / conseils .

Suis data manager depuis un peu plus de deux ans maintenant, et je suis complètement passé à côté de certaines innovations depuis la fin de mon master (novembre 2019), notamment tout ce qui gravite autour des LLM / IA generative. La faute à mon job actuel (très orientés sur des cas d'usage d'analyse business / data viz qui n'ont rien à voir avec ce domaine) et par manque de temps.

Est-ce que vous auriez des références de mooc / cours / docs / projets kaggle pour que je puisse potasser un peu le sujet ?

Merci à vous

fazero

Salut c'est Ralph

deeplearning.ai fait des trucs sympas et pas très longs

---------------
Agent immobilier sur Paris 16

NotCompliant

Karpathy a des cours avec code en live etc sur ce sujet : https://youtu.be/zduSFxRajkE

3Bleu1Marron a de bonnes videos pour l'aspect maths : https://youtu.be/eMlx5fFNoYc

Message cité 1 fois

MassiveAttack

Merci beaucoup je vais regarder ça !
Une amie m'a notamment conseillé "Generative AI for Everyone" sur deeplearning.ai

mcrak

1er, 2ème & 3eme top player.

NotCompliant a écrit :

3Bleu1Marron a de bonnes videos pour l'aspect maths : https://youtu.be/eMlx5fFNoYc

Vous connaissez d’autres chaînes d’une qualité comparable à celle-ci?
C’est une vraie mine d’or j’adore ses vidéos, merci pour le partage!

---------------
Se Queda.

NotCompliant

Petit quizz, qui peut me dire ce que ce modele fait et si c'est une bonne idee d'implementation. Je donne pas de contexte pour pas biaiser, je poste mon analyse apres pour discussion

Spoiler :

Message cité 1 fois
Message édité par NotCompliant le 26-04-2024 à 05:34:13

mrproton

Désolé j'utilise par tensorflow le boomer

fazero

Salut c'est Ralph

Vous faites des trucs compliqués

De mon côté maintenant 80% du boulot c'est de faire des requêtes à openAI

Message cité 1 fois

---------------
Agent immobilier sur Paris 16

NotCompliant

C'est cense etre un UNET + LSTM fait par ma ((((collegue))) pour traiter des videos

Ca prends une sequence de 16 images, applique un conv+lstm dessus pour apprendre les features temporelles et spatiales et... elle detruit tout directement en appliquant un maxpooling hyper aggressif sur l'axe temporel (donc 16 images -> 1 image)

Ensuite elle applique unet pour faire la segmentation

Elle s'etonne que ca marche aussi bien et tout le monde la felicite, ui ca marche bien car tu fais juste de la segmentation classique avec une sorte de regularisation cheloue au debut mais y'a 0 apprentissage temporel

Le model doit probablement juste apprendre a mettre les pixels les plus brilliants sur la frame du milieu (celle qui colle au masque ground truth) et basta

gnieeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee

Message édité par NotCompliant le 26-04-2024 à 11:54:05

NotCompliant

fazero a écrit :

Vous faites des trucs compliqués

De mon côté maintenant 80% du boulot c'est de faire des requêtes à openAI

T'as pas de syndrome imposteur / anxiete ? Si c'est vraiment ca ton taf c'est finito non ?

Message cité 1 fois

LibreArbitre

La /root est longue

NotCompliant a écrit :

Petit quizz, qui peut me dire ce que ce modele fait et si c'est une bonne idee d'implementation. Je donne pas de contexte pour pas biaiser, je poste mon analyse apres pour discussion

Spoiler :

https://image.noelshack.com/fichier [...] dc5e72.jpg

Citation :

Implementation Assessment

Whether this model is a good implementation idea depends on the specific task and data at hand. ConvLSTM2D layers are generally good for tasks that involve both spatial and temporal dimensions, such as video classification or weather prediction with spatially distributed data over time. However, without more context about the data and the problem being solved, it's difficult to assess the effectiveness of this model architecture.

It's also worth noting that there are some commented-out lines in the code, which might indicate that the model is still under development or that different configurations are being tested.

Citation :

Quant à savoir s'il s'agit d'une bonne idée de mise en œuvre, cela dépend de la tâche spécifique et des données en question. Les couches ConvLSTM2D sont généralement bonnes pour les tâches qui impliquent à la fois des dimensions spatiales et temporelles, comme la classification vidéo ou la prévision météorologique avec des données réparties spatialement au fil du temps. Cependant, sans plus de contexte sur les données et le problème à résoudre, il est difficile d'évaluer l'efficacité de cette architecture de modèle.

Il convient également de noter qu'il y a quelques lignes commentées dans le code.

De rien

Edit : Je ne suis pas DS donc je serais intéressé de savoir si la réponse faite est pertinente ou pas :jap:

Message édité par LibreArbitre le 26-04-2024 à 12:24:08

---------------
Hebergement d'images

NotCompliant

C'est une reponse superficielle, ca dit pas grand chose, il explique juste chaque couche et leur agencement mais fait pas de conclusion quant a la pertinence du modele

Chatgpt4 est pas mal et allait dans mon sens, j'ai un pote DS qui est aussi d'accord

Jpense que mon intuition est correcte mais feel free to correct me

MTiger

bonjour :hello:

est ce qu'il y a une commande python pour avoir accès a sa feature list pour un réseau de neurones sklearn sauvegardé avec pickle?

je vous remercie [:augie]

LibreArbitre

La /root est longue

A priori non mais : https://you.com/search?q=est+ce+qu% [...] bm=youchat

Spoiler :

mais comme d'habitude ça doit être de la merde

Message cité 1 fois
Message édité par LibreArbitre le 26-04-2024 à 16:50:12

---------------
Hebergement d'images

MTiger

LibreArbitre a écrit :

A priori non mais : https://you.com/search?q=est+ce+qu% [...] bm=youchat

Spoiler :

mais comme d'habitude ça doit être de la merde

dak merci

silly_hopper

Bonjour,

Je commence a me faire une bonne reputation dans ma boite et j'ai la possibilite de passer team lead/chef d'equipe. J'ai deja un impact important sur plusieurs departements en temps qu'IC senior (ingenieur recherche) et je suis en consequence tres bien paye avec des augmentations consequentes tous les ans. On m'a fait comprendre que le passage en chef d'equipe n'aurai qu'un impact marginal sur la remuneration.

J'ai ~15ans d'xp, je suis a un niveau de salaire qui me suffirait largement si il suit environ l'inflation et je me demande si les responsabilites supplementaires justifient le changement de role. Des avis?

Message cité 1 fois
Message édité par silly_hopper le 10-05-2024 à 20:55:14

Pina Colada

C'est pas des responsabilités supplémentaires, c'est des responsabilités différentes. C'est deux types de jobs différents avec des enjeux et des responsabilités différentes.
C'est l'erreur classique de passer "manager" pour penser gagner plus.

NotCompliant

Plus d'emmerdes = up de salaire conséquent

Je comprends pas le délire de vouloir + de responsabilités

Message cité 1 fois

Filob

silly_hopper a écrit :

Bonjour,

Je commence a me faire une bonne reputation dans ma boite et j'ai la possibilite de passer team lead/chef d'equipe. J'ai deja un impact important sur plusieurs departements en temps qu'IC senior (ingenieur recherche) et je suis en consequence tres bien paye avec des augmentations consequentes tous les ans. On m'a fait comprendre que le passage en chef d'equipe n'aurai qu'un impact marginal sur la remuneration.

J'ai ~15ans d'xp, je suis a un niveau de salaire qui me suffirait largement si il suit environ l'inflation et je me demande si les responsabilites supplementaires justifient le changement de role. Des avis?

je +1 sur le "ce sont 2 jobs différents", faut bien avoir ça en tête.

J'ai fait le shift il y a 5 ans pour de bon, le management pur ça me saoule un peu par contre j'aime beaucoup la partie stratégie/ vision (mais tu l'as vraiment en étant directeur, pas middle manager).

Middle manager c'est quand même spécial comme position je trouve, et pas le + passionnant à mes yeux.

---------------
Ma capacité de concentration est si courte que... Oh, regarde, un pigeon!

silly_hopper

NotCompliant a écrit :

Plus d'emmerdes = up de salaire conséquent

Je comprends pas le délire de vouloir + de responsabilités

c'est un peu court termiste comme approche. J'ai fait plusieurs changements sans augmentation de salaire immediate mais qui m'ont permis de faire x6 sur le salaire en ~10 ans. Sur le long terme l'objectif ne serait clairement pas de rester middle manager mais de passer au dessus comme indique precedemment, ou je pense que le potentiel est probablement a x1.5/x2

Message cité 1 fois

fazero

Salut c'est Ralph

NotCompliant a écrit :

T'as pas de syndrome imposteur / anxiete ? Si c'est vraiment ca ton taf c'est finito non ?

Si tout le temps mais j'ai appris à vivre avec

Mon taff ça a jamais tellement été de faire de l'algo pur, j'ai du faire du deep learning en prod une fois en 10 ans
ça consiste plutôt à être au milieu d'ITs qui comprennent rien à la data et s'en foutent du produit et des équipes produit qui comprennent rien à la data non plus et s'en foutent de la partie IT

Ce qui est finito dans le métier j'ai l'impression c'est faire de l'algo pur (sauf chez Meta/Google/OpenAI et dans des domaines très niche) et savoir coder (on laisse ça aux MLops/MLeng/DataEng et on se contente d'un notebook python côté datascience)

fazero

Salut c'est Ralph

silly_hopper a écrit :

En France il y a quand même beaucoup plus de postes bien rémunérés côté management que côté IC

MTiger

dites j'ai un jeu de données

20 variables entrées, 1 sortie, 100k points

des que je mets une seconde couche l'algo diverge et le loss devient nan

alors j'ai mis une seule couche et le hic c'"est que il encaisse de mieux en mieux avec plus de neurones
le meilleur résultat que j'ai c'est avec 1000 neurones (!!), et ca fonctionne y compris sur les couches tests

des idées pour faire en sorte que ca devienne plus nan avec 2 couches?
1000 c vraiment trop ? d'hab je sais que le rule of thumb c'est d'avoir moins de neurones que tes données d'entrées...^^
quels sont les risques a part overfitting? (que je ne constate pas ici car l'erreur sur les tests est plus faible qu'avec moins de neurones)

merci :hello:

Message édité par MTiger le 27-05-2024 à 16:11:35

mystiko

Je cherche à changer de boite mais je galère (je cherche en quasi full remote, c'est plus la mode)

Sur 2024 :
* Environ 15 entretien RH (quasi 100% donc mon exp donne envie)
* 13 no go pour mon salaire trop élevé et 2 go
* Les 2 go sont sur des boites très tech et "haut niveau" => 2 fails au coding live. Pas mauvais mais "trop lent", "code pas assez optimisé"

Bref, faut que je travaille sur ces coding live (ou que je revois ma carrière mais j'ai pas trouvé une autre voie qui paye "autant" )

A part potasser des exo sur leetcode, d'autres trucs ?
Des bouquins genre "cracking the coding interview" ?

Question plus générale : 9 ans que je suis DS, je suis touche à tout mais pas ultra pointu dans un domaine particulier.
Ce type de profil plait aux boites non tech (et ça m'intente) mais ils ne sont pas full remote ou n'ont pas 100k de budget (plutôt 60-70k part chez moi ...)
Et je suis trop léger pour des boites à dominante tech (Data.dog, C.riteo par ex)
Je peux bifurquer vers quoi? [:tinostar dei]

Message cité 1 fois

Chou Andy

Would you know my nem

Baisse de salaire

Je suis dans un cas un peu similaire (mais avec moins d'xp) pour l'instant je cherche dans la COGIP mais ça penche très fort vers Paris

---------------
J'aurais voulu être un businessman

Publicité

Page : 1 2 3 4 5 .. 132 133 134 135 136 137

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Emploi & Etudes

Etudes / Orientation

[Topic Unique] Machine Learning & Data Science

Sujets relatifs
Recherche d'emploi	[Topik Unique] Les girls de la section E&E
Avez vous des problèmatiques sur le Big Data ?	Master Finance et Stratégie de Science Po après des études de droit ?
Je veux travailler dans les Big DATA	Orientation pour Data Science & Recherche Opérationnelle
[Topic Unique] Concours ingénieur ENAC/IESSA : 30 postes	[Topic Unique] EIVP
[Topic Unique] L'Aylite !!!
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science

Page générée en 0.111 secondes