Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1002 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  115  116  117  ..  133  134  135  136  137  138
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°34585
pinkleaf
Posté le 13-04-2021 à 17:56:49  profilanswer
 

Reprise du message précédent :
 
J'ai un peu de temps cette semaine alors je cherche à upskiller - je n'ai encore jamais travaillé sur du process mining proprement dit
https://fluxicon.com/blog/2015/10/w [...] cientists/
 
Quelqu'un ici aurait l'experience et une formation à recommander?  
J'ai vu ce coursera (mais 22h total) https://www.coursera.org/learn/process-mining
 
 :jap:

n°34586
cassiopell​a
Posté le 13-04-2021 à 18:51:17  profilanswer
 

foudres, Et bah j'ai ton message initial, tant pis pour toi.  :p Je peux te pardonner si tu me montre ce que c'est un github sympa pour toi  :ange:

 
Citation :

Et s'ils cherchent économétrie sous google y'a écrit que ça fait partie des sciences économiques...


Théorie des jeux aussi. Il n'empêche que les deux sont des pures maths. L'économétrie c'est une branche des stats pour traiter et interpréter les données économiques et financières qui sont bien particulières. Il y a un grand focus sur la causalité (j'ai bien dit causalité et non corrélation). L'objectif n'est presque jamais la prédiction. Tout comme il y a des modèles et approches spéciales pour traiter du texte, des vidéos etc. D'ailleurs dans le traitement du signal, le modèle le plus utilisé est celui d'un économètre.

 

C'est méconnu du grand publique, mais dans les bonnes fac d'éco tu as beaucoup de maths. Et sur 5 ans un économiste peut avoir beaucoup plus de maths qu'un ingénieur/chimiste/biologiste. Il y a même la programmation: Pascale/Scilab/R/Python (dépend de l'année d'étude), SQL. Bien sur, ce n'est pas comme en informatique, mais c'est pas rien non plus.

 

Bon, fin de la culture général. J'espère que la prochaine fois quand tu seras face à un économètre, tu te souviendra qui sont ils.

 
Citation :

SI tu n'a pas fait d'études d'économie mais de math/info effectivement c'est faux. mais en quoi l'économie c'est bien ou pas bien ? C'est juste différent.


Peu importe si je suis économiste, économètre. Pourquoi as tu décidé que je ne serais pas d'accord de faire 50%-50% DEV/ML?

 
Citation :

C'est toi qui a clairement dit dans un autre message que t'avais pas le temps que github et kaggle c'était pas ta priorié mais ton postdoc.


Non, je n'ai jamais dit ça. J'ai dit que si un doctorant (qui n'a pas encore soutenu) ou un post-doc passe son temps à remplir le kaggle/githab, c'est un mauvais signe pour vous et votre entreprise. Il ne fait pas son job. Autrement dit c'est un glandeur. Où est la garantie qu'il ne change pas d'avis et de priorité encore une fois, une fois CDI chez vous signé et la période d’essayé passé? Non, un doctorant/post-doc à minima sérieux n'a pas de temps libre de remplir kaggle/githab sauf si c'est son domaine. Oui, ces sont des esclaves des grands chercheurs  :whistle:  :lol: C'est ainsi, c'est accepté parce que cela ne dure que 3-6 ans et c'est la période où tu feras le plus de recherche sans être dérangé. Donc oui, ces gens bossent 50h-60h-70h/semaine et n'ont pas du temps "pour soi".

 

J'ai le github, mais pas de kaggle. C'est juste pour ne pas s’éparpiller.

 

Il n'existe pas de thèse "théorique", càd sans avoir travaillé avec les données, en stats. Je ne vois pas comment on peut faire...

 
Citation :

Si tu dis que ta thése était centrée sur la data scence, sortir de nouveaux algos de data sicence etc et que l'économie est un détail, je pense qu'il faut présenter les faits de façon à ce que ce soit clair pour tout le monde


J'ai compris  ;) même si ton ton ne m'a pas plus, merci la critique.

 
Citation :

En fait si ta fait math sup / math spé ou qye tu as au moins une licence en math et pas info ou économie oui ça va les rassurer.


J'ai une licence d'économétrie (pas l'économie) et L2 de maths Paris 6 (fait à distance): c'est rassurant? J'ai enseigné les probas et stats à l'université (et l'économétrie, mais oublions...). Je suis russe (une excellente formation scolaire en maths y compris les démonstrations que les français voient qu'en prépa).

 

P.S. concernant ton message initiale: l'économétrie n'est pas un domaine d'application, mais la partie intégrale de la Data Science. Avant le boom de 2011-2012, qui faisais la Data Science à ton avis? L'économie et la finance sont parmi les premiers domaines d'application en stat et c'est là qu'on avait les données.


Message édité par cassiopella le 13-04-2021 à 18:54:16
n°34587
pinkleaf
Posté le 13-04-2021 à 20:17:09  profilanswer
 

cassiopella a écrit :

foudres, Et bah j'ai ton message initial, tant pis pour toi.  :p Je peux te pardonner si tu me montre ce que c'est un github sympa pour toi  :ange:  
 

Citation :

Et s'ils cherchent économétrie sous google y'a écrit que ça fait partie des sciences économiques...


Théorie des jeux aussi. Il n'empêche que les deux sont des pures maths. L'économétrie c'est une branche des stats pour traiter et interpréter les données économiques et financières qui sont bien particulières. Il y a un grand focus sur la causalité (j'ai bien dit causalité et non corrélation). L'objectif n'est presque jamais la prédiction. Tout comme il y a des modèles et approches spéciales pour traiter du texte, des vidéos etc. D'ailleurs dans le traitement du signal, le modèle le plus utilisé est celui d'un économètre.
 
C'est méconnu du grand publique, mais dans les bonnes fac d'éco tu as beaucoup de maths. Et sur 5 ans un économiste peut avoir beaucoup plus de maths qu'un ingénieur/chimiste/biologiste. Il y a même la programmation: Pascale/Scilab/R/Python (dépend de l'année d'étude), SQL. Bien sur, ce n'est pas comme en informatique, mais c'est pas rien non plus.
 
Bon, fin de la culture général. J'espère que la prochaine fois quand tu seras face à un économètre, tu te souviendra qui sont ils.
 

Citation :

SI tu n'a pas fait d'études d'économie mais de math/info effectivement c'est faux. mais en quoi l'économie c'est bien ou pas bien ? C'est juste différent.


Peu importe si je suis économiste, économètre. Pourquoi as tu décidé que je ne serais pas d'accord de faire 50%-50% DEV/ML?  
 

Citation :

C'est toi qui a clairement dit dans un autre message que t'avais pas le temps que github et kaggle c'était pas ta priorié mais ton postdoc.


Non, je n'ai jamais dit ça. J'ai dit que si un doctorant (qui n'a pas encore soutenu) ou un post-doc passe son temps à remplir le kaggle/githab, c'est un mauvais signe pour vous et votre entreprise. Il ne fait pas son job. Autrement dit c'est un glandeur. Où est la garantie qu'il ne change pas d'avis et de priorité encore une fois, une fois CDI chez vous signé et la période d’essayé passé? Non, un doctorant/post-doc à minima sérieux n'a pas de temps libre de remplir kaggle/githab sauf si c'est son domaine. Oui, ces sont des esclaves des grands chercheurs  :whistle:  :lol: C'est ainsi, c'est accepté parce que cela ne dure que 3-6 ans et c'est la période où tu feras le plus de recherche sans être dérangé. Donc oui, ces gens bossent 50h-60h-70h/semaine et n'ont pas du temps "pour soi".
 
J'ai le github, mais pas de kaggle. C'est juste pour ne pas s’éparpiller.
 
Il n'existe pas de thèse "théorique", càd sans avoir travaillé avec les données, en stats. Je ne vois pas comment on peut faire...
 

Citation :

Si tu dis que ta thése était centrée sur la data scence, sortir de nouveaux algos de data sicence etc et que l'économie est un détail, je pense qu'il faut présenter les faits de façon à ce que ce soit clair pour tout le monde


J'ai compris  ;) même si ton ton ne m'a pas plus, merci la critique.  
 

Citation :

En fait si ta fait math sup / math spé ou qye tu as au moins une licence en math et pas info ou économie oui ça va les rassurer.


J'ai une licence d'économétrie (pas l'économie) et L2 de maths Paris 6 (fait à distance): c'est rassurant? J'ai enseigné les probas et stats à l'université (et l'économétrie, mais oublions...). Je suis russe (une excellente formation scolaire en maths y compris les démonstrations que les français voient qu'en prépa).  
 
P.S. concernant ton message initiale: l'économétrie n'est pas un domaine d'application, mais la partie intégrale de la Data Science. Avant le boom de 2011-2012, qui faisais la Data Science à ton avis? L'économie et la finance sont parmi les premiers domaines d'application en stat et c'est là qu'on avait les données.


 
J'espère que tu réponds autrement, si en entretien, on te dit que tu n'es pas qualifiée  :o  

n°34588
MTiger
Posté le 13-04-2021 à 20:34:10  profilanswer
 

@cassiopella

 


va postuler a apple/amazon, précisément en mettant en avant que tu sais distinguer causalité et corrélation

 

un des chasseurs de tete sur linkedin a marqué ceci

Big Tech companies (Amazon, Apple, Microsoft), are hiring army’s of PHD Economists. Why?

 

Could this be the beginning of the end for ‘Data Scientists’ ?

 

Economists training lends itself very well to analysing data sets in a commercial way, spotting trends, identifying correlation & causation.

 

Economists are trained to understand market forces & the levers that affect them, and are often very good at understanding what data can be used to improve operational efficiencies & optimise logistics & supply chain.

 

Big Tech have realised that Economists possess both the commercial & analytics skills that businesses have been crying out for.

 

Economists are ‘Unicorns' !

 

So where does this leave Data Scientists ?

 

Will Economists just become Data Scientists ?

 

Or Is this the beginning of the end of the Data Science job title being used ubiquitously ?

 

What do you think ?

 


au passage si certains la traitent de nulle parce qu'elle fait de l'éco, ptet que ce post les fera réfléchir :D

 

mon conseil perso: en france l'insertion des docteurs est pourrie
va a l'étranger si possible
apres ma these j'ai chopé un taff en angleterre assez facilement
en france tu resteras la chercheuse deconnectée des besoins de l'entreprise toussa toussa :sarcastic:


Message édité par MTiger le 13-04-2021 à 20:43:49
n°34589
foudres
Posté le 13-04-2021 à 20:58:21  profilanswer
 

cassiopella a écrit :

P.S. concernant ton message initiale: l'économétrie n'est pas un domaine d'application, mais la partie intégrale de la Data Science. Avant le boom de 2011-2012, qui faisais la Data Science à ton avis? L'économie et la finance sont parmi les premiers domaines d'application en stat et c'est là qu'on avait les données.


 
Honnetement dans la branche ou je suis avant data science le buzzword precedant était big data avec hadoop et tout l'écosystéme autour. Genre tu compute les prochains article à acheter dans ton logiciel de e-commerce ou tu fais de la fraud detection sur credit card... Ca date de 2004 je crois.  
 
Encore avant le buzzword c'était BI ou Business Intelligence je sais pas si c'est années 80 ou 90 le début... Genre tu calculait les ventes de ton hypermarché sur chaque article (des centaines de milliers) tu faisait la somme par sous rayon / rayon d'un coté, de l'autre jour/semaine/mois/trimeste/année et aussi magasin/région/pays...
 
Mais ça je pense c'est la vision informaticien... On fait pas des stats sur des données économiques ou quoi que ce soit d'utile hors info en général (données médicales, revenus moyen whatever). A la fin c'est toujours un truc lié au logiciel qu'on est en train de développer. Ecran qui permet se balader dans les ventes et faire des prévisions sur les achats, analyse de logs ou d'images... Ce genre de trucs.
 
La pure statistique encore une fois nous sert peu sauf si c'est un requirement client explicite. Non le truc c'est plutôt mon systéme a plein de données (Pétabyte/Hexabytes) déjà dispo mais éparpillées ou pas dispo (car jamais enregistrées). On récup tout ça sur des centaines de systéme différents, on récup aussi des données de clients, on achétes des données à l'exterieur aussi c'est vrai on met tout ça dans un data lake et on fait plein de calcul et prédiction avec  qu'on réintegre dans nos logiciels.

n°34590
foudres
Posté le 13-04-2021 à 21:11:32  profilanswer
 

MTiger a écrit :

@cassiopella
 
 
va postuler a apple/amazon, précisément en mettant en avant que tu sais distinguer causalité et corrélation
 
un des chasseurs de tete sur linkedin a marqué ceci

Big Tech companies (Amazon, Apple, Microsoft), are hiring army’s of PHD Economists. Why?
 
Could this be the beginning of the end for ‘Data Scientists’ ?
 
Economists training lends itself very well to analysing data sets in a commercial way, spotting trends, identifying correlation & causation.
 
Economists are trained to understand market forces & the levers that affect them, and are often very good at understanding what data can be used to improve operational efficiencies & optimise logistics & supply chain.
 
Big Tech have realised that Economists possess both the commercial & analytics skills that businesses have been crying out for.
 
Economists are ‘Unicorns' !
 
So where does this leave Data Scientists ?
 
Will Economists just become Data Scientists ?
 
Or Is this the beginning of the end of the Data Science job title being used ubiquitously ?
 
What do you think ?

 
 
au passage si certains la traitent de nulle parce qu'elle fait de l'éco, ptet que ce post les fera réfléchir :D
 
mon conseil perso: en france l'insertion des docteurs est pourrie
va a l'étranger si possible
apres ma these j'ai chopé un taff en angleterre assez facilement
en france tu resteras la chercheuse deconnectée des besoins de l'entreprise toussa toussa :sarcastic:


 
Attends j'ai pas dit que notre amie est nulle. Je vois pas de raison de le penser. C'était pas vraiment le sujet. Normalement sur sa thése elle fait partie des meilleurs au monde par définition.
 
Quand à google, j'espére que ça marchera mais soyons clair... C'est pas évident d'y entrer non plus. En général les gens prennent plusieurs années à préparer leur entretien et les réussissent souvent la deuxiéme ou troisiéme fois quelques années aprés. En tout cas, si on peut y consacrer le temps, clairement c'est une expérience à vivre. Pour mon cas perso, je passe d'abord aux US, google oiu une autres des entreprises vraiment innovantes dans la tech, je verrai aprés.
 
C'est vrai qu'ils ont beaucoup de chercheurs. Il sont suffisament gros/riche/puissant pour investir pendant 10 ou 15 ans par ex sur les voitures autonome sans vraiment gagner de sous avec pour créer un marché ensuite. Ca peu de boites peuvent prétendre le faire.
 
Et je partage le constat désolant sur la recherche en France. Je serai pour plus de selection, une bourse de thése à mini 3000€/mois, revaloriser les salaires des chercheurs, leur fournir du vrai matos sans rechigner et aussi des asistants. On investit trop peu sur les sciences, la recherche et les gens avec des compétances pointues qui font avancer les connaissances de l'humanité.

n°34591
pinkleaf
Posté le 14-04-2021 à 13:13:49  profilanswer
 


Article interessant quant au developpement de AutoML pour le deep learning  
https://towardsdatascience.com/towa [...] 57c3784b8c
 
L'origine de la démarche reste mercantile mais je trouve le partage de connaissances intéressant: définition de AutoML dans le DL, définition de quelques stages de maturité vers la prod (ci dessous)
 
Level 1 — High level DL frameworks
Level 2 — Solving predefined tasks and transfer learning.
Level 3 — DL-AutoML with neural architecture search and hyper-parameter tuning
Level 4 — Full automation, DL-AutoML on any given task

n°34592
jeancharle​s0123
Posté le 15-04-2021 à 17:05:04  profilanswer
 

cassiopella a écrit :

foudres
 
Non, je n'ai jamais dit ça. J'ai dit que si un doctorant (qui n'a pas encore soutenu) ou un post-doc passe son temps à remplir le kaggle/githab, c'est un mauvais signe pour vous et votre entreprise. Il ne fait pas son job. Autrement dit c'est un glandeur. Où est la garantie qu'il ne change pas d'avis et de priorité encore une fois, une fois CDI chez vous signé et la période d’essayé passé? Non, un doctorant/post-doc à minima sérieux n'a pas de temps libre de remplir kaggle/githab sauf si c'est son domaine. Oui, ces sont des esclaves des grands chercheurs  :whistle:  :lol: C'est ainsi, c'est accepté parce que cela ne dure que 3-6 ans et c'est la période où tu feras le plus de recherche sans être dérangé. Donc oui, ces gens bossent 50h-60h-70h/semaine et n'ont pas du temps "pour soi".
 


 
Sans passer son temps sur Kaggle / github, ca augmenterai evidemment l'attractivite de ton CV si tu as un lien github avec quelques projets. Ne serait-ce que 1 ou 2 projets avec quelques classes, quelques scripts, des tests, des instructions claires, ... Ca n'a pas besoin d'etre trop chronophage, et ca rassure l'employeur, et/ou remplit la checklist du recruteur d'une plus grosse boite.
 
Et comme l'a mentionne @MTiger, sans connaitre precisement ton profil, il me semble que postuler pour un poste de data science et / ou ML engineer aux GAFAMs peut avoir du sens.
Ca demanderait de l'entrainement (Leetcode, how to crack the coding interview, etc... si  c'est pas deja fait), mais ton profil a l'air adequat.

n°34593
cassiopell​a
Posté le 24-04-2021 à 12:38:33  profilanswer
 

@jeancharles0123, merci pour les conseilles même si je ne parlais pas de moi et c'est déjà fait (cela fait plusieurs années que j'ai eu la thèse + github). Je suis juste étonnée qu'un travailleur glandeur vous intéresse plus qu'une personne qui assure pleinement le contrat pour lequel elle est payée. Mais je pense que c'est du à la méconnaissance du travail qu'effectue le doctorant ou postdoc.
 

jeancharles0123 a écrit :


Et comme l'a mentionne @MTiger, sans connaitre precisement ton profil, il me semble que postuler pour un poste de data science et / ou ML engineer aux GAFAMs peut avoir du sens.
Ca demanderait de l'entrainement (Leetcode, how to crack the coding interview, etc... si  c'est pas deja fait), mais ton profil a l'air adequat.


Je me suis inscrite sur Leetcode.... Je ne comprends pas à quoi cela sert. C'est juste un entrainement? Parce que le profil... bah.... beaucoup d'exercices ne sont accessibles que s'il y a un abonnement. Et tous les exercices ont été corrigés par la communauté, donc on peut avoir des jolies stats sans rien comprendre.
 

n°34594
foudres
Posté le 24-04-2021 à 15:12:45  profilanswer
 

cassiopella a écrit :

@jeancharles0123, merci pour les conseilles même si je ne parlais pas de moi et c'est déjà fait (cela fait plusieurs années que j'ai eu la thèse + github). Je suis juste étonnée qu'un travailleur glandeur vous intéresse plus qu'une personne qui assure pleinement le contrat pour lequel elle est payée. Mais je pense que c'est du à la méconnaissance du travail qu'effectue le doctorant ou postdoc.


 
Alors soyons clair tu dois un nombre d'heure à ton employeur de 35H/semaine sur l'année. Si t'en fait plus ta typiquement des RTT. Ce que tu fais le reste du temps c'est ton choix et surement pas à ton employeur de le controler.
 
Ensuite soyons clair bosser à fond peut être efficace pour progresser plus vite et faire évoluer sa carriére, mais c'est loin d'être garanti. Au final les gens achetent l'XP/age (plus tes vieux plus t'es payé), les réélles compétances, les résultats mais aussi le réseau social et les soft skills.
 
Si tu as bossé 80H/semaine ou 30H/semaine pendant 3 ans, ça comptera pour 3 ans d'XP pas plus ni moins. Et si et seulement si c'est considéré comme une activité correspondant au domaine. Ensuite il vont voir si ton profil leur plait et si tu leur parait compétante. Et faut convaincre tout le monde y compris le vieux con de chef.
 
C'est peut être débile, mais c'est comme ça.
 

cassiopella a écrit :


Je me suis inscrite sur Leetcode.... Je ne comprends pas à quoi cela sert. C'est juste un entrainement? Parce que le profil... bah.... beaucoup d'exercices ne sont accessibles que s'il y a un abonnement. Et tous les exercices ont été corrigés par la communauté, donc on peut avoir des jolies stats sans rien comprendre.


 
Le but de ces outils n'est pas de te la péter sur son score. Tout le monde s'en fou sauf peut être si tu gagne un concours de compétitive programming auquel cas ça peut être un moyen de décrocher un poste dans certaines boites.
 
L'idée c'est plutôt que la plupart des boites les plus cotées, avec les jobs les plus intéréssant, les meilleurs salaire etc type Google/Facebook et bien d'autre vont faire un entretien technique incluant de pisser au tableau ou en ligne en temps limité un petit programme d'algorithm genre une application de dijsktra et dans ton cas pourquoi pas de coder un K-mean basique.
 
Amazon par exemple me l'avais demandé, 2 exercices à faire en 1H 40, 1 facile et 1 moyen en gros. Sans entrainement et réviser, à peu prés impossible d'y arriver. Avec 2 mois d'entrainement, une disaine d'heure par semaines à vérifier mon algorithmie, c'est passé.
 
Ma boite actuelle est moins exigeante mais fait passer des tests avec Coding Game pour la plupart des embauches technique...
 
D'autres demandent de coder l'algo en live au tableau... C'est le plus lourd car le plus éloigné du job au quotidien.
 
Mais je soutient la proposition de MTiger. Tu trouvera peut être plus chaussure à ton pied sur des companies qui veulent des gens à la pointe et tu t'éclatera peut être plus. mais vu que la compétition est mondiale et qu'il peuvent choisir, faut assurer.
 
Ta des bouquins genre "Cracking the google coding interview" pour aider. Et les plateformes genre Leetcode etc servent sutout à s'entrainer pour les interviews à la con. Je suis d'accord que c'est plus pour les développeurs... A toi de te renseigner.


Message édité par foudres le 24-04-2021 à 15:15:49
n°34595
jeancharle​s0123
Posté le 28-04-2021 à 19:39:41  profilanswer
 

cassiopella a écrit :

Je suis juste étonnée qu'un travailleur glandeur vous intéresse plus qu'une personne qui assure pleinement le contrat pour lequel elle est payée.  


 
J'ai l'impression que tu étais dans un labo compliqué  :( , mais ton experience de thèse n'est manifestement pas une généralité. Pour beaucoup, il est tout à fait possible de faire sa thèse ET d'étoffer son CV. Un thésard fait du piano sur son temps libre? Bah il fera un peu moins de piano pour travailler sur son CV, et les directeurs de thèse que j'ai connu ont jamais interdit a quelqu'un d'avoir un hobby...
 
 

cassiopella a écrit :


Je me suis inscrite sur Leetcode.... Je ne comprends pas à quoi cela sert. C'est juste un entrainement? Parce que le profil... bah.... beaucoup d'exercices ne sont accessibles que s'il y a un abonnement. Et tous les exercices ont été corrigés par la communauté, donc on peut avoir des jolies stats sans rien comprendre.
 


 
C'est juste de l'entrainement. Les entretiens GAFAM sont particuliers et il vaut mieux s'entrainer avant. L'avantage, c'est qu'une fois que tu as passé le premier filtre, et que tu choppes un entretien, presque personne va regarder ton CV après  :D (bon pour un ingenieur / ingenieur recherche "de base", pas pour un team lead ou autre).

n°34596
foudres
Posté le 30-04-2021 à 11:25:40  profilanswer
 

jeancharles0123 a écrit :

J'ai l'impression que tu étais dans un labo compliqué  :( , mais ton experience de thèse n'est manifestement pas une généralité. Pour beaucoup, il est tout à fait possible de faire sa thèse ET d'étoffer son CV. Un thésard fait du piano sur son temps libre? Bah il fera un peu moins de piano pour travailler sur son CV, et les directeurs de thèse que j'ai connu ont jamais interdit a quelqu'un d'avoir un hobby...


Bien sûr. D'ailleur ceux qui vont donner le poste ont aucune idée si la personne fait 30H/semaine ou 80H/semaine. Et selon l'opinion de chacun à ce sujet peuvent trés bien considérer qu'il veulent pas de quelqu'un qui dédie sa vie au boulot et considérer que c'est malsain et la refuser pour ça.
 
En plus pour les compétances lié à un job il y a rarement un seule chose sur laquelle progresser. Un job de chercheur va inclure forcément énormément de soft skills, capacité à diriger une équipe, capacité à convaincre, travailler en équipe, convaincre pour obtenir un budget, savoir se vendre... En plus de tout l'aspect technologique autour. Quelqu'un qui trouverai rien, mais saura bien vendre risque d'être plus utile qu'un bon chercheur si ces qualités lui permettent d'avoir du financement pour 10 bon chercheurs.
 
Avoir des activités perso à coté liées au job ou nom (coder en data science c'est une des core skills quand même) c'est aussi montrer qu'on est quelqu'un de curieux et d'ouvert. Si la personne est trop mono maniaque, ça peut être vu comme un point négatif. A l'inverse avoir plusieurs hobbies, rencontrer les gens, vivre sa vie sera vu comme quelqu'un d'ouvert, social et équilibré, des qualité qui pourraient être vu comme essentielles. Sans parler du gros plus d'être capable de s'intếresser aux autres et leur propres intérêts qui peut faire gagner le job.
 
Il y a toujours un compromis à trouver entre être un bon généraliste et un spécialiste. D'autant plus que les bonnes idées, les contrats signés vont souvent venir de la confrontation de plusieurs domaines.


Message édité par foudres le 30-04-2021 à 11:27:51
n°34597
MTiger
Posté le 12-05-2021 à 10:48:29  profilanswer
 

Est ce que quelqu'un a des cours ou autres a me conseiller sur le sentiment analysis ?
 
sites, videos youtubes, livre etc :p

n°34598
o_BlastaaM​oof_o
Posté le 24-05-2021 à 15:51:48  profilanswer
 

MTiger a écrit :

Est ce que quelqu'un a des cours ou autres a me conseiller sur le sentiment analysis ?
 
sites, videos youtubes, livre etc :p


Non. Sentiment analysis, c'est un truc sur étagère maintenant. Tu prends une bibliothèque de sentiment analysis et tu lis la doc.

n°34599
o_BlastaaM​oof_o
Posté le 24-05-2021 à 16:00:23  profilanswer
 

cassiopella a écrit :

@jeancharles0123, merci pour les conseilles même si je ne parlais pas de moi et c'est déjà fait (cela fait plusieurs années que j'ai eu la thèse + github). Je suis juste étonnée qu'un travailleur glandeur vous intéresse plus qu'une personne qui assure pleinement le contrat pour lequel elle est payée. Mais je pense que c'est du à la méconnaissance du travail qu'effectue le doctorant ou postdoc.
 


 

cassiopella a écrit :


Je me suis inscrite sur Leetcode.... Je ne comprends pas à quoi cela sert. C'est juste un entrainement? Parce que le profil... bah.... beaucoup d'exercices ne sont accessibles que s'il y a un abonnement. Et tous les exercices ont été corrigés par la communauté, donc on peut avoir des jolies stats sans rien comprendre.
 


Je débarque après la bataille mais je décèle à 30 kilomètres le complexe de supériorité du docteur/doctorant.
 
Oui, le parcours que tu as choisi te mène tout droit à des postes dans la fonction publique à 35 k€/an (si tu as de la chance) et te garantiront des augmentations mirobolantes de 0,5% par an.
Non, sur un exam technique lambda, tu n'es pas meilleure que le type sorti d'école d'ingé + stage de fin d'études.
Oui, ta valeur ajoutée est ailleurs mais 99% des boîtes s'en fichent parce qu'elles ne pourraient pas la valoriser de toute manière.
Non, les histoires qu'on raconte aux doctorants du genre "une thèse vous apprend à raisonner comme de vraies scientifiques et pas de vulgaires ingénieurs" n'ont aucune réalité concrète sur le marché du travail.
Oui, tu te feras toujours passer devant par des ingés issus d'une école réputée lorsqu'il s'agira d'accéder au département R&D d'une boîte privée. Et oui, c'est injuste mais c'est comme ça.
 
Y a deux solutions pour ne pas faire partie des docteurs qui galèrent : soit tu te débrouilles pour trouver la micro-niche capable de t'accueillir et de valoriser ton profil, soit tu pars à l'étranger.
 
PS : c'est un docteur qui parle.
 
 

n°34600
neo world
Posté le 25-05-2021 à 08:03:34  profilanswer
 

Clairement l'option partir à l'étranger est plus que valable pour un post doctorant : on sait pas bien valoriser ces profils en France au contraire d'autres pays riches :jap:

n°34601
mrproton
Posté le 25-05-2021 à 20:44:28  profilanswer
 

o_BlastaaMoof_o a écrit :


Je débarque après la bataille mais je décèle à 30 kilomètres le complexe de supériorité du docteur/doctorant.
 
Oui, le parcours que tu as choisi te mène tout droit à des postes dans la fonction publique à 35 k€/an (si tu as de la chance) et te garantiront des augmentations mirobolantes de 0,5% par an.
Non, sur un exam technique lambda, tu n'es pas meilleure que le type sorti d'école d'ingé + stage de fin d'études.
Oui, ta valeur ajoutée est ailleurs mais 99% des boîtes s'en fichent parce qu'elles ne pourraient pas la valoriser de toute manière.
Non, les histoires qu'on raconte aux doctorants du genre "une thèse vous apprend à raisonner comme de vraies scientifiques et pas de vulgaires ingénieurs" n'ont aucune réalité concrète sur le marché du travail.
Oui, tu te feras toujours passer devant par des ingés issus d'une école réputée lorsqu'il s'agira d'accéder au département R&D d'une boîte privée. Et oui, c'est injuste mais c'est comme ça.
 
Y a deux solutions pour ne pas faire partie des docteurs qui galèrent : soit tu te débrouilles pour trouver la micro-niche capable de t'accueillir et de valoriser ton profil, soit tu pars à l'étranger.
 
PS : c'est un docteur qui parle.
 
 


 
Alors ça c'est qu'à moitié vrai ...
Je vois plutôt pas mal de boîtes qui justement préfèrent prendre des phd pour des postes de data science. Ils les veulent en premier job pour toucher leur CIR (les startups on vous voit).
Et les postes les plus "prestige" eux c'est phd obligatoire ou alors un gros bagage expérience.
 
 
 

neo world a écrit :

Clairement l'option partir à l'étranger est plus que valable pour un post doctorant : on sait pas bien valoriser ces profils en France au contraire d'autres pays riches :jap:


 
+1 million, même si la situation est plus compliquée actuellement, heureusement ça a l'air de s'améliorer

n°34602
LibreArbit​re
La /root est longue
Posté le 26-05-2021 à 08:51:07  profilanswer
 

Mais la grande tendance des 10 dernières années c'est pas le combo Phd+ingé ?


---------------
Pharyo | Protometre | Capvirage
n°34603
o_BlastaaM​oof_o
Posté le 26-05-2021 à 10:21:09  profilanswer
 

mrproton a écrit :


Alors ça c'est qu'à moitié vrai ...
Je vois plutôt pas mal de boîtes qui justement préfèrent prendre des phd pour des postes de data science. Ils les veulent en premier job pour toucher leur CIR (les startups on vous voit).
Et les postes les plus "prestige" eux c'est phd obligatoire ou alors un gros bagage expérience.


 

LibreArbitre a écrit :

Mais la grande tendance des 10 dernières années c'est pas le combo Phd+ingé ?


Y a PhD et PhD... Oui, si tu fais un doctorat dans le domaine de la data science ou du ML/DL, tu vas trouver un job facilement.
En revanche, pour tous les PhD qui ont touché de près ou d'un peu plus loin la data science (économétrie, maths applis, bio, astrophysique, etc.), c'est plus compliqué et je maintiens qu'il vaut mieux sortir d'une école groupe A ou B que d'une école moins prestigieuse (ou pire encore, de la fac !) complétée par un doctorat.

n°34604
foudres
Posté le 04-06-2021 à 14:46:21  profilanswer
 

LibreArbitre a écrit :

Mais la grande tendance des 10 dernières années c'est pas le combo Phd+ingé ?


La grosse différence entre une école d'ingé tout venant (groupe C par ex), c'est la coté pragmatique et apprendre à bosser en entreprise. Le budget par étudiant n'a aussi rien avoir.  
 
Ce qui est l'opposé de ce qu'on apprend en thése. En thése on apprend à bosser 50-80H/semaine avec 0 budget, a perdre son temps, à servir d'esclave et de main d'oeuvre à pas cher et même à en être fier. Par contre on travailler assez peu de façon pragmatique. En entreprise on va pas essayer et mesurer la performance de la méthode qui a priori ne fonctionne pas et bien souvent on prendra un produit tout fait qui répond déjà au besoin et on passera à autre chose.
 
Si tu combine les 2 ingé + phd, ton dernier stage sera pas en entreprise, et tu sera effectivement un profil hybride, mais dans l'ensemble tu intéréssera moins l'entreprise qu'un simple diplôme d'ingé.
 
La différence se fait si tu fait une école d'ingé groupe A trés réputée plus thése. La tu va intérésser du monde oui. Mais c'est pas aquis. Et si ta pas fait l'école d'ingé avant et que t'es déjà en thése ou si tu n'a pas le dossier qui va bien pour rentrer dans ces écoles ultra réputées, faut pas t'imaginer qu'on va t'acceuillir comme le messie non plus.
 
Au final école d'ingé ou pas, thése ou pas, les gens tant qu'ils n'ont pas été confronté au monde du travail sont un peu naif. Il savent pas qu'il y en a des millions comme eux et qu'on attends à ce qu'ils s'adaptent au monde alors que eux s'imaginent que le monde va s'adapter à eux.


Message édité par foudres le 04-06-2021 à 14:48:54
n°34605
foudres
Posté le 04-06-2021 à 17:03:55  profilanswer
 

Pour une raison que je m'explique pas, en France, on a trop peu de budget en recherche publique d'un coté, et les entreprises sont pas intéréssées à avoir des labos de recherche et faires des choses vraiment nouvelles. C'est plus suiveur. C'est domage.

n°34606
o_BlastaaM​oof_o
Posté le 04-06-2021 à 18:01:38  profilanswer
 

foudres a écrit :


La grosse différence entre une école d'ingé tout venant (groupe C par ex), c'est la coté pragmatique et apprendre à bosser en entreprise. Le budget par étudiant n'a aussi rien avoir.  
 
Ce qui est l'opposé de ce qu'on apprend en thése. En thése on apprend à bosser 50-80H/semaine avec 0 budget, a perdre son temps, à servir d'esclave et de main d'oeuvre à pas cher et même à en être fier. Par contre on travailler assez peu de façon pragmatique. En entreprise on va pas essayer et mesurer la performance de la méthode qui a priori ne fonctionne pas et bien souvent on prendra un produit tout fait qui répond déjà au besoin et on passera à autre chose.
 
Si tu combine les 2 ingé + phd, ton dernier stage sera pas en entreprise, et tu sera effectivement un profil hybride, mais dans l'ensemble tu intéréssera moins l'entreprise qu'un simple diplôme d'ingé.
 
La différence se fait si tu fait une école d'ingé groupe A trés réputée plus thése. La tu va intérésser du monde oui. Mais c'est pas aquis. Et si ta pas fait l'école d'ingé avant et que t'es déjà en thése ou si tu n'a pas le dossier qui va bien pour rentrer dans ces écoles ultra réputées, faut pas t'imaginer qu'on va t'acceuillir comme le messie non plus.
 
Au final école d'ingé ou pas, thése ou pas, les gens tant qu'ils n'ont pas été confronté au monde du travail sont un peu naif. Il savent pas qu'il y en a des millions comme eux et qu'on attends à ce qu'ils s'adaptent au monde alors que eux s'imaginent que le monde va s'adapter à eux.


Faut pas exagérer non plus... Ma thèse, ça n'a pas été ça du tout. Je travaillais "normalement", sauf pendant les 3 derniers mois où c'était quasiment du non stop, rédaction oblige. Et en termes de matériel, j'avais accès à un cluster de calcul de 800 cores (en 2010 !) que je partageais avec deux autres thésards.
 
J'admets que c'était au CEA, pas dans une université. Mais mes anciens collègues qui faisaient leur thèse en fac ne se plaignaient pas non plus.
 

foudres a écrit :

Pour une raison que je m'explique pas, en France, on a trop peu de budget en recherche publique d'un coté, et les entreprises sont pas intéréssées à avoir des labos de recherche et faires des choses vraiment nouvelles. C'est plus suiveur. C'est domage.


La réponse est simple.
 
La recherche publique a par définition peu d'argent parce que :
1. l'Etat est en déficit perpétuel et compte ses sous
2. elle ne sait pas se vendre au privé, ce serait un métier à part mais qui n'existe malheureusement pas en France.
 
Et à l'inverse, le privé s'appuie allègrement sur la recherche publique pour faire sa R&D, mais sans pour autant la rémunérer de manière adéquate.
Une grosse partie de la R&D d'EDF est faite par le CEA.
Une grosse partie de la R&D d'Airbus est faite par l'ONERA.
 
En Allemagne, ça ne se passe pas DU TOUT comme ça. Le privé et le public travaillent en étroite collaboration et cela assure des financements confortables et pérennes à la recherche publique. D'ailleurs, les chercheurs les plus talentueux sont souvent dans le public parce qu'ils y trouvent de bonnes conditions de travail (rémunération comprise) sans sacrifier leur vie personnelle.

n°34607
cassiopell​a
Posté le 06-06-2021 à 12:29:12  profilanswer
 

Oh, vous avez écrit pas mal de choses ici! Moi je cherche, je cherche...  :pt1cable: Mais bon, pour être honnête: je viens de commencer de le faire réellement. Avant c'était juste quelques offres.
 

o_BlastaaMoof_o a écrit :


Non, sur un exam technique lambda, tu n'es pas meilleure que le type sorti d'école d'ingé + stage de fin d'études.


Ah bon. Donc une personne qui ne sait pas coder, qui as fait un petit cours de 10h sur les stats.... est meilleurs parce qu'elle a un diplôme d'ingé? Je parle de ces cas là. Je ne me compare jamais à un ingénieur ENSIMAG.
 

o_BlastaaMoof_o a écrit :


Y a PhD et PhD... Oui, si tu fais un doctorat dans le domaine de la data science ou du ML/DL, tu vas trouver un job facilement.
En revanche, pour tous les PhD qui ont touché de près ou d'un peu plus loin la data science (économétrie, maths applis, bio, astrophysique, etc.), c'est plus compliqué et je maintiens qu'il vaut mieux sortir d'une école groupe A ou B que d'une école moins prestigieuse (ou pire encore, de la fac !) complétée par un doctorat.


J'ai fait le master 2 dans une école d'ingénieur A+, et le doctorat CIFRE aussi. Pour le moment cela n'aide pas.  
 

o_BlastaaMoof_o a écrit :


La réponse est simple.
 
La recherche publique a par définition peu d'argent parce que :
1. l'Etat est en déficit perpétuel et compte ses sous
2. elle ne sait pas se vendre au privé, ce serait un métier à part mais qui n'existe malheureusement pas en France.


Non, le point 2) est plus compliqué. L'université et les labos publiques n'ont pas le droit de se vendre au privé. C'est même mal vu par certains. Alors que les labos des écoles d'ingés sont riches comme crésus et ont une très grande liberté pour trouver de l'argent. Un exemple d'un collègue dans un labo publique parisien: tous les entrées d'argent (contrat européens, CIFRE, collaboration etc) vont directement au budget global. Le chercher qui est à l'origine de ce contrat ne peut en profiter. S'il veut embaucher un post-doc, un doctorant, aller à une conférence ou à une réunion dans le cadre du projet, il doit faire la demande de financement comme tous les autres.  

n°34608
Chou Andy
Would you know my nem
Posté le 06-06-2021 à 13:23:08  profilanswer
 

cassiopella a écrit :


Ah bon. Donc une personne qui ne sait pas coder, qui as fait un petit cours de 10h sur les stats.... est meilleurs parce qu'elle a un diplôme d'ingé? Je parle de ces cas là. Je ne me compare jamais à un ingénieur ENSIMAG.


 
Pourquoi il ne saurait pas coder ?
Certes ce ne sont pas les cours de l'école d'ingé qui vont aider, mais coder correctement est à la portée de n'importe quel ingé qui s'est un peu intéressé au sujet au cours de sa vie (et qui s'applique).


---------------
J'aurais voulu être un businessman
n°34609
foudres
Posté le 06-06-2021 à 15:22:32  profilanswer
 

cassiopella a écrit :

J'ai fait le master 2 dans une école d'ingénieur A+, et le doctorat CIFRE aussi. Pour le moment cela n'aide pas.


 
Il faut avoir le diplôme donc 2 ans mini statutairement + quelques contraintes genre avoir passé son TOIC. Avec 1 an tu n'a pas ça, et donc ce n'est pas du tout vu pareil, d'autant plus que les boites aiment les Master entreprise, pas recherche.
 
Certains vont aussi regarder si t'es passé par une bonne prépa ou non.
 
Note que je dis pas si c'est bien ou pas. C'est comme ça que le systéme fonctionne.

n°34610
foudres
Posté le 06-06-2021 à 15:36:44  profilanswer
 

Chou Andy a écrit :


 
Pourquoi il ne saurait pas coder ?
Certes ce ne sont pas les cours de l'école d'ingé qui vont aider, mais coder correctement est à la portée de n'importe quel ingé qui s'est un peu intéressé au sujet au cours de sa vie (et qui s'applique).


 
Savoir coder est sans doute jouable pour beaucoup de gens, mais il faut beaucoup d'XP pour le faire naturellement et avec efficacité.  
 
En particulier savoir coder est pas ce qui est vraiment recherché, c'est un prés requis, bien sûr. Savoir développer des logiciels et produits de code (y compris data science) de façon industrielle, c'est à dire stable, maintenable, modulaire, facile à déployer en prod, à releaser, dans les temps, bien documentés et qui puissent facilement être repris par d'autre, ce n'est pas la même chose.  
 
Est-ce que le systéme peu aussi revenir facilement à la version précédante (du code ou du modéle) en cas de probléme en prod sans grosse galére ?
Si t'es en data science, est-ce que tu peux aussi facilement évaluer ton modéle via une lib embedded ou via un web service ? Dans ce dernier cas, est-ce que tu scale à 10K-100K TPS si nécessaire ? Sait tu pour des raison d'audit/investigation par exemple rejouer le modéle comme il l'était y'a 6 mois ?
 
Nous on part sur du multi cloud, au cas ou une région tombe, le service doit encore fonctionenr. Donc ta aussi des problématiques de localisation et transfert des données. Sur un produit récent de data science, avec 28TB (compressé) de data par jour, rien que le coût annuel de transfert des données entre les US et l'Europe, ça se compte en centaines de milliers voire en million par an.  
 
L'équipe d'à coté en data science par exemple ils sont "devops", et le robot qu'il ont déployé à coté, il met environ 3 jours à run chaque fois, et il arrive souvent qu'il ai une instabilité qui force a relancer un run manuel et il faut repartir de zéro. Et au lieu de tourner sur des infras de prod dans le data center, il tourne sur des machines sur un data center plus utilisé pour les tests. Rien que ça, c'est pas trés professionnel. Il sont pas non plus capable pour l'instant d'assurer le support 24H/24 7J/7...
 
On se dit souvent, c'est la data science, c'est offline, on s'en fout blablabla. Sauf que l'autre fois, le robot s'est embalé, il a shoot trop de traffic, pour ses calcul sur un autre systéme, ça a impacté un autre client, et c'est moi qui était d'astreinte et ai du résoudre le probléme à 23H le samedi soir. C'est pas mon équipe, ni ma responsabilité, mais j'ai du démerder le systéme quand même.
 
Les problémes finissent toujours par arriver. Et quand ta été en frontline 2-3 fois, ta envie que les choses soient bien faite et de prévoir tout ce qui peut l'être à l'avance.
 
Et si t'arrive à vendre que tu sais faire de la data science à un niveau industriel et pas juste un modéle qui marche en test sur 3 cas, ca a beaucoup plus de valeur.
 
Ca va donc jusqu'à coder un truc propre, modulaire, unit tested, jusqu'au releasing du nouveau modéle en canary testing en prod avec KPI de monitoring pour voir s'il performe correctement et si on peut vraiment l'utiliser en prod.
 
Edit: On attends pas du data scientist pur tout ça, dans une entreprise un peu mature, les ops seront de la partie bien sûr, mais au moins le code doit être releasable facilement, bien désigné, testé, les métriques permettant de monitorer que les KPI fonctionnelles s'effondrent pas, ça sera au data scientist de les sortir. Y'a quand même un minimum.


Message édité par foudres le 06-06-2021 à 15:43:19
n°34611
o_BlastaaM​oof_o
Posté le 07-06-2021 à 00:51:53  profilanswer
 

cassiopella a écrit :

Oh, vous avez écrit pas mal de choses ici! Moi je cherche, je cherche...  :pt1cable: Mais bon, pour être honnête: je viens de commencer de le faire réellement. Avant c'était juste quelques offres.
 


 

cassiopella a écrit :


Ah bon. Donc une personne qui ne sait pas coder, qui as fait un petit cours de 10h sur les stats.... est meilleurs parce qu'elle a un diplôme d'ingé? Je parle de ces cas là. Je ne me compare jamais à un ingénieur ENSIMAG.
 


 
J'ai pas compris là... Ce que je te dis, c'est que d'après ce que j'ai pu lire de ton parcours sur ce topic, sur un exam technique lambda, tu te fais éclater par le premier type venu sorti d'une école d'ingé (parce que quasiment tous les élèves ingés ont des cours de programmation dans un ou plusieurs langages) qui a un minimum d'expérience dans les pattes (disons un stage de fin d'études).
 

cassiopella a écrit :


J'ai fait le master 2 dans une école d'ingénieur A+, et le doctorat CIFRE aussi. Pour le moment cela n'aide pas.  
 


 
Faire un master dans une école A+ != faire l'école A+...
En termes de reconnaissance du diplôme, ça n'a juste rien à voir.
 

cassiopella a écrit :


Non, le point 2) est plus compliqué. L'université et les labos publiques n'ont pas le droit de se vendre au privé. C'est même mal vu par certains. Alors que les labos des écoles d'ingés sont riches comme crésus et ont une très grande liberté pour trouver de l'argent. Un exemple d'un collègue dans un labo publique parisien: tous les entrées d'argent (contrat européens, CIFRE, collaboration etc) vont directement au budget global. Le chercher qui est à l'origine de ce contrat ne peut en profiter. S'il veut embaucher un post-doc, un doctorant, aller à une conférence ou à une réunion dans le cadre du projet, il doit faire la demande de financement comme tous les autres.  


 
"Pas le droit de se vendre au privé" ? Qu'est-ce que c'est que ces histoires ? Y a une loi qui s'appelle la loi LRU qui justement a donné une grande autonomie aux universités, en particulier dans la recherche de financements. Si les facs et les labos publics se débrouillent mal, ils ne peuvent s'en prendre qu'à eux-mêmes. C'est la loi du marché, faut savoir se vendre et être performant et à ce petit jeu, les écoles d'ingénieur et certaines facs s'en sortent mieux.

n°34612
o_BlastaaM​oof_o
Posté le 07-06-2021 à 00:59:19  profilanswer
 

foudres a écrit :

 

Savoir coder est sans doute jouable pour beaucoup de gens, mais il faut beaucoup d'XP pour le faire naturellement et avec efficacité.

 

En particulier savoir coder est pas ce qui est vraiment recherché, c'est un prés requis, bien sûr. Savoir développer des logiciels et produits de code (y compris data science) de façon industrielle, c'est à dire stable, maintenable, modulaire, facile à déployer en prod, à releaser, dans les temps, bien documentés et qui puissent facilement être repris par d'autre, ce n'est pas la même chose.

 

Est-ce que le systéme peu aussi revenir facilement à la version précédante (du code ou du modéle) en cas de probléme en prod sans grosse galére ?
Si t'es en data science, est-ce que tu peux aussi facilement évaluer ton modéle via une lib embedded ou via un web service ? Dans ce dernier cas, est-ce que tu scale à 10K-100K TPS si nécessaire ? Sait tu pour des raison d'audit/investigation par exemple rejouer le modéle comme il l'était y'a 6 mois ?

 

Nous on part sur du multi cloud, au cas ou une région tombe, le service doit encore fonctionenr. Donc ta aussi des problématiques de localisation et transfert des données. Sur un produit récent de data science, avec 28TB (compressé) de data par jour, rien que le coût annuel de transfert des données entre les US et l'Europe, ça se compte en centaines de milliers voire en million par an.

 

L'équipe d'à coté en data science par exemple ils sont "devops", et le robot qu'il ont déployé à coté, il met environ 3 jours à run chaque fois, et il arrive souvent qu'il ai une instabilité qui force a relancer un run manuel et il faut repartir de zéro. Et au lieu de tourner sur des infras de prod dans le data center, il tourne sur des machines sur un data center plus utilisé pour les tests. Rien que ça, c'est pas trés professionnel. Il sont pas non plus capable pour l'instant d'assurer le support 24H/24 7J/7...

 

On se dit souvent, c'est la data science, c'est offline, on s'en fout blablabla. Sauf que l'autre fois, le robot s'est embalé, il a shoot trop de traffic, pour ses calcul sur un autre systéme, ça a impacté un autre client, et c'est moi qui était d'astreinte et ai du résoudre le probléme à 23H le samedi soir. C'est pas mon équipe, ni ma responsabilité, mais j'ai du démerder le systéme quand même.

 

Les problémes finissent toujours par arriver. Et quand ta été en frontline 2-3 fois, ta envie que les choses soient bien faite et de prévoir tout ce qui peut l'être à l'avance.

 

Et si t'arrive à vendre que tu sais faire de la data science à un niveau industriel et pas juste un modéle qui marche en test sur 3 cas, ca a beaucoup plus de valeur.

 

Ca va donc jusqu'à coder un truc propre, modulaire, unit tested, jusqu'au releasing du nouveau modéle en canary testing en prod avec KPI de monitoring pour voir s'il performe correctement et si on peut vraiment l'utiliser en prod.

 

Edit: On attends pas du data scientist pur tout ça, dans une entreprise un peu mature, les ops seront de la partie bien sûr, mais au moins le code doit être releasable facilement, bien désigné, testé, les métriques permettant de monitorer que les KPI fonctionnelles s'effondrent pas, ça sera au data scientist de les sortir. Y'a quand même un minimum.


Non mais arrête avec ce discours [:damienm:4]

 

La réalité, c'est que :

  • 90% des data scientists sur le marché ne sont pas foutus de produire mieux qu'un script Python ou R de 500 lignes qui marche à peu près.
  • 90% des statisticiens (formellement, on appelle ça un chargé d'étude statistique) seraient tout à fait capables de faire la même chose que les data scientists.
  • Un type qui est à la fois un bon data scientist et bon data engineer, ça n'existe pas.
  • Les préoccupations de production, ça ne doit pas être dans le giron des data scientists. Chacun son métier et produire du code industriel est un métier à part.
  • Si tu veux que tes data scientists produisent quelque chose de réutilisable, il faut leur mettre à disposition et leur imposer le framework qui va bien.


Message édité par o_BlastaaMoof_o le 07-06-2021 à 17:53:52
n°34613
cassiopell​a
Posté le 07-06-2021 à 08:22:36  profilanswer
 

o_BlastaaMoof_o a écrit :


 
J'ai pas compris là... Ce que je te dis, c'est que d'après ce que j'ai pu lire de ton parcours sur ce topic, sur un exam technique lambda, tu te fais éclater par le premier type venu sorti d'une école d'ingé...


Pourrais tu me dire à quel moment tu as décidé que je code avec les pieds? Pourquoi? Pourtant tu dis plus loin:

Citation :

La réalité, c'est que :
 -  90% des statisticiens (formellement, on appelle ça un chargé d'étude statistique) seraient tout à fait capable de faire la même chose que les data scientists.


Pourquoi tu me mets dans les 10% qui ne sont pas capables?
 

Citation :

le premier type venu sorti d'une école d'ingé (parce que quasiment tous les élèves ingés ont des cours de programmation dans un ou plusieurs langages) qui a un minimum d'expérience dans les pattes (disons un stage de fin d'études).


Tu es ingénieur? D'où vient cette certitude? Je travaille depuis 5 ans avec des ingénieurs et la réalité est beaucoup moins rose de ce que tu décris. En plus, j'ai donné deux fois les cours de python aux collègues ingénieurs.
 
P.S.

Citation :

Un type qui est à la fois un bon data scientist et bon data engineer, ça n'existe pas.


Si, cela peut exister. J'ai un collègue comme ça. Mais il est spécialiste de tout ce qui est autours des images. Par contre il ne connait pas grande chose en dehors.

n°34614
o_BlastaaM​oof_o
Posté le 07-06-2021 à 11:42:06  profilanswer
 

cassiopella a écrit :


Pourrais tu me dire à quel moment tu as décidé que je code avec les pieds? Pourquoi? Pourtant tu dis plus loin:

Citation :

La réalité, c'est que :
 -  90% des statisticiens (formellement, on appelle ça un chargé d'étude statistique) seraient tout à fait capable de faire la même chose que les data scientists.


Pourquoi tu me mets dans les 10% qui ne sont pas capables?

 

Réussir un exam technique de programmation != savoir coder.

 
cassiopella a écrit :


Citation :

le premier type venu sorti d'une école d'ingé (parce que quasiment tous les élèves ingés ont des cours de programmation dans un ou plusieurs langages) qui a un minimum d'expérience dans les pattes (disons un stage de fin d'études).


Tu es ingénieur? D'où vient cette certitude? Je travaille depuis 5 ans avec des ingénieurs et la réalité est beaucoup moins rose de ce que tu décris. En plus, j'ai donné deux fois les cours de python aux collègues ingénieurs.

 

Non, je ne suis pas ingénieur. J'ai fait une vieille fac de province et à l'issue de mon master (en maths applis), j'avais suivi des cours de C, Fortran, Java et Python.
Je doute que les élèves ingénieurs en fassent moins.

 

Quant à Python, il est tout à fait possible que dans certains cursus, il ne fasse pas partie des langages enseignés. Ce n'est aucunement un souci pour quelqu'un qui a la tête bien faite, il rattrapera très vite son retard.

 
cassiopella a écrit :


Citation :

Un type qui est à la fois un bon data scientist et bon data engineer, ça n'existe pas.


Si, cela peut exister. J'ai un collègue comme ça. Mais il est spécialiste de tout ce qui est autours des images. Par contre il ne connait pas grande chose en dehors.

 

Un spécialiste en computer vision doublé d'un bon data engineer ? Encore plus improbable. Je pense qu'on ne parle pas de la même chose, tout simplement.


Message édité par o_BlastaaMoof_o le 07-06-2021 à 11:43:18
n°34615
numbernine
numéro neuf
Posté le 07-06-2021 à 11:46:17  profilanswer
 

o_BlastaaMoof_o a écrit :


 
La réalité, c'est que :

  • 90% des data scientists sur le marché ne sont pas foutus de produire mieux qu'un script Python ou R de 500 lignes qui marche à peu près.
  • 90% des statisticiens (formellement, on appelle ça un chargé d'étude statistique) seraient tout à fait capable de faire la même chose que les data scientists.
  • Un type qui est à la fois un bon data scientist et bon data engineer, ça n'existe pas.
  • Les préoccupations de production, ça ne doit pas être dans le giron des data scientists. Chacun son métier et produire du code industriel est un métier à part.
  • Si tu veux que tes data scientists produisent quelque chose de réutilisable, il faut leur mettre à disposition et leur imposer le framework qui va bien.



 
 
+1
Tellement fatiguant de croire qu'un data scientist doit savoir faire du ml, de l'infra, de l'archi, du backend, du front etc. A ce que je sache quand on recrute un backend, on lui demande pas de connaitre sur le bout des doigts les derniers frameworks front [:massys]

n°34616
rokhlan
Posté le 07-06-2021 à 16:39:41  profilanswer
 

o_BlastaaMoof_o a écrit :

Non, je ne suis pas ingénieur. J'ai fait une vieille fac de province et à l'issue de mon master (en maths applis), j'avais suivi des cours de C, Fortran, Java et Python.
Je doute que les élèves ingénieurs en fassent moins.


Pas de Fortran, mais du C++ à la place :o
 
Et du Matlab [:petoulachi]

n°34617
Johnny_Bob​by
Less is more
Posté le 07-06-2021 à 17:39:02  profilanswer
 

numbernine a écrit :


 
 
+1
Tellement fatiguant de croire qu'un data scientist doit savoir faire du ml, de l'infra, de l'archi, du backend, du front etc. A ce que je sache quand on recrute un backend, on lui demande pas de connaitre sur le bout des doigts les derniers frameworks front [:massys]


 
Sans oublier la partie soft skills et expertise métier  :o

n°34618
o_BlastaaM​oof_o
Posté le 07-06-2021 à 17:48:31  profilanswer
 

rokhlan a écrit :


Pas de Fortran, mais du C++ à la place :o

 

Et du Matlab [:petoulachi]


MATLAB, je m'y suis formé tout seul à la base :o
C'est de loin le plus facile à apprendre à mon sens.


Message édité par o_BlastaaMoof_o le 07-06-2021 à 17:48:57
n°34619
mrproton
Posté le 07-06-2021 à 18:07:20  profilanswer
 

Johnny_Bobby a écrit :


 
Sans oublier la partie soft skills et expertise métier  :o


 
Et le plus important étant un classement top 2% mondial sur kaggle et hackerrank, et au moins 15 contributions open source significatives
C'est le minimum de nos jours :o

n°34620
cassiopell​a
Posté le 07-06-2021 à 18:20:11  profilanswer
 

o_BlastaaMoof_o a écrit :


Réussir un exam technique de programmation != savoir coder.


Tu n'as pas répondu à ma question. Et pourquoi parles tu d'examen technique? Je vois que tu as un à priori sans me connaitre, sans voir mon CV. Tu as décidé que je ne sais pas coder. Pourtant tu ne sais pas si j'ai eu les cours de programmations, combien j'en ai eu et quel est mon expérience. Donc je répose ma question: pourquoi tu penses que je code avec les pieds? Parce que je suis une fille? Parce que dans le titre de mon diplôme il y a un "éco"-machin chose?

 
Citation :


J'ai fait une vieille fac de province et à l'issue de mon master (en maths applis), j'avais suivi des cours de C, Fortran, Java et Python.


Ok, comme moi. Donc j'en conclu que tu codes avec les pieds.  :kaola:

 
Citation :

Je doute que les élèves ingénieurs en fassent moins.


Et pourtant si! J'avais pensé comme toi avant. Mais après 5 ans de travail à côté des ingénieurs je peux te dire que ce sont des rares cas qui viennent de certaines écoles. En plus il y a quelques années c'était une grosse mode d'enseigner VBA aux ingénieurs. Je te laisse imaginer les modèles qu'ils produisaient en Excel...

 
Citation :

Un spécialiste en computer vision doublé d'un bon data engineer ? Encore plus improbable. Je pense qu'on ne parle pas de la même chose, tout simplement.


Si si. ENSIMAG + thèse + 10 ans d'expérience. Mais j'imagine que cela ne court pas la rue...


Message édité par cassiopella le 07-06-2021 à 18:23:25
n°34621
foudres
Posté le 07-06-2021 à 21:14:48  profilanswer
 

o_BlastaaMoof_o a écrit :


Non mais arrête avec ce discours [:damienm:4]
 
La réalité, c'est que :

  • 90% des data scientists sur le marché ne sont pas foutus de produire mieux qu'un script Python ou R de 500 lignes qui marche à peu près.
  • 90% des statisticiens (formellement, on appelle ça un chargé d'étude statistique) seraient tout à fait capables de faire la même chose que les data scientists.
  • Un type qui est à la fois un bon data scientist et bon data engineer, ça n'existe pas.
  • Les préoccupations de production, ça ne doit pas être dans le giron des data scientists. Chacun son métier et produire du code industriel est un métier à part.
  • Si tu veux que tes data scientists produisent quelque chose de réutilisable, il faut leur mettre à disposition et leur imposer le framework qui va bien.



 
Alors déjà y'en a qui y arrivent tout à fait, mais effectivement ils ont pas la même paye ou le même respect. Ceux qui sont chez nous comme ça, sont genre "lead data scientist" ou "principal engineer" ou autre titre équivalent.
 
Cela dit, le probléme reste réél, le petit nouveau pour le coup, qui est dev, est capable de faire tout ça en sortant de son école (ENSIMAG pour le coup) qu'on a chez nous et beaucoup d'autres de la nouvelle génération sont des dev avec une flavor data science, ils sont capable de faire tout ça ET sont bon dans le sujet. La data science est plus une option de leur cursus, c'est vrai. Mais ça correspond plus au besoin d'avoir des gens capable de se démerder un peu et qui n'ont pas besoin d'un paquet de gens autour d'eux pour arriver à livrer un truc qui marche.
 
Du coup forcément, ce genre de profil sera largement préféré, quitte à les payer plus cher. Et ça c'est pas moi qui l'invente, c'est une tendance lourde de la data science.
 
Edit: Sinon il faudra vraiment avoir un level en ML/data science élevé pour compenser.


Message édité par foudres le 07-06-2021 à 21:19:43
n°34622
rokhlan
Posté le 08-06-2021 à 09:34:02  profilanswer
 

Tiens, petite question : vous pensez qu'il est possible de produire un résultat (genre un p'tit POC) en 2 mois ?

 

Parce que discutait avec un data scientist de COGIP et il me disait qu'il faut 5/6 mois de travail pour avoir quelque chose à montrer aux commanditaires.

 

Ce serait par exemple sur des sujets d'analyse de series temporelles.

n°34623
Rontgen
Posté le 08-06-2021 à 09:46:36  profilanswer
 

rokhlan a écrit :

Tiens, petite question : vous pensez qu'il est possible de produire un résultat (genre un p'tit POC) en 2 mois ?
 
Parce que discutait avec un data scientist de COGIP et il me disait qu'il faut 5/6 mois de travail pour avoir quelque chose à montrer aux commanditaires.
 
Ce serait par exemple sur des sujets d'analyse de series temporelles.


 
Je pense pas qu'on puisse répondre à ca de facon générale
Ca dépend des données, de ton infrastructure, de la personne qui va travailler dessus, et de la maturité que ton POC doit avoir
 
J'ai investi beaucoup de temps dans notre pipeline et workflow donc dans certains cas je peux te sortir un prototype en meme pas quelques heures :o

n°34624
o_BlastaaM​oof_o
Posté le 08-06-2021 à 09:49:36  profilanswer
 

cassiopella a écrit :


Tu n'as pas répondu à ma question. Et pourquoi parles tu d'examen technique? Je vois que tu as un à priori sans me connaitre, sans voir mon CV. Tu as décidé que je ne sais pas coder. Pourtant tu ne sais pas si j'ai eu les cours de programmations, combien j'en ai eu et quel est mon expérience. Donc je répose ma question: pourquoi tu penses que je code avec les pieds? Parce que je suis une fille?


OK, le débat s'arrête ici pour ma part, trouve-toi quelqu'un d'autre pour alimenter ton délire de persécution :jap:

n°34625
rokhlan
Posté le 08-06-2021 à 10:08:20  profilanswer
 

Rontgen a écrit :

 

Je pense pas qu'on puisse répondre à ca de facon générale
Ca dépend des données, de ton infrastructure, de la personne qui va travailler dessus, et de la maturité que ton POC doit avoir

 

J'ai investi beaucoup de temps dans notre pipeline et workflow donc dans certains cas je peux te sortir un prototype en meme pas quelques heures :o


 :jap:

 

Tu utilises Jenkins pour les pipelines ?

 Page :   1  2  3  4  5  ..  115  116  117  ..  133  134  135  136  137  138

Aller à :
Ajouter une réponse
 

Sujets relatifs
[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires[Topic Unique] Claude by Anthropic
[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)