Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2018 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  9  10  11  ..  128  129  130  131  132  133
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°4994511
tandouye
Posté le 11-06-2017 à 20:30:53  profilanswer
 

Reprise du message précédent :
Bonjour,
 
Des gens connaissent le Msc entre l'essec et centrale? et surtout la sélectivité ?  
 
gracias

mood
Publicité
Posté le 11-06-2017 à 20:30:53  profilanswer
 

n°4995236
foret_impr​obable
Posté le 14-06-2017 à 19:48:34  profilanswer
 

C'est dommage que ce topic ne soit pas plus actif... du coup j'essaie de relancer avec plusieurs sujets à la fois :
 
- Un site pas mal pour se former, je ne crois pas l'avoir vu passer dans la discussion  : http://datasciencemasters.org/
 
- Quelqu'un a déjà essayé le site de recrutement datasama ?
 
- Quels sont pour vous les avantages d'avoir un PhD pour s'insérer dans le milieu ? Est-ce qu'avec un diplôme d'ingénieur groupe A et en plus un M2R en maths appli on peut pas déjà trouver un job et faire une carrière solide ?
 
- Est-ce risquer de commencer sa carrière dans une start-up ? Surtout si on débarque comme le seul data scientist de l'équipe...
 
- J'ai vu quelques profils de data scientists en freelance, ça peut être un bon plan de se lancer tout seul après quelques années d'industrie ?
 

n°4995253
Bébé Yoda
Posté le 14-06-2017 à 20:52:20  profilanswer
 

J'ai contacté datasama, le gars est sympa et disponible mais 90% des postes qu'ils proposent sont en RP. Il a pris le temps de répondre à mes questions et à me conseiller sur ce que je devais apprendre. Je ne sais pas s'ils sont bons pour un placement final mais je pense que ça vaut le coup de les contacter.

 

PhD ça dépend du poste visé, c'est toujours pareil. Dans les grands groupes c'est quitte ou double, dans les plus petites structures je pense que ça peut être un plus (tout dépend du domaine).

n°4995317
korial
Posté le 15-06-2017 à 08:52:56  profilanswer
 

J'ai commencé Ma Carriere dans une startup, seul machine learning du groupe, ca s'est plutôt bien passé. Mais faut savoir être autonome, être déjà au courant de comment travailler, avoir pas mal de culture dans le domaine, lire tout seul les papiers de recherche, etc.  
Et faut avoir envie de faire un peu de tout, recherche développement implémentation.  
 
Bon après je sais pas ce que ça donnera ensuite face à des gens qui ont commencé dans un grand groupe :o

n°4995318
Kaffeine
Noisette
Posté le 15-06-2017 à 08:59:14  profilanswer
 

Bah dans un grand groupe c'est tout pareil  :o recherche, dev, implémentation, cadrage besoin etc; veille techno, parfois de l'avant vente. Bref du tout

n°4995323
o_BlastaaM​oof_o
Posté le 15-06-2017 à 09:23:44  profilanswer
 

foret_improbable a écrit :

- Quels sont pour vous les avantages d'avoir un PhD pour s'insérer dans le milieu ? Est-ce qu'avec un diplôme d'ingénieur groupe A et en plus un M2R en maths appli on peut pas déjà trouver un job et faire une carrière solide ?

 

Dans mon équipe, nous privilégions grandement les PhD. Après des études de niveau Bac+5, grande école ou pas, les profils manquent grandement de méthodologie et de compétences en développement (même si on peut avoir de bonnes surprises).

 

Le plus gros défaut des data scientists en général, c'est qu'ils sont bordéliques. Le doctorat aide à corriger ce défaut.

 

edit : mais globalement, il n'y a aucun problème à trouver un job de data scientist en sortie d'école, principalement dans une SSII.

Message cité 1 fois
Message édité par o_BlastaaMoof_o le 15-06-2017 à 09:24:14
n°4995421
foret_impr​obable
Posté le 15-06-2017 à 19:41:07  profilanswer
 

o_BlastaaMoof_o a écrit :


 
Dans mon équipe, nous privilégions grandement les PhD. Après des études de niveau Bac+5, grande école ou pas, les profils manquent grandement de méthodologie et de compétences en développement (même si on peut avoir de bonnes surprises).
 
Le plus gros défaut des data scientists en général, c'est qu'ils sont bordéliques. Le doctorat aide à corriger ce défaut.
 
edit : mais globalement, il n'y a aucun problème à trouver un job de data scientist en sortie d'école, principalement dans une SSII.


 
Et 3 ans d'expérience en tant que data scientist, ça permet aussi d'être moins bordéliques, non ? Du coup entre un PhD qui termine sa thèse et un data scientist non-PhD mais avec 3 ans d'expérience dans les pattes, qui est privilégié ?

n°4995434
Rontgen
Posté le 15-06-2017 à 20:19:55  profilanswer
 

foret_improbable a écrit :

 

Et 3 ans d'expérience en tant que data scientist, ça permet aussi d'être moins bordéliques, non ? Du coup entre un PhD qui termine sa thèse et un data scientist non-PhD mais avec 3 ans d'expérience dans les pattes, qui est privilégié ?


Ça dépend du domaine du PhD :o

 

Après, les PhD vont peut être pas viser les mêmes postes, par exemple plutot des postes vraiment orientés machine learning

 

Sinon, je pense celui qui sera privilégié, c'est celui qui a une expérience dans le même domaine d'application

n°4995451
o_BlastaaM​oof_o
Posté le 15-06-2017 à 22:02:22  profilanswer
 

foret_improbable a écrit :


 
Et 3 ans d'expérience en tant que data scientist, ça permet aussi d'être moins bordéliques, non ? Du coup entre un PhD qui termine sa thèse et un data scientist non-PhD mais avec 3 ans d'expérience dans les pattes, qui est privilégié ?


Un data scientist avec 3 ans d'expérience, ça n'existe quasiment pas sur le marché aujourd'hui.
 
Mais pour rester sur le sujet, les quelques data scientists non PhD que j'ai pu voir ont quand même de sacrées lacunes en développement. Tout va bien tant qu'il s'agit d'écrire un petit code R de quelques centaines de lignes ou de gribouiller un truc dans un notebook Python. En revanche, quand il faut produire un vrai code, propre, structuré, qui fait des choses complexes, si possible de manière distribuée, y a plus grand monde.

n°4995460
foret_impr​obable
Posté le 15-06-2017 à 22:27:03  profilanswer
 

Ok je vois... Mais concernant les PhD, c'est pas trop dur de trouver un truc intéressant (en France) ? On dit souvent qu'une bonne thèse ça passe par un bon encadrant, or y a quand même peu d'encadrants hyper calés dans le domaine en France, non ?  
Une thèse CIFRE, c'est une bonne option ?

mood
Publicité
Posté le 15-06-2017 à 22:27:03  profilanswer
 

n°4995463
o_BlastaaM​oof_o
Posté le 15-06-2017 à 22:35:44  profilanswer
 

Selon moi, il ne faut pas faire une thèse en statistiques ou en "data science" (qui n'est pas une discipline, pour rappel). Il s'agit plutôt de faire une thèse en maths applis dans un domaine tel que la bioinfo ou le traitement du signal. Les EPIC tels que le CEA ou l'INRA sont de bons spots pour moi. Les thèses CIFRE, no offense aux gens concernés, c'est quand même souvent un peu bullshit...

n°4995479
Bébé Yoda
Posté le 15-06-2017 à 23:24:31  profilanswer
 

Bah les CIFRE c'est comme le reste, il faut bien choisir. J'en ai vu (et encadré) des moisies et d'excellentes....
Les thèses dans l'académique, ça peut aussi être vraiment très moisi :D

n°4995483
Rontgen
Posté le 15-06-2017 à 23:32:22  profilanswer
 

Bébé Yoda a écrit :

Bah les CIFRE c'est comme le reste, il faut bien choisir. J'en ai vu (et encadré) des moisies et d'excellentes....
Les thèses dans l'académique, ça peut aussi être vraiment très moisi :D


+1
Au moins avec une Cifre, on est sur que le sujet sert vaguement à quelque chose :o

n°4995493
rogermajax
Posté le 16-06-2017 à 01:18:03  profilanswer
 

o_BlastaaMoof_o a écrit :

Selon moi, il ne faut pas faire une thèse en statistiques ou en "data science" (qui n'est pas une discipline, pour rappel). Il s'agit plutôt de faire une thèse en maths applis dans un domaine tel que la bioinfo ou le traitement du signal.


Pourquoi tu penses qu'une thèse en stat/ML n'est pas à privilégier ?

n°4995494
rogermajax
Posté le 16-06-2017 à 01:43:09  profilanswer
 

dede_sav a écrit :

Avec le RF comme avec LASSO, les features "non idependante" entre elle ne seront pas toutes sélectionné non ?

 

Mon idée est vraiment de capturer toutes les features qui sont "non-independante" avec la feature cible puis de les classer et enfin de supprimer les inutiles (avec un RF pourquoi pas).

 

Intuitivement je dirais qu'effectivement le classement d'une feature par RF peut être biaisé par la présence d'une feature assez similaire, comme pour LASSO.

 

De manière générale c'est compliqué de classer les features.

 

Tu peux avoir 2 features inutiles prises separement mais très utiles prises ensembles. Du coup comment tu classes ces features, inutiles ou utiles?

 

RF et LASSO les classera (je dis ça intuitivement) comme utiles tandis que si tu regardes uniquement la corrélation avec la variable cible, elles seront classées inutiles puisque considéré séparément.

 

Tout dépend de ce que tu veux tirer de ton étude.


Message édité par rogermajax le 16-06-2017 à 01:49:22
n°4995656
korial
Posté le 16-06-2017 à 18:08:31  profilanswer
 

o_BlastaaMoof_o a écrit :


Un data scientist avec 3 ans d'expérience, ça n'existe quasiment pas sur le marché aujourd'hui.
 
Mais pour rester sur le sujet, les quelques data scientists non PhD que j'ai pu voir ont quand même de sacrées lacunes en développement. Tout va bien tant qu'il s'agit d'écrire un petit code R de quelques centaines de lignes ou de gribouiller un truc dans un notebook Python. En revanche, quand il faut produire un vrai code, propre, structuré, qui fait des choses complexes, si possible de manière distribuée, y a plus grand monde.


Ben moi les PhD que j'ai pu voir ils codaient comme des pieds et n'en avait rien à cirer :o :o :o
Je me permets de m'insurger contre cette généralité réductrice des non PhD :o

n°4995668
dede_sav
Posté le 16-06-2017 à 19:44:03  profilanswer
 

PhD c'est juste une expérience poussé durant 3ans. Comme dans toute population, tu trouveras des branleurs comme des fou furieux qui bossent h24.
 
Un PhD c'est pas un gage de savoir faire mais plus un gage de qualité/compétences* (le gars peut géré un projet, vulgarisé / communiqué, prendre et décomposé des problèmes complexes, etc.)
C'est l'expérience qui te donne le savoir faire, et un gars qui fait 3ans d'analyse de donnée bah il aura pas mal d'expérience ... (entre les données à nettoyer, comprendre ce que veut le client etc.)
 
*De mon point de vue de thésard

n°4995708
Pina Colad​a
Posté le 17-06-2017 à 01:20:37  profilanswer
 

Ya quand même un sacré gap entre les types qui ont fait de la recherche pendant 3/4 ans et les types qui n'en n'ont jamais fait je trouve.
Rien que savoir le noms des pointures dans ton domaine ou savoir classifier rapidement les papiers de merde ou les papiers intéressant, c'est pas un truc qu'on apprend en entreprise et les types qui n'ont pas fait de recherche la dedans sont complètement perdu.
Ca dépend surtout ce que veut la boite, et si c'est pour intégrer un poste plus orienté recherche / développent de prototype ou pour intégrer un poste classique d'ingénierie.

n°4995739
korial
Posté le 17-06-2017 à 12:15:46  profilanswer
 

Oui j'aurais plus tendance à être d'accord avec le fait que en moyenne les PhD sont plus fort pour faire le stuff "recherche" (juger les papiers, rester à jour avec l'état de l'art, etc), mais plus haut on parlait de produire du code de qualité, et dans mes observations c'est négativement corrélé avec le fait d'avoir un PhD (mais il y a trop peu d'exemples pour conclure).  
 
Enfin bref ça me paraît normal que Si tu fais De La recherche pendant 3 ans tu vas être plus fort pour en faire après, auto  [:master of obvious]

n°4995747
Bébé Yoda
Posté le 17-06-2017 à 13:11:27  profilanswer
 

Oui voilà c'est assez logique qu'un chercheur soit meilleur en recherche :D
Après, niveau code ça dépend des parcours. Si le gars à fait un M2 info/math puis thèse dans le domaine, il sera meilleur

n°4995766
korial
Posté le 17-06-2017 à 15:34:55  profilanswer
 

Meilleur que qui ?
Meilleur que les gens sans m2 info avec thèse ok
Meilleur que les gens avec m2 info et 3 ans d'xp en entreprise je crois pas (à moins de pas coder dans la boîte)

n°4995776
Bébé Yoda
Posté le 17-06-2017 à 16:07:07  profilanswer
 

Heu je sais plus où on en est du débat :D

 

Mais dans mon expérience, les PhD scientifiques font des data scientists OK, paid pêchent souvent niveau code.
Je vois autour de moi (doctorat en physique), tout le monde sait coder mais en réalité on bidouille on se débrouille. Ça marche mais c'est rarement optimisé, et tout ce qui est versioning et compagnie, tu auras de la chance s'ils en ont entendu parler.

n°4995779
korial
Posté le 17-06-2017 à 16:12:27  profilanswer
 

Je suis d'accord vu mon expérience aussi :o

n°4995792
rogermajax
Posté le 17-06-2017 à 17:34:19  profilanswer
 

Pour changer de ce débat débile :O , quelqu'un à déjà mis en oeuvre du deep learning sur un problème concret? Si c'est le cas, decrire le problème la taille de la base d'exemple et les gains éventuels par rapport à des ensembles d'arbres et des réseaux non profonds.
Merci! :)


Message édité par rogermajax le 17-06-2017 à 17:34:42
n°4995793
Bébé Yoda
Posté le 17-06-2017 à 17:52:47  profilanswer
 

Deep learning, J'ai pas encore attaqué. Je compte m'y mettre bientôt le temps de terminer quelques cours.
D'ailleurs si vous avez des recommandations, je suis preneur (genre un bon cours synthétique sur coursera)

n°4995795
Rasthor
Posté le 17-06-2017 à 18:08:06  profilanswer
 

Bébé Yoda a écrit :

Deep learning, J'ai pas encore attaqué. Je compte m'y mettre bientôt le temps de terminer quelques cours.
D'ailleurs si vous avez des recommandations, je suis preneur (genre un bon cours synthétique sur coursera)


 
http://deeplearning.net/tutorial/
 
http://deeplearning.net/tutorial/deeplearning.pdf

n°4995799
Rontgen
Posté le 17-06-2017 à 18:55:19  profilanswer
 

J'utilise du deep learning très régulièrement.
Pendant longtemps j'ai fait des random forests et j'etais assez réticent à tout abandonner pour faire des réseaux de neurones.
Mais depuis que je m'y suis formé et que je sais les entraîner, j'ai du me faire une raison: sur 100% de mes applications (en gros du traitement d'image mais pas sur des photos), ça défonce très largement les random forests, même quand j'ai un nombre de données pas si élevé.
Du coup je ne fais plus que ça maintenant :o


Message édité par Rontgen le 17-06-2017 à 18:55:46
n°4995807
Darmstadti​um
Pipoteur grotesque
Posté le 17-06-2017 à 19:51:10  profilanswer
 

Je travaille actuellement sur de la reconnaissance vocale, au niveau des modèles de langage, les réseaux de neurones (récurrents : RNN type LSTM, GRU etc. et éventuellement des CNN pour faire des character-level embeddings) sont très au dessus des modèles Markoviens classiques.


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°4995961
Kaffeine
Noisette
Posté le 19-06-2017 à 12:54:57  profilanswer
 

o_BlastaaMoof_o a écrit :


Un data scientist avec 3 ans d'expérience, ça n'existe quasiment pas sur le marché aujourd'hui.
 
Mais pour rester sur le sujet, les quelques data scientists non PhD que j'ai pu voir ont quand même de sacrées lacunes en développement. Tout va bien tant qu'il s'agit d'écrire un petit code R de quelques centaines de lignes ou de gribouiller un truc dans un notebook Python. En revanche, quand il faut produire un vrai code, propre, structuré, qui fait des choses complexes, si possible de manière distribuée, y a plus grand monde.


 

Bébé Yoda a écrit :

Heu je sais plus où on en est du débat :D
 
Mais dans mon expérience, les PhD scientifiques font des data scientists OK, paid pêchent souvent niveau code.
Je vois autour de moi (doctorat en physique), tout le monde sait coder mais en réalité on bidouille on se débrouille. Ça marche mais c'est rarement optimisé, et tout ce qui est versioning et compagnie, tu auras de la chance s'ils en ont entendu parler.


 
Faux problème, on a toute une équipe des devs qui redéveloppe notre code et qui met en prod nos modèles, elle industrialise le tout sur des serveurs en intégrant les flux des applis, recette, tests unitaires tout le bordel avec des itérations et tout ce qu'en suit.
 
Bon après on a toute une méthodo et des bonnes pratiques pour que tout soit homogène et que le passage soit facilité

Message cité 2 fois
Message édité par Kaffeine le 19-06-2017 à 12:55:55
n°4995966
Jadha
Next one's coming faster
Posté le 19-06-2017 à 13:18:04  profilanswer
 

Kaffeine a écrit :


 
Faux problème, on a toute une équipe des devs qui redéveloppe notre code et qui met en prod nos modèles, elle industrialise le tout sur des serveurs en intégrant les flux des applis, recette, tests unitaires tout le bordel avec des itérations et tout ce qu'en suit.
 
Bon après on a toute une méthodo et des bonnes pratiques pour que tout soit homogène et que le passage soit facilité


 
Tiens ça m'intéresse bien de savoir comment. Il faut que les développeurs connaissent un minimum les algos pour les recoder, non ?

n°4995968
Kaffeine
Noisette
Posté le 19-06-2017 à 13:29:19  profilanswer
 

Nous on fait surtout des spécifications, mais il  y a des fonctionnels de leur coté.  
Après pas forcement, on recode pas des fonctions déjà implémentées.


Message édité par Kaffeine le 19-06-2017 à 13:53:17
n°4995969
doublebeur​re
Posté le 19-06-2017 à 13:29:51  profilanswer
 

[:lardoncru]

n°4996009
dede_sav
Posté le 19-06-2017 à 18:00:02  profilanswer
 

Mesdames et Messieurs,  
 
Je suis à la recherche d'une cartographie des métiers autour de l'analyse de données (donc pas de gouvernance avec les CDO, etc.). Pourriez vous m'aider ?  
 
Concrètement, j'essaye de voir la différence entre :
- Data scientist : à l'aide de ces connaissances métiers et des compétences en maths/stats, il va créer un modèle (prédictif)  
- Machine learning engineer : à l'aide de ces connaissances en génie logiciel et en math, il va récupérer le modèle fait par le data scientist et le transforme en un modèle industrialisable, scalable puis il va l'implémenter donc les algo sur R, Spark, etc.
- Data engineer = Machine learning engineer ?
- Data architecte : à l'aide de ces connaissances en architecture applicatif, il va proposer et maintenir une architecture spécialisé dans le traitement de données (spark, etc...)  
- ?
 
Est-vous d'accords avec cette article ?  
https://www.datacamp.com/community/ [...] gs.xz9QqiQ

Message cité 1 fois
Message édité par dede_sav le 19-06-2017 à 18:05:03
n°4996011
Kaffeine
Noisette
Posté le 19-06-2017 à 18:14:42  profilanswer
 

regarde dedans, pas eu le temps de lire par contre
https://www.telecom-paristech.fr/fi [...] n_2017.pdf

n°4996012
MassiveAtt​ack
Posté le 19-06-2017 à 18:16:29  profilanswer
 

dede_sav a écrit :

Mesdames et Messieurs,  
 
Je suis à la recherche d'une cartographie des métiers autour de l'analyse de données (donc pas de gouvernance avec les CDO, etc.). Pourriez vous m'aider ?  
 
Concrètement, j'essaye de voir la différence entre :
- Data scientist : à l'aide de ces connaissances métiers et des compétences en maths/stats, il va créer un modèle (prédictif)  
- Machine learning engineer : à l'aide de ces connaissances en génie logiciel et en math, il va récupérer le modèle fait par le data scientist et le transforme en un modèle industrialisable, scalable puis il va l'implémenter donc les algo sur R, Spark, etc.
- Data engineer = Machine learning engineer ?
- Data architecte : à l'aide de ces connaissances en architecture applicatif, il va proposer et maintenir une architecture spécialisé dans le traitement de données (spark, etc...)  
- ?
 
Est-vous d'accords avec cette article ?  
https://www.datacamp.com/community/ [...] gs.xz9QqiQ


Il te manque toute la partie exploitation, en aval de la phase de traitement de données. C'est quand même LA finalité de la data science :).
Les métiers concernés sont d'ailleurs mentionnés dans ton article (Data Analyst, Business Analyst ...)

n°4996018
alpachinoi​s
Posté le 19-06-2017 à 19:46:59  profilanswer
 

On devrait parler des salaires un peu. Vous touchez combien grâce à la data science :o

n°4996072
Bébé Yoda
Posté le 20-06-2017 à 07:32:46  profilanswer
 

Moi ça m'a coûté 400€ pour l'instant :o

n°4996140
o_BlastaaM​oof_o
Posté le 20-06-2017 à 15:31:54  profilanswer
 

Kaffeine a écrit :


 
Faux problème, on a toute une équipe des devs qui redéveloppe notre code et qui met en prod nos modèles, elle industrialise le tout sur des serveurs en intégrant les flux des applis, recette, tests unitaires tout le bordel avec des itérations et tout ce qu'en suit.
 
Bon après on a toute une méthodo et des bonnes pratiques pour que tout soit homogène et que le passage soit facilité


 
Qui redéveloppe dans le même langage ? Lequel le cas échéant ?

n°4996189
alpachinoi​s
Posté le 20-06-2017 à 17:09:44  profilanswer
 

Putain je viens de voir une offre d'emploi 60k à Castres pour être data analyst confirmé et 65k pour Responsable de pôle « Data Lab et Performance digitale »
 
Putain ce salaire à Castres [:siluro]

n°4996203
Bébé Yoda
Posté le 20-06-2017 à 18:34:59  profilanswer
 

alpachinois a écrit :

Putain je viens de voir une offre d'emploi 60k à Castres pour être data analyst confirmé et 65k pour Responsable de pôle « Data Lab et Performance digitale »

 

Putain ce salaire à Castres [:siluro]


Ils doivent avoir du mal à attirer des gens jusque là

n°4996206
rokhlan
Posté le 20-06-2017 à 18:52:40  profilanswer
 

Pourtant ça a l'air pas mal comme coin [:cerveau neuf]

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  9  10  11  ..  128  129  130  131  132  133

Aller à :
Ajouter une réponse
 

Sujets relatifs
Recherche d'emploi[Topik Unique] Les girls de la section E&E
Avez vous des problèmatiques sur le Big Data ?Master Finance et Stratégie de Science Po après des études de droit ?
Je veux travailler dans les Big DATAOrientation pour Data Science & Recherche Opérationnelle
[Topic Unique] Concours ingénieur ENAC/IESSA : 30 postes [Topic Unique] EIVP
[Topic Unique] L'Aylite !!! 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR