Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2353 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  12  13  14  ..  128  129  130  131  132  133
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°5001596
Darmstadti​um
Pipoteur grotesque
Posté le 19-07-2017 à 16:12:49  profilanswer
 

Reprise du message précédent :
Je pense que personne ne connait en fait [:klemton]


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
mood
Publicité
Posté le 19-07-2017 à 16:12:49  profilanswer
 

n°5001600
Jadha
Next one's coming faster
Posté le 19-07-2017 à 16:34:46  profilanswer
 

marioto a écrit :


 
Ce bide... :'(
C'est sûrement moins intéressant que votre discussion mais quand même :(


 
TRIED est un master qui s'effectue également au CNAM.
J'ai suivi un ou deux cours comme ça, j'ai pas trouvé ça fou.
 
Je pense que c'est plus intéressant de faire le certificat Data Scientist du CNAM si tu travailles déjà ou de faire un autre master de Paris Saclay (mais je connais pas leur sélectivité).

n°5001629
Tidom
Posté le 19-07-2017 à 18:50:30  profilanswer
 

Pour la methode de sélection de variables dans le cas d'un data shift : En fait le rapport du participant au challenge auquel je pensais est public :)
C'est accessible sans abonnement :
https://annals-csis.org/proceedings/2016/drp/21.html
Y a une partie sur les Pretraitements et la methode de classification utilisée (un bayesien sélectif avec construction de variables automatique pour les problèmes relationnels) et ensuite sur le data shift (appelé drift ici). C'est décrit assez succinctement mais au moins on voit l'évolution de la performance.


Message édité par Tidom le 19-07-2017 à 18:52:38
n°5001633
dede_sav
Posté le 19-07-2017 à 19:36:34  profilanswer
 

Le calcul du drift est d'ailleurs l'une des méthodes au cœur des outils d'auto-ml comme Predicsis / Khiops khiops.predicsis.com de Marc Boullé justement, ou encore edge-ml http://www.edge-ml.com/ et dans une moindre mesure dans l'outil MLBox d'Axel de Romblay https://github.com/AxeldeRomblay/MLBox.
D'ailleurs je crois que c'est un réseau de neurone qui s'occupe d'estimer le drift des variables dans le cas de MLBox.

Message cité 1 fois
Message édité par dede_sav le 19-07-2017 à 19:38:55
n°5001904
Tidom
Posté le 21-07-2017 à 07:06:47  profilanswer
 

dede_sav a écrit :

Le calcul du drift est d'ailleurs l'une des méthodes au cœur des outils d'auto-ml comme Predicsis / Khiops khiops.predicsis.com de Marc Boullé justement, ou encore edge-ml http://www.edge-ml.com/ et dans une moindre mesure dans l'outil MLBox d'Axel de Romblay https://github.com/AxeldeRomblay/MLBox.
D'ailleurs je crois que c'est un réseau de neurone qui s'occupe d'estimer le drift des variables dans le cas de MLBox.


 
Mais qu'est-ce que c'est que cette pub déguisée derrière un multi ?! :o

n°5001950
Bébé Yoda
Posté le 21-07-2017 à 10:54:50  profilanswer
 

Toujours sur mon problème de régression (prédiction de prix, on a 80 features: surfaces, nb chambres, environnement, etc.), je me pose des questions sur la sélection des features.
 
J'ai obtenu un bon score en combinant plusieurs regresseurs (par exemple, un gradientboosting, un elastic net, un xgboost, dont je fais la moyenne).
 
J'ai tenté une autre approche où je commence par un LASSO, je conserve seulement les features non nulles et je relance la procédure précente avec ces features sélectionnées automatiquement.
Pour l'optimiser j'ai une méthode où je vais évaluer le score pour différentes valeurs de alpha et conserver le bon nombre de features.
Bref, cette dernière approche m'a permis d'obtenir un score encore meilleur (j'ai réussi à grimper dans les 30%, youpi).  
 
Seulement je ne sais pas si c'est dû au hasard, ou bien si c'est vraiment une bonne idée de procéder comme ça. Qu'en pensez-vous ?
 
 
Au passage, j'ai une autre question. J'ai commencé à utiliser des pipelines, j'aimerais pouvoir faire la même chose que ma 2eme procédure, du genre:

Code :
  1. pipe = Pipeline(steps=[
  2.     ('select', LASSO()),
  3.     ('regressor1', GradientBoosting()),
  4.     ('regressor2', Regressor())
  5. ])
  6. pipe.fit(training_data)
  7. pipe.predict


 
Seulement ça ne fonctionne pas car Lasso, elasticnet ou ridge n'ont pas de 'transform' dans leurs méthodes (du coup je continue de faire à la main)
J'imagine que c'est un peu long à m'expliquer, mais si vous avez des liens pertinents pour mieux piger ça, ça m'intéresse :)
 
Edit : à la main je fais ça
 

Code :
  1. #Je crée plein de modèles
  2. Huber_model = HuberRegressor(alpha=0.009)
  3. ElNet_model = ElasticNetCV(l1_ratio=np.arange(0.05,0.95,0.05),alphas=np.arange(1,100,10),cv=5, max_iter=1500)
  4. GBoost_model = GradientBoostingRegressor(loss="ls",
  5.                                          learning_rate=0.09,
  6.                                          n_estimators=500,
  7.                                         max_depth=4,
  8.                                         alpha=0.08)
  9. AdaBoost_model = AdaBoostRegressor(n_estimators=100, learning_rate=0.7, loss="exponential" )
  10. MLP_model = MLPRegressor(max_iter=300, solver='lbfgs', activation='relu', alpha=0.000005)
  11. xgb_model = XGBRegressor(n_estimators=1000,max_depth=3,learning_rate=0.05)
  12. Regressors = [Huber_model,ElNet_model, AdaBoost_model, MLP_model]
  13. RegNames = ["Huber","ElasticNet","AdaBoost","MLP"]
  14. print("*** STARTING REGRESSION ON MULTIPLE MODELS ***\n" )       
  15. MultipleRegressors(Regressors,RegNames, X_train,y_train, X_test, data, features)  #Fit les modèles et donne le Xval score
  16. print("*** \o/ FINISHED \o/ ***" )


Message édité par Bébé Yoda le 23-07-2017 à 10:30:53
n°5002211
Bébé Yoda
Posté le 23-07-2017 à 10:32:26  profilanswer
 

Sinon, est-ce que certains d'entre vous s'amusent sur des compétitions Kaggle ?
 
J'aimerais bien rejoindre ou monter une équipe. Le but serait pas de tenter la gagne mais plutôt de s'entraîner et progresser, apprendre à travailler en équipe etc...
 
Vous seriez tentés ?

n°5002215
dede_sav
Posté le 23-07-2017 à 10:58:08  profilanswer
 

Ca pourrait être sympa :)

n°5002277
Bébé Yoda
Posté le 23-07-2017 à 20:07:55  profilanswer
 

dede_sav a écrit :

Ca pourrait être sympa :)


 
Bon on est déjà 2 c'est un bon début.
Il nous faut un "chef de projet", pour orienter tout ça. Perso j'ai du temps libre et de l'envie pour m'y consacrer, mais je vais manquer de compétences pour coordonner et avoir de bonnes idées ;)

n°5002452
alpachinoi​s
Posté le 24-07-2017 à 20:03:05  profilanswer
 


Tu vas te mettre à ça toi aussi ? :o

mood
Publicité
Posté le 24-07-2017 à 20:03:05  profilanswer
 

n°5002455
Bébé Yoda
Posté le 24-07-2017 à 20:11:14  profilanswer
 

Allez venez rejoindre notre super team kaggle

n°5002456
Rontgen
Posté le 24-07-2017 à 20:50:40  profilanswer
 

Depuis que je fais du ML au boulot, je dois avouer que j'ai moins la motivation de faire des challenges Kaggle le soir :o

n°5002494
Bébé Yoda
Posté le 24-07-2017 à 23:43:27  profilanswer
 

Rontgen a écrit :

Depuis que je fais du ML au boulot, je dois avouer que j'ai moins la motivation de faire des challenges Kaggle le soir :o

 

Oui je comprends, ça donne pas envie de continuer le boulot :D

n°5002508
Tidom
Posté le 25-07-2017 à 07:57:07  profilanswer
 

J'avoue que c'est alléchant de participer à une HFR-team sur kaggle. Mais je suis dépassé en ce moment dans mon planning de travail.
 
Vous nous tenez au courant de vos avancées et des challenges auxquels vous participez ?

n°5002510
Bébé Yoda
Posté le 25-07-2017 à 08:08:27  profilanswer
 

J'ai repéré la compétition sur les taxis qui est sympa.
https://www.kaggle.com/c/nyc-taxi-trip-duration

 

En gros il faut prédire les temps de trajets pour les taxis à New-York.
Le prix est faible, le but est d'encourager le travail participatif, de publier des kernels et tutos.

 

Le problème, c'est qu'il faut gérer les coordonnées, j'ai jamais fait ça. Ça me plairait bien mais je pars de zéro. Je sais pas par où prendre le problème

n°5002540
Tidom
Posté le 25-07-2017 à 10:10:10  profilanswer
 

Celui là est chaud
Comme on a droit à des donnes externes, clairement des données utiles au probleme seraient la carte des rues de News York. Il faudrait la transformer en graphe orienté et associer des temps de trajets moyens aux arêtes par exemple (les noeuds du graphe étant les intersections)
Pour les coordonnées géographiques de départ et d'arrivée, il faut réussir à les associer à des noeuds du graphe ...
 
Apres ça on peut commencer à réfléchir ...

n°5002613
blixow
Posté le 25-07-2017 à 15:52:17  profilanswer
 

C'est vrai qu'Octave est souvent utilisé pour des prototypes d'algo de ML ?
 
J'ai commencé le mooc de ml de stanford et le prof dit ça :o

n°5002615
Rontgen
Posté le 25-07-2017 à 16:03:00  profilanswer
 

Non, en ML c'est Python avant tout

n°5002622
Bébé Yoda
Posté le 25-07-2017 à 16:45:48  profilanswer
 

J'écume pas mal d'offres d'emploi en ce moment, j'ai passé des entretiens, c'est la première fois que j'entends parler d'octave (pour du ML).

n°5002627
dr_zaius
Simius Mathematicus
Posté le 25-07-2017 à 16:59:17  profilanswer
 

blixow a écrit :

C'est vrai qu'Octave est souvent utilisé pour des prototypes d'algo de ML ?
 
J'ai commencé le mooc de ml de stanford et le prof dit ça :o


 
C'est le mooc d'Andrew Ng ? Je pense que c'est vue académique et pas vue industrie donc possible que le prototypage d'un algo maths soit fait en matlab (Octave étant un matlab gratuit) pour lui.  
Un prof en traitement d'images me disait qu'il commençait avec matlab et pas python pour construire des algos (j'étais sur un projet de reconnaissance d'images avec lui pourtant).  
 
Après en entreprise j'imagine que c'est juste Python, jamais vu d'offre non plus avec matlab hors ingé/méca/méthodes_num.


---------------
« Nous sommes tous des farceurs : nous survivons à nos problèmes.» Cioran
n°5002644
Darmstadti​um
Pipoteur grotesque
Posté le 25-07-2017 à 18:34:40  profilanswer
 

Matlab est très utilisé dans l'académique pour le ML et aussi par certaines grosses boites. Octave est une implémentation libre du langage de Matlab qui est presque entièrement compatible (mais pas à 100%).


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°5002645
Bébé Yoda
Posté le 25-07-2017 à 18:42:25  profilanswer
 

C'est d'ailleurs cette "presque" compatibilité qui est problématique.
Dans mon ancienne boîte, pour faire des économies on nous avait forcé à utiliser Octave.
Après plusieurs semaines de perdues et des bugs en cascade on a pu reprendre des licences MATLAB :)

 

Enfin perso, je m'étais mis à python et j'utilisais plus du tout MATLAB

 


Mais c'était pas du ML.

n°5002663
Darmstadti​um
Pipoteur grotesque
Posté le 25-07-2017 à 19:41:00  profilanswer
 

Bébé Yoda a écrit :

C'est d'ailleurs cette "presque" compatibilité qui est problématique.


Non mais clairement c'est la zermi frer [:yuri orlov]


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°5002679
Rasthor
Posté le 25-07-2017 à 20:46:05  profilanswer
 

Je confirme, dans ma boite, c'est les classiques Java + Python.

n°5002683
Rontgen
Posté le 25-07-2017 à 21:01:38  profilanswer
 

Rasthor a écrit :

Je confirme, dans ma boite, c'est les classiques Java + Python.


Java [:frogaski62:5]

 

Sinon, même dans l'académique, MATLAB est en train d'être abandonné pour Python dans les labos que je connais
Vu la quantité de librairies open source et la gratuité, y'a pas photo

Message cité 2 fois
Message édité par Rontgen le 25-07-2017 à 21:01:50
n°5002687
Darmstadti​um
Pipoteur grotesque
Posté le 25-07-2017 à 21:23:50  profilanswer
 

Ouep, mais Matlab est encore bien installé et ça facilite pas mal la vie de coder ton truc en matlab quand tu veux le comparer à d'autres trucs dont les auteurs fournissent du code... matlab :o


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°5002716
Rasthor
Posté le 25-07-2017 à 23:44:53  profilanswer
 


Moi je ne touche pas a ca, mais des qu'il s'agit de coder des trucs lourds, c'est plus optimal que Python apparement.

n°5002729
Bébé Yoda
Posté le 26-07-2017 à 00:37:15  profilanswer
 

Rasthor a écrit :


Moi je ne touche pas a ca, mais des qu'il s'agit de coder des trucs lourds, c'est plus optimal que Python apparement.


 
J'ai vu pas mal d'annonces où java est requis, du coup je m'y suis mis ... Ca me rappelle C#, c'est pas fabuleux mais ça passe je trouve

n°5002734
Darmstadti​um
Pipoteur grotesque
Posté le 26-07-2017 à 01:11:01  profilanswer
 

Perso je suis pas fan de Python pour les gros systèmes, je préfère un langage statiquement typé pour ça :o


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°5002739
Millsap
Posté le 26-07-2017 à 04:21:51  profilanswer
 

Perso pour les gros trucs a optimiser, je passe du Python au Scala.
Pas mon langage préféré, mais il faut reconnaître que ca fait le taf :)

n°5002744
Rontgen
Posté le 26-07-2017 à 07:11:59  profilanswer
 

Dans ma boite on fait un logiciel en C++ donc le Python c'est vraiment que pour des tests très préliminaires, ou pour des fonctionnalités qui sont pas encore implémentées dans notre soft :o

n°5002763
o_BlastaaM​oof_o
Posté le 26-07-2017 à 10:08:10  profilanswer
 

Rontgen a écrit :


Java [:frogaski62:5]  
 
Sinon, même dans l'académique, MATLAB est en train d'être abandonné pour Python dans les labos que je connais
Vu la quantité de librairies open source et la gratuité, y'a pas photo


C'est vrai en France, beaucoup moins à l'étranger.

Rasthor a écrit :


Moi je ne touche pas a ca, mais des qu'il s'agit de coder des trucs lourds, c'est plus optimal que Python apparement.


Plus optimal, ça ne veut rien dire... Plus optimal de quel point de vue ? Pour ma part, en-dehors du côté multi-plateforme, je ne vois aucun avantage à Java. Le langage est lourd, la syntaxe pénible, les performances plus que moyennes...

n°5002900
blixow
Posté le 27-07-2017 à 07:54:09  profilanswer
 

Ok dommage
 
Ouai c'est le cours d'andrew ng

n°5003364
blixow
Posté le 29-07-2017 à 10:45:57  profilanswer
 

Vous conseilleriez quoi comme mooc de ml pour quelqu'un qui n'en a jamais fait ?
 
Ca me fait un peu chier de suivre un mooc qui utilise un langage pas du tout utilisé :o

n°5003365
Bébé Yoda
Posté le 29-07-2017 à 10:51:39  profilanswer
 

Perso je te conseillerais de suivre quand même celui d'Andrew Ng mais sans forcément faire les exercices, uniquement parce qu'il est complet.
 
Pour te faire la main je te conseille ce cours : https://www.coursera.org/specializa [...] e-learning
 
Tu as 4 cours assez complets et vraiment bien faits. Les notions sont bien expliquées, et tu vas pouvoir coder toi même certains algorithmes pour bien comprendre comment ils fonctionnent (par exemple ton propre LASSO ou ton propre kNN). Les slides sont clairs, les orateurs parlent clairement et c'est bien rythmé. Honnêtement j'ai beaucoup appris avec ces cours, j'y ai passé 3 mois pour tout faire sérieusement et j'ai pu me débrouiller tout seul avec ce que j'ai appris sur mes premières compétitions kaggle.

n°5003367
Darmstadti​um
Pipoteur grotesque
Posté le 29-07-2017 à 11:27:39  profilanswer
 

En ML comme ailleurs faut pas se focaliser sur le langage, on s'en fout pas mal.
 
Les lib d'algèbre linéaire s'utilisent de manière semblable, t'auras pas de mal à adapter les exemples de code Matlab en Numpy si tu veux, c'est même un bon exercice imho.


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°5003371
unknown_pe​rson
Posté le 29-07-2017 à 12:24:23  profilanswer
 

Bébé Yoda a écrit :

Perso je te conseillerais de suivre quand même celui d'Andrew Ng mais sans forcément faire les exercices, uniquement parce qu'il est complet.
 

 

+1
Jai vraiment trouvé ce cours passionnant et complet et facile à suivre, même sans background mathématiques (enfin a part un bac S :o)
Après je serais d'avis de faire les exercices, plus parce que je pense qu'on assimilé mieux avec ça, et que ça aide pas mal à raisonner en calcul matricielle (j'ai eu un peu de mal avec ça au début :D)

n°5003380
Rontgen
Posté le 29-07-2017 à 14:02:19  profilanswer
 

Ouais ben il est pas mal comme introduction le cours de Ng, mais bon, faut le regarder en vitesse x2 sinon on s'ennuie avec sa voix je trouve :o

n°5003914
Theomede
Flingué mais pas trop
Posté le 02-08-2017 à 18:38:17  profilanswer
 

Bonjour :o  
 
J'me permet de venir solliciter vos lumières, vu que je sais pas trop où poser ma question, pour une question formation / bagage nécessaire.  
 
J'ai une formation en informatique / maths financières, et je fais actuellement du reporting dans une banque, or je fais des stats de bas niveau et de la manipulation de bdd.
 
J'voudrais me diriger vers le domaine de la data science, parce que j'ai l'impression qu'il y a un gros manque de ces compétences dans les entreprises, et pour avoir pas mal bossé cette année avec Palantir, ça avait l'air cool ce qu'ils faisaient :o
 
Donc afin d'acquérir proprement les bases théoriques, je voudrais faire une formation, mais le choix a l'air relativement limité en France.
Après quelques recherches, je suis tombé sur cette formation du CNAM : http://formation.cnam.fr/recherche [...] 69531.kjsp
 
Qu'en pensez-vous ? Le projet vous semble cohérent ? Faire cette formation vous semble utile ?


---------------
Je suis quelqu'un de modéré, mais c'est rarement volontaire.
n°5003921
o_BlastaaM​oof_o
Posté le 02-08-2017 à 18:52:07  profilanswer
 

Je pense qu'il serait plus efficace de tenter une mobilité interne vers un poste de data scientist. Toutes les banques recrutent en ce moment, il y a même probablement une équipe dédiée dans la tienne.

n°5003922
Bébé Yoda
Posté le 02-08-2017 à 18:55:34  profilanswer
 

Salut,

 

On dirait que tu as déjà un bon bagage technique, pas mal d'expérience et un cerveau qui fonctionne bien (je t'ai vu sur d'autres topics ;)).
J'ai l'impression qu'en gros il te manque le côté machine/deep learning ?
Je ne suis pas (encore) dans le domaine mais j'ai passé pas mal d'entretiens. Ce que j'ai vu dans toutes les boîtes c'est des difficultés à recruter des gens compétents. Ils ont beaucoup de candidatures de jeunes sortis d'école mais il leur manque des gens plus expérimentés qui peuvent avoir une vision métier/business (en gros savoir interpréter les données).
Quand je vois comment se passent mes entretiens je pense que tu collerais pas mal aux besoins.
Tout dépend ce que tu veux faire. Si tu vise un poste très technique (plutôt R&D disons) ça peut être un peu compliqué puisqu'ils cherchent souvent des gens avec des doctorats dans le domaine.
Pour tout le reste je pense que tu pourrais apprendre suffisamment vite tout seul pour ne pas avoir à faire de formation trop longue.
J'ai pas l'impression que le truc du CNAM est très adapté pour toi. Je te verrais bien capable d'apprendre les bases en 2/3 mois, assez pour gagner un poste en tout cas puis finir de te former sur place.
Il y a des gens ici qui connaissent le truc de l'intérieur et auront une autre vision ;)

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  12  13  14  ..  128  129  130  131  132  133

Aller à :
Ajouter une réponse
 

Sujets relatifs
Recherche d'emploi[Topik Unique] Les girls de la section E&E
Avez vous des problèmatiques sur le Big Data ?Master Finance et Stratégie de Science Po après des études de droit ?
Je veux travailler dans les Big DATAOrientation pour Data Science & Recherche Opérationnelle
[Topic Unique] Concours ingénieur ENAC/IESSA : 30 postes [Topic Unique] EIVP
[Topic Unique] L'Aylite !!! 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR