Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2489 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  26  27  28  ..  133  134  135  136  137  138
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°31025
Rontgen
Posté le 24-01-2018 à 19:06:20  profilanswer
 

Reprise du message précédent :
Tu es dans le cas d'une régression, mais pas forcément linéaire, c'est toi qui décide du modèle
Mais bon, effectivement avec seulement 10 échantillons, c'est probablement le meilleur choix

 

Ce que tu proposes a du sens mais est un peu manuel alors que tu peux directement estimer ce genre de choses lors du fitting du modèle

 

Si tu entraines un modèle linéaire avec des variables non corrélées avec ta valeur cible, normalement elles auront naturellement un coefficient nul (enfin peut être pas avec 10 échantillons)
Tu peux régulariser aussi explicitement en pénalisant la norme L2 des coeffs, ça s'appelle la ridge regression
Tu peux aussi pénaliser une norme plus robuste que la L2 (cherche Lasso regression), qui va avoir tendance à annuler les petits coeffs (donc à éliminer completement les variables pas très importantes)

 

Ah oui et sinon, 10k mesures par échantillon c'est beaucoup
Tu peux aussi peut être utiliser une technique de réduction de dimensions genre PCA pour visualiser tes 10 échantillons dans une base adaptée

 

Je ne sais pas quel langage tu utilises mais toutes ces méthodes sont en général disponibles facilement


Message édité par Rontgen le 24-01-2018 à 19:10:38
n°31026
Rasthor
Posté le 24-01-2018 à 19:37:21  profilanswer
 

Merci! Je suis en python (donc scikit-learn. ;) ).

n°31027
Profil sup​primé
Posté le 24-01-2018 à 22:29:33  answer
 

10k variables pour 10 échantillons peut importe la méthode ou modèle je ne vois pas comment tu peux obtenir un résultat intéressant et valide d'un point de vue statistique

n°31028
Rontgen
Posté le 24-01-2018 à 22:38:58  profilanswer
 

Bah il se peut tout à fait que des variables correlent fortement avec la valeur cible
Mais c'est vrai que vu la taille de l'échantillon, la confiance en ce modèle sera probablement assez limitée

 

Faudra l'évaluer avec un leave one out sur les 10 échantillons pour voir si d'une part le modèle stable et d'autre part vérifier que ça overfit pas

n°31029
Darmstadti​um
Pipoteur grotesque
Posté le 24-01-2018 à 22:46:09  profilanswer
 

Ça peut suffire si les données sont par nature de rang très faible (idéalement au plus 10 pour que le système soit au pire sur-déterminé) et qu'une bonne technique de réduction de dimensionalité est appliquée. Il peut aussi faire de la sélection de features mais avec 10 points ça sera pas fameux je pense.


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°31030
blacksad
Posté le 25-01-2018 à 09:21:09  profilanswer
 

Rontgen a écrit :

Perso je suis plutot d'accord avec la solution B
Si tu utilises la solution A, tu auras deux valeurs différentes pour 11:00, ca peut introduire des confusions
 
Mais bon, c'est juste une convention donc c'est pas tres important :o


Vu que j'ai plus d'une valeur par seconde, j'aurais aussi deux valeurs différentes pour 11h30 si je prends la B. Ou alors j'ai pas compris ce que tu as dit [:aelenia]  
Et la convention ce n'est pas très important, sauf si tu es le seul à ne pas utiliser la même que les autres :o Parce que si je dois dans le futur croiser mes données avec d'autres sources qui utilisent une autre convention, va falloir que je fasse un convertisseur... C'est pas la mort mais bon...

n°31031
Rontgen
Posté le 25-01-2018 à 09:36:58  profilanswer
 

blacksad a écrit :


Vu que j'ai plus d'une valeur par seconde, j'aurais aussi deux valeurs différentes pour 11h30 si je prends la B. Ou alors j'ai pas compris ce que tu as dit [:aelenia]  
Et la convention ce n'est pas très important, sauf si tu es le seul à ne pas utiliser la même que les autres :o Parce que si je dois dans le futur croiser mes données avec d'autres sources qui utilisent une autre convention, va falloir que je fasse un convertisseur... C'est pas la mort mais bon...


Ah oui, tu as raison  [:ddr555]  
Bah disons que c'est plus satisfaisant d'avoir une valeur centrée plutot que décalée
Par contre si ca va a l'encontre des autres conventions, je suis d'accord qu'il vaut mieux plutot suivre la majorité :jap:

n°31032
o_BlastaaM​oof_o
Posté le 25-01-2018 à 10:55:49  profilanswer
 

Plix a écrit :

Affreux ce code  d'"anonymisation"  :sweat:  :sweat:
 
Il faudrait qu'il passe un peu de temps à parcourir l'api de pandas et numpy pour progresser...
 
Par curiosité c'est quel type de profil ?


Ecole d'ingénieur groupe B/C... en informatique :lol:

n°31033
TiDom
Posté le 31-01-2018 à 13:26:34  profilanswer
 

Pour ceux que ça intéresse : https://www.lip6.fr/colloquium/
"Une approche géométrique de l’apprentissage non supervisé", une conférence "world-class" de Léon Bottou au LIP6 à Jussieu ... pour les Parisiens donc  :o


Message édité par TiDom le 31-01-2018 à 13:27:35
n°31034
Bébé Yoda
Posté le 31-01-2018 à 13:44:17  profilanswer
 

Hello, j'ai trouvé un poste de Data analyst (plutôt que scientist en fait, c'est plutôt bien pour moi vu qu'il me manque quelques compétences assez poussées en math/stat/algos.
On bosse avec un labo de recherche qui fait la partie vraiment"fondamentale" du travail et on se concentre sur l'utilisation et l'analyse.
Ça parle de maintenance prédictive, c'est exactement ce que je voulais faire je suis hyper content :)
On a du Spark pour regarder des Times séries et on anticipe la maintenance.
Youpi  [:sebxoii]

 

J'ai plus qu'à passer la période d'essai maintenant  [:kabouk:3]

n°31035
TiDom
Posté le 31-01-2018 à 13:52:46  profilanswer
 

Bébé Yoda a écrit :

Hello, j'ai trouvé un poste de Data analyst (plutôt que scientist en fait, c'est plutôt bien pour moi vu qu'il me manque quelques compétences assez poussées en math/stat/algos.
On bosse avec un labo de recherche qui fait la partie vraiment"fondamentale" du travail et on se concentre sur l'utilisation et l'analyse.
Ça parle de maintenance prédictive, c'est exactement ce que je voulais faire je suis hyper content :)
On a du Spark pour regarder des Times séries et on anticipe la maintenance.  
Youpi  [:sebxoii]  
 
J'ai plus qu'à passer la période d'essai maintenant  [:kabouk:3]


 
 
Bravo  [:elwe calafalas]  
La maintenance prédictive c'est "trendy" : https://fr.linkedin.com/pulse/la-ma [...] us-thierry
 
Et courage :o

n°31036
Bébé Yoda
Posté le 31-01-2018 à 13:56:23  profilanswer
 

Woot je vais finir peut-être par avoir un vrai salaire HFR compliant  [:sebxoii]

 

C'est un domaine qui m'intéresse parce que j'ai beaucoup bossé dans l'industrie (la bonne vieille qui tâche, avec des usines vieilles de 100 ans) et j'avais vu pas mal d'axes d'amélioration

n°31037
Jadha
Next one's coming faster
Posté le 31-01-2018 à 14:26:25  profilanswer
 

Bébé Yoda a écrit :

Hello, j'ai trouvé un poste de Data analyst (plutôt que scientist en fait, c'est plutôt bien pour moi vu qu'il me manque quelques compétences assez poussées en math/stat/algos.
On bosse avec un labo de recherche qui fait la partie vraiment"fondamentale" du travail et on se concentre sur l'utilisation et l'analyse.
Ça parle de maintenance prédictive, c'est exactement ce que je voulais faire je suis hyper content :)
On a du Spark pour regarder des Times séries et on anticipe la maintenance.  
Youpi  [:sebxoii]  
 
J'ai plus qu'à passer la période d'essai maintenant  [:kabouk:3]


 
Félicitations !
 
Je suis intriguée de savoir quelles sont les compétences que tu estimes avoir besoin d'approfondir avant de devenir Data Scientist.

n°31038
Bébé Yoda
Posté le 31-01-2018 à 14:36:18  profilanswer
 

Je dirais que pour être un vrai data scientist faudrait que je comprennes plus en profondeur les algorithmes de machine/deep learning pour être capable d'en faire moi même, par exemple.
Là on est surtout utilisateurs des outils et on fait plus de développement pour la mise en production, enfin dans leur définition de analyst/scientist

n°31039
Jadha
Next one's coming faster
Posté le 31-01-2018 à 15:07:58  profilanswer
 

Bébé Yoda a écrit :

Je dirais que pour être un vrai data scientist faudrait que je comprennes plus en profondeur les algorithmes de machine/deep learning pour être capable d'en faire moi même, par exemple.
Là on est surtout utilisateurs des outils et on fait plus de développement pour la mise en production, enfin dans leur définition de analyst/scientist


 
Je vois. Merci de ta réponse.
Au final dans ce cas, cela veut dire que c'est presque indispensable de faire un master, non ?
Toutes les formations d'entreprises que j'ai vues restent vraiment en surface sur ce sujet.

n°31040
Bébé Yoda
Posté le 31-01-2018 à 15:14:58  profilanswer
 

Difficile de répondre, ça dépend de ton parcours et de ton expérience. En auto formation j'ai réussi à apprendre suffisamment, mais j'ai un doctorat en physique comme background ça aide (même si je suis une pipe en stats et probas :o ), j'aurais pu faire un truc plus "scientist" je pense, en complétant sur le tas.

 

Après, analyst ça me va mieux. J'ai fait 15 ans de R&D, donc être sur des sujets plus pratiques, aller voir les clients, etc ça me convient plus pour changer

n°31041
Profil sup​primé
Posté le 31-01-2018 à 16:31:04  answer
 

Félicitation zuf !

n°31042
Jadha
Next one's coming faster
Posté le 31-01-2018 à 17:13:54  profilanswer
 

Tiens, j'en profite pour partager mon cours préféré sur le machine learning : Learning from Data par Y. Abu Mostafa https://www.youtube.com/playlist?li [...] 4B7615313A.
 
Il y a une bonne partie de théorie, et je le trouve d'une pédagogie exceptionnel. Contrairement aux MOOCs traditionnels, les cours sont directement ceux de Caltech et durent plus d'une heure chacun.


Message édité par Jadha le 31-01-2018 à 17:14:26
n°31043
blacksad
Posté le 01-02-2018 à 08:20:31  profilanswer
 

Z'avez vu ?
Ya une chaire "Sciences des données" au collège de France : Leçon inaugurale - Stéphane Mallat
Et la suite des cours : https://www.college-de-france.fr/si [...] 7-2018.htm
J'ai pas regardé ; c'est sans doute un peu moins concret et appliqué que les MOOC.

n°31044
Rontgen
Posté le 01-02-2018 à 09:14:14  profilanswer
 

Mallat  [:cerveau love]  
Un des meilleurs profs que j'ai eus pendant ma scolarité, même si effectivement c'est probablement plutot du coté théorique  :jap:

n°31045
nesquik69
Posté le 05-02-2018 à 17:12:53  profilanswer
 

Petit question au topic:
 
en terme de package/conditions de travail/evolution, il y en t'il une vraie différence entre un "data scientist"( Machine learning , stats , etc etc...) et un " data engineer"( travail avec de grand volume de données, Spark Hadoop etc etc ...) ?
 
tout ca dans le domaine bancaire/assurance, et pour un JD....
 
merci  :bounce:


Message édité par nesquik69 le 05-02-2018 à 17:14:01
n°31046
o_BlastaaM​oof_o
Posté le 06-02-2018 à 09:57:53  profilanswer
 

Oui.

n°31047
Rontgen
Posté le 06-02-2018 à 10:11:31  profilanswer
 

Dans quel sens ?

n°31048
Profil sup​primé
Posté le 06-02-2018 à 10:32:25  answer
 

Dans le sens, qui fait le plus de fric (je suppose).

n°31049
o_BlastaaM​oof_o
Posté le 06-02-2018 à 10:35:10  profilanswer
 

Data scientist > Data engineer en termes de rémunération, clairement.

n°31050
Profil sup​primé
Posté le 06-02-2018 à 10:43:20  answer
 

Exact, l'ingénieur n'étant qu'un technicien ++, le véritable ouvrier du 21ème siècle. Bedonnant, une calvitie plus ou moins prononcée, une très faible réussite avec les femmes. Bref, tout en bas de l'échelle sociale. [:kolombin:4]
 
En revanche, le data scientist [:vouslsavezbfm:5]

n°31051
o_BlastaaM​oof_o
Posté le 06-02-2018 à 10:50:04  profilanswer
 

C'est surtout que le data scientist est plus visible.
 
Toutes les boîtes pensent avoir besoin de data scientists, très peu ont conscience d'avoir besoin de data engineers.

n°31052
Arnoldoo
Posté le 06-02-2018 à 11:25:15  profilanswer
 

o_BlastaaMoof_o a écrit :

C'est surtout que le data scientist est plus visible.

 

Toutes les boîtes pensent avoir besoin de data scientists, très peu ont conscience d'avoir besoin de data engineers.


+10

n°31053
ndingaman
Joga Bonito!
Posté le 06-02-2018 à 11:55:02  profilanswer
 

drapal
en mode discovery

n°31054
Profil sup​primé
Posté le 06-02-2018 à 22:50:47  answer
 

o_BlastaaMoof_o a écrit :

C'est surtout que le data scientist est plus visible.

 

Toutes les boîtes pensent avoir besoin de data scientists, très peu ont conscience d'avoir besoin de data engineers.


Yes perso un dat engineer experimenté et bon, qui n'est pas juste un data scientist wanabe, je pourrais payer très cher. De bon data scientist c'est bien plus facile a trouver.

n°31055
ShoTo
... fuck ... mother fucker ...
Posté le 11-02-2018 à 11:10:42  profilanswer
 

J'étais vendredi à une présentation (informelle) d'un master de physique à Jussieu et le prof parlait ouvertement du big data comme débouché possible pour les diplomés. Il disait que les physiciens étaient recherchés car aguéris à l'analyse de données (j'ai direct pensé à zuf) mais que l'aspect physique était aussi utile mais je n'ai pas bien compris pourquoi


---------------
The king stays the king. D'Angelo Barksdale
n°31056
Profil sup​primé
Posté le 11-02-2018 à 12:45:59  answer
 

Ca va faire un mois que j'essaie de me faire une config pour jouer avec du DL/Kaggle  la maison... les prix des GPUs sont complètement délirants. Je n'ai qu'une hâte, que le prix des cryptocurrencies tombe à 0 pour:
a) mettre fin au gaspillage énergétique de cette connerie que sont les XXX cryptos sur le marché. Que des pigeons se fassent plumer honnêtement ca m'en touche une sans bouger l'autre mais que ca impacte l'environnementsans rien produire de valeur ca me révolte.
b) mettre fin à cette inflation sur le prix des GPU type 1070/1080...

 

Vaiment frustrant, pas vraiment envie de claquer 1000 balles dans un GPU


Message édité par Profil supprimé le 11-02-2018 à 12:47:45
n°31057
-Meringue-
Posté le 11-02-2018 à 12:51:29  profilanswer
 

Messieurs  [:cetrio:1]  
 
Pour mon stage de fin d’études commençant dans un mois, je vais principalement bosser sur du NLP. Je suis donc à la recherche de papiers ou références littéraires sur le sujet afin de mieux appréhender la mission. Si vous avez ça sous le coude, je suis grandement preneur.  ;)

n°31058
Profil sup​primé
Posté le 11-02-2018 à 12:55:25  answer
 

ShoTo a écrit :

J'étais vendredi à une présentation (informelle) d'un master de physique à Jussieu et le prof parlait ouvertement du big data comme débouché possible pour les diplomés. Il disait que les physiciens étaient recherchés car aguéris à l'analyse de données (j'ai direct pensé à zuf) mais que l'aspect physique était aussi utile mais je n'ai pas bien compris pourquoi


La physique c'est maintenant beaucoup de calcul numérique et de simulation qui sont très proches niveau méthodes et language du machine learning.
De plus y'a un côté ''bidouille de potard'' dans le ml qui est très "physique". Par contre les physiciens codent mal :o

  


On vient de s'acheter une deuxième machine avec 4 titan Xp, je t'enverrai des photos :o

n°31059
rogermajax
Posté le 11-02-2018 à 13:58:11  profilanswer
 

Pour les "académiques", NVIDIA peut vous envoyer une Xp gratuitement.
 
A vue de nez, c'est pas très sélectif, ils m'en ont envoyé une alors que je fais de la recherche très appliquée utilisant du ML.
 
https://developer.nvidia.com/academic_gpu_seeding


Message édité par rogermajax le 11-02-2018 à 13:58:27
n°31060
Profil sup​primé
Posté le 11-02-2018 à 19:13:27  answer
 

 

Ça va on est équipé au boulot, c'est pour la maison!
A moins que "on" ne soient toi et ta moitié, auquel cas respect! [:tiwow:2]


Message édité par Profil supprimé le 11-02-2018 à 22:15:15
n°31061
wadle
Posté le 14-02-2018 à 12:22:02  profilanswer
 

Bonjour à tous,
 
(1er post sur le thread data  :jap: )
 
Je cherche à comprendre les différences entre Criteo et Rakuten Marketing (anciennement Nextperf) à Paris concernant des postes de Data Scientist / Data Analyst.
 
Je me doute que Criteo est bien plus gros. Mais laquelle des 2 boites a la plus forte croissance? Les ambiances et les rems sont-elles différentes?
 
 
Si certains ont des insights cela m'aiderait beaucoup.
 
 
See you
 :hello:


Message édité par wadle le 14-02-2018 à 16:01:56
n°31062
Profil sup​primé
Posté le 15-02-2018 à 11:16:24  answer
 

Salut tout le monde !  :hello:  
 
C'est officiel, je suis premier de ma promo en overall et en sciences, je serai donc (sauf catastrophe :o ) dans le master Data de l'X... ce qui implique de futures grosses PLS en maths  :D  
 
Quelqu'un aurait une ref de bouquin en algèbre ? J'aimerai bien un livre qui expose tous les fondamentaux pour les data sciences, avec beaucoup d'exos corrigés et pas trop trop théorique (l'objectif étant d'avoir des bases solides...) :jap:
 
(Ou bien un site web... )
 
Merci ! :jap:


Message édité par Profil supprimé le 15-02-2018 à 13:23:42
n°31063
Plix
Posté le 15-02-2018 à 11:23:20  profilanswer
 

 

Féloches  :jap:

 

En réponse à ta question: Matrix Algebra: Theory, Computations and Applications in Statistics, Springer


Message édité par Plix le 15-02-2018 à 11:24:14
n°31064
Bébé Yoda
Posté le 15-02-2018 à 11:52:45  profilanswer
 

 

GG t'as l'air d'avoir bien bossé pour gagner ta place !

n°31065
Profil sup​primé
Posté le 15-02-2018 à 13:28:30  answer
 

Merci à vous deux :jap:
 
Je regarde ton livre, il a l'air très complet mais les exos sont pas corrigés, c'est dommage...  :(  
 

 Page :   1  2  3  4  5  ..  26  27  28  ..  133  134  135  136  137  138

Aller à :
Ajouter une réponse
 

Sujets relatifs
[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires[Topic Unique] Claude by Anthropic
[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)