Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1581 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  39  40  41  ..  128  129  130  131  132  133
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°5060976
Rontgen
Posté le 26-06-2018 à 18:30:28  profilanswer
 

Reprise du message précédent :
Ca a vraiment amelioré les résultats de faire de la reduction de dim sur des images, par rapport a un reseau de neurones direct ?

mood
Publicité
Posté le 26-06-2018 à 18:30:28  profilanswer
 

n°5060981
dede_sav
Posté le 26-06-2018 à 19:08:15  profilanswer
 

Je suis preneur du papier :p

n°5060989
Darmstadti​um
Pipoteur grotesque
Posté le 26-06-2018 à 21:36:38  profilanswer
 


Effectivement tu vois mal :o

 

Là où je suis actuellement en stage (recherche quantitative axée machine learning dans une banque top 3 à Londres pour rester un poil vague) il y a plusieurs stagiaires du MVA et ceux avec une expérience en finance préalable sont plus l'exception que la règle :o

 

Je suis moi même doctorant en machine learning sans expérience des produits financiers (et j'étais pris au MVA [:ocolor]).

 

Donc clairement les profils ML et stats computationnelles intéressent de plus en plus les banques, et je pense qu'actuellement il y a même au moins autant à faire de ce côté là que côté sto/edp :jap:


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°5061038
Alicanto
アリカント
Posté le 27-06-2018 à 10:20:11  profilanswer
 

Salut, je dois résoudre un problème de régression assez particulier, et je peine à trouver des infos (en fait je sais même pas comment appeler ce type de problème :o).

 

Chaque échantillon de mes données comporte :
- X : des données climatiques (températures et précipitation quotidiennes sur une année). Ce sont donc des séries temporelles.
- Y : une date de floraison d'un certain type de plante qui aurait poussé dans ces conditions climatiques.

 

J'aimerais créer un modèle pour prédire Y en utilisant X. Avez-vous des idées ?


Message édité par Alicanto le 27-06-2018 à 10:20:48
n°5061039
o_BlastaaM​oof_o
Posté le 27-06-2018 à 10:26:57  profilanswer
 


Encore un intitulé qui ne veut rien dire :o

n°5061040
Rontgen
Posté le 27-06-2018 à 10:30:15  profilanswer
 

Vu ton avatar, tu veux prédire la date du hanami ? :D
 
Ca me parait etre un problème de régression assez classique.
Ma première approche serait de transformer la date Y en un nombre [0;1] ou 0 est le 1e janvier et 1 est le 31 décembre, ou plutot 0 pour la date minimum dans ton ensemble de données et 1 pour la date la plus tardive.
Concernant X, si tu as peu de données, tu peux essayer d'extraire des features qui ont du sens; sinon tu te fais pas chier et tu utilises un réseau de neurones :o

n°5061044
Alicanto
アリカント
Posté le 27-06-2018 à 10:48:03  profilanswer
 

Rontgen a écrit :

Vu ton avatar, tu veux prédire la date du hanami ? :D
 
Ca me parait etre un problème de régression assez classique.
Ma première approche serait de transformer la date Y en un nombre [0;1] ou 0 est le 1e janvier et 1 est le 31 décembre, ou plutot 0 pour la date minimum dans ton ensemble de données et 1 pour la date la plus tardive.
Concernant X, si tu as peu de données, tu peux essayer d'extraire des features qui ont du sens; sinon tu te fais pas chier et tu utilises un réseau de neurones :o


C'est principalement pour prédire le cycle de croissance du riz, c'est moins glamour... :o
 
Désolé, mon message était trop court, je n'ai pas expliqué la situation suffisamment...
Pour Y, j'avais pensé à ça, effectivement.
Pour X, j'avais pensé à calculer les moyennes mensuelles etc... Mais il semblerait que la tendance, l'ordre de succession des valeurs est aussi assez importante, et on perd cette information en moyennant. Un réseau de neurone complexe (une entrée par jour) pourrait faire l'affaire j'imagine ?

Message cité 2 fois
Message édité par Alicanto le 27-06-2018 à 10:50:58
n°5061048
o_BlastaaM​oof_o
Posté le 27-06-2018 à 10:55:25  profilanswer
 

Alicanto a écrit :


C'est principalement pour prédire le cycle de croissance du riz, c'est moins glamour... :o

 

Désolé, mon message était trop court, je n'ai pas expliqué la situation suffisamment...
Pour Y, j'avais pensé à ça, effectivement.
Pour X, j'avais pensé à calculer les moyennes mensuelles etc... Mais il semblerait que la tendance, l'ordre de succession des valeurs est aussi assez importante, et on perd cette information en moyennant. Un réseau de neurone complexe (une entrée par jour) pourrait faire l'affaire j'imagine ?


Toujours commencer par une bonne grosse étape de visualisation. Cela t'aidera à définir des estimateurs discriminants.

 

edit :

 

Pour illustrer l'intérêt de la visualisation, je te propose de jeter un oeil au webinar suivant : https://fr.mathworks.com/videos/mac [...] 00694.html
L'exemple 1 (à partir de 10:00) est simpliste mais intéressant et généralisable à d'autres problèmes. D'ailleurs il traite également de séries temporelles.


Message édité par o_BlastaaMoof_o le 27-06-2018 à 10:59:06
n°5061407
uuuugh
Posté le 29-06-2018 à 16:30:10  profilanswer
 

Alicanto a écrit :


C'est principalement pour prédire le cycle de croissance du riz, c'est moins glamour... :o
 
Désolé, mon message était trop court, je n'ai pas expliqué la situation suffisamment...
Pour Y, j'avais pensé à ça, effectivement.
Pour X, j'avais pensé à calculer les moyennes mensuelles etc... Mais il semblerait que la tendance, l'ordre de succession des valeurs est aussi assez importante, et on perd cette information en moyennant. Un réseau de neurone complexe (une entrée par jour) pourrait faire l'affaire j'imagine ?


si t'essayes les reseaux de neurones, tu peux aussi essayer un CNN pour exploiter la dependence temporelle de tes données au lieu d'y aller en mode bourrin 1 entrée = 1 jour et dense layers


Message édité par uuuugh le 29-06-2018 à 16:32:43
n°5061635
Profil sup​primé
Posté le 03-07-2018 à 03:32:20  answer
 

Le contenu de ce message a été effacé par son auteur

mood
Publicité
Posté le 03-07-2018 à 03:32:20  profilanswer
 

n°5061639
Rontgen
Posté le 03-07-2018 à 07:18:59  profilanswer
 

Sur ta fenêtre glissante (prends plus que 3 points), tu calcules non seulement la moyenne mais aussi l'écart type.
Si il y a une valeur qui est au delà d'un intervalle genre [-3 sigma; 3 sigma] c'est probablement une mesure à dégager
Enfin je dis 3 mais faut ajuster


Message édité par Rontgen le 03-07-2018 à 07:20:28
n°5061640
mystiko
Posté le 03-07-2018 à 07:20:03  profilanswer
 

Hello

 

Certains ont déjà tenté la freelance ?
On a pris un freelance devops chez nous, quand je vois le tarif ça me titille :o
Comment ça se passe en général ? On te file un set de donné avec un objectif et tu as n jours pour sortir quelque chose ? C'est des missions chez le client ou à domicile ?

 

3 ans d'analyse de données avec beaucoup de R et un peu de python/spark c'est light ?

n°5061642
korial
Posté le 03-07-2018 à 08:06:42  profilanswer
 

J’y songe pour plus tard, mais pour l’instant je trouve que je ne suis pas prêt, notamment niveau réseau et soft skills :o
 
Si je le fais je pense que j’essaierais dans un premier temps sur mon temps libre pour voir de quoi je suis capable, me faire la main, peut être mettre en place des process.  
 
Pour l’instant je suis plus à l’aise avec un salaire qui tombe tous les mois :)

n°5061644
Tidom
Posté le 03-07-2018 à 08:14:27  profilanswer
 

J'y réfléchis aussi ... mais je suis toujours en réflexion :o
Si y a des retours d'expérience, je suis preneur :)

n°5061647
Rasthor
Posté le 03-07-2018 à 08:22:29  profilanswer
 


Prend la median. :)

n°5061670
Rontgen
Posté le 03-07-2018 à 09:53:57  profilanswer
 

Rasthor a écrit :


Prend la median. :)


C'est une idée encore meilleure :jap:

n°5061671
Rontgen
Posté le 03-07-2018 à 09:56:26  profilanswer
 

korial a écrit :

J’y songe pour plus tard, mais pour l’instant je trouve que je ne suis pas prêt, notamment niveau réseau et soft skills :o
 
Si je le fais je pense que j’essaierais dans un premier temps sur mon temps libre pour voir de quoi je suis capable, me faire la main, peut être mettre en place des process.  
 
Pour l’instant je suis plus à l’aise avec un salaire qui tombe tous les mois :)


Tu peux essayer de trouver une solution intermédiaire, par exemple rejoindre un cabinet d'expertise ou de conseil dans ce domaine particulier
Ca te permet de gagner beaucoup d'expérience, potentiellement du réseau et d'avoir un salaire un peu plus élevé (même si pas au niveau d'un freelance) en ayant un job un peu plus secure

n°5061679
o_BlastaaM​oof_o
Posté le 03-07-2018 à 10:44:43  profilanswer
 

mystiko a écrit :

Hello
 
Certains ont déjà tenté la freelance ?
On a pris un freelance devops chez nous, quand je vois le tarif ça me titille :o
Comment ça se passe en général ? On te file un set de donné avec un objectif et tu as n jours pour sortir quelque chose ? C'est des missions chez le client ou à domicile ?
 
3 ans d'analyse de données avec beaucoup de R et un peu de python/spark c'est light ?


Franchement, vu l'offre pléthorique au travers de SSII (spécialisées ou non), je suis sceptique sur le business model.

n°5061680
Rontgen
Posté le 03-07-2018 à 10:47:18  profilanswer
 

Ouais enfin on parle pas du même genre de profil que la majorité des ingénieurs de SSII

n°5061688
Tidom
Posté le 03-07-2018 à 11:29:14  profilanswer
 

o_BlastaaMoof_o a écrit :


Franchement, vu l'offre pléthorique au travers de SSII (spécialisées ou non), je suis sceptique sur le business model.


 
 
C'est un peu bizarre ta remarque : pour les autres domaines des SSII (dev, BD, ...), y a aussi des freelance/indépendants qui ont fait leurs armes en SSII avant de se lancer non ?

n°5061690
Profil sup​primé
Posté le 03-07-2018 à 11:36:28  answer
 

Le contenu de ce message a été effacé par son auteur

n°5061729
o_BlastaaM​oof_o
Posté le 03-07-2018 à 14:30:54  profilanswer
 

Tidom a écrit :


 
 
C'est un peu bizarre ta remarque : pour les autres domaines des SSII (dev, BD, ...), y a aussi des freelance/indépendants qui ont fait leurs armes en SSII avant de se lancer non ?


Pour les autres domaines, la demande est sans commune mesure.

n°5061748
alpachinoi​s
Posté le 03-07-2018 à 16:13:13  profilanswer
 

Que pensez-vous de ce master en cours du soir. Bonne alternative ou pas par rapport aux MOOC ou CNAM :??:
 
Est-ce pertinent si on a déjà un DUT STID + M2 MIAGE :??:
 
http://offreformation.univ-lyon2.f [...] 997_fr.pdf


Message édité par alpachinois le 03-07-2018 à 16:20:13
n°5061783
Rasthor
Posté le 03-07-2018 à 21:31:09  profilanswer
 

Rontgen a écrit :


C'est une idée encore meilleure :jap:

 


:D

 

Ca a un terme precis: median absolute deviation (MAD)

 

https://en.wikipedia.org/wiki/Median_absolute_deviation

 

http://eurekastatistics.com/using- [...] -outliers/

 

Message cité 1 fois
Message édité par Rasthor le 03-07-2018 à 21:34:37
n°5061788
Bébé Yoda
Posté le 03-07-2018 à 23:22:18  profilanswer
 

 

Alors c'est marrant parce que je suis sur un problème similaire et j'ai pris une moyenne +3 sigma.
Je voulais tenter avec la médiane mais en Spark c'est assez lourd à calculer donc je vais devoir rester sur la moyenne pour pas trop charger la mémoire.

 

Faudrait que je poste un graphe pour illustrer. J'ai des valeurs tout le temps comprises entre 0 et 5 en gros, et puis au bout d'un moment j'en ai une au dessus, puis une deuxième et de plus en plus.
L'idée est de compter ces pics et de déterminer à partir de combien de pics je dois lever une alerte pour une maintenance.
Pour l'instant c'est assez basique : je compte un point dès qu'il est au dessus de 3 sigma, puis je fais la somme de ces points sur une fenêtre et des que j'en ai plus qu'un nombre défini alors c'est une alerte.
Sauf que cette limite est définie arbitrairement et je me demande s'il y a une meilleure méthode pour ça.

 

Sinon pour détecter les pics j'ai aussi tenté un arima mais ça me semble bien lourd pour pas grand chose.

 


Question subsidiaire : je ne suis pas sûr que ma distribution de points est normale (plutôt log normale je dirais). Est-ce qu'une approche 3 sigma est toujours valable ? Il me semblait que la normalité de la distribution était une hypothèse

n°5061799
korial
Posté le 04-07-2018 à 08:24:12  profilanswer
 

Rontgen a écrit :


Tu peux essayer de trouver une solution intermédiaire, par exemple rejoindre un cabinet d'expertise ou de conseil dans ce domaine particulier
Ca te permet de gagner beaucoup d'expérience, potentiellement du réseau et d'avoir un salaire un peu plus élevé (même si pas au niveau d'un freelance) en ayant un job un peu plus secure


Oui c’est vrai ce serait un bon moyen de transition. C’est marrant car quand je lis cabinet de conseil je me rends compte que ça ne me fait pas du tout envie pour l’instant, je préfère travailler sur un produit.  
Mais bon ça peut s’essayer pour voir.

Bébé Yoda a écrit :


 
Alors c'est marrant parce que je suis sur un problème similaire et j'ai pris une moyenne +3 sigma.
Je voulais tenter avec la médiane mais en Spark c'est assez lourd à calculer donc je vais devoir rester sur la moyenne pour pas trop charger la mémoire.
 
Faudrait que je poste un graphe pour illustrer. J'ai des valeurs tout le temps comprises entre 0 et 5 en gros, et puis au bout d'un moment j'en ai une au dessus, puis une deuxième et de plus en plus.
L'idée est de compter ces pics et de déterminer à partir de combien de pics je dois lever une alerte pour une maintenance.
Pour l'instant c'est assez basique : je compte un point dès qu'il est au dessus de 3 sigma, puis je fais la somme de ces points sur une fenêtre et des que j'en ai plus qu'un nombre défini alors c'est une alerte.
Sauf que cette limite est définie arbitrairement et je me demande s'il y a une meilleure méthode pour ça.
 
Sinon pour détecter les pics j'ai aussi tenté un arima mais ça me semble bien lourd pour pas grand chose.
 
 
Question subsidiaire : je ne suis pas sûr que ma distribution de points est normale (plutôt log normale je dirais). Est-ce qu'une approche 3 sigma est toujours valable ? Il me semblait que la normalité de la distribution était une hypothèse


Ce sera pas la première fois qu’une approche qui semble non valable mathématiquement fonctionne empiriquement :o
Cela dit si tu as des preuves que c’est log normal (peut être tu peux faire un test de distribution pour t’en convaincre), pourquoi ne pas calculer la moyenne et 3 sigma après exp() ?

n°5061801
Bébé Yoda
Posté le 04-07-2018 à 08:38:00  profilanswer
 

Je vais faire les tests pour vérifier le type de distribution, je tâtonne un peu mais j'avance :)
 
Après, oui, j'ai testé le truc sur plusieurs dizaines de cas et ça fonctionne bien (en gros je trouve les alertes au moment où le système les envoie, donc je peux les anticiper)
Mais comme au final je vais avoir beaucoup plus de cas à traiter je voudrais être "certain" que ça va être valable

n°5061824
o_BlastaaM​oof_o
Posté le 04-07-2018 à 11:34:01  profilanswer
 


De mon expérience, ni plus ni moins que dans les entreprises elles-mêmes...

n°5061860
Bébé Yoda
Posté le 04-07-2018 à 18:42:42  profilanswer
 


 
C'est partout pareil en fait :o
 
Et pourtant les boîtes fonctionnent quand même pas trop mal dans l'ensemble ;)

n°5061979
o_BlastaaM​oof_o
Posté le 05-07-2018 à 15:18:46  profilanswer
 


Mais stop tes poncifs là c'est pénible :sleep:

n°5061983
Bébé Yoda
Posté le 05-07-2018 à 15:38:11  profilanswer
 

Je parlais de toutes les boîtes dans tous les domaines en fait.
Je lis partout que tout le monde est mauvais et ne sait rien faire (je caricature un peu) et en pratique j'ai vu ça nulle part et on a plein de boîtes hyper compétitives

n°5061986
Alicanto
アリカント
Posté le 05-07-2018 à 15:56:48  profilanswer
 


Pourquoi un tirage complètement aléatoire ne convient il pas à la situation ?

n°5061988
Bébé Yoda
Posté le 05-07-2018 à 15:59:33  profilanswer
 

C'est 3 fois rien 500k lignes, pas besoin d'en enlever :o

n°5061991
-Meringue-
Posté le 05-07-2018 à 16:19:35  profilanswer
 

Avec pandas:  
 
df.groupby(‘Classe’).apply(pandas.DataFrame.sample, frac=0.03).reset_index(drop=True)
 
?

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  39  40  41  ..  128  129  130  131  132  133

Aller à :
Ajouter une réponse
 

Sujets relatifs
Recherche d'emploi[Topik Unique] Les girls de la section E&E
Avez vous des problèmatiques sur le Big Data ?Master Finance et Stratégie de Science Po après des études de droit ?
Je veux travailler dans les Big DATAOrientation pour Data Science & Recherche Opérationnelle
[Topic Unique] Concours ingénieur ENAC/IESSA : 30 postes [Topic Unique] EIVP
[Topic Unique] L'Aylite !!! 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR