Forum | HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop

1581 connectés

FORUM HardWare.fr

Emploi & Etudes

Etudes / Orientation

[Topic Unique] Machine Learning & Data Science

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 .. 39 40 41 .. 128 129 130 131 132 133 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic Unique] Machine Learning & Data Science

n°5060976

Rontgen

Reprise du message précédent :
Ca a vraiment amelioré les résultats de faire de la reduction de dim sur des images, par rapport a un reseau de neurones direct ?

mood

Publicité

n°5060981

dede_sav

Je suis preneur du papier

n°5060989

Darmstadtium

Pipoteur grotesque

Effectivement tu vois mal

Là où je suis actuellement en stage (recherche quantitative axée machine learning dans une banque top 3 à Londres pour rester un poil vague) il y a plusieurs stagiaires du MVA et ceux avec une expérience en finance préalable sont plus l'exception que la règle

Je suis moi même doctorant en machine learning sans expérience des produits financiers (et j'étais pris au MVA [:ocolor] ).

Donc clairement les profils ML et stats computationnelles intéressent de plus en plus les banques, et je pense qu'actuellement il y a même au moins autant à faire de ce côté là que côté sto/edp :jap:

---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets

n°5061038

Alicanto

アリカント

Salut, je dois résoudre un problème de régression assez particulier, et je peine à trouver des infos (en fait je sais même pas comment appeler ce type de problème ).

Chaque échantillon de mes données comporte :
- X : des données climatiques (températures et précipitation quotidiennes sur une année). Ce sont donc des séries temporelles.
- Y : une date de floraison d'un certain type de plante qui aurait poussé dans ces conditions climatiques.

J'aimerais créer un modèle pour prédire Y en utilisant X. Avez-vous des idées ?

Message édité par Alicanto le 27-06-2018 à 10:20:48

n°5061039

o_BlastaaMoof_o

Encore un intitulé qui ne veut rien dire

n°5061040

Rontgen

Vu ton avatar, tu veux prédire la date du hanami ?

Ca me parait etre un problème de régression assez classique.
Ma première approche serait de transformer la date Y en un nombre [0;1] ou 0 est le 1e janvier et 1 est le 31 décembre, ou plutot 0 pour la date minimum dans ton ensemble de données et 1 pour la date la plus tardive.
Concernant X, si tu as peu de données, tu peux essayer d'extraire des features qui ont du sens; sinon tu te fais pas chier et tu utilises un réseau de neurones

Message cité 1 fois

n°5061044

Alicanto

アリカント

Rontgen a écrit :

Vu ton avatar, tu veux prédire la date du hanami ?

Ca me parait etre un problème de régression assez classique.
Ma première approche serait de transformer la date Y en un nombre [0;1] ou 0 est le 1e janvier et 1 est le 31 décembre, ou plutot 0 pour la date minimum dans ton ensemble de données et 1 pour la date la plus tardive.
Concernant X, si tu as peu de données, tu peux essayer d'extraire des features qui ont du sens; sinon tu te fais pas chier et tu utilises un réseau de neurones

C'est principalement pour prédire le cycle de croissance du riz, c'est moins glamour...

Désolé, mon message était trop court, je n'ai pas expliqué la situation suffisamment...
Pour Y, j'avais pensé à ça, effectivement.
Pour X, j'avais pensé à calculer les moyennes mensuelles etc... Mais il semblerait que la tendance, l'ordre de succession des valeurs est aussi assez importante, et on perd cette information en moyennant. Un réseau de neurone complexe (une entrée par jour) pourrait faire l'affaire j'imagine ?

Message cité 2 fois
Message édité par Alicanto le 27-06-2018 à 10:50:58

n°5061048

o_BlastaaMoof_o

Alicanto a écrit :

C'est principalement pour prédire le cycle de croissance du riz, c'est moins glamour...

Désolé, mon message était trop court, je n'ai pas expliqué la situation suffisamment...
Pour Y, j'avais pensé à ça, effectivement.
Pour X, j'avais pensé à calculer les moyennes mensuelles etc... Mais il semblerait que la tendance, l'ordre de succession des valeurs est aussi assez importante, et on perd cette information en moyennant. Un réseau de neurone complexe (une entrée par jour) pourrait faire l'affaire j'imagine ?

Toujours commencer par une bonne grosse étape de visualisation. Cela t'aidera à définir des estimateurs discriminants.

edit :

Pour illustrer l'intérêt de la visualisation, je te propose de jeter un oeil au webinar suivant : https://fr.mathworks.com/videos/mac [...] 00694.html
L'exemple 1 (à partir de 10:00) est simpliste mais intéressant et généralisable à d'autres problèmes. D'ailleurs il traite également de séries temporelles.

Message édité par o_BlastaaMoof_o le 27-06-2018 à 10:59:06

n°5061407

uuuugh

Alicanto a écrit :

C'est principalement pour prédire le cycle de croissance du riz, c'est moins glamour...

Désolé, mon message était trop court, je n'ai pas expliqué la situation suffisamment...
Pour Y, j'avais pensé à ça, effectivement.
Pour X, j'avais pensé à calculer les moyennes mensuelles etc... Mais il semblerait que la tendance, l'ordre de succession des valeurs est aussi assez importante, et on perd cette information en moyennant. Un réseau de neurone complexe (une entrée par jour) pourrait faire l'affaire j'imagine ?

si t'essayes les reseaux de neurones, tu peux aussi essayer un CNN pour exploiter la dependence temporelle de tes données au lieu d'y aller en mode bourrin 1 entrée = 1 jour et dense layers

Message édité par uuuugh le 29-06-2018 à 16:32:43

n°5061635

Profil supprimé

Le contenu de ce message a été effacé par son auteur

Message cité 1 fois

mood

Publicité

n°5061639

Rontgen

Sur ta fenêtre glissante (prends plus que 3 points), tu calcules non seulement la moyenne mais aussi l'écart type.
Si il y a une valeur qui est au delà d'un intervalle genre [-3 sigma; 3 sigma] c'est probablement une mesure à dégager
Enfin je dis 3 mais faut ajuster

Message édité par Rontgen le 03-07-2018 à 07:20:28

n°5061640

mystiko

Hello

Certains ont déjà tenté la freelance ?
On a pris un freelance devops chez nous, quand je vois le tarif ça me titille
Comment ça se passe en général ? On te file un set de donné avec un objectif et tu as n jours pour sortir quelque chose ? C'est des missions chez le client ou à domicile ?

3 ans d'analyse de données avec beaucoup de R et un peu de python/spark c'est light ?

Message cité 1 fois

n°5061642

korial

J’y songe pour plus tard, mais pour l’instant je trouve que je ne suis pas prêt, notamment niveau réseau et soft skills

Si je le fais je pense que j’essaierais dans un premier temps sur mon temps libre pour voir de quoi je suis capable, me faire la main, peut être mettre en place des process.

Pour l’instant je suis plus à l’aise avec un salaire qui tombe tous les mois

Message cité 1 fois

n°5061644

Tidom

J'y réfléchis aussi ... mais je suis toujours en réflexion
Si y a des retours d'expérience, je suis preneur

n°5061647

Rasthor

Prend la median.

Message cité 1 fois

n°5061670

Rontgen

Rasthor a écrit :

Prend la median.

C'est une idée encore meilleure :jap:

Message cité 1 fois

n°5061671

Rontgen

korial a écrit :

J’y songe pour plus tard, mais pour l’instant je trouve que je ne suis pas prêt, notamment niveau réseau et soft skills

Si je le fais je pense que j’essaierais dans un premier temps sur mon temps libre pour voir de quoi je suis capable, me faire la main, peut être mettre en place des process.

Pour l’instant je suis plus à l’aise avec un salaire qui tombe tous les mois

Tu peux essayer de trouver une solution intermédiaire, par exemple rejoindre un cabinet d'expertise ou de conseil dans ce domaine particulier
Ca te permet de gagner beaucoup d'expérience, potentiellement du réseau et d'avoir un salaire un peu plus élevé (même si pas au niveau d'un freelance) en ayant un job un peu plus secure

Message cité 1 fois

n°5061679

o_BlastaaMoof_o

mystiko a écrit :

Hello

Certains ont déjà tenté la freelance ?
On a pris un freelance devops chez nous, quand je vois le tarif ça me titille
Comment ça se passe en général ? On te file un set de donné avec un objectif et tu as n jours pour sortir quelque chose ? C'est des missions chez le client ou à domicile ?

3 ans d'analyse de données avec beaucoup de R et un peu de python/spark c'est light ?

Franchement, vu l'offre pléthorique au travers de SSII (spécialisées ou non), je suis sceptique sur le business model.

Message cité 1 fois

n°5061680

Rontgen

Ouais enfin on parle pas du même genre de profil que la majorité des ingénieurs de SSII

n°5061688

Tidom

o_BlastaaMoof_o a écrit :

Franchement, vu l'offre pléthorique au travers de SSII (spécialisées ou non), je suis sceptique sur le business model.

C'est un peu bizarre ta remarque : pour les autres domaines des SSII (dev, BD, ...), y a aussi des freelance/indépendants qui ont fait leurs armes en SSII avant de se lancer non ?

Message cité 1 fois

n°5061690

Profil supprimé

Le contenu de ce message a été effacé par son auteur

Message cité 1 fois

n°5061729

o_BlastaaMoof_o

Tidom a écrit :

C'est un peu bizarre ta remarque : pour les autres domaines des SSII (dev, BD, ...), y a aussi des freelance/indépendants qui ont fait leurs armes en SSII avant de se lancer non ?

Pour les autres domaines, la demande est sans commune mesure.

Message cité 1 fois

n°5061748

alpachinois

Que pensez-vous de ce master en cours du soir. Bonne alternative ou pas par rapport aux MOOC ou CNAM :??:

Est-ce pertinent si on a déjà un DUT STID + M2 MIAGE :??:

http://offreformation.univ-lyon2.f [...] 997_fr.pdf

Message édité par alpachinois le 03-07-2018 à 16:20:13

n°5061783

Rasthor

Rontgen a écrit :

C'est une idée encore meilleure :jap:

Ca a un terme precis: median absolute deviation (MAD)

https://en.wikipedia.org/wiki/Median_absolute_deviation

http://eurekastatistics.com/using- [...] -outliers/

Message cité 1 fois
Message édité par Rasthor le 03-07-2018 à 21:34:37

n°5061788

Bébé Yoda

Rasthor a écrit :

Ca a un terme precis: median absolute deviation (MAD)

https://en.wikipedia.org/wiki/Median_absolute_deviation

http://eurekastatistics.com/using- [...] -outliers/

Alors c'est marrant parce que je suis sur un problème similaire et j'ai pris une moyenne +3 sigma.
Je voulais tenter avec la médiane mais en Spark c'est assez lourd à calculer donc je vais devoir rester sur la moyenne pour pas trop charger la mémoire.

Faudrait que je poste un graphe pour illustrer. J'ai des valeurs tout le temps comprises entre 0 et 5 en gros, et puis au bout d'un moment j'en ai une au dessus, puis une deuxième et de plus en plus.
L'idée est de compter ces pics et de déterminer à partir de combien de pics je dois lever une alerte pour une maintenance.
Pour l'instant c'est assez basique : je compte un point dès qu'il est au dessus de 3 sigma, puis je fais la somme de ces points sur une fenêtre et des que j'en ai plus qu'un nombre défini alors c'est une alerte.
Sauf que cette limite est définie arbitrairement et je me demande s'il y a une meilleure méthode pour ça.

Sinon pour détecter les pics j'ai aussi tenté un arima mais ça me semble bien lourd pour pas grand chose.

Question subsidiaire : je ne suis pas sûr que ma distribution de points est normale (plutôt log normale je dirais). Est-ce qu'une approche 3 sigma est toujours valable ? Il me semblait que la normalité de la distribution était une hypothèse

Message cité 1 fois

n°5061799

korial

Rontgen a écrit :

Tu peux essayer de trouver une solution intermédiaire, par exemple rejoindre un cabinet d'expertise ou de conseil dans ce domaine particulier
Ca te permet de gagner beaucoup d'expérience, potentiellement du réseau et d'avoir un salaire un peu plus élevé (même si pas au niveau d'un freelance) en ayant un job un peu plus secure

Oui c’est vrai ce serait un bon moyen de transition. C’est marrant car quand je lis cabinet de conseil je me rends compte que ça ne me fait pas du tout envie pour l’instant, je préfère travailler sur un produit.
Mais bon ça peut s’essayer pour voir.

Bébé Yoda a écrit :

Alors c'est marrant parce que je suis sur un problème similaire et j'ai pris une moyenne +3 sigma.
Je voulais tenter avec la médiane mais en Spark c'est assez lourd à calculer donc je vais devoir rester sur la moyenne pour pas trop charger la mémoire.

Faudrait que je poste un graphe pour illustrer. J'ai des valeurs tout le temps comprises entre 0 et 5 en gros, et puis au bout d'un moment j'en ai une au dessus, puis une deuxième et de plus en plus.
L'idée est de compter ces pics et de déterminer à partir de combien de pics je dois lever une alerte pour une maintenance.
Pour l'instant c'est assez basique : je compte un point dès qu'il est au dessus de 3 sigma, puis je fais la somme de ces points sur une fenêtre et des que j'en ai plus qu'un nombre défini alors c'est une alerte.
Sauf que cette limite est définie arbitrairement et je me demande s'il y a une meilleure méthode pour ça.

Sinon pour détecter les pics j'ai aussi tenté un arima mais ça me semble bien lourd pour pas grand chose.

Question subsidiaire : je ne suis pas sûr que ma distribution de points est normale (plutôt log normale je dirais). Est-ce qu'une approche 3 sigma est toujours valable ? Il me semblait que la normalité de la distribution était une hypothèse

Ce sera pas la première fois qu’une approche qui semble non valable mathématiquement fonctionne empiriquement
Cela dit si tu as des preuves que c’est log normal (peut être tu peux faire un test de distribution pour t’en convaincre), pourquoi ne pas calculer la moyenne et 3 sigma après exp() ?

n°5061801

Bébé Yoda

Je vais faire les tests pour vérifier le type de distribution, je tâtonne un peu mais j'avance

Après, oui, j'ai testé le truc sur plusieurs dizaines de cas et ça fonctionne bien (en gros je trouve les alertes au moment où le système les envoie, donc je peux les anticiper)
Mais comme au final je vais avoir beaucoup plus de cas à traiter je voudrais être "certain" que ça va être valable

n°5061824

o_BlastaaMoof_o

De mon expérience, ni plus ni moins que dans les entreprises elles-mêmes...

Message cité 1 fois

n°5061860

Bébé Yoda

C'est partout pareil en fait

Et pourtant les boîtes fonctionnent quand même pas trop mal dans l'ensemble

Message cité 1 fois

n°5061979

o_BlastaaMoof_o

Mais stop tes poncifs là c'est pénible :sleep:

n°5061983

Bébé Yoda

Je parlais de toutes les boîtes dans tous les domaines en fait.
Je lis partout que tout le monde est mauvais et ne sait rien faire (je caricature un peu) et en pratique j'ai vu ça nulle part et on a plein de boîtes hyper compétitives

Message cité 1 fois

n°5061986

Alicanto

アリカント

Pourquoi un tirage complètement aléatoire ne convient il pas à la situation ?

n°5061988

Bébé Yoda

C'est 3 fois rien 500k lignes, pas besoin d'en enlever

Message cité 1 fois

n°5061991

-Meringue-

Avec pandas:

df.groupby(‘Classe’).apply(pandas.DataFrame.sample, frac=0.03).reset_index(drop=True)

?

mood

Publicité

Page : 1 2 3 4 5 .. 39 40 41 .. 128 129 130 131 132 133

Page Précédente

Ajouter une réponse

FORUM HardWare.fr

Emploi & Etudes

Etudes / Orientation

[Topic Unique] Machine Learning & Data Science

Sujets relatifs
Recherche d'emploi	[Topik Unique] Les girls de la section E&E
Avez vous des problèmatiques sur le Big Data ?	Master Finance et Stratégie de Science Po après des études de droit ?
Je veux travailler dans les Big DATA	Orientation pour Data Science & Recherche Opérationnelle
[Topic Unique] Concours ingénieur ENAC/IESSA : 30 postes	[Topic Unique] EIVP
[Topic Unique] L'Aylite !!!
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science

Forum MesDiscussions.Net, Version 2010.2
(c) 2000-2011 Doctissimo

Page générée en 0.086 secondes

Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR