Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1986 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  116  117  118  ..  128  129  130  131  132  133
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°5161733
rokhlan
Posté le 08-06-2021 à 10:08:20  profilanswer
 

Reprise du message précédent :

Rontgen a écrit :

 

Je pense pas qu'on puisse répondre à ca de facon générale
Ca dépend des données, de ton infrastructure, de la personne qui va travailler dessus, et de la maturité que ton POC doit avoir

 

J'ai investi beaucoup de temps dans notre pipeline et workflow donc dans certains cas je peux te sortir un prototype en meme pas quelques heures :o


 :jap:

 

Tu utilises Jenkins pour les pipelines ?

mood
Publicité
Posté le 08-06-2021 à 10:08:20  profilanswer
 

n°5161735
flyingchai​r
Posté le 08-06-2021 à 13:03:09  profilanswer
 

rokhlan a écrit :

Tiens, petite question : vous pensez qu'il est possible de produire un résultat (genre un p'tit POC) en 2 mois ?
 
Parce que discutait avec un data scientist de COGIP et il me disait qu'il faut 5/6 mois de travail pour avoir quelque chose à montrer aux commanditaires.
 
Ce serait par exemple sur des sujets d'analyse de series temporelles.


Si il y a des données propres pour travailler et qu’il n’y a aucune industrialisation ou intégration un faire (normal pour un PoC) ça peut se faire en 1 journée. Si les données sont indisponibles, puis disponibles mais ignobles, beaucoup plus de temps.  

n°5161746
rokhlan
Posté le 08-06-2021 à 16:08:42  profilanswer
 

Les données sont bien évidemment présentes :o

 

Un peu de nettoyage cependant est nécessaire :o

n°5161747
Rontgen
Posté le 08-06-2021 à 16:28:10  profilanswer
 

rokhlan a écrit :


 :jap:  
Tu utilises Jenkins pour les pipelines ?


Non au début d'un projet, quand je recois les données, il y a toujours une phase d'exploration un peu manuelle  
Ce que je voulais dire, c'est qu'on a mis en place des outils efficaces pour annoter et organiser les données, puis les exporter dans un format immédiatement consommable par nos scripts d'entrainement de modèle, qui produisent des fichiers directement intégrables dans notre framework (je fais du software, pas du déploiement dans le cloud)

n°5161751
flyingchai​r
Posté le 08-06-2021 à 16:47:15  profilanswer
 

rokhlan a écrit :

Les données sont bien évidemment présentes :o
 
Un peu de nettoyage cependant est nécessaire :o


C’est pour ça que je parle de données propres, on sait tous que c’est 90+% du boulot de les mettre au carré :o  
Après tu lances ta routine qui fait passer tous les algos les uns après les autres et tu vas te chercher un café (ou tu reviens le lendemain si tu as mis des réseaux de neurones)  [:clooney3]

n°5161798
MTiger
Posté le 09-06-2021 à 17:15:28  profilanswer
 

entretien lundi avec tests sur les données en temps réel

 


ils me demandent pas de faire un algo mais de tester la présentation des données

 

en gros ils vont menvoyer un fichier excel avec une problématique et me demander de trouver une histoire a raconter, faire parler les données

 

quelqu'un a déjà passé ca ?
si oui un bon truc pr se préparer ?
vidéo youtube ? bouquin ? nawak ?

 

cimer :)


Message édité par MTiger le 09-06-2021 à 17:15:38
n°5161807
draculax
Posté le 09-06-2021 à 17:44:52  profilanswer
 

je dirai de regarder des compet kaggle et de voir les meilleurs notebook.
 
C'est souvent similaire.
 
1/ tu commences tjrs par comprendre en gros les variables et regarder leur distribution (genre si > 50% de NaN autant dégager direct)
 
2/ tu les mets au propre
 
3/ XGBoost :o

n°5161817
MTiger
Posté le 09-06-2021 à 19:13:43  profilanswer
 

draculax a écrit :

je dirai de regarder des compet kaggle et de voir les meilleurs notebook.
 
C'est souvent similaire.
 
1/ tu commences tjrs par comprendre en gros les variables et regarder leur distribution (genre si > 50% de NaN autant dégager direct)
 
2/ tu les mets au propre
 
3/ XGBoost :o


 
 
je pense justement que yaura pas d'algorithmiques
 
c'est vraiment juste le storytelling qu'ils veulent évaluer et la mise en forme
 

n°5161821
-Meringue-
Posté le 09-06-2021 à 19:35:46  profilanswer
 

Regarde des notebooks Kaggle d’EDA, généralement c’est spécifié dans le nom et il y a beaucoup d’up-votes  :D

n°5162014
cassiopell​a
Posté le 13-06-2021 à 11:07:32  profilanswer
 

J’ai eu un entretien et étude de cas assez étrange… ou je me fais des idées?!

 

1) L’entreprise a toujours très peu d’images parce que ce sont les cas très particuliers (genre 50-200 images). Et on ne peut pas trouver ce type d’images sur internet (ils ont exploré déjà cette piste)
2) Ils ne veulent pas trop embêter le client pour les annotations (il faut une connaissance métier pour le faire). Donc le minimum d’annotations possible.
3) C’est un post-doc… mais a l’aire être plus un CDD déguisé en post-doc (j’ai demandé pour les publies, ils ne veulent pas publier dans les revues de ML)
4) Et au final l’étude de cas c’est une 50 d’images dans le train et 10 dans test. Le comble: les images ne sont pas annotées! En soit les images sont denses, beaucoup d’objets bien en claire et séparés. Mais je me demande si on peut faire quoique ce soit avec si peu d’images. Jamais vu ce genre de cas. Pour les modèles classiques c’est clairement pas assez.

 

Tout cela me laisse penser qu’in aura toujours un gros manque des données. Et le fait que c’est un CDD… Le fait que les résultats ne seront pas publiables… Vous en pensez quoi de tout ça?

 

P.S. petite précision: je ne suis pas aux abois. Ce qui m'a initialement séduit dans l'offre: 10km de chez moi et la possibilité de faire un postdoc (donc plus court que la thèse). Je me suis dit au début que si je fait un bon post-doc, c'est bien vendable. Mais il faut du contenu à montrer...

Message cité 1 fois
Message édité par cassiopella le 13-06-2021 à 12:21:40
mood
Publicité
Posté le 13-06-2021 à 11:07:32  profilanswer
 

n°5162016
mrproton
Posté le 13-06-2021 à 14:34:03  profilanswer
 

Je suis pas spécialiste de computer vision (mon domaine c’est la nlp) je peux tromper, mais 50 images pour entraîner ça me parait beaucoup trop peu pour qu’un modèle puisse généraliser au mieux pour une utilisation réelle.  
Et 10 images pour valider ??  [:clooney8]  
 
Et le fait que ce soit un post doc, avec aucune publi… ça fait penser qu’ils veulent te flexer et surtout profiter de ton CIR pour avoir ta main d’œuvre à pas cher

n°5162021
Johnny_Bob​by
Less is more
Posté le 13-06-2021 à 20:37:58  profilanswer
 

cassiopella a écrit :

J’ai eu un entretien et étude de cas assez étrange… ou je me fais des idées?!
 
1) L’entreprise a toujours très peu d’images parce que ce sont les cas très particuliers (genre 50-200 images). Et on ne peut pas trouver ce type d’images sur internet (ils ont exploré déjà cette piste)
2) Ils ne veulent pas trop embêter le client pour les annotations (il faut une connaissance métier pour le faire). Donc le minimum d’annotations possible.
3) C’est un post-doc… mais a l’aire être plus un CDD déguisé en post-doc (j’ai demandé pour les publies, ils ne veulent pas publier dans les revues de ML)
4) Et au final l’étude de cas c’est une 50 d’images dans le train et 10 dans test. Le comble: les images ne sont pas annotées! En soit les images sont denses, beaucoup d’objets bien en claire et séparés. Mais je me demande si on peut faire quoique ce soit avec si peu d’images. Jamais vu ce genre de cas. Pour les modèles classiques c’est clairement pas assez.
 
Tout cela me laisse penser qu’in aura toujours un gros manque des données. Et le fait que c’est un CDD… Le fait que les résultats ne seront pas publiables… Vous en pensez quoi de tout ça?
 
P.S. petite précision: je ne suis pas aux abois. Ce qui m'a initialement séduit dans l'offre: 10km de chez moi et la possibilité de faire un postdoc (donc plus court que la thèse). Je me suis dit au début que si je fait un bon post-doc, c'est bien vendable. Mais il faut du contenu à montrer...


 
Run, fool [:ogratte:4]

n°5162023
Rontgen
Posté le 13-06-2021 à 21:42:20  profilanswer
 

En computer vision, le coup du "il faut beaucoup d'images pour que le deep learning marche" est un mythe
Ca dépend énormément du type de problème: la classification c'est plus facile que la régression, la segmentation pixel par pixel c'est plus facile que la classification d'image, et évidemment y'a des problèmes plus faciles que d'autres

 

J'ai déjà bossé sur des projets ou ça marchait deja bien avec 10 images, et d'autres ou ça marchait pas du tout en dessous de 10k images

 

Bon après, je dis pas que la proposition est pas louche: le truc c'est qu'avec si peu d'images t'as pas grand chose à faire, soit ça marche direct, soit ça marchera pas :o

n°5162160
MTiger
Posté le 16-06-2021 à 21:12:13  profilanswer
 

3e round entretien lundi

 

on me dit de rien préparer, ce sera une etude de cas en live mais je pense pas d'un point de vue strictement technique

 

genre on me dit de bosser

 

- aptitude a réfléchir et a proposer des solutions au client
- aptitude a structurer un projet  et voir si je peux mener operationnellement le projet etc

 

quelqu'un a déjà eu ce genre d'entretiens ? ca se prepare comment ?

 


j'ai pas de doute sur la viabilité de la boite c'est une tres bonne boite au niveau européen par contre :D


Message édité par MTiger le 16-06-2021 à 21:12:25
n°5163073
99luftball​ons
Posté le 29-06-2021 à 23:59:50  profilanswer
 

Hello, est-ce que vous avez déjà fait appel à des services d'étiquetage de données?  
 
Lesquels? Qu'est-ce que vous en avez pensé?  
 

n°5163126
mystiko
Posté le 30-06-2021 à 19:48:04  profilanswer
 

No quote please :o
 
 
Une idée d'un salaire de Lead DS (purement technique) dans une scale up?
Levée de fond récente d'un peu moins de 100M€, 200 salariés aujourd'hui et 250 à la fin de l'année
Equipe de 4-5 DS
 
 
NB : localisation peu importante, c'est du full TT

n°5163169
Rick_C137
Posté le 01-07-2021 à 09:24:07  profilanswer
 

C'est quoi "lead DS" ? Le manageur de l'équipe de 4/5 personnes ou juste un espèce de leader technique sur un projet spécifique ?
 
Et même si t'es en TT, le salaire dépendra de où se situe la boite et ou tu te situe toi (car la boite et toi payeront plus ou moins de charges sociales)

n°5163210
Rontgen
Posté le 01-07-2021 à 13:44:01  profilanswer
 

Meme questions + C'est pour bosser dans le coeur de métier, ou c'est plutot genre Business Intelligence?

n°5164667
Firefinger
Posté le 23-07-2021 à 00:28:56  profilanswer
 

Bonjour bonjour,
 
J'envisage une reconversion pour devenir data analyst et j'aurai plusieurs questions pour ceux travaillant dans le domaine qui pourraient m'aider. Me concernant, j'ai 32 ans, un bac+5 en marketing et j'occupais dernièrement un poste de business developer. Mes questions :
 
- J'ai pu voir qu'un certain niveau de mathématiques était requis (stats, probas, etc.), mon niveau actuel en maths n'est franchement pas ouf et je me demandais s'il existait des cours en ligne couvrant l'intégralité des fondamentaux requis pour occuper le poste de data analyst ?  
 
- J'ai appris le SQL, Python et l'utilisation de certaines librairies (Pandas,Numpy,Matplotlib, Seaborn, etc.), mais selon vous, quelles sont les (autres) compétences/outils qu'il faut absolument avoir/maîtriser pour un "entry job" de data analyst ?
 
- Enfin, est-il réaliste d'espérer obtenir un poste dans le domaine sans faire de formation diplomante (à base de cours en ligne qui n'ont pas franchement de "valeur" ), uniquement avec un portfolio que je me serais créé ?
 
(Ha et j'insiste, je parle bien du poste de "Data Analyst", d'après ce que j'ai pu lire le poste de Data Scientist requiert des compétences bien plus élevées en mathématiques notamment)
 
Merci d'avance  :jap:


---------------
"J'ai claqué beaucoup d'argent dans l'alcool, les filles et les voitures de sport - le reste, je l'ai gaspillé." @ Georges Best
n°5164672
mrproton
Posté le 23-07-2021 à 08:55:40  profilanswer
 

Firefinger a écrit :

Bonjour bonjour,
 
J'envisage une reconversion pour devenir data analyst et j'aurai plusieurs questions pour ceux travaillant dans le domaine qui pourraient m'aider. Me concernant, j'ai 32 ans, un bac+5 en marketing et j'occupais dernièrement un poste de business developer. Mes questions :
 
- J'ai pu voir qu'un certain niveau de mathématiques était requis (stats, probas, etc.), mon niveau actuel en maths n'est franchement pas ouf et je me demandais s'il existait des cours en ligne couvrant l'intégralité des fondamentaux requis pour occuper le poste de data analyst ?  
 
- J'ai appris le SQL, Python et l'utilisation de certaines librairies (Pandas,Numpy,Matplotlib, Seaborn, etc.), mais selon vous, quelles sont les (autres) compétences/outils qu'il faut absolument avoir/maîtriser pour un "entry job" de data analyst ?
 
- Enfin, est-il réaliste d'espérer obtenir un poste dans le domaine sans faire de formation diplomante (à base de cours en ligne qui n'ont pas franchement de "valeur" ), uniquement avec un portfolio que je me serais créé ?
 
(Ha et j'insiste, je parle bien du poste de "Data Analyst", d'après ce que j'ai pu lire le poste de Data Scientist requiert des compétences bien plus élevées en mathématiques notamment)
 
Merci d'avance  :jap:


 
Data scientist / data analyst c’est des titres qui veulent rien dire. Le vrai nom c’est statisticien
 
1. Oui bien sûr il y en a des dizaines, certains sont meilleurs que d’autres. Le plus connu étant celui d’Andrew sur Coursera.
Tu pourras aussi trouver des livres (pdf) qui couvrent tout, et des cheatsheets.
 
2. En plus de ce que tu as énoncé je dirai que les compétences les plus importantes seront humaine. :)
Pour la technique c’est déjà bien, peut-être que d’autres pourront te lister plus de choses mais sinon tu apprendras sur le tas car le domaine évolue vite. Tu peux mettre les mains dans le machine learning si ça t’intéresse.
 
3. Oui c’est réaliste. :)
Je pense qu’on bascule doucement vers une évolution des « formations », amplifié par le covid. Les formations en ligne sont de plus en plus reconnues, certaines en particulier. Beaucoup de personnes en reconversion ont pu en profiter pour atteindre leur objectif. D’autres sur ce topic te diront sûrement que dans leur boites certains DS ont été recrutés sans diplôme mais par leur moocs + compétences.

n°5164673
mrproton
Posté le 23-07-2021 à 09:00:20  profilanswer
 

Bon autrement il se passe plus rien ici, personnes pour réanimer ce topic ? :D
Now Compliant a finit head of ai ou au fond de la marina de Singapour ?
 
Allez je relance une discussion, vous avez touchés aux transformers linéaires ? (Fast transformer, performer, linformer…)
Si oui pour quelle utilisation et les résultats étaient concluants ?

n°5164677
LibreArbit​re
RIP mon Orion
Posté le 23-07-2021 à 10:02:46  profilanswer
 

Oui, la disparitation de Now Compliant a laissé un vide...
 
C'est quand même dommage d'avoir supprimé son compte ainsi que tous ses postes (je ne savais même pas que la modocratie acceptait de faire ça sauf dans un cadre judiciaire, ce qui ne doit pas être le cas ici)...


---------------
Hebergement d'images | Le topic de la VR standalone
n°5164809
cassiopell​a
Posté le 24-07-2021 à 22:00:57  profilanswer
 

Concernant le poste dont j'ai parlé plus haut, je leur ai dit "non" (j'ai parlé avec deux anciens de la boite et les retours ne sont pas bons). Mais Rontgen a raison, c'était le cas où le peu d'images a suffit.... en faisant juste le traitement d'image (pas de ML).

 

L'août est le temps mort. Je compte d'ajouter d'autres projets sur mon GitHub. A votre avis, sur quoi faut-il se focaliser? Montrer un peu de tout, ou faire focus sur 1-2 techniques (genre DL computer vision/NLP, programmation et traitement des données)?

 

Pour le job cela avance plutôt bien, même en France.

 
LibreArbitre a écrit :

Oui, la disparitation de Now Compliant a laissé un vide...

 

C'est quand même dommage d'avoir supprimé son compte ainsi que tous ses postes (je ne savais même pas que la modocratie acceptait de faire ça sauf dans un cadre judiciaire, ce qui ne doit pas être le cas ici)...


Oui, il y avait des discussions intéressantes :(


Message édité par cassiopella le 24-07-2021 à 22:01:41
n°5165093
Firefinger
Posté le 29-07-2021 à 03:47:11  profilanswer
 

mrproton a écrit :


 
Data scientist / data analyst c’est des titres qui veulent rien dire. Le vrai nom c’est statisticien
 
1. Oui bien sûr il y en a des dizaines, certains sont meilleurs que d’autres. Le plus connu étant celui d’Andrew sur Coursera.
Tu pourras aussi trouver des livres (pdf) qui couvrent tout, et des cheatsheets.
 
2. En plus de ce que tu as énoncé je dirai que les compétences les plus importantes seront humaine. :)
Pour la technique c’est déjà bien, peut-être que d’autres pourront te lister plus de choses mais sinon tu apprendras sur le tas car le domaine évolue vite. Tu peux mettre les mains dans le machine learning si ça t’intéresse.
 
3. Oui c’est réaliste. :)
Je pense qu’on bascule doucement vers une évolution des « formations », amplifié par le covid. Les formations en ligne sont de plus en plus reconnues, certaines en particulier. Beaucoup de personnes en reconversion ont pu en profiter pour atteindre leur objectif. D’autres sur ce topic te diront sûrement que dans leur boites certains DS ont été recrutés sans diplôme mais par leur moocs + compétences.


 
Merci de ta réponse !
 
Pour les titres, c'est ce que j'ai pu lire ici et là sur internet (par exemple ICI) mais en effet la nuance parait assez floue parfois.
 
1. J'ai jeté un oeil et j'ai trouvé le cours sur le Machine Learning (qui doit être celui dont tu parles j'imagine ?) qui correspondrait apparemment à ce que devrait savoir faire un data scientist, qu'en est-il pour les compétences mathématiques d'un data analyst ? (je suis obligé d'utiliser ces termes pour être bien sûr qu'on parle de la même chose, désolé :o)  
 
2. Tu penses à quoi en particulier quand tu dis compétences humaines ?
 
3. Ha parfait ! C'est motivant :)


---------------
"J'ai claqué beaucoup d'argent dans l'alcool, les filles et les voitures de sport - le reste, je l'ai gaspillé." @ Georges Best
n°5165105
o_BlastaaM​oof_o
Posté le 29-07-2021 à 11:50:10  profilanswer
 

mrproton a écrit :

 

Data scientist / data analyst c’est des titres qui veulent rien dire. Le vrai nom c’est statisticien

1. Oui bien sûr il y en a des dizaines, certains sont meilleurs que d’autres. Le plus connu étant celui d’Andrew sur Coursera.
Tu pourras aussi trouver des livres (pdf) qui couvrent tout, et des cheatsheets.

 

2. En plus de ce que tu as énoncé je dirai que les compétences les plus importantes seront humaine. :)
Pour la technique c’est déjà bien, peut-être que d’autres pourront te lister plus de choses mais sinon tu apprendras sur le tas car le domaine évolue vite. Tu peux mettre les mains dans le machine learning si ça t’intéresse.

 

3. Oui c’est réaliste. :)
Je pense qu’on bascule doucement vers une évolution des « formations », amplifié par le covid. Les formations en ligne sont de plus en plus reconnues, certaines en particulier. Beaucoup de personnes en reconversion ont pu en profiter pour atteindre leur objectif. D’autres sur ce topic te diront sûrement que dans leur boites certains DS ont été recrutés sans diplôme mais par leur moocs + compétences.


WTF ?

 

Des data scientists qui n'ont quasiment aucune notion de statistiques (au-delà du test du χ²), j'en ai vu passer un paquet. Et d'ailleurs il est souvent inutile d'avoir des connaissances poussées en statistiques quand on fait de la data science...

 

D'ailleurs, si tu mets un data scientist devant un vrai outil de statisticien comme Stata, il sera perdu la plupart du temps.


Message édité par o_BlastaaMoof_o le 29-07-2021 à 11:50:51
n°5165108
Erel
Posté le 29-07-2021 à 12:36:42  profilanswer
 

Drapal

n°5165135
Filob
Posté le 30-07-2021 à 08:15:17  profilanswer
 

Firefinger a écrit :


 
Merci de ta réponse !
 
Pour les titres, c'est ce que j'ai pu lire ici et là sur internet (par exemple ICI) mais en effet la nuance parait assez floue parfois.
 
1. J'ai jeté un oeil et j'ai trouvé le cours sur le Machine Learning (qui doit être celui dont tu parles j'imagine ?) qui correspondrait apparemment à ce que devrait savoir faire un data scientist, qu'en est-il pour les compétences mathématiques d'un data analyst ? (je suis obligé d'utiliser ces termes pour être bien sûr qu'on parle de la même chose, désolé :o)  
 
2. Tu penses à quoi en particulier quand tu dis compétences humaines ?
 
3. Ha parfait ! C'est motivant :)


 
Absolument pas indispensable pour être data analyst de faire une formation en machine learning
 
Blinde plutôt les connaissances côté bases de données, ton python/SQL pour la manipulation, et bonnes pratiques de data viz saupoudrées d'un peu de storytelling.  
En tout cas c'est ce que je demande en priorité à ceux que je recrute, et ça me semble assez général vu les dernières boites où je suis passée et ma veille sur les annonces de recrutement / le métier en général.

Message cité 1 fois
Message édité par Filob le 30-07-2021 à 08:17:00

---------------
Ma capacité de concentration est si courte que... Oh, regarde, un pigeon!
n°5165141
neo world
Posté le 30-07-2021 à 11:26:35  profilanswer
 

Filob a écrit :

 

Absolument pas indispensable pour être data analyst de faire une formation en machine learning

 

Blinde plutôt les connaissances côté bases de données, ton python/SQL pour la manipulation, et bonnes pratiques de data viz saupoudrées d'un peu de storytelling.
En tout cas c'est ce que je demande en priorité à ceux que je recrute, et ça me semble assez général vu les dernières boites où je suis passée et ma veille sur les annonces de recrutement / le métier en général.


Marrant ça se rapproche beaucoup de l'image que je me fais du data analyst "junior".

 

Dans vos boîtes, avec l'explosion des candidats, vous n'avez pas largement relevé la barre pendant les recrutements ?

 

De mon côté, je me suis dit que les temps avaient changé dans pas mal de secteurs quand j'ai entendu un sucrier français dire à quel point la DS l'aidait d'ores et déjà à faire des économies d'énergie importantes dans ses usines en faisant, à l'échelle, une optimisation qu'un spécialiste "lambda" mettait relativement longtemps à mettre en place à chaque nouvelle saison de transformation.

 

Ça me changeait des slidewares "IA, Blockchain, casser les silots, la data est le nouveau pétrole ..." Sans use case métier précis derrière car, "vous comprenez, on en est encore au stade d'expérimentation du coup on fait des dashboards et pis c'est tout" [:the este]

n°5165155
o_BlastaaM​oof_o
Posté le 30-07-2021 à 12:50:55  profilanswer
 

neo world a écrit :


Marrant ça se rapproche beaucoup de l'image que je me fais du data analyst "junior".  
 
Dans vos boîtes, avec l'explosion des candidats, vous n'avez pas largement relevé la barre pendant les recrutements ?
 
De mon côté, je me suis dit que les temps avaient changé dans pas mal de secteurs quand j'ai entendu un sucrier français dire à quel point la DS l'aidait d'ores et déjà à faire des économies d'énergie importantes dans ses usines en faisant, à l'échelle, une optimisation qu'un spécialiste "lambda" mettait relativement longtemps à mettre en place à chaque nouvelle saison de transformation.
 
Ça me changeait des slidewares "IA, Blockchain, casser les silots, la data est le nouveau pétrole ..." Sans use case métier précis derrière car, "vous comprenez, on en est encore au stade d'expérimentation du coup on fait des dashboards et pis c'est tout" [:the este]


Une petite anecdote, pour appuyer le propos...
 
J'ai travaillé à un moment donné en avant-vente avec un grand groupe industriel français qui fabrique des turbines. Ils étaient confrontés au problème suivant. Les pales montées sur les turbines n'avaient pas toutes exactement les mêmes caractéristiques (masse, forme) en raison de leur taille d'une part et du process industriel de fabrication d'autre part. Du coup, pour fabriquer une turbine aussi équilibrée que possible, les pales (une cinquantaine par turbine) devaient être placées d'une manière bien précise en fonction de leurs caractéristiques intrinsèques.
 
Le mode opératoire était le suivant. Un ingénieur disposait d'un fichier Excel avec la liste des pales et leurs caractéristiques. Dans le fichier Excel était automatiquement calculé un indice d'équilibre (je ne me souviens plus du nom exact) et l'objectif pour l'ingénieur était d'obtenir une valeur proche de 1. Pour cela, il déplaçait manuellement dans son fichier Excel les pales pour faire varier l'indice d'équilibre, se servant de son expérience pour essayer de converger aussi rapidement que possible vers une solution optimale. Le traitement d'un fichier prenait environ une heure d'expérimentation.
 
L'entreprise en question nous avait contacté à l'époque pour optimiser ce processus. Un algo d'optimisation et 5 minutes de temps d'exécution plus tard, on parvenait à indice d'équilibre de l'ordre de 0,05. Inutile de dire que les ingénieurs en face de nous se sentaient un peu idiots. Et aujourd'hui, on en parlerait volontiers comme un cas d'application de l'IA.

n°5165156
rokhlan
Posté le 30-07-2021 à 13:03:56  profilanswer
 
n°5165159
o_BlastaaM​oof_o
Posté le 30-07-2021 à 13:45:34  profilanswer
 


French engineering at its best [:stefro]

n°5165163
Voxinat
High Frequency Trolling
Posté le 30-07-2021 à 14:32:37  profilanswer
 

o_BlastaaMoof_o a écrit :


Une petite anecdote, pour appuyer le propos...
 
J'ai travaillé à un moment donné en avant-vente avec un grand groupe industriel français qui fabrique des turbines. Ils étaient confrontés au problème suivant. Les pales montées sur les turbines n'avaient pas toutes exactement les mêmes caractéristiques (masse, forme) en raison de leur taille d'une part et du process industriel de fabrication d'autre part. Du coup, pour fabriquer une turbine aussi équilibrée que possible, les pales (une cinquantaine par turbine) devaient être placées d'une manière bien précise en fonction de leurs caractéristiques intrinsèques.
 
Le mode opératoire était le suivant. Un ingénieur disposait d'un fichier Excel avec la liste des pales et leurs caractéristiques. Dans le fichier Excel était automatiquement calculé un indice d'équilibre (je ne me souviens plus du nom exact) et l'objectif pour l'ingénieur était d'obtenir une valeur proche de 1. Pour cela, il déplaçait manuellement dans son fichier Excel les pales pour faire varier l'indice d'équilibre, se servant de son expérience pour essayer de converger aussi rapidement que possible vers une solution optimale. Le traitement d'un fichier prenait environ une heure d'expérimentation.
 
L'entreprise en question nous avait contacté à l'époque pour optimiser ce processus. Un algo d'optimisation et 5 minutes de temps d'exécution plus tard, on parvenait à indice d'équilibre de l'ordre de 0,05. Inutile de dire que les ingénieurs en face de nous se sentaient un peu idiots. Et aujourd'hui, on en parlerait volontiers comme un cas d'application de l'IA.


L'indice d'equilibre évoluait entre 0 et 1 j'imagine? Ton client était vraiment satisfait en ayant 0.05?


---------------
Sah Quel Plaisir
n°5165165
o_BlastaaM​oof_o
Posté le 30-07-2021 à 14:41:02  profilanswer
 

Voxinat a écrit :


L'indice d'equilibre évoluait entre 0 et 1 j'imagine? Ton client était vraiment satisfait en ayant 0.05?


Non, il n'y avait pas de limite supérieure. Généralement, un placement aléatoire des pales donnait un indice entre 50 et 100.

n°5165171
Arraz
Posté le 30-07-2021 à 15:15:13  profilanswer
 

Firefinger a écrit :

Bonjour bonjour,
 
J'envisage une reconversion pour devenir data analyst et j'aurai plusieurs questions pour ceux travaillant dans le domaine qui pourraient m'aider. Me concernant, j'ai 32 ans, un bac+5 en marketing et j'occupais dernièrement un poste de business developer. Mes questions :
 
- J'ai pu voir qu'un certain niveau de mathématiques était requis (stats, probas, etc.), mon niveau actuel en maths n'est franchement pas ouf et je me demandais s'il existait des cours en ligne couvrant l'intégralité des fondamentaux requis pour occuper le poste de data analyst ?  
 
- J'ai appris le SQL, Python et l'utilisation de certaines librairies (Pandas,Numpy,Matplotlib, Seaborn, etc.), mais selon vous, quelles sont les (autres) compétences/outils qu'il faut absolument avoir/maîtriser pour un "entry job" de data analyst ?
 
- Enfin, est-il réaliste d'espérer obtenir un poste dans le domaine sans faire de formation diplomante (à base de cours en ligne qui n'ont pas franchement de "valeur" ), uniquement avec un portfolio que je me serais créé ?
 
(Ha et j'insiste, je parle bien du poste de "Data Analyst", d'après ce que j'ai pu lire le poste de Data Scientist requiert des compétences bien plus élevées en mathématiques notamment)
 
Merci d'avance  :jap:


 
 
Pas besoin de stats poussées pour faire data analyst dans beaucoup de boites. Les outils que tu peux apprendre et qui t'aideront beaucoup sont Tableau et Power Bi. Si tu te fais un joli portfolio de graphs, tu auras un bon point de départ.
 
Je ne sais pas ce que racontent certains posteurs ici, je vais éclaircir quelques points :
 
- Data analyst et Data Scientist sont deux postes très distincts d'un point de vue responsabilité.
Certaines boites se mélangent les pinceaux et appelent leur data analyst des data scientist et vis versa mais ça c'est aussi et surtout dû à la nouveauté des metiers.  
- Stata est un outil d'économie, pas de statistiques.
- Statisticien c'est un terme de super vague. Un type qui fait des moyennes peut se prétendre statisticien (data analyste), pareil pour celui qui fait des modèles de ML simple (Regression tree, logit), pareil pour celui qui fait du R&D et qui va surtout étudier l'aspect methodo. T'as même beaucoup de "data engineer" (la personne qui met en place l'infrastructure informatique) qui ont souvent des formations poussées en statistiques (ça aide à comprendre le besoin et l'utilisation)
 
 

Message cité 1 fois
Message édité par Arraz le 30-07-2021 à 15:24:33
n°5165204
Filob
Posté le 31-07-2021 à 11:12:11  profilanswer
 

neo world a écrit :


Marrant ça se rapproche beaucoup de l'image que je me fais du data analyst "junior".  
 
Dans vos boîtes, avec l'explosion des candidats, vous n'avez pas largement relevé la barre pendant les recrutements ?
 
De mon côté, je me suis dit que les temps avaient changé dans pas mal de secteurs quand j'ai entendu un sucrier français dire à quel point la DS l'aidait d'ores et déjà à faire des économies d'énergie importantes dans ses usines en faisant, à l'échelle, une optimisation qu'un spécialiste "lambda" mettait relativement longtemps à mettre en place à chaque nouvelle saison de transformation.
 
Ça me changeait des slidewares "IA, Blockchain, casser les silots, la data est le nouveau pétrole ..." Sans use case métier précis derrière car, "vous comprenez, on en est encore au stade d'expérimentation du coup on fait des dashboards et pis c'est tout" [:the este]


 
Bha le Mr qui pose la question est justement junior :D
Pour un senior les compétences de base restent les mêmes, j'attends juste quelqu'un d'autonome pour gérer ses projets de A à Z, collecter besoins et feedbacks du métier etc, voir encadrement et recrutement de stagiaires.
Après on passe sur des postes de leads, techniques ou managers.


---------------
Ma capacité de concentration est si courte que... Oh, regarde, un pigeon!
n°5165231
cassiopell​a
Posté le 01-08-2021 à 15:16:14  profilanswer
 

Vous vous souvenez que j'avais dit que certaines entreprises s'intéressent un peu trop au parcours des candidats? (prépa ou non, quelle prépa). Et bah voilà la preuve :lol: :
https://i.ibb.co/W5g6JH6/question-formation.jpg
Une RH m'envoie le questionnaire en disant il faut y répondre 3pour qu'on puisse étudier votre dossier". Le questionnaire demande aussi l'âge des candidats.

 

Les amis m'ont conseillé de contourner les RH autant que possible. Et du coup cela se passe beaucoup mieux. J'ai eu deux propositions venant des boites où j'ai postulé d'abord sur le site et où j'ai eu la réponse automatique "vous n'avez pas assez d'expérience blabla". Les RH français ne savent pas gérer les profils atypiques. Et ne comprennent pas forcement ce que c'est une thèse, un postdoc. Une m'a dit par exemple qu'en doctorat/postdoc on ne travaille jamais avec les données  :whistle:

 
Arraz a écrit :


Pas besoin de stats poussées pour faire data analyst dans beaucoup de boites. Les outils que tu peux apprendre et qui t'aideront beaucoup sont Tableau et Power Bi. Si tu te fais un joli portfolio de graphs, tu auras un bon point de départ.


Oui, mais certains boites de conseil qui font du BI demandent de connaitre le secteur et de comprendre les données. Cela leur permet de mettre immédiatement la personne chez le client.

 
Citation :


- Stata est un outil d'économie, pas de statistiques.


Tu es allé un peu fort  :lol: Si on suit ta logique, R est aussi un outil d'économie. L'analyse en composantes principales est un outil d'agronomie?! INSEE ne fait pas les statistiques... Depuis quand le maximum de vraisemblance, EM, logit, clusterint, ACP/ACM, ARMA etc ne sont pas les statistiques? Cela me rappelle une connaissance qui a dit une fois: l'apprentissage automatique ce n'est pas la même chose que machin learning  :pt1cable:

 

Oui, le programme est assez prisé par les économistes, mais c'est parce que jusqu'à le buzz autour du machine learning c'est en économie et finance qu'il y avait la quasi totalité de la demande pour faire les stats. Les modèles et les approches se sont adoptés à ce genre de données.

 

Si STATA est toujours intéressant c'est parce que:
1) Toutes les choses sont bien documentés, beaucoup mieux que dans scikit-learn. Et certaines choses sont gérées de façon plus intelligente (du point de vu mathématique).
2) C'est très peu connu, mais on peut tout programmer et faire des packages comme dans R. Mais il faut bien décrire le package crée.
3) Les graphiques sont sympa et faciles à faire.
4) Et surtout la fouille des données est très facile et rapide. Cela économise un temps fou pour toutes les données quantitatives/qualitatives. J'aime beaucoup approche par dataframe dans R/pandas, mais ce n'est pas aussi rapide.
5) Beaucoup moins cher que SAS.

 

D'ailleurs je ne comprends pas pourquoi certaines entreprises sont si accrochées à SAS qui est juste H-O-R-R-I-B-L-E.

 
Citation :

Statisticien c'est un terme de super vague. Un type qui fait des moyennes peut se prétendre statisticien (data analyste), pareil pour celui qui fait des modèles de ML simple (Regression tree, logit), pareil pour celui qui fait du R&D et qui va surtout étudier l'aspect methodo. T'as même beaucoup de "data engineer" (la personne qui met en place l'infrastructure informatique) qui ont souvent des formations poussées en statistiques (ça aide à comprendre le besoin et l'utilisation)


Ah bon? Je n'ai jamais croisé des personnes qui se disent statisticiens alors qu'ils ne l'ont pas. Mêmes les MIAGE n'osent pas se prétendre "statisticien". Un statisticien est un mathématicien qui développe des modèles théoriques en statistiques, c'est-à-dire des modèles qui peuvent être utilisés peu importe le secteur. Tu n'es pas mathématicien <=> tu n'es pas statisticien. C'est assez facile.

Message cité 2 fois
Message édité par cassiopella le 01-08-2021 à 15:19:38
n°5165232
dr_zaius
Simius Mathematicus
Posté le 01-08-2021 à 16:49:12  profilanswer
 

cassiopella a écrit :

Tu n'es pas mathématicien <=> tu n'es pas statisticien. C'est assez facile.

 

Les algébristes apprécieront  [:salade man:2]

 

Le mépris  [:le guide:5]


---------------
« Nous sommes tous des farceurs : nous survivons à nos problèmes.» Cioran
n°5165235
cassiopell​a
Posté le 01-08-2021 à 20:14:38  profilanswer
 

dr_zaius a écrit :

 

Les algébristes apprécieront  [:salade man:2]

 

Le mépris  [:le guide:5]


 Toutafait  :lol:  :kaola:


Message édité par cassiopella le 01-08-2021 à 20:16:54
n°5165236
o_BlastaaM​oof_o
Posté le 01-08-2021 à 20:22:49  profilanswer
 

cassiopella a écrit :

Tu n'es pas mathématicien <=> tu n'es pas statisticien.


Oula...
 
Le fait que la notion d'équivalence t'échappe (alors que c'est une notion étudiée dès l'entrée dans l'enseignement supérieur, parfois même en Terminale) explique bien des choses, si tu veux mon avis :o

n°5165238
cassiopell​a
Posté le 01-08-2021 à 21:26:18  profilanswer
 

o_BlastaaMoof_o a écrit :


Oula...
 
Le fait que la notion d'équivalence t'échappe (alors que c'est une notion étudiée dès l'entrée dans l'enseignement supérieur, parfois même en Terminale) explique bien des choses, si tu veux mon avis :o


Et cela ne t’est pas venu à l’esprit que je sais ce que c’est et que je l’ai utilisé exprès? Bon, mais c’est logique pour toi. Rien qu’en regardant mon pseudo tu sais que je code mal et je ne sais pas ce que c'est une équivalence.  :lol:  
 
Plus sérieusement: c'est assez révélateur que tu réponds à moi et non au message d’Arraz qui ne te choque pas. Dans la réalité il n’y a aucune difficulté à savoir qui est géomètre, statisticien, algébriste, etc. Mais pour cela il faut arrêter de regarder le nom du diplôme et de l’école. Mais tu penses par les clichés, on l’a vu sur la page précédente.

n°5165245
o_BlastaaM​oof_o
Posté le 01-08-2021 à 23:59:32  profilanswer
 

cassiopella a écrit :


Et cela ne t’est pas venu à l’esprit que je sais ce que c’est et que je l’ai utilisé exprès? Bon, mais c’est logique pour toi. Rien qu’en regardant mon pseudo tu sais que je code mal et je ne sais pas ce que c'est une équivalence.  :lol:  
 
Plus sérieusement: c'est assez révélateur que tu réponds à moi et non au message d’Arraz qui ne te choque pas. Dans la réalité il n’y a aucune difficulté à savoir qui est géomètre, statisticien, algébriste, etc. Mais pour cela il faut arrêter de regarder le nom du diplôme et de l’école. Mais tu penses par les clichés, on l’a vu sur la page précédente.


Tu me fais rire tellement tu transpires la frustration :lol:
 
Ta dernière lubie semble être le diplôme, j'en déduis donc que tu ne sors pas d'une école cotée et que tu te considères aussi compétente que les dizaines de gugusses qui sortent d'écoles mieux cotées que la tienne :D Désolé de te décevoir mais si le diplôme et l'école ne permettent pas de préjuger des compétences d'une personne en particulier, ils déterminent bien en moyenne le niveau de compétence. En gros, si tu embauches un EPITA, tu as plus de chances de tomber sur un tocard que si tu embauches un X. Toutes les entreprises dans le monde entier appliquent ce genre de filtre, même si ça te défrise.
 
PS : c'est un type sorti de la belle et grande université française qui te dit ça :o

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  116  117  118  ..  128  129  130  131  132  133

Aller à :
Ajouter une réponse
 

Sujets relatifs
Recherche d'emploi[Topik Unique] Les girls de la section E&E
Avez vous des problèmatiques sur le Big Data ?Master Finance et Stratégie de Science Po après des études de droit ?
Je veux travailler dans les Big DATAOrientation pour Data Science & Recherche Opérationnelle
[Topic Unique] Concours ingénieur ENAC/IESSA : 30 postes [Topic Unique] EIVP
[Topic Unique] L'Aylite !!! 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR