Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
686 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  118  119  120  ..  128  129  130  131  132  133
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°5166489
cassiopell​a
Posté le 19-08-2021 à 00:47:46  profilanswer
 

Reprise du message précédent :

o_BlastaaMoof_o a écrit :


Il a bien parlé de datascientest dès le début et c'est assez connu... Et sinon, y a Google. Bref.

 

Sur le fond, putain mais par pitié arrêtez avec git, bash, docker et consorts [:fegafobobos:2]

 

Les data scientists qui savent faire un git pull/push, un grep et un docker build qui se prennent subitement pour des experts Linux / DevOps / MLOps / whatever [:clooney27]

 

Tous ces bidules, ce sont des trucs qu'on apprend sur le tas. Ou sur Coursera, Udemy ou l'une des nombreuses plateformes de MOOC. Aucun besoin de lire les pages du manuel dans une formation continue [:clooney12]


Il y a une très grosse différence entre écrire des lignes python dans un notebook et faire des scripts avec des classes. Je parlais surtout de ça. Le reste oui, est assez rapide à apprendre…

 

Mais mais… si je dois payer 5000 euros j’aimerais avoir quelque chose de complet. Si on suit ta logique, les bidules ML et DL on peut aussi les apprendre sur  le net, alors pourquoi payer 5000???  ;) Bon c’est à markov de décider.


Message édité par cassiopella le 19-08-2021 à 00:50:41
mood
Publicité
Posté le 19-08-2021 à 00:47:46  profilanswer
 

n°5166491
Erel
Posté le 19-08-2021 à 08:23:12  profilanswer
 

C’est toujours pareil : chaque aime apprendre à sa façon…

n°5168374
mystiko
Posté le 13-09-2021 à 21:09:40  profilanswer
 

Vous conseilleriez quoi comme formation à un ami qui veut une formation (diplômante ? ) sur la data science ? Pas forcément payé par sa boîte donc pas 15k€.

 


Aujourdhui il code en python et touche un peu à tout mais pas évidant à revendre pour changer de boite / job

 

Jaurai tendance à dire qu'un bon mooc ça fait aussi bien qu'une certification moyenne mais je suis pas recruteur :o

Message cité 3 fois
Message édité par mystiko le 13-09-2021 à 21:11:12
n°5168376
neo world
Posté le 13-09-2021 à 21:30:30  profilanswer
 

mystiko a écrit :

Vous conseilleriez quoi comme formation à un ami qui veut une formation (diplômante ? ) sur la data science ? Pas forcément payé par sa boîte donc pas 15k€.

 


Aujourdhui il code en python et touche un peu à tout mais pas évidant à revendre pour changer de boite / job

 

Jaurai tendance à dire qu'un bon mooc ça fait aussi bien qu'une certification moyenne mais je suis pas recruteur :o


Cours kaggle + Mickaël Tits (gratuit dans les deux cas)  :jap:

n°5168377
mystiko
Posté le 13-09-2021 à 21:34:52  profilanswer
 

neo world a écrit :


Cours kaggle + Mickaël Tits (gratuit dans les deux cas)  :jap:


 
Je suis plutot de cet avis. Mais comment tu valorises ça sur un CV avec des bourrins de RH?

n°5168379
flyingchai​r
Posté le 13-09-2021 à 21:42:46  profilanswer
 

mystiko a écrit :

Jaurai tendance à dire qu'un bon mooc ça fait aussi bien qu'une certification moyenne mais je suis pas recruteur :o


Je confirme, j’ai un pote qui s’est auto formé en ML avec des blogs, la boîte lui a ensuite payé une certification à 9k dans une école réputée, il était meilleur que le formateur (pas dur cela dit, le formateur était jamais sorti de son école). Bon par contre pour faire comprendre ça à un RH…

n°5168380
neo world
Posté le 13-09-2021 à 21:58:42  profilanswer
 

mystiko a écrit :

 

Je suis plutot de cet avis. Mais comment tu valorises ça sur un CV avec des bourrins de RH?


Concours kaggle (c'est toujours gratuit), alimenter un git, participer à des meetups. Il aura accès à de bien meilleures boîtes que celles qui regardent le diplôme passé  il y a 5 / 10 / 20 ans avant :)

n°5168383
flyingchai​r
Posté le 13-09-2021 à 22:35:21  profilanswer
 

Par contre faut pas rêver le salaire sera celui d’un data scientist débutant. Ça peut piquer lors d’une reconversion…

n°5168384
neo world
Posté le 13-09-2021 à 22:50:39  profilanswer
 

C'est vrai mais normalement l'évolution sera rapide (c'est encore sous tension) et le plafond beaucoup plus haut que pour un développeur lambda sans spécialité recherchée :jap:

n°5168385
mystiko
Posté le 13-09-2021 à 22:54:52  profilanswer
 

Il a 30 ans et n'est pas forcément ultra bien payé. Je pense que ça devrait aller.

 

Je lui ai conseillé de se faire payer un formation par sa boîte (si possible) juste pour avoir un nom de fac/école connu et de faire des mooc à côté :jap:

mood
Publicité
Posté le 13-09-2021 à 22:54:52  profilanswer
 

n°5168387
flyingchai​r
Posté le 13-09-2021 à 23:45:52  profilanswer
 

Le nom de l’école rassure et permet d’avoir le premier entretien effectivement. Après c’est une étude de cas, et c’est les compétences qui parlent.


Message édité par flyingchair le 13-09-2021 à 23:46:09
n°5168390
ShoTo
... fuck ... mother fucker ...
Posté le 14-09-2021 à 09:09:56  profilanswer
 

Mais s'il va au bout de la formation Kaggle, il peut pas le mettre sur linkdin ?


---------------
The king stays the king. D'Angelo Barksdale
n°5168424
o_BlastaaM​oof_o
Posté le 14-09-2021 à 17:59:18  profilanswer
 

mystiko a écrit :

Vous conseilleriez quoi comme formation à un ami qui veut une formation (diplômante ? ) sur la data science ? Pas forcément payé par sa boîte donc pas 15k€.
 
 
Aujourdhui il code en python et touche un peu à tout mais pas évidant à revendre pour changer de boite / job
 
Jaurai tendance à dire qu'un bon mooc ça fait aussi bien qu'une certification moyenne mais je suis pas recruteur :o


C'est pas un peu tard pour ça ? Le secteur me semble complètement bouché.

n°5168426
neo world
Posté le 14-09-2021 à 18:15:05  profilanswer
 

o_BlastaaMoof_o a écrit :


C'est pas un peu tard pour ça ? Le secteur me semble complètement bouché.


Pour les très grosse COGIP c'est un tout petit peu calmé (de ce que je vois) mais sur le reste c'est toujours la foire d'empoigne. Je dois recevoir une à quatre offres par semaine (de gens qui n'ont pas lu mon profil manifestement  :D ) sur des jobs de data science / Big data / data engineering. Y compris les @cc€nture et autres CAP G

 

Pas trop inquiet pour quelqu'un de motivé qui se reconverti :-)

n°5168427
neo world
Posté le 14-09-2021 à 18:17:16  profilanswer
 

ShoTo a écrit :

Mais s'il va au bout de la formation Kaggle, il peut pas le mettre sur linkdin ?


Ça passera pas le filtre des équipes de recrutement (j'en connais pas une seule qui mets Kaggle dans ses filtres) mais en complément de bonnes compétences avec un peu de réseautage pour moi y'a pas besoin d'une école particulière

n°5168833
cassiopell​a
Posté le 21-09-2021 à 17:58:52  profilanswer
 

Bonjour ou plutôt rebonjour,

 

Comme je commence mon nouveau job le 2 novembre, je me dis que j'ai assez de temps pour faire une formation sur coursera. Pourriez vous me conseiller quelque chose?

 

Je cherche:

 

Soit DL et tensorflow (ou Pytorch, why not...). Mais j'ai déjà une expérience de 6 mois en classification d'image avec TesnorFlow. Je cherche un cours où on comprend réellement ce qui se passe à l'intérieur du CNN. Et j'aimerais aller plus loin que la classification (GAN, détection, segmentation etc). Je suis aussi intéressée par TensorFlow lui même.

 

Soit l'analyse de Fourier. Presque surement je serais confrontée aux séries temporelles (données physiques), donc il faut connaitre à minima l'analyse de Fourrier et peut-être autre chose. J'ai fait quelques projets où il fallait faire la décomposition Fourier, mais cela reste assez obscure. A l'un de mes entretiens on a mentionné une autre décomposition, plus performante... mais je ne me souviens plus le nom.

 

Dans les deux cas je cherche à comprendre en profondeur les processus pour passer du stade "j'appuie sur les boutons pour faire des jolies trucs" à "je sais ce que je fais et pourquoi => je suis capable de créer les choses". Des conseils? Merci à l'avance.

Message cité 3 fois
Message édité par cassiopella le 21-09-2021 à 18:28:49
n°5168836
Tidom
Posté le 21-09-2021 à 18:16:08  profilanswer
 

J'aime bien celui récent du CNRS :  
https://youtube.com/channel/UC4Sukzudhbwr6fs10cXrJsQ
 
La partie 2 est consacrée aux CNNs : à voir si le niveau de détails te convient  
 
Mon avis personnel est que pour aller au fond des choses rien ne vaut un bouquin spécialisé... et beaucoup de temps :o

n°5168837
cassiopell​a
Posté le 21-09-2021 à 18:18:50  profilanswer
 

Si vous connaissez les bons bouquins en DL qui sont récents et étudient les choses en profondeurs, je suis preneuse!

 
Tidom a écrit :

J'aime bien celui récent du CNRS :
https://youtube.com/channel/UC4Sukzudhbwr6fs10cXrJsQ

 

La partie 2 est consacrée aux CNNs : à voir si le niveau de détails te convient

 

Mon avis personnel est que pour aller au fond des choses rien ne vaut un bouquin spécialisé... et beaucoup de temps :o


Merci pour le lien!


Message édité par cassiopella le 21-09-2021 à 18:28:18
n°5168847
flyingchai​r
Posté le 21-09-2021 à 19:57:04  profilanswer
 

cassiopella a écrit :


Soit l'analyse de Fourier. Presque surement je serais confrontée aux séries temporelles (données physiques), donc il faut connaitre à minima l'analyse de Fourrier et peut-être autre chose. J'ai fait quelques projets où il fallait faire la décomposition Fourier, mais cela reste assez obscure. A l'un de mes entretiens on a mentionné une autre décomposition, plus performante... mais je ne me souviens plus le nom.


Le cepstre ?
 
L’analyse cepstrale est une technique complémentaire d’analyse, développée sur plusieurs variantes, dont les plus utilisées sont le cepstre complexe , défini comme la transformée de Fourier inverse du logarithme décimal de la transformée de Fourier, et le cepstre de puissance défini comme la transformée de Fourier inverse du logarithme décimal du module de la transformée de Fourier du signal.

Message cité 1 fois
Message édité par flyingchair le 21-09-2021 à 20:00:08
n°5168869
solal94
Ars longa, vita brevis
Posté le 22-09-2021 à 08:33:44  profilanswer
 

flyingchair a écrit :


Le cepstre ?

 

L’analyse cepstrale est une technique complémentaire d’analyse, développée sur plusieurs variantes, dont les plus utilisées sont le cepstre complexe , défini comme la transformée de Fourier inverse du logarithme décimal de la transformée de Fourier, et le cepstre de puissance défini comme la transformée de Fourier inverse du logarithme décimal du module de la transformée de Fourier du signal.


 :sleep:

n°5168885
mrproton
Posté le 22-09-2021 à 10:33:33  profilanswer
 

cassiopella a écrit :

Bonjour ou plutôt rebonjour,
 
Comme je commence mon nouveau job le 2 novembre, je me dis que j'ai assez de temps pour faire une formation sur coursera. Pourriez vous me conseiller quelque chose?
 
Je cherche:
 
Soit DL et tensorflow (ou Pytorch, why not...). Mais j'ai déjà une expérience de 6 mois en classification d'image avec TesnorFlow. Je cherche un cours où on comprend réellement ce qui se passe à l'intérieur du CNN. Et j'aimerais aller plus loin que la classification (GAN, détection, segmentation etc). Je suis aussi intéressée par TensorFlow lui même.  
 
Soit l'analyse de Fourier. Presque surement je serais confrontée aux séries temporelles (données physiques), donc il faut connaitre à minima l'analyse de Fourrier et peut-être autre chose. J'ai fait quelques projets où il fallait faire la décomposition Fourier, mais cela reste assez obscure. A l'un de mes entretiens on a mentionné une autre décomposition, plus performante... mais je ne me souviens plus le nom.
 
Dans les deux cas je cherche à comprendre en profondeur les processus pour passer du stade "j'appuie sur les boutons pour faire des jolies trucs" à "je sais ce que je fais et pourquoi => je suis capable de créer les choses". Des conseils? Merci à l'avance.


 
Pour la convolution j'avais bien aimé ce petit papier : https://arxiv.org/abs/1603.07285
 
Pour TensorFlow / PyTorch, voire Jax même Flux ou les autres, tu peux te renseigner sur les différences entre ces librairies et choisir celle qui te convient le mieux de par leur mode d'utilisation et possibilités, et te former dessus.
En prenant en compte ta dernière phrase je pense que tu devrais éviter tensorflow, ou alors construis toi même les méthodes d'entrainement

n°5168891
cassiopell​a
Posté le 22-09-2021 à 12:39:49  profilanswer
 

Peut-être quelqu'un sera intéressé. J'ai trouvé les vidéos du cours de Stanford CS231n: Convolutional Neural Networks for Visual Recognition :  
http://cs231n.stanford.edu/
Les slides de 2021: http://cs231n.stanford.edu/slides/2021/
Par contre les vidéos les plus récentes sont de 2017, fait par Andrej Karpathy. Il explique super bien. Le début, cela peut aller. Mais pour la suite il y a une grosse différence entre les slides de 2017 et 2021  :(  
 

mrproton a écrit :


 
Pour la convolution j'avais bien aimé ce petit papier : https://arxiv.org/abs/1603.07285
 
Pour TensorFlow / PyTorch, voire Jax même Flux ou les autres, tu peux te renseigner sur les différences entre ces librairies et choisir celle qui te convient le mieux de par leur mode d'utilisation et possibilités, et te former dessus.
En prenant en compte ta dernière phrase je pense que tu devrais éviter tensorflow, ou alors construis toi même les méthodes d'entrainement


Merci beaucoup pour le pdf. C'est ce que je cherchais! Je suis d'accord pour tensorflow, mais il y a des contraintes (c'est utilisé dans la boite).  
 


J'ai regardé une vidéo, ce n'est pas ce que je cherche. Il ne va pas au fond des choses.

n°5168892
-Meringue-
Posté le 22-09-2021 à 13:12:13  profilanswer
 

cassiopella a écrit :

Peut-être quelqu'un sera intéressé. J'ai trouvé les vidéos du cours de Stanford CS231n: Convolutional Neural Networks for Visual Recognition :  
http://cs231n.stanford.edu/
Les slides de 2021: http://cs231n.stanford.edu/slides/2021/
Par contre les vidéos les plus récentes sont de 2017, fait par Andrej Karpathy. Il explique super bien. Le début, cela peut aller. Mais pour la suite il y a une grosse différence entre les slides de 2017 et 2021  :(  
 


 
J’avais beaucoup aimé les lectures de Stanford à l’époque. Très bien structuré, contenu de qualité. C’est dommage que ça ne soit pas mis à jour ces vidéos.

n°5170556
draculax
Posté le 21-10-2021 à 18:51:34  profilanswer
 

cassiopella a écrit :

Bonjour ou plutôt rebonjour,
 
Comme je commence mon nouveau job le 2 novembre, je me dis que j'ai assez de temps pour faire une formation sur coursera. Pourriez vous me conseiller quelque chose?
 
Je cherche:
 
Soit DL et tensorflow (ou Pytorch, why not...). Mais j'ai déjà une expérience de 6 mois en classification d'image avec TesnorFlow. Je cherche un cours où on comprend réellement ce qui se passe à l'intérieur du CNN. Et j'aimerais aller plus loin que la classification (GAN, détection, segmentation etc). Je suis aussi intéressée par TensorFlow lui même.  
 
Soit l'analyse de Fourier. Presque surement je serais confrontée aux séries temporelles (données physiques), donc il faut connaitre à minima l'analyse de Fourrier et peut-être autre chose. J'ai fait quelques projets où il fallait faire la décomposition Fourier, mais cela reste assez obscure. A l'un de mes entretiens on a mentionné une autre décomposition, plus performante... mais je ne me souviens plus le nom.
 
Dans les deux cas je cherche à comprendre en profondeur les processus pour passer du stade "j'appuie sur les boutons pour faire des jolies trucs" à "je sais ce que je fais et pourquoi => je suis capable de créer les choses". Des conseils? Merci à l'avance.


 
Pour comprendre réellement comment ça marche faut accepter plusieurs trucs :
 
1/ C'est pas du tout un secteur "mature" sur la théorie, c'est pas l'analyse de Fourier / la regression logistique avec pleins de théorèmes sur tes résultats.
 
2/ Les gens qui y pigent le max passent 3 ans en thèse à faire que ça / lire des papiers / tester des trucs. Je pense qu'à ton niveau, vouloir comprendre le fond du truc c'est l'équivalent pour un dev de comprendre pourquoi quand il fait .show() les pixels changent de couleur. C'est intellectuellement intéressant mais à un moment faut accepter de taffer avec des morceaux qui nous échappent.

n°5172204
flyingchai​r
Posté le 20-11-2021 à 17:12:43  profilanswer
 

Hello,j’espère que je réveille personne  [:dks:1]  
 
Est-ce que quelqu’un connaît grosso perso les tarifs annuels d’utilisation d’une plateforme de type Datarobot ? Leur modèle de facturation quoi.

n°5172205
Erel
Posté le 20-11-2021 à 18:58:31  profilanswer
 

Les modèles sont assez variables.
Donnes plus d’éléments de contexte.

n°5172206
flyingchai​r
Posté le 20-11-2021 à 19:15:47  profilanswer
 

Imaginons qu’une entreprise veuille développer avec ses propres DS puis mettre en production un modèle de prédiction des ventes des ses produits, 3000 références dont on veut individuellement prédire les ventes sur les 6 prochains mois avec un pas d’une semaine et mettre à jour les prédictions toute les semaines en fonction des dernières données de vente disponibles.


Message édité par flyingchair le 20-11-2021 à 19:16:14
n°5172209
Erel
Posté le 20-11-2021 à 20:02:01  profilanswer
 

Ok ça c’est ton use case. Si il sont des DS qui savent coder pourquoi aller vers ce type d’outils ?
J’imagine qu’il y a d’autres éléments recherchés ?

n°5172210
flyingchai​r
Posté le 20-11-2021 à 20:17:41  profilanswer
 

Parce qu’en l’occurrence ce sont des DS qui à la base sont ingénieurs anything et qui ont eu une formation de 20 jours à la DS, donc il sont pas cons, ils savent bidouiller en data science mais sans être des cadors. Et surtout ils savent un peu coder en python sur un environnement de développement type VS Code, mais ils ne savent pas passer en production et scaler.  
 
Mais je ne sais pas vraiment ce que fait DataRobot en réalité  [:mur-mur:2]

n°5172212
-Meringue-
Posté le 20-11-2021 à 21:24:54  profilanswer
 

Ne faudrait-il pas embaucher des personnes pour la mise en production?  

n°5172214
o_BlastaaM​oof_o
Posté le 20-11-2021 à 22:11:01  profilanswer
 

flyingchair a écrit :

Parce qu’en l’occurrence ce sont des DS qui à la base sont ingénieurs anything et qui ont eu une formation de 20 jours à la DS, donc il sont pas cons, ils savent bidouiller en data science mais sans être des cadors. Et surtout ils savent un peu coder en python sur un environnement de développement type VS Code, mais ils ne savent pas passer en production et scaler.  
 
Mais je ne sais pas vraiment ce que fait DataRobot en réalité  [:mur-mur:2]


Bah faut pas se faire chier et tout faire en MATLAB, au moins tu auras des outils sur étagère :spamafote:
 
Sinon, une plateforme DataWhatever pour disons une équipe de 5 à 10 personnes, faut compter 100 à 200 k€ par an.
 
Mais il faut garder à l'esprit que la plateforme en question ne te permettra probablement pas d'industrialiser. Certains prétendent que c'est le cas mais en réalité, c'est du bullshit dans la plupart des cas.

n°5172216
flyingchai​r
Posté le 20-11-2021 à 23:03:42  profilanswer
 

Non mais c’est pas pour nous, chez nous on a des DS, des devs, des gars qui font de l’infra, du coup on sait industrialiser nos projets. Je pose la question pour une micro étude de marché.  
 
Du coup une plateforme DataTruc pour une petite équipe de DS on est sur du 100 à 200 keurs/an, mais si on veut industrialiser le service derrière ça tourne ça fournit une infra en mode Infra as a service ou bien il faut créer une infra locale ? Et ça crée une API pour recevoir les requêtes et délivrer les prédictions ?
 
Et en passant, Matlab dans des conditions comparables çà coûterait combien ?  [:sidela:4]

n°5172223
o_BlastaaM​oof_o
Posté le 21-11-2021 à 11:27:57  profilanswer
 

flyingchair a écrit :

Non mais c’est pas pour nous, chez nous on a des DS, des devs, des gars qui font de l’infra, du coup on sait industrialiser nos projets. Je pose la question pour une micro étude de marché.  
 
Du coup une plateforme DataTruc pour une petite équipe de DS on est sur du 100 à 200 keurs/an, mais si on veut industrialiser le service derrière ça tourne ça fournit une infra en mode Infra as a service ou bien il faut créer une infra locale ? Et ça crée une API pour recevoir les requêtes et délivrer les prédictions ?
 
Et en passant, Matlab dans des conditions comparables çà coûterait combien ?  [:sidela:4]


Entrons une seconde dans les détails d'une plateforme que je connais bien, Dataiku en l'occurrence. Note que mes infos sont peut être un peu datées mais dans l'esprit, ça doit rester valable.

  • Pour l'environnement de prototypage, il faut acquérir une licence serveur (80 k€ par an) + N licences utilisateurs (de l'ordre de 5 k€ par utilisateur et par an).
  • Pour les environnements de préproduction et de production, il faut acquérir en plus une licence de mise en production (10 k€ par an et par instance). L'instance de mise en production permet d'exécuter les modèles créés via la plateforme en mode API. J'ignore en revanche ce qu'il advient des pipelines de transformation de données, j'imagine qu'il y a un peu de boulot pour mettre tout ça en musique.


Dataiku ne fournit aucune infra, uniquement la brique logicielle. J'imagine qu'on doit trouver des offres SaaS sur étagère auprès de certains cloud providers. Un autre point à mentionner ici est que Dataiku fait un usage croissant de Kubernetes, à tel point que Kubernetes est devenu (encore une fois à ma connaissance) l'environnement de déploiement privilégié. Cela suppose donc d'avoir un cluster Kubernetes sous la main et une équipe pour le gérer.
 
Côté MATLAB, il faut compter 2-3 k€ par utilisateur et par an + quelques k€ par an pour la licence de compilation + 10 à 20 k€ par an pour la licence de mise en production (en fonction du sizing, l'idée étant de déployer un certain nombre de "workers" qui sont en capacité d'exécuter les requêtes entrantes en parallèle).

n°5172227
flyingchai​r
Posté le 21-11-2021 à 12:01:28  profilanswer
 

Merci pour ces infos, c’est très clair  [:radio comptoir:4]

n°5172229
giorno_gio​75
Posté le 21-11-2021 à 12:21:21  profilanswer
 

flyingchair a écrit :

Non mais c’est pas pour nous, chez nous on a des DS, des devs, des gars qui font de l’infra, du coup on sait industrialiser nos projets. Je pose la question pour une micro étude de marché.

 

Du coup une plateforme DataTruc pour une petite équipe de DS on est sur du 100 à 200 keurs/an, mais si on veut industrialiser le service derrière ça tourne ça fournit une infra en mode Infra as a service ou bien il faut créer une infra locale ? Et ça crée une API pour recevoir les requêtes et délivrer les prédictions ?

 

Et en passant, Matlab dans des conditions comparables çà coûterait combien ?  [:sidela:4]

 

Pourquoi pas essayer les solutions type AWS, Azure ou GCP ?

 

C'est très flexible, très peu cher et très adapté pour des gens qui savent bidouiller (plutot que se renfermer dans des solutions propriétaires).

 

En plus le pricing est public vu qu'il est à l'utilisation donc tu peux faire de très bonnes estimations.

 

Je dis ça car j'ai un use case similaire (avec 3 fois plus de refs) et ça tourne utilise des services azure comme databricks. Par jour, mon job me coute 2€. Il va chercher la donnée dans une base Teradata (relou mais c'est un truc historique de la boite), mon ML tourne dans un cluster databricks et boom après bon l'export moi c'est un fichier PDF/Excel envoyé à plusieurs marchés à travers le monde mais ça c'est la partie onsenfou.

Message cité 1 fois
Message édité par giorno_gio75 le 21-11-2021 à 12:26:48
n°5172231
Erel
Posté le 21-11-2021 à 12:29:52  profilanswer
 

Ouais mais adapté que pour des codeurs bidouillées uniquement.

n°5172240
o_BlastaaM​oof_o
Posté le 21-11-2021 à 19:14:45  profilanswer
 

giorno_gio75 a écrit :


 
Pourquoi pas essayer les solutions type AWS, Azure ou GCP ?
 
C'est très flexible, très peu cher et très adapté pour des gens qui savent bidouiller (plutot que se renfermer dans des solutions propriétaires).
 
En plus le pricing est public vu qu'il est à l'utilisation donc tu peux faire de très bonnes estimations.
 
Je dis ça car j'ai un use case similaire (avec 3 fois plus de refs) et ça tourne utilise des services azure comme databricks. Par jour, mon job me coute 2€. Il va chercher la donnée dans une base Teradata (relou mais c'est un truc historique de la boite), mon ML tourne dans un cluster databricks et boom après bon l'export moi c'est un fichier PDF/Excel envoyé à plusieurs marchés à travers le monde mais ça c'est la partie onsenfou.


Proposer des solutions cloud et parler d’éviter de s’enfermer dans des solutions propriétaires dans le même message, c’est un peu fort de café :o
 
Y a pas grand chose sur étagère chez les cloud providers. De manière générale, faut savoir coder.
 
Sinon, ton use case, c’est du batch à première vue, non ? Rien à voir avec des API en termes de complexité.

n°5172241
neo world
Posté le 21-11-2021 à 20:08:44  profilanswer
 

o_BlastaaMoof_o a écrit :


Proposer des solutions cloud et parler d’éviter de s’enfermer dans des solutions propriétaires dans le même message, c’est un peu fort de café :o

 

Y a pas grand chose sur étagère chez les cloud providers. De manière générale, faut savoir coder.

 

Sinon, ton use case, c’est du batch à première vue, non ? Rien à voir avec des API en termes de complexité.


Il a parlé de faire du Spark / TF / Pytorch / Scikit ... via une plateforme que tu retrouves partout. Pas du SageMaker en BigQuery ML :o

 

Et ne parlons pas de l'Egress c'est moins de 100€ le TB. Il va pas devoir fermer la boîte pour exporter son dataset :o

n°5172242
o_BlastaaM​oof_o
Posté le 21-11-2021 à 21:17:48  profilanswer
 

neo world a écrit :


Il a parlé de faire du Spark / TF / Pytorch / Scikit ... via une plateforme que tu retrouves partout. Pas du SageMaker en BigQuery ML :o
 
Et ne parlons pas de l'Egress c'est moins de 100€ le TB. Il va pas devoir fermer la boîte pour exporter son dataset :o


Allons allons, tu es très bien placé pour savoir que même si la plupart des technologies proposées par les cloud providers sont effectivement open source, ils font tout pour maintenir leurs clients captifs, soit par des mesures techniques soit par une structure de coûts bien étudiée.
 
Entendons-nous bien, je ne critique pas, chaque entreprise a le droit de protéger son business comme elle l'entend dans la limite des régulations en vigueur. Il y a vraisemblablement des clients à qui ça convient.
 
Mais voir des gens se plaindre de technologies propriétaires et mettre en avant dans le même message les cloud providers alors que c'est du vendor lock-in puissance 10 par rapport à tout ce qu'on a pu connaître par le passé, ça me fait doucement rire :o

n°5172243
neo world
Posté le 21-11-2021 à 21:47:04  profilanswer
 

Il mettait en avant le coût et la facilité d'utilisation. Le vendor locking quand il s'agit d'open source  [:pug67:2]  :o

 

C'est un peu l'équivalent de "Monsieur le client, n'achetez pas de serveur HP : la carte ILO est spécifique et vous devrez changer vos habitudes / les sondes de monitoring demain si vous passez chez Lenovo" :o

n°5172251
giorno_gio​75
Posté le 22-11-2021 à 09:24:00  profilanswer
 

o_BlastaaMoof_o a écrit :


Proposer des solutions cloud et parler d’éviter de s’enfermer dans des solutions propriétaires dans le même message, c’est un peu fort de café :o
 
Y a pas grand chose sur étagère chez les cloud providers. De manière générale, faut savoir coder.
 
Sinon, ton use case, c’est du batch à première vue, non ? Rien à voir avec des API en termes de complexité.


 
Ah bah je réitère, les solutions propriétaires, c'est un enfermement au quotidien pour un data scientist. J'ai récemment basculé dans du cloud provider et c'est bien plus de liberté proposée, très clairement. Après la liberté absolue c'est évidemment d'avoir son propre truc à soi (mais bon courage) mais pour moi les cloud providers > solutions propriétaires niveau liberté, aucun doute là-dessus, c'est tellement plus agile c'est un bonheur.
 
Et surtout cette possibilité pour nous les DS de maitriser les coûts et d'avoir un truc qui nous parle direct, c'est tellement rafraichissant. J'ai encore en tête ces histoires de négociations sur les prix des licences, les prix d'exploitation du logiciel faits par des gens qui n'y connaissent rien et entendent pas nos avis .
 
J'ai 0 action dedans mdr (contrairement à o_BlastaaMoof_o que je soupçonne d'avoir quelques parts dans MathWorks :D jk)

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  118  119  120  ..  128  129  130  131  132  133

Aller à :
Ajouter une réponse
 

Sujets relatifs
Recherche d'emploi[Topik Unique] Les girls de la section E&E
Avez vous des problèmatiques sur le Big Data ?Master Finance et Stratégie de Science Po après des études de droit ?
Je veux travailler dans les Big DATAOrientation pour Data Science & Recherche Opérationnelle
[Topic Unique] Concours ingénieur ENAC/IESSA : 30 postes [Topic Unique] EIVP
[Topic Unique] L'Aylite !!! 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR