Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2459 connectés 

 


Utilisez-vous du machine learning dans votre job ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  29  30  31  ..  133  134  135  136  137  138
Auteur Sujet :

[Topic Unique] Machine Learning & Data Science

n°31145
Darmstadti​um
Pipoteur grotesque
Posté le 14-03-2018 à 21:03:49  profilanswer
 

Reprise du message précédent :

Rontgen a écrit :

Y'a pas de quoi se rouler par terre en général, mais y'a quelques chroniques qui sont vraiment bonnes (en général celles ou ils interviewent des vieux de droite :o)
 
Dans celle-ci, je trouve intéressant le fait qu'il arrive à faire dire aux exposants que "la récolte des données fait peur" ou que "c'est chiant pour l'utilisateur" :D
On se rend compte aussi que le langage bullshit est bien installé dans le domaine, à base de "la data", d'initiales "DMP", etc.


 [:opus dei]


---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°31146
Orhan_Pamu​k
Voyageur décontracté
Posté le 15-03-2018 à 07:16:33  profilanswer
 

 

Si tu as/cherches des accès données, que tu es intéressé à te brancher à des profs de stats inférentielles ou à des gens qui sont demandeurs d'analyse ou des accès méthodes fondas excellents j'en suis.

 

En ce qui me concerne il se profile un stage en stats en 2019 et je cherche peut-être un/des gars en d'étude à placer, avec un esprit de compétition pour qui potentiellement dépasser l'insee ou la bce fout pas les jetons.

 

J'ai des projets, des datas et des modèles à potentiellement déléguer. tout en R et assez recherche fonda.


Message édité par Orhan_Pamuk le 15-03-2018 à 07:28:26
n°31147
Orhan_Pamu​k
Voyageur décontracté
Posté le 22-03-2018 à 13:34:19  profilanswer
 
n°31148
-Meringue-
Posté le 22-03-2018 à 21:05:23  profilanswer
 

Faut que ça soit l’année où je quitte la ville pour que ça y soit organisé  :o

n°31149
Dr_Zaius
Simius Mathematicus
Posté le 27-03-2018 à 09:21:46  profilanswer
 

:o
 

Spoiler :

https://reho.st/preview/self/eb6b611967f6d49e903721889257291763c416a8.png


---------------
« Nous sommes tous des farceurs : nous survivons à nos problèmes.» Cioran
n°31150
TiDom
Posté le 27-03-2018 à 10:35:52  profilanswer
 
n°31151
Profil sup​primé
Posté le 10-04-2018 à 13:01:36  answer
 
n°31152
Bébé Yoda
Posté le 10-04-2018 à 13:10:01  profilanswer
 

C'est par semaine ?

n°31153
Voxinat
High Frequency Trolling
Posté le 10-04-2018 à 13:37:31  profilanswer
 


Bienvenu à Londres  [:cond:3]


---------------
Sah Quel Plaisir
n°31154
Profil sup​primé
Posté le 10-04-2018 à 13:40:50  answer
 

Voxinat a écrit :


Bienvenu à Londres  [:cond:3]


 
Je comprends les kheys au RSA [:la chancla:1]

n°31155
Rontgen
Posté le 10-04-2018 à 13:46:49  profilanswer
 


 [:double deuce:2]

n°31156
TiDom
Posté le 10-04-2018 à 14:17:18  profilanswer
 

 

Graduate Machine Learning Analyst ?
Ca veut dire quoi "graduate" ? Niveau universitaire je suppose, le diplôme minimum c'est le bachelor degree (aka la licence). Qu'est-ce qu'on peut bien apprendre en machine learning au niveau licence ?  [:clooney11]


Message édité par TiDom le 10-04-2018 à 14:17:42
n°31157
Rontgen
Posté le 10-04-2018 à 14:19:29  profilanswer
 

TiDom a écrit :


 
Graduate Machine Learning Analyst ?
Ca veut dire quoi "graduate" ? Niveau universitaire je suppose, le diplôme minimum c'est le bachelor degree (aka la licence). Qu'est-ce qu'on peut bien apprendre en machine learning au niveau licence ?  [:clooney11]


La régression linéaire :o
Note que c'est suffisant dans pas mal de problèmes :o

n°31158
Voxinat
High Frequency Trolling
Posté le 10-04-2018 à 14:20:30  profilanswer
 

TiDom a écrit :


 
Graduate Machine Learning Analyst ?
Ca veut dire quoi "graduate" ? Niveau universitaire je suppose, le diplôme minimum c'est le bachelor degree (aka la licence). Qu'est-ce qu'on peut bien apprendre en machine learning au niveau licence ?  [:clooney11]


Tips : Bachelor UK = 4 ans. Ecole française = 3 ans.


---------------
Sah Quel Plaisir
n°31159
Rasthor
Posté le 10-04-2018 à 21:19:35  profilanswer
 

Ils sont "legerement" en dessous du marche....
 
https://www.standard.co.uk/tech/goo [...] 10366.html

Citation :

Why Google beats up Goldman in the fight for the top graduates
Technology is winning out over banking when it comes to graduate recruitment  
 
The average starting salary at a bank is £46,000, whereas graduate coders can earn £51,000, according to research from jobs site Glassdoor.


 

n°31160
Profil sup​primé
Posté le 10-04-2018 à 21:23:43  answer
 

Y'a quand même un sacré gap entre 46 et 26, il y a une explication particulière ou ils sont juste totalement déconnectés du marché  :??:  
 
 
La data c'est le nouvel or noir, foncez qu'ils disaient [:la chancla:1]

n°31161
DooMIII
Séminariste en reconversion
Posté le 12-04-2018 à 19:29:03  profilanswer
 

Voxinat a écrit :


Bienvenu à Londres  [:cond:3]


 
J'avais remarqué ça dans mon domaine (assurance)... les anglais n'hésitent pas à tenter très bas. Pas de tabous.
 
Quand tu vois ça, tu restes en France   [:maldoror]


---------------
Ceterum censeo Euro delendum esse
n°31162
Darmstadti​um
Pipoteur grotesque
Posté le 12-04-2018 à 19:52:20  profilanswer
 

TiDom a écrit :


Graduate Machine Learning Analyst ?


Pas étonné par les £26k. C'est le genre de job où tu peux postuler sans vraiment connaître le domaine et le "analyst" hors banque fais plutôt penser à un job plus business analyst que ML. J'imagine bien les tâches être plus du style régressions linéaires et stats descriptives sous Excel que R&D en ML.

DooMIII a écrit :


J'avais remarqué ça dans mon domaine (assurance)... les anglais n'hésitent pas à tenter très bas. Pas de tabous.

 

Quand tu vois ça, tu restes en France [:maldoror]


Mais ils montent aussi beaucoup plus haut :o Les salaires stagnent beaucoup moins qu'à Paris pour les bons postes, quel pays est le mieux pour toi dépend de ce à quoi tu peux prétendre :o :o :o


Message édité par Darmstadtium le 12-04-2018 à 19:55:25

---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
n°31163
Profil sup​primé
Posté le 16-04-2018 à 20:18:17  answer
 

Salut tout le monde  :D  
 
J'ai une petite question sur Panda
 
J'ai plusieurs fichiers csv avec des ID de clients (dans chacun des fichiers, ces ID vont de 1 à 50), j'essaye de splitter ces fichiers en : training set/test set (70%/30%).  
 
L'idée c'est de sélectionner aléatoirement 35 chiffres entre 1 et 50 ce qui correspond à 35 clients choisis au hasard pur constituer mon training set et de récupérer dans chaque fichier les lignes associées à ces client (par ex dans le fichier 1 il y a 5000 lignes associées au client 1 tandis que dans le fichier 2 il n'y a que 3 lignes pour le client 1 etc...), j'ai fait en gros comme ça et je me demandais s'il y avait une meilleure méthode  :??:  
 

Code :
  1. liste = sample([1,2...50],35) # donne 35 nombres aléatoires entre 1 et 50
  2. Pour nom_fichier dans[Nom_fichier1,....Nom_fichierN]: #Je boucle sur les noms des fichiers, le chemin étant identique
  3. df = pd.read_csv(chemin du fichier) # Je lis mon csv avec panda
  4. train = df[ df["ID client"].isin(liste) ] # Je fais la sélection sur les lignes


 
 
C'est un peu galérien de faire ça non ? :o  
 
Et que se passe-t-il si par exemple le client numero 6 est retenu pour le training set mais ne se trouve pas dans un des fichiers ? Ca fausse tout non ?  :??:  
 
 
Merci :jap:


Message édité par Profil supprimé le 16-04-2018 à 20:19:59
n°31164
Bébé Yoda
Posté le 16-04-2018 à 22:04:08  profilanswer
 

La meilleure solution c'est celle là :http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html

 

Mais c'est peut-être pas la réponse que tu attendais :o

n°31165
Profil sup​primé
Posté le 16-04-2018 à 22:10:08  answer
 

Non je peux pas splitter aléatoirement car chaque fichier est interdépendant et ne contient pas le même nombre de lignes !  
 
Je dois vraiment sélectionner aléatoirement mes clients puis extraire les infos de ces clients pour en faire mon training set...

n°31166
Profil sup​primé
Posté le 16-04-2018 à 22:17:22  answer
 


Tu lis tous les fichiers d'un coup, tu crée un unique dataframe et tu sélectionne 35 integer sur 50 avec un numpy random permutation sur un array de 1 a 50

n°31167
Profil sup​primé
Posté le 16-04-2018 à 22:20:13  answer
 

Je vois pas trop comment tu veux faire ça, mon premier fichier a ~ 10 000 lignes pour 10 colonnes tandis que mon deuxième fichier a 200 lignes pour 3 colonnes par ex :??:
 

n°31168
Profil sup​primé
Posté le 16-04-2018 à 22:21:59  answer
 


Les features sont différentes ?

n°31169
Profil sup​primé
Posté le 16-04-2018 à 22:23:41  answer
 

Ouaip, toutes les colonnes sont différentes. Seule la colonne Client_ID est identique pour tous les fichiers.  
 

n°31170
Profil sup​primé
Posté le 16-04-2018 à 22:24:21  answer
 


Dans ce cas tu fais tous tes merge/join avant et préparation du set de données si ça rentre dans ta mémoire et le split à la fin


Message édité par Profil supprimé le 16-04-2018 à 22:24:36
n°31171
Profil sup​primé
Posté le 16-04-2018 à 22:26:24  answer
 

Ouaip j'y ai pensé mais c'est pas vraiment l'objectif.  
 
Le but ça serait plutôt de leur filer les 5-6 fichiers bruts et les laisser se démerder, un peu comme un Kaggle. C'est à eux de clean les données, faire les merge qui vont bien etc.  
 
Je voulais juste savoir si ma technique détaillée plus haut marchait

n°31172
Profil sup​primé
Posté le 16-04-2018 à 22:30:52  answer
 

 

Oui ça marche ajoute juste une seed pour être sur d'avoir toujours le même set de clients dans le train dataset. Si c'est pour un kaggle like encore mieux si un fichier ne contient pas un client c'est plus intéressant

n°31173
Profil sup​primé
Posté le 16-04-2018 à 22:35:08  answer
 

Merci beaucoup pour ta réponse :jap:
 
Dans le training je suppose que c pas un souci qu'un client manque dans un fichier par contre ça va pas merder si dans mon set de test c'est pas le cas :??:

n°31174
Profil sup​primé
Posté le 16-04-2018 à 22:36:45  answer
 

 

Non mais pas sympa si c'est juste dans le test set que c'est incomplet

n°31175
Profil sup​primé
Posté le 16-04-2018 à 22:41:28  answer
 

Oui tu as raison, jvais m'arranger pour que ça manque dans les deux ou pas du tout.
 
Merci d"avoir pris du temps pour me répondre c'est sympa :jap:

n°31176
Rontgen
Posté le 16-04-2018 à 22:47:10  profilanswer
 

Dans la série "tout va bien il n'y a pas de bulle dans le domaine", voici un nouveau record

Spoiler :

Good morning Rontgen,
I work with one of the most promising startups in AI in the world and together we are trying to speak to the brightest minds in the field - for this reason I thought I'd reach out, based on the brilliant research you have been involved in.

 

My client's research team has made ground breaking discoveries and have guaranteed an outstanding investment, with an IPO process at the moment.

 

There are multiple positions available at Post-Doc, Senior and Lead level with salaries that can go above the $450k mark + stock options.


[:clooney16]


Message édité par Rontgen le 16-04-2018 à 22:48:03
n°31177
Plix
Posté le 16-04-2018 à 22:51:39  profilanswer
 

Énorme ! Après j'imagine que le process est au niveau du salaire ! Et j'espère que le salaire qu'ils font miroiter n'est pas celui du chief data scientist pour faire un gros effet...

 

Curieux de connaître ton parcours en passant, par MP si tu préfères


Message édité par Plix le 16-04-2018 à 22:52:43
n°31178
Rasthor
Posté le 16-04-2018 à 22:57:17  profilanswer
 

C'est aux USA ? :??:

n°31179
Profil sup​primé
Posté le 16-04-2018 à 22:59:53  answer
 

Tout réside dans le "that can go above" :o
 
Bulle dans le sens ça va exploser ? Ou bulle dans le sens on peut s'en mettre plein les fouilles encore tranquillement, svp faites pas les cons il me reste 1 an d'étude :lol:

n°31180
Bébé Yoda
Posté le 17-04-2018 à 07:50:06  profilanswer
 

Rasthor a écrit :

C'est aux USA ? :??:

 

450k mark, ça doit être en Allemagne de l'est :o

n°31181
Rontgen
Posté le 17-04-2018 à 08:15:00  profilanswer
 

Plix a écrit :

Énorme ! Après j'imagine que le process est au niveau du salaire ! Et j'espère que le salaire qu'ils font miroiter n'est pas celui du chief data scientist pour faire un gros effet...

 

Curieux de connaître ton parcours en passant, par MP si tu préfères


Oui effectivement, le boulot doit probablement être vénère :D

 

Mon parcours c'est école d'inge spécialité maths + M2 en parallèle, puis thèse Cifre dans une boîte internationale
Depuis 4 ans, je travaille dans une toute petite boîte qui sert un peu de labo R&D privé et indépendant pour des startups ou des grandes boîtes qui manquent de compétences
Je suis responsable de tout ce qui est machine learning (veille technologique, recherche, apprentissage des modèles, intégration dans le produit, écriture d'articles et de brevets), je sers aussi un peu de chef de projet (dans le sens responsable de l'avancement) mais j'ai pas vraiment de management vu qu'il n'y a pas de hiérarchie dans ma boîte

 

Si tu veux plus de détails, envoie moi un MP :o

 
Rasthor a écrit :

C'est aux USA ? :??:


Nan, cette offre elle est pour le Japon :o

 


Dans le sens que normalement, les start-ups ont pas assez d'argent pour payer un salaire aussi haut :o
Je pense qu'il y a un déluge de thunes sur les boîtes qui font de l'IA, parce que les investisseurs savent pas quoi faire de leur fric et que les GAFA les ont habitués à acheter des start-ups a des prix délirants

n°31182
Bébé Yoda
Posté le 17-04-2018 à 08:30:51  profilanswer
 

J'ai clairement pas fait une thèse dans le bon domaine :(
Le mieux qu'on m'a proposé c'est d'écrire des livres ou être invité à des conférences.
Ça fait plaisir mais niveau boulot derrière c'était que de la merde sous payé :/

n°31183
Rasthor
Posté le 17-04-2018 à 08:44:27  profilanswer
 

Bébé Yoda a écrit :

J'ai clairement pas fait une thèse dans le bon domaine :(
Le mieux qu'on m'a proposé c'est d'écrire des livres ou être invité à des conférences.
Ça fait plaisir mais niveau boulot derrière c'était que de la merde sous payé :/


T'as fait une these en biologie ? :o

n°31184
Rontgen
Posté le 17-04-2018 à 09:13:09  profilanswer
 

Bébé Yoda a écrit :

J'ai clairement pas fait une thèse dans le bon domaine :(
Le mieux qu'on m'a proposé c'est d'écrire des livres ou être invité à des conférences.
Ça fait plaisir mais niveau boulot derrière c'était que de la merde sous payé :/


En fait, ma thèse était pas vraiment sur le machine learning, mais elle était dans un domaine dans lequel le ML a eu un impact incroyable (à la fois dans la recherche et dans l'industrie)
J'ai eu la chance d'avoir eu un collègue, nouveau venu dans le labo vers le milieu de ma thèse, qui m'a convaincu de m'intéresser au ML (avant que ce soit la mega hype) parce qu'au début j'y croyais pas trop pour être honnête  [:ddr555]  
On a bossé ensemble et ses algos défoncaient les miens donc j'ai bien du me rendre à l'évidence et j'ai commencé à être suivre des cours et utiliser ca un peu à la fin de ma thèse
Par contre, dès que je suis rentré dans ma boite, j'ai dit au chef qu'il fallait investir là-dedans; il m'a laissé du temps au début pour que je développe depuis zéro l'architecture
C'était pas évident parce que j'étais tout seul mais comme on était seulement au début de la hype, on a réussi à tout développer sans avoir de retard :o
Depuis, le ML (et le Deep Learning en particulier) occupent une place centrale dans beaucoup de nos projets donc forcément mon role et mon impact au sein de la boite a pris de l'ampleur :jap:

n°31185
Bébé Yoda
Posté le 17-04-2018 à 09:17:14  profilanswer
 

Rasthor a écrit :


T'as fait une these en biologie ? :o

 

Nanotech en gros... Ça paye pas, à moins de partir en Californie mais j'avais pas du tout envie

 Page :   1  2  3  4  5  ..  29  30  31  ..  133  134  135  136  137  138

Aller à :
Ajouter une réponse
 

Sujets relatifs
[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires[Topic Unique] Claude by Anthropic
[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co 
Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)