| |||||
| Auteur | Sujet : [Topic Unique] Machine Learning & Data Science |
|---|---|
Profil supprimé | Posté le 06-01-2018 à 17:52:03 ![]() Reprise du message précédent : Je vais te dire un truc, la plafond de verre 'e dépend pas de ton diplôme (sauf en cogip |
Profil supprimé | Posté le 06-01-2018 à 17:56:14 ![]() Mouaip fin je viens d'une école d'ingé assez bidon donc je le sens pas trop |
guigui84b |
Message édité par guigui84b le 10-01-2018 à 11:11:44 |
TiDom |
|
Bébé Yoda |
|
Bébé Yoda | Alors j'ai bien compris qu'il créait une nouvelle colonne pour stocker une nouvelle ID.
|
Profil supprimé | Posté le 21-01-2018 à 18:20:46 ![]() Vas-y explique pourquoi faut pas procéder comme ça outre le fait que ça rame |
o_BlastaaMoof_o | Sérieusement ? |
Profil supprimé | Posté le 21-01-2018 à 19:01:26 ![]() Il est chelou son code, c'est quoi la solution en 0.19 sec ? |
o_BlastaaMoof_o | En MATLAB, ça va ressembler à la chose suivante :
Message édité par o_BlastaaMoof_o le 21-01-2018 à 19:13:09 |
Bébé Yoda | Tiens si tu veux j'ai écrit un petit article sur le sujet :
|
Profil supprimé | Posté le 21-01-2018 à 19:16:59 ![]() En effet, pas compris pourquoi il s'emmerdait à réinventer la poudre Message édité par Profil supprimé le 21-01-2018 à 19:19:49 |
Rasthor |
|
Profil supprimé | Posté le 21-01-2018 à 19:22:30 ![]() Merci pour l'article, j'ai appris des trucs zuf |
o_BlastaaMoof_o | En fait je crois que je vais m'en servir comme question d'entretien |
Bébé Yoda |
Message édité par Bébé Yoda le 21-01-2018 à 19:28:51 |
Profil supprimé | Posté le 21-01-2018 à 19:30:45 ![]() Non tqt t'as raison Zuf |
o_BlastaaMoof_o | Y a eu du delete |
Bébé Yoda | Ouf Me voilà rassuré. En tout cas j'ai retenu qu'en python il faut dans la mesure du possible bannir les boucles. Leçon numéro 1. PS : si vous embauchez dans vos boîtes ça m'intéresse. Je suis pas plus mauvais que vos étudiants fraîchement diplômés |
Rasthor |
Non, bien au contraire!
|
o_BlastaaMoof_o |
|
Rasthor |
|
Bébé Yoda | C'est vrai, surtout quand on maîtrise pas du tout C et compagnie comme moi Après comme dit plus haut, à performances égales un code plus compact est pas forcément plus "utile" au final. |
Profil supprimé | Posté le 21-01-2018 à 22:45:16 ![]() Bonjour aux pros de la data,
Message édité par Profil supprimé le 21-01-2018 à 22:48:11 |
Profil supprimé | Posté le 21-01-2018 à 22:55:20 ![]() Tu prends ta liste de départ, tu divises en x sous listes avec x tin nombre de threads. Tu écris une fonction qui compte les Autre solution: pandas avec un group by sum. 2 lignes de code en comptant l'import Message édité par Profil supprimé le 21-01-2018 à 23:03:53 |
o_BlastaaMoof_o | En MATLAB, tu avais juste à remplacer ton deuxième for par un parfor et c'était torché.
|
Profil supprimé | Posté le 21-01-2018 à 23:12:59 ![]()
|
Profil supprimé | Posté le 21-01-2018 à 23:14:55 ![]() Donc j'ai réussi a écrire ma fonction pour compter les ABCD:
Message édité par Profil supprimé le 21-01-2018 à 23:27:33 |
Profil supprimé | Posté le 22-01-2018 à 07:28:55 ![]() Ta fonction va donner un nombre de vote égal pour chaque candidat, égal à la taille de ta sous liste... Après regarde les exemples pour pool sur python une fois ta fonction écrite c'est juste une ligne de code que tu peux récupérer directement |
Rasthor | Fundamentals of Data Visualization
|
Plix | Affreux ce code d'"anonymisation" Il faudrait qu'il passe un peu de temps à parcourir l'api de pandas et numpy pour progresser... Par curiosité c'est quel type de profil ? |
nawker vent d'est | Si même linkedin me dit que je dois postuler à des tafs machine learning et data science dans la nouvelle cogip de démo --------------- "genre il voulait 2 coktail avec du cidre qui valait 2€, y'en avait plus mais il restait un coktail avec du "vin" au même prix, le mec voulait pas de ce cocktail...j'ai réussi à lui faire accepter en lui donnant en plus un morceau de camembert" Gypssix |
Rontgen | C'est pas déconnant, il y a énormément de physiciens qui se reconvertissent dans la data science ou le ML |
Bébé Yoda |
J'ai passé un entretien hier pour rejoindre une équipe de 13 gars avec des profils variés. 2 physiciens, 1 biologiste, 1 financier. On trouve de tout |
Profil supprimé | Posté le 24-01-2018 à 11:36:24 ![]()
Message édité par Profil supprimé le 24-01-2018 à 12:05:29 |
blacksad | Question sans doute un brin HS, mais parmi les topics que je connais c'est sans doute le plus approprié.
|
Rontgen | Perso je suis plutot d'accord avec la solution B
|
Rasthor | J'ai un petit probleme: J'ai 10 echantillons, annote de A a J.
Donc on est clairement dans un cadre regression lineaire multiple. Maintenant, parmis mes 10'000 variables, certaines seront utiles pour le modele, et d'autres non. Comment pourrais-je sortir les variables utiles pour avoir un modèle optimale ? Je pense partir sur un bête test de corrélation Spearman, pour sortir les variables qui sont le plus correlees, et base mon modele la-dessus. Un avis ? Message édité par Rasthor le 24-01-2018 à 18:10:38 |
Rontgen | Tu es dans le cas d'une régression, mais pas forcément linéaire, c'est toi qui décide du modèle Ce que tu proposes a du sens mais est un peu manuel alors que tu peux directement estimer ce genre de choses lors du fitting du modèle Si tu entraines un modèle linéaire avec des variables non corrélées avec ta valeur cible, normalement elles auront naturellement un coefficient nul (enfin peut être pas avec 10 échantillons) Ah oui et sinon, 10k mesures par échantillon c'est beaucoup Je ne sais pas quel langage tu utilises mais toutes ces méthodes sont en général disponibles facilement Message édité par Rontgen le 24-01-2018 à 19:10:38 |

| Sujets relatifs | |
|---|---|
| [Topic unique] Veille IA - Actu, lectures, podcasts & documentaires | [Topic Unique] Claude by Anthropic |
| [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co | |
| Plus de sujets relatifs à : [Topic Unique] Machine Learning & Data Science | |




