Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1136 connectés 

  FORUM HardWare.fr
  Hardware
  Conseil d'achat

  Meilleure configuration possible pour le data mining

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Meilleure configuration possible pour le data mining

n°10375403
Johny78
Posté le 28-05-2018 à 10:13:20  profilanswer
 

Bonjour à tous,
 
Dans le cadre de mon emploi, je souhaiterais acheter avec mon entreprise le meilleur ordinateur possible pour traiter des quantités massives de données avec R ( language dédié aux traitements statistiques).  
 
Je bénéfécie d'un buget très élevé c'est à dire de 5 000 euros , voire 10 000 euros si nécessaire.
 
Voici la configuration à laquelle je pensais:
 
CPU : Intel Core i7-7820X
 
GPU: Nvidia GeForce GTX 1080 Ti Turbo - 11 Go
 
RAM: 128 GO de RAM DDR4 ( Corsair - Vengence LPX Series Low Profile 8 * 16 Go 2400 MHz CAS 14)
 
Stockage: 2 To de stockage SSD ( Samsung - 860 EVO - 2 To)
 
Carte mère: MSI - X299 SLI Plus
 
Je ne suis pas expert sur les composants à choisir pour optimiser les temps de traitement et tout conseil est ici le bienvenu  :??:  
Les types de traitements à realiser avec ce super ordinateur seront les suivants:
 
- lecture et mise en RAM de tables depuis une base Oracle  
- traitement des tables avec différentes opérations de selection et de filtre + utilisation d'algorithmes de machine learning type deep learning
- affichage dynamique de cartes sous leaflet permettant de visualiser près de 100 000 objets spaciaux ( type polygones, points...)
 
 
Pour préciser ma demande, voici les questions sur lesquels j'aimerais beaucoup avoir des précisions:
 
- 1/ afin d'effectuer du traitement de données, vaut il préférer un i7 avec 4 coeurs seulement (ex:  Intel® Core™ i7-7740X) mais cadencé à 4.3 Ghz ou bien un i9 avec 16 coeurs ( ex : Intel® Core™ i9-7960X ) mais avec une fréquence d'horloge nettement plus petite ( en l'occurence 2.8 GHz) . Autrement dit: le multi-threat est il valable dans le cadre de lecture de table pour mise en RAM puis traitement de ces tables ? ( je précise que mon probleme principal concerne aujourd'hui le temps de lecture des tables qui atteignent 25 Go au format csv)  
 
- 2/ quel est le composant qui va me permettre d'afficher d'afficher des cartes à partir d'un très grand nombre de données spatiales ( pour info j'utilise le package leaflet) ?  Actuellement, le chargement de la carte prend énormément de temps tout comme le raffraichissement lorsque je zoom ou que je me déplace sur la carte ... La rapidité d'affichage dépend elle de la GPU ou du CPU ( ou d'autre chose ?)  
 
3/ la carte graphique Nvidia GeForce GTX 1080 Ti Turbo - 11 Go est elle performante pour le deep learning ou bien faudrait il partir sur un autre modèle ?
 
 
Je vous remercie d'avance pour l'aide que vous pourriez m'apporter !  :)  
 
 
 
 
 

mood
Publicité
Posté le 28-05-2018 à 10:13:20  profilanswer
 

n°10375404
keos92
This is the way..
Posté le 28-05-2018 à 10:14:13  profilanswer
 

Mauvaise cat.
 
Va voir en Hardware https://forum.hardware.fr/hfr/Hardw [...] ujet-1.htm

n°10375405
fdaniel
Have you got a 27B/6 ?
Posté le 28-05-2018 à 10:30:20  profilanswer
 

Ce sujet a été déplacé de la catégorie Discussions vers la categorie Hardware par Fdaniel


---------------
Topic des restos / Topic des boutiques gastronomiques
n°10375904
Amonchakai
Posté le 29-05-2018 à 10:13:39  profilanswer
 

Hello,

 

1/ je doutes que ça change grand chose de passer du i7 au i9. Le read.csv2 de R est mono thread, ce qui pourrait te faire gagner c'est un SSD encore plus rapide, genre ca: https://www.ldlc.com/fiche/PB00219278.html

 

Mais rien que lire tes données et les écrire dans un format binaire (avec readRDS / saveRDS) tu gagnerai déjà énormément. Du coup, faut toujours se taper le CSV une fois, tu le sauvegarde en binaire (saveRDS) et après tu lis du binaire la prochaine fois que tu charge tes données. Et tu gagnera même en place.

 

2/ je sais pas, mais vu que ça a l'air d'être du Javascript derrière, le GPU peut peut être prendre la tâche. Ça dépends de comment c'est fait. Si tu as un ordi déjà en place, je regarderai dans le gestionnaire des taches ce qui est à 100% quand ça rame. CPU ou GPU.

 

3/ la 1080ti, c'est bien, c'est la solution économique. Tu pourrai vouloir une Titan vu que tu as le budget, mais avec la 1080ti tu sera déjà bien.


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Hardware
  Conseil d'achat

  Meilleure configuration possible pour le data mining

 

Sujets relatifs
Meilleure configuration possible pour le data miningMontage d'une nouvelle configuration défaut d'allimentation
Conseils configurationConfiguration PC gamer.
[Mining]RX580 HS ?Meilleure ventilation
Plus de sujets relatifs à : Meilleure configuration possible pour le data mining


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR