| |||||
| Auteur | Sujet : Infra IA : aide au choix et troubleshot de LLM locaux |
|---|---|
croustx Modoadorateur | Reprise du message précédent :
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
Pipould's |
En parlant de layer split, on dirait que le split tensors avec MTP ne fonctionne pas et rebalance Les couches mtp Sur le cpu. Vous confirmez ? Pour qwen 3.6 27b J'en en tout cas ce que j'ai sur ma configuration (3090/3090ti). |
neo world | Partage la ligne de commande que tu utilises |
the_fennec f3nn3cUs z3rd4 |
Message cité 1 fois Message édité par the_fennec le 23-06-2026 à 09:30:22 --------------- Faudra que je teste un jour :o |
Pipould's |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
b-tzu Geek a toute heure... |
Message cité 1 fois Message édité par b-tzu le 23-06-2026 à 10:37:24 --------------- Topic Ventes || Topic Jeux Vidéos || Topic Téléphonie (Rien pour le moment) |
Pipould's |
Message cité 2 fois Message édité par Pipould's le 23-06-2026 à 10:59:15 |
neo world |
|
Pipould's |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
Pipould's |
|
Pipould's |
|
neo world |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
neo world |
|
Pipould's |
Message édité par Pipould's le 23-06-2026 à 12:21:35 |
Pipould's |
|
Pipould's |
|
neo world | pour fêter ce jour de canicule : nouveau sondage et hardware hall of fame en FP.
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 | @neo world, pour la FP, j'ai aussi un MBP m4 48GB pour le taf (et Bedrock aussi --------------- Faudra que je teste un jour :o |
b-tzu Geek a toute heure... | bon, cest bien compliqué a conf llama pour openvino. deja telecharger les bonnes dll openvino cest pas la folie, puis le lancer bien... et avoir des perfs deguelasse de 1 token seconde, meme sur des modeles 1.5B. gemini (toujours lui) me dit que le gguf nest peut etre pas adapté au npu, et qu'il faudrait une version spécifique du modele avec des fichiers xml et bin, quantification int4. je teste au fur et a mesure --------------- Topic Ventes || Topic Jeux Vidéos || Topic Téléphonie (Rien pour le moment) |
neo world |
Message cité 1 fois Message édité par neo world le 23-06-2026 à 15:36:20 |
morcok |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
morcok |
Intel i9 je sais plus quoi, 64go de ram et 3060 12go en effet. Pour l'instant je suis sur qwen 3.6 35B effectivement. C'est pas mal mais c'est lent. |
b-tzu Geek a toute heure... |
--------------- Topic Ventes || Topic Jeux Vidéos || Topic Téléphonie (Rien pour le moment) |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
b-tzu Geek a toute heure... | le npu est bien a 100% dusage oui --------------- Topic Ventes || Topic Jeux Vidéos || Topic Téléphonie (Rien pour le moment) |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
b-tzu Geek a toute heure... | et lhistoire de format ? oublier gguf pour xml/bat, comme ici : https://huggingface.co/OpenVINO/Qwe [...] ct-int4-ov --------------- Topic Ventes || Topic Jeux Vidéos || Topic Téléphonie (Rien pour le moment) |
the_fennec f3nn3cUs z3rd4 | Non je pense pas que ça va aider. Tu as essayé quel quants? Quelle taille fait le modèle?
Message édité par the_fennec le 23-06-2026 à 20:46:24 --------------- Faudra que je teste un jour :o |
Olivie SUUUUUUUUUUUUUU | Version 1 bit
--------------- |
b-tzu Geek a toute heure... | jai essayé le igpu, avec un modele 8B qwen 3 jetais a 8 token seconde, ca passe encore. --------------- Topic Ventes || Topic Jeux Vidéos || Topic Téléphonie (Rien pour le moment) |
b-tzu Geek a toute heure... |
--------------- Topic Ventes || Topic Jeux Vidéos || Topic Téléphonie (Rien pour le moment) |

| Sujets relatifs | |
|---|---|
| [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co | sécurité de l'IA / agentique et des Devs en roue libre |
| Plus de sujets relatifs à : Infra IA : aide au choix et troubleshot de LLM locaux | |




