| |||||
| Auteur | Sujet : Infra IA : aide au choix et troubleshot de LLM locaux |
|---|---|
neo world | Reprise du message précédent :
|
neo world |
Message édité par neo world le 21-05-2026 à 17:32:48 |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
speedboyz30 Guide Michelin :o | On attends tes retours sur le Strix Halo alors |
speedboyz30 Guide Michelin :o |
|
neo world |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
neo world |
Message édité par neo world le 21-05-2026 à 17:42:18 |
neo world |
Message édité par neo world le 21-05-2026 à 19:13:31 |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
Olivie SUUUUUUUUUUUUUU |
--------------- |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
hardcorsaire | Je viens de regarders les specs du futur mini-pc AMD Ryzen AI Halo
Message édité par hardcorsaire le 22-05-2026 à 18:26:11 |
the_fennec f3nn3cUs z3rd4 |
Message édité par the_fennec le 22-05-2026 à 15:35:16 --------------- Faudra que je teste un jour :o |
neo world |
|
neo world |
|
the_fennec f3nn3cUs z3rd4 |
Message édité par the_fennec le 22-05-2026 à 16:16:37 --------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 |
Message édité par the_fennec le 22-05-2026 à 17:19:02 --------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 | Bon mitigé sur Claude Code, il marche bien, mais il ne compacte pas seul, il arrive a remplir le contexte et se prends une erreur 400 de llama.cpp. Je peux encore compacter manuellement, mais c'est lourd, il bosse une grosse heure c'est tout.
--------------- Faudra que je teste un jour :o |
neo world | Tu as découpé comment tes taches ? Pour moi c’est chaud de tout faire en une passe. Faudrait découper par module en lui donnant en skills comment c’était fait dans le bon vieux temps et lui donner des templates pour qu’il puisse bosser sans exploser le million de token en contexte |
the_fennec f3nn3cUs z3rd4 | J'ai un AGENTS.md et un implementation.md, mais c'est juste pour donner des guide-lines, mais c'est plus de l’exportation qu'autre chose.
--------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 |
neo world |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
TotalRecall | Ce sujet a été déplacé de la catégorie Hardware vers la categorie Intelligence Artificielle par TotalRecall --------------- Topic .Net - C# @ Prog |
TotalRecall | Une nouvelle cat entière pour parler de modèles, de NPU, de lamas, et de tout ce que vous voudrez qui s'y rapporte. Amusez vous bien --------------- Topic .Net - C# @ Prog |
speedboyz30 Guide Michelin :o |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
LibreArbitre La /root est longue |
https://forum.hardware.fr/hfr/Progr [...] 8747_1.htm
Message édité par LibreArbitre le 26-05-2026 à 15:05:30 --------------- Pharyo | Cinépite | Capvirage |
Plam Bear Metal | Ici en contexte pro pour des usages divers, j'ai 3 machines : Le tout avec LiteLLM devant pour proxifier. J'attend qwen 3.7 avec beaucoup d'impatience Message édité par Plam le 26-05-2026 à 17:33:02 --------------- Spécialiste du bear metal |
the_fennec f3nn3cUs z3rd4 | Tu utilises quoi pour l'inférence? vLLM ?
--------------- Faudra que je teste un jour :o |
Plam Bear Metal |
Modèle HF : Qwen/Qwen3.6-27B-FP8
Modèle HF : QuantTrio/Qwen3.6-35B-A3B-AWQ
--------------- Spécialiste du bear metal |
the_fennec f3nn3cUs z3rd4 | Vidéo sur les effets de la quantization, de Q8 a Q1!
--------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
Amonchakai | Hello
Message cité 1 fois Message édité par Amonchakai le 27-05-2026 à 23:40:53 |
extenue1 | Test du Nvidia DGX Spark (Dell) : le mini PC IA à 128 Go de RAM https://www.frandroid.com/marques/3 [...] -go-de-ram A 3k je prends, 6k non Message cité 2 fois Message édité par extenue1 le 28-05-2026 à 10:22:23 |
the_fennec f3nn3cUs z3rd4 | CUDA 13.3 est sortis, c'est censé régler des problèmes d’alignements mémoire qui m'avaient obligé à patcher vLLM pour le faire tourner. Donc l’installe pour les pauvre devrait être plus facile. Bon, ça me concerne pas vu que ça marche pas sur la BC250.
Message édité par the_fennec le 28-05-2026 à 14:42:23 --------------- Faudra que je teste un jour :o |
neo world |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |

| Sujets relatifs | |
|---|---|
| [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co | sécurité de l'IA / agentique et des Devs en roue libre |
| Plus de sujets relatifs à : Infra IA : aide au choix et troubleshot de LLM locaux | |




