Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
7268 connectés 

 


Dernière réponse
Sujet : OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)
bulldozer_fusion tu utilises quels modèles?

Votre réponse
Nom d'utilisateur    Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !
Le ton de votre message                        
                       
Votre réponse


[b][i][u][strike][spoiler][fixed][cpp][url][email][img][*]   
 
   [quote]
 

Options

 
Vous avez perdu votre mot de passe ?


Vue Rapide de la discussion
bulldozer_fusion tu utilises quels modèles?
shinjo bon sang, mon hermes bouffe du token comme le titanic brulait du charbon...
je viens de passer une demie journée a tenter de tout optimiser...
 
je suis parti de mon soul.md que j'ai explosé en plusieurs fichiers
puis je suis passé a headroom avec divers tests qui m'ont montré que sur mes usages "infra" je pouvais gagner entre 30 et 50%
j'ai restructuré un skill pour passer de 15/20 appels sequentiels aux MCP a un script python qui livre une pré collecte de données au modéle
j'ai joué sur tous mes crons avec des passages de contextes, la réécriture des prompts et du choix de modéles forcés pour les cron basiques
j'ai aussi routé les taches auxiliaires vers d'autres modéles moins gourmands en tokens
 
hier j'ai fait 9,9M tokens / 42 sessions; j'attends de voir ce que ça donnera demain; le but c'est de ne pas perdre en pertinence mais d'optimiser au max
Big Blue Il est pas aussi lent :o  
 
J’aimais bien minimax mais il finit systématiquement planter :whistle:
LibreArbitre Je viens de tester MiniMax M3 et pour ma skill HFR il est nettement moins bon que GLM-5.1, et de loin...
Winpoks

benos a écrit :


J'ai testé rapidos, un petit modèle gemma 4 le iGpu s'envole à 100%, cogiter sur un "hey salut" prend plus de 10 sec :D je vais regarder pour choper un abonnement dédié à cet usage :jap:

 

Si c'est pour cet usage, tu peux aussi aller dans la rue et dire "hey salut" aux gens.  :O

the_fennec

benos a écrit :


J'ai testé rapidos, un petit modèle gemma 4 le iGpu s'envole à 100%, cogiter sur un "hey salut" prend plus de 10 sec :D je vais regarder pour choper un abonnement dédié à cet usage :jap:


 
Oui, pas de miracle ;)

Big Blue

Olivie a écrit :


Après ton annonce sur GLM 5.2 niveau Fable, maintenant c'est Nex niveau Opus :o


Les bench, rien que les bench :o  
https://img3.super-h.fr/images/2026 [...] 329413.jpg
 
Et j'étais sûr que tu allais réagir :whistle:

benos

the_fennec a écrit :


 
Ya un topic dédié:
https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
 
T'as pas un vieux GPU qui traine, même une 1060 ça peut aider.
 
Sinon, pour du 100% CPU il y a ik_llama, il a des opti pure CPU:
https://github.com/ikawrakow/ik_llama.cpp
 
Tu peux rester sous Windows pour tester. Essaye Gemma4 en MoE: gemma-4-26B-A4B-it-qat-UD-Q4_K_XL
https://huggingface.co/unsloth/gemm [...] t-qat-GGUF
 
Ou Qwen 3.6 en UD-Q3_K_XL qui a 1B de paramètres actif en moins:
https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF


J'ai testé rapidos, un petit modèle gemma 4 le iGpu s'envole à 100%, cogiter sur un "hey salut" prend plus de 10 sec :D je vais regarder pour choper un abonnement dédié à cet usage :jap:


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)