OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)

Recherche :

Dernière réponse
Sujet : OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)
bulldozer_fusion	tu utilises quels modèles?

Votre réponse

Nom d'utilisateur

Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !

Le ton de votre message

Votre réponse

Smilies

Liste des smilies perso
Wiki smilies
Chercher un smiley

Options

Activer votre signature
Désactiver les smilies
Activer la notification par email du sujet

Aperçu

Vous avez perdu votre mot de passe ?

Vue Rapide de la discussion

bulldozer_fusion

tu utilises quels modèles?

shinjo

bon sang, mon hermes bouffe du token comme le titanic brulait du charbon...
je viens de passer une demie journée a tenter de tout optimiser...

je suis parti de mon soul.md que j'ai explosé en plusieurs fichiers
puis je suis passé a headroom avec divers tests qui m'ont montré que sur mes usages "infra" je pouvais gagner entre 30 et 50%
j'ai restructuré un skill pour passer de 15/20 appels sequentiels aux MCP a un script python qui livre une pré collecte de données au modéle
j'ai joué sur tous mes crons avec des passages de contextes, la réécriture des prompts et du choix de modéles forcés pour les cron basiques
j'ai aussi routé les taches auxiliaires vers d'autres modéles moins gourmands en tokens

hier j'ai fait 9,9M tokens / 42 sessions; j'attends de voir ce que ça donnera demain; le but c'est de ne pas perdre en pertinence mais d'optimiser au max

Big Blue

Il est pas aussi lent :o

J’aimais bien minimax mais il finit systématiquement planter :whistle:

LibreArbitre

Je viens de tester MiniMax M3 et pour ma skill HFR il est nettement moins bon que GLM-5.1, et de loin...

Winpoks

benos a écrit :

J'ai testé rapidos, un petit modèle gemma 4 le iGpu s'envole à 100%, cogiter sur un "hey salut" prend plus de 10 sec :D je vais regarder pour choper un abonnement dédié à cet usage :jap:

Si c'est pour cet usage, tu peux aussi aller dans la rue et dire "hey salut" aux gens. :O

the_fennec

benos a écrit :

J'ai testé rapidos, un petit modèle gemma 4 le iGpu s'envole à 100%, cogiter sur un "hey salut" prend plus de 10 sec :D je vais regarder pour choper un abonnement dédié à cet usage :jap:

Oui, pas de miracle ;)

Big Blue

Olivie a écrit :

Après ton annonce sur GLM 5.2 niveau Fable, maintenant c'est Nex niveau Opus :o

Les bench, rien que les bench :o
https://img3.super-h.fr/images/2026 [...] 329413.jpg

Et j'étais sûr que tu allais réagir :whistle:

benos

the_fennec a écrit :

Ya un topic dédié:
https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0

T'as pas un vieux GPU qui traine, même une 1060 ça peut aider.

Sinon, pour du 100% CPU il y a ik_llama, il a des opti pure CPU:
https://github.com/ikawrakow/ik_llama.cpp

Tu peux rester sous Windows pour tester. Essaye Gemma4 en MoE: gemma-4-26B-A4B-it-qat-UD-Q4_K_XL
https://huggingface.co/unsloth/gemm [...] t-qat-GGUF

Ou Qwen 3.6 en UD-Q3_K_XL qui a 1B de paramètres actif en moins:
https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF

J'ai testé rapidos, un petit modèle gemma 4 le iGpu s'envole à 100%, cogiter sur un "hey salut" prend plus de 10 sec :D je vais regarder pour choper un abonnement dédié à cet usage :jap: