Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
3227 connectés 

 


 Mot :   Pseudo :  
 
 Page :   1  2
Page Suivante
Auteur Sujet :

Communauté de l'IA

n°40286
XaTriX
Posté le 24-06-2026 à 17:12:07  profilanswer
 

Reprise du message précédent :
oui ? :o


---------------
[:dawa]
n°40289
Bagdarion
Posté le 24-06-2026 à 17:31:27  profilanswer
 

jix a écrit :

Un truc qui serait vraiment cool sur ce topic, ce serait le partage des skillz et hooks "must have" de base pour tout projet de dev, avec quelques explications (pourquoi ne pas le mettre ça sur github), fait par l'élite HFR :sol:

 

Je pense à quelque chose de vraiment générique qui aiderait la communauté de l'anneau l'IA, made in HFR.

 

Il y a pleins de choses qui existent partout mais j'ai pas franchement confiance perso..

 

Ce serait super utile pour les gens non skillés (comme moi par exemple :))

 

Edit : idem pour les configurations pour les IA, par ex config propre à Claude dans le JSON, etc..


J'aime bien l'idée également.
En revanche pour le moment je ne peux pas grandement aider car souvent je fais mes propres skills( why not :o)

 

J'utilise CAVEMAN au quotidien mais honnêtement je n'ai pas de mesures pour vérifier si j'y gagne réellement.

 

J'ai testé graphify et pour le coup je n'ai pas remarqué de gain, plutôt l'inverse même puisqu'il fallait régulièrement build/mettre à jour le graph

Message cité 1 fois
Message édité par Bagdarion le 24-06-2026 à 17:32:11
n°40290
jix
Jar ar en Skaggig Svensk
Posté le 24-06-2026 à 17:51:51  profilanswer
 

ajoute un bouton "offre moi une bière" dans le github :o


---------------
Finalement ça va bien s'passer ..
n°40291
jix
Jar ar en Skaggig Svensk
Posté le 24-06-2026 à 17:53:46  profilanswer
 

J'aimerais bien trouver un chatbot pour le faire le support de mon site, qu'on puisse adapter facilement à son propre contenu, vous pensez que ça existe en public sur github ?
 
Edit : bon, un peu tôt pour ça, on verra quand mon projet sera plus avancé, Glaude m'a gentiment dit qu'il ne fallait pas mettre l'huile avant le tournesol :o


Message édité par jix le 24-06-2026 à 19:47:17

---------------
Finalement ça va bien s'passer ..
n°40379
memaster
M.arc a volé mon 62
Posté le 25-06-2026 à 20:50:39  profilanswer
 

drap :o


---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster
n°40387
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 25-06-2026 à 23:41:05  profilanswer
 


Oui c'est pour quoi? :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°40388
memaster
M.arc a volé mon 62
Posté le 26-06-2026 à 00:03:26  profilanswer
 

et bien ça yeah je cause avec mon ollama en local. [:e-te]  
ce truc de fou :love:


---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster
n°40389
memaster
M.arc a volé mon 62
Posté le 26-06-2026 à 00:05:47  profilanswer
 

Citation :


La commande nvidia-smi me donne comme driver le numero 450 et une cuda version de 11.0 et 4Go de vram. Est ce que ce sont des spécifications suffisantes pour vous?
Le Driver NVIDIA (numéro 450) et la CUDA Version (11.0) avec une quantité significative d'espace de mémoire vidéo apparentée à environ 4 Go sont des spécifications  
solides qui devraient généralement permettre un fonctionnement fluide pour les applications exigeant le traitement par GPU, comme Ollama qui peut utiliser la CUDA  
et nécessite une carte graphique performante. Toutefois, cela dépend aussi de la compatibilité exacte entre cette version NVIDIA avec votre modèle spécifique  
d'appareil utilisateur final (par exemple un ordinateur portable ou une station de travail).
 
Pour vérifier si les spécifications sont suffisantes et s'assurer que le pilote fonctionne correctement, voici quelques étapes à considérer :  
1. Essayez d'utiliser la commande `nvidia-smi` régulièrement pour surveiller l'état du GPU. Ceci peut vous aider à détecter des problèmes éventuels en temps réel ou  
après avoir effectué certaines modifications de configurations.
   
2. Vérifiez que le pilote NVIDIA est complètement installé et mis à jour avec `sudo apt-get update` suivie par `sudo nvidia-smi`. Si une mise à niveau du driver est  
recommandée, tentez d'installer la dernière version disponible pour votre modèle spécifique de carte graphique.
   
3. Pour les applications qui utilisent CUDA et GPU comme Ollama, vérifiez que le module CUDA n'est pas désactivé dans `/etc/modules` ou via `modprobe`. Si ce  
dernier est nécessaire pour votre travail avec Ollama, assurez-vous qu’il s’exécute sans erreurs en utilisant les commandes pertinentes comme `lspci`, `nvidia-smi`,  
et peut-être même la commande directe de l'application si possible.
   
4. Évaluez d'autres aspects matériels tels que le thermomètre du GPU, qui pourrait être un indicateur précoce potentiel de surcharge ou problèmes liés au  
fonctionnement de votre carte graphique avec les applications spécifiques comme Ollama si elles sont exigeantes en termes d'utilisation.
   
5. Assurez-vous que le logiciel audio/vidéo dans Linux est correctement configuré pour afficher la sortie vidéo via VDPAU ou CUPS, surtout lors de l’exécution  
directe depuis un terminal avec `xvfb` si nécessaire.
   
6. Si vous rencontrez toujours des problèmes après ces vérifications et optimisations, il serait judicieux d'envisager la création d'un environnement Linux virtuel  
ou une session basée sur Docker pour isoler le logiciel Ollama de tout autre traitement parallèle qui peut affecter sa performance.
 
Il est recommandé que si vous n’arrivez pas à résoudre les problèmes avec ces étapes, il serait conseillé d'envisager une consultation technique supplémentaire ou  
même un changement matériel pour assurer la compatibilité et le fonctionnement optimaux des applications graphiques.
 
Cela dit, gardez en tête que bien souvent, les performances sont également fortement dépendantes du logiciel associé à Ollama qui peut ne pas être entièrement  
compatible avec toutes configurations matérielles ou logicielle spécifiques d'utilisateurs finaux, ce qui peut nécessiter une attention particulière et  
potentiellement la recherche de solutions issues des forums communautaires spécialisés pour les systèmes Linux.


j'ai plus qu'à le config quelques part sur un dual nvidia.
j'avais une erreur avec openclaw, allors j'ai lancé ollama run phi3 et boum j'ai un assistant LLM qui fonctionne. [:e-te]


---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster
n°40421
Nr13
Posté le 26-06-2026 à 13:43:37  profilanswer
 

Bagdarion a écrit :


J'aime bien l'idée également.
En revanche pour le moment je ne peux pas grandement aider car souvent je fais mes propres skills( why not :o)
 
J'utilise CAVEMAN au quotidien mais honnêtement je n'ai pas de mesures pour vérifier si j'y gagne réellement.
 
J'ai testé graphify et pour le coup je n'ai pas remarqué de gain, plutôt l'inverse même puisqu'il fallait régulièrement build/mettre à jour le graph


 
Pour la question sur caveman j'ai trouvé cette analyse intéressante: https://codepointer.substack.com/p/ [...] s-with-rtk
TLDR: ça fait bien ce que ça dit faire, mais selon ton usage (évidemment) en fait l'impact sur la conso/facture est.. faible.

n°40423
XaTriX
Posté le 26-06-2026 à 13:53:40  profilanswer
 

Je n'ai pas vraiment confiance en des outils comme rtk ou caveman, je pense que le gain est nul, léger, voir négatif et que ça rajoute des contraintes et de l'incertitude sur les réponses des outils.
Il vaut mieux utiliser des outils plus performant que les verbeux classiques et savoir manager son contexte.


---------------
[:dawa]
n°40427
jix
Jar ar en Skaggig Svensk
Posté le 26-06-2026 à 15:01:36  profilanswer
 

Ce que dit l'article
 
Attention au titre : l'article n'est pas une promo de RTK, c'est une enquête critique. L'auteur teste trois outils open-source (rtk, headroom, caveman) qui promettent de réduire la consommation de tokens LLM de 60-90 %… et démontre que dans la vraie vie le gain combiné est d'environ 3,7 % (et 0,5 % pour RTK seul).
 
RTK, c'est quoi
 
Un wrapper en ligne de commande qui intercepte les commandes shell avant exécution et compacte leur sortie avant que le modèle ne la lise.
 
- Fonctionne via un hook PreToolUse : git status devient rtk git status.
- Filtres spécialisés par type de commande (grep, git diff, git log, ls…) : déduplication, troncature, résumés.
- Exemple ls -la : 37 lignes avec permissions/propriétaire/dates → arbre compact + ligne "Summary: 23 files, 10 dirs (13 .md, 2 .json…)".
- Garde-fous : si le parsing échoue → sortie brute ; les diffs tronqués gardent un marqueur [full diff: rtk git diff --no-compact].
 
Promesses vs réalité
                                       Promesse (microbench)                                                                 Réel (replay de vraies sessions)
grep                                99 % (ex. rg registerSingleton sur VS Code : 694k → 2,4k tokens)         —
git diff                              33-99 %                                                                                         —
Part réelle de la facture.     60-90 %                                                                                         0,5 %
 
Pourquoi l'écart est énorme :
 
1 - Problème de dénominateur : la promesse divise par une seule commande ; la facture réelle se divise sur des centaines de tours.
2 - 78 % des tokens d'outils contournent RTK : ils passent par les outils natifs Read/Grep/Glob/WebFetch de Claude Code, qui n'appellent jamais le hook shell.
3 - Structure de prix : l'essentiel de la facture (42 % cache_create, 29 % output) ne touche jamais le flux de RTK ; les gains tombent sur les tokens les moins chers (cache_read, ~0,50 $/M contre 5-25 $/M).
4 - Les lectures de fichiers contiennent peu de redondance → les stratégies de dédup de RTK n'y mordent pas.
 
Risques
 
- Sécurité : le hook s'exécute sur le shell → une release compromise = exécution de commandes arbitraires, potentiellement invisible (headroom télécharge le binaire RTK automatiquement → exposition supply-chain).
- Perte de données silencieuse : la troncature peut couper un warning critique que l'agent avait demandé.
Conclusion de l'auteur : gains réels marginaux (~0,5 %) à mettre en balance avec le fait de donner à un binaire tiers un accès direct à ton shell. Pour la plupart des gens, le risque l'emporte sur le bénéfice.
 
Est-ce intéressant pour toi ?
Honnêtement, non — pas l'outil. Et c'est encore plus net dans ton cas que dans le cas générique de l'article :
 
- Tu utilises massivement les outils natifs (Read, Grep, Glob, les agents Explore/audits). Or c'est précisément ce flux (les 78 %) que RTK ne touche pas. Le gain serait encore plus proche de zéro que la moyenne.
- Sécurité : tu bosses sur une app en prod avec des PII réelles (cf. tes mémos sur les audits-secrets/PII). Greffer un binaire à hook shell téléchargé automatiquement, c'est exactement le type de dette que tes propres garde-fous (audit-secrets, audit-3rd-party, supply-chain) sont censés éviter. Mauvais ratio.
- Tu as déjà 35+ hooks PreToolUse très réglés. Ajouter un wrapper qui ré-écrit tes commandes shell crée un risque de collision/effets de bord avec ton tooling existant, pour un gain de ~0,5 %.
 
Ce qui est récupérable, en revanche, c'est l'idée — pas le produit :
 
- Préférer des grep/rg ciblés (avec -l, -c, head) plutôt que des dumps massifs — tu le fais déjà via tes agents Explore qui lisent des extraits.
- Éviter de faire avaler à l'agent des sorties verbeuses inutiles.
 
Le vrai enseignement de l'article pour toi est plutôt méthodologique : se méfier des promesses « -90 % de tokens » qui comparent une seule commande au lieu de la facture réelle. Le levier qui compte vraiment sur ta facture, c'est le cache (cache_create/cache_read) et l'output, pas la compaction de sorties shell.


Message édité par jix le 26-06-2026 à 15:01:55

---------------
Finalement ça va bien s'passer ..
n°40429
joce
"BugHunter"
Posté le 26-06-2026 à 15:09:48  profilanswer
 

Pour le gain de headroom on est largement au delà des 3.7% (je suis plus autour de 37% pour le coup).  
RTK je suis plus dubitatif parce qu'effectivement souvent les agents voient que l'output est tronqué et passe par un Read non tronqué, donc au final tu consommes plus.
 
 
 


---------------
Try tamag0: Not an AI assistant. A team that thinks and learns together.
n°40452
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 26-06-2026 à 16:33:38  profilanswer
 

headroom + caveman c'est vraiment le top
RTK beaucoup moins même si ça aide un petit peu mais c'est bien plus limité


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°40453
XaTriX
Posté le 26-06-2026 à 16:34:11  profilanswer
 

url headroom ?


---------------
[:dawa]
n°40456
joce
"BugHunter"
Posté le 26-06-2026 à 16:34:44  profilanswer
 

XaTriX a écrit :

url headroom ?


https://github.com/chopratejas/headroom
 
c'est intégré dans tamag0, le build avec support codex arrive :D


---------------
Try tamag0: Not an AI assistant. A team that thinks and learns together.
n°40457
XaTriX
Posté le 26-06-2026 à 16:35:21  profilanswer
 

ce lobbying :o


---------------
[:dawa]
n°40459
XaTriX
Posté le 26-06-2026 à 16:36:10  profilanswer
 

abusé les artefacts claude
https://forumhfr.github.io/artifact [...] d-spacing/


---------------
[:dawa]
n°40465
joce
"BugHunter"
Posté le 26-06-2026 à 16:47:10  profilanswer
 
n°40493
memaster
M.arc a volé mon 62
Posté le 26-06-2026 à 21:40:20  profilanswer
 

j'ai installé un autre assistant ollama/phi3 sur une autre machine pour comparer.
c'étrange, mais les 2 assistants n'ont pas le même comportement.
 
il y en a un : mon premier est très coopératif dans ce que je lui demande,
du genre des infos sur le sys et des commandes à tapper pour résoudre tel ou tel pb.
notamment sur openclaw...
 
le 2nd : le plus jeune essaye de me vendre des tokens de cloud alors que je lui dis qu'il tourne en local.
il arrete pas de me repeter que c'est microsoft à distance qui gère ses réponses...
 
hallucinant :pt1cable:


---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster
n°40530
Nr13
Posté le 27-06-2026 à 08:00:09  profilanswer
 

joce a écrit :

Pour le gain de headroom on est largement au delà des 3.7% (je suis plus autour de 37% pour le coup).  
RTK je suis plus dubitatif parce qu'effectivement souvent les agents voient que l'output est tronqué et passe par un Read non tronqué, donc au final tu consommes plus.
 
 
 


 
Ha oui c'est une différence drastique là. Comment ça se fait?

n°40534
joce
"BugHunter"
Posté le 27-06-2026 à 08:38:44  profilanswer
 

Nr13 a écrit :


 
Ha oui c'est une différence drastique là. Comment ça se fait?


peut être la façon dont le bench a été fait, c'est pas de l'usage réel au final, il a sample 500 sessions et a fait des tests dessus. Mon hypothèse c'est que comme la compression de headroom n'est pas immédiate à se construire et qu'il y a un petit temps d'apprentissage, ca doit biaiser sa méthode de mesure.


---------------
Try tamag0: Not an AI assistant. A team that thinks and learns together.
 Page :   1  2
Page Suivante

Aller à :
Ajouter une réponse
 

Sujets relatifs
La communauté de l'IALes métiers disparus du fait de l'IA
liste des agrégateurs d'AI et apps d'IA Local:[Topic unique] Développement via IA
Le topic des agents IAOpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)
Les anti IAL'IA et ses implications sociétales : droit d'auteur, éthique, dérives
[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires 
Plus de sujets relatifs à : Communauté de l'IA


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)