Communauté de l'IA

Recherche :

Mot : Pseudo : Filtrer
Page : 1 2 Page Suivante Page Précédente Bas de page
Auteur	Sujet : Communauté de l'IA

XaTriX

Reprise du message précédent :
oui ?

---------------
[:dawa]

Bagdarion

jix a écrit :

Un truc qui serait vraiment cool sur ce topic, ce serait le partage des skillz et hooks "must have" de base pour tout projet de dev, avec quelques explications (pourquoi ne pas le mettre ça sur github), fait par l'élite HFR :sol:

Je pense à quelque chose de vraiment générique qui aiderait la communauté de ~~l'anneau~~ l'IA, made in HFR.

Il y a pleins de choses qui existent partout mais j'ai pas franchement confiance perso..

Ce serait super utile pour les gens non skillés (comme moi par exemple )

Edit : idem pour les configurations pour les IA, par ex config propre à Claude dans le JSON, etc..

J'aime bien l'idée également.
En revanche pour le moment je ne peux pas grandement aider car souvent je fais mes propres skills( why not )

J'utilise CAVEMAN au quotidien mais honnêtement je n'ai pas de mesures pour vérifier si j'y gagne réellement.

J'ai testé graphify et pour le coup je n'ai pas remarqué de gain, plutôt l'inverse même puisqu'il fallait régulièrement build/mettre à jour le graph

Message cité 1 fois
Message édité par Bagdarion le 24-06-2026 à 17:32:11

jix

Jar ar en Skaggig Svensk

ajoute un bouton "offre moi une bière" dans le github

---------------
Finalement ça va bien s'passer ..

jix

Jar ar en Skaggig Svensk

J'aimerais bien trouver un chatbot pour le faire le support de mon site, qu'on puisse adapter facilement à son propre contenu, vous pensez que ça existe en public sur github ?

Edit : bon, un peu tôt pour ça, on verra quand mon projet sera plus avancé, Glaude m'a gentiment dit qu'il ne fallait pas mettre l'huile avant le tournesol

Message édité par jix le 24-06-2026 à 19:47:17

---------------
Finalement ça va bien s'passer ..

memaster

M.arc a volé mon 62

drap

Message cité 1 fois

---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster

bulldozer_fusion

rip Mekthoub & Marc

memaster a écrit :

drap

Oui c'est pour quoi?

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

memaster

M.arc a volé mon 62

et bien ça yeah je cause avec mon ollama en local. [:e-te]
ce truc de fou :love:

---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster

memaster

M.arc a volé mon 62

Citation :

La commande nvidia-smi me donne comme driver le numero 450 et une cuda version de 11.0 et 4Go de vram. Est ce que ce sont des spécifications suffisantes pour vous?
Le Driver NVIDIA (numéro 450) et la CUDA Version (11.0) avec une quantité significative d'espace de mémoire vidéo apparentée à environ 4 Go sont des spécifications
solides qui devraient généralement permettre un fonctionnement fluide pour les applications exigeant le traitement par GPU, comme Ollama qui peut utiliser la CUDA
et nécessite une carte graphique performante. Toutefois, cela dépend aussi de la compatibilité exacte entre cette version NVIDIA avec votre modèle spécifique
d'appareil utilisateur final (par exemple un ordinateur portable ou une station de travail).

Pour vérifier si les spécifications sont suffisantes et s'assurer que le pilote fonctionne correctement, voici quelques étapes à considérer :
1. Essayez d'utiliser la commande `nvidia-smi` régulièrement pour surveiller l'état du GPU. Ceci peut vous aider à détecter des problèmes éventuels en temps réel ou
après avoir effectué certaines modifications de configurations.

2. Vérifiez que le pilote NVIDIA est complètement installé et mis à jour avec `sudo apt-get update` suivie par `sudo nvidia-smi`. Si une mise à niveau du driver est
recommandée, tentez d'installer la dernière version disponible pour votre modèle spécifique de carte graphique.

3. Pour les applications qui utilisent CUDA et GPU comme Ollama, vérifiez que le module CUDA n'est pas désactivé dans `/etc/modules` ou via `modprobe`. Si ce
dernier est nécessaire pour votre travail avec Ollama, assurez-vous qu’il s’exécute sans erreurs en utilisant les commandes pertinentes comme `lspci`, `nvidia-smi`,
et peut-être même la commande directe de l'application si possible.

4. Évaluez d'autres aspects matériels tels que le thermomètre du GPU, qui pourrait être un indicateur précoce potentiel de surcharge ou problèmes liés au
fonctionnement de votre carte graphique avec les applications spécifiques comme Ollama si elles sont exigeantes en termes d'utilisation.

5. Assurez-vous que le logiciel audio/vidéo dans Linux est correctement configuré pour afficher la sortie vidéo via VDPAU ou CUPS, surtout lors de l’exécution
directe depuis un terminal avec `xvfb` si nécessaire.

6. Si vous rencontrez toujours des problèmes après ces vérifications et optimisations, il serait judicieux d'envisager la création d'un environnement Linux virtuel
ou une session basée sur Docker pour isoler le logiciel Ollama de tout autre traitement parallèle qui peut affecter sa performance.

Il est recommandé que si vous n’arrivez pas à résoudre les problèmes avec ces étapes, il serait conseillé d'envisager une consultation technique supplémentaire ou
même un changement matériel pour assurer la compatibilité et le fonctionnement optimaux des applications graphiques.

Cela dit, gardez en tête que bien souvent, les performances sont également fortement dépendantes du logiciel associé à Ollama qui peut ne pas être entièrement
compatible avec toutes configurations matérielles ou logicielle spécifiques d'utilisateurs finaux, ce qui peut nécessiter une attention particulière et
potentiellement la recherche de solutions issues des forums communautaires spécialisés pour les systèmes Linux.

j'ai plus qu'à le config quelques part sur un dual nvidia.
j'avais une erreur avec openclaw, allors j'ai lancé ollama run phi3 et boum j'ai un assistant LLM qui fonctionne. [:e-te]

---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster

Nr13

Bagdarion a écrit :

J'aime bien l'idée également.
En revanche pour le moment je ne peux pas grandement aider car souvent je fais mes propres skills( why not )

J'utilise CAVEMAN au quotidien mais honnêtement je n'ai pas de mesures pour vérifier si j'y gagne réellement.

J'ai testé graphify et pour le coup je n'ai pas remarqué de gain, plutôt l'inverse même puisqu'il fallait régulièrement build/mettre à jour le graph

Pour la question sur caveman j'ai trouvé cette analyse intéressante: https://codepointer.substack.com/p/ [...] s-with-rtk
TLDR: ça fait bien ce que ça dit faire, mais selon ton usage (évidemment) en fait l'impact sur la conso/facture est.. faible.

XaTriX

Je n'ai pas vraiment confiance en des outils comme rtk ou caveman, je pense que le gain est nul, léger, voir négatif et que ça rajoute des contraintes et de l'incertitude sur les réponses des outils.
Il vaut mieux utiliser des outils plus performant que les verbeux classiques et savoir manager son contexte.

---------------
[:dawa]

jix

Jar ar en Skaggig Svensk

Ce que dit l'article

Attention au titre : l'article n'est pas une promo de RTK, c'est une enquête critique. L'auteur teste trois outils open-source (rtk, headroom, caveman) qui promettent de réduire la consommation de tokens LLM de 60-90 %… et démontre que dans la vraie vie le gain combiné est d'environ 3,7 % (et 0,5 % pour RTK seul).

RTK, c'est quoi

Un wrapper en ligne de commande qui intercepte les commandes shell avant exécution et compacte leur sortie avant que le modèle ne la lise.

- Fonctionne via un hook PreToolUse : git status devient rtk git status.
- Filtres spécialisés par type de commande (grep, git diff, git log, ls…) : déduplication, troncature, résumés.
- Exemple ls -la : 37 lignes avec permissions/propriétaire/dates → arbre compact + ligne "Summary: 23 files, 10 dirs (13 .md, 2 .json…)".
- Garde-fous : si le parsing échoue → sortie brute ; les diffs tronqués gardent un marqueur [full diff: rtk git diff --no-compact].

Promesses vs réalité
Promesse (microbench) Réel (replay de vraies sessions)
grep 99 % (ex. rg registerSingleton sur VS Code : 694k → 2,4k tokens) —
git diff 33-99 % —
Part réelle de la facture. 60-90 % 0,5 %

Pourquoi l'écart est énorme :

1 - Problème de dénominateur : la promesse divise par une seule commande ; la facture réelle se divise sur des centaines de tours.
2 - 78 % des tokens d'outils contournent RTK : ils passent par les outils natifs Read/Grep/Glob/WebFetch de Claude Code, qui n'appellent jamais le hook shell.
3 - Structure de prix : l'essentiel de la facture (42 % cache_create, 29 % output) ne touche jamais le flux de RTK ; les gains tombent sur les tokens les moins chers (cache_read, ~0,50 $/M contre 5-25 $/M).
4 - Les lectures de fichiers contiennent peu de redondance → les stratégies de dédup de RTK n'y mordent pas.

Risques

- Sécurité : le hook s'exécute sur le shell → une release compromise = exécution de commandes arbitraires, potentiellement invisible (headroom télécharge le binaire RTK automatiquement → exposition supply-chain).
- Perte de données silencieuse : la troncature peut couper un warning critique que l'agent avait demandé.
Conclusion de l'auteur : gains réels marginaux (~0,5 %) à mettre en balance avec le fait de donner à un binaire tiers un accès direct à ton shell. Pour la plupart des gens, le risque l'emporte sur le bénéfice.

Est-ce intéressant pour toi ?
Honnêtement, non — pas l'outil. Et c'est encore plus net dans ton cas que dans le cas générique de l'article :

- Tu utilises massivement les outils natifs (Read, Grep, Glob, les agents Explore/audits). Or c'est précisément ce flux (les 78 %) que RTK ne touche pas. Le gain serait encore plus proche de zéro que la moyenne.
- Sécurité : tu bosses sur une app en prod avec des PII réelles (cf. tes mémos sur les audits-secrets/PII). Greffer un binaire à hook shell téléchargé automatiquement, c'est exactement le type de dette que tes propres garde-fous (audit-secrets, audit-3rd-party, supply-chain) sont censés éviter. Mauvais ratio.
- Tu as déjà 35+ hooks PreToolUse très réglés. Ajouter un wrapper qui ré-écrit tes commandes shell crée un risque de collision/effets de bord avec ton tooling existant, pour un gain de ~0,5 %.

Ce qui est récupérable, en revanche, c'est l'idée — pas le produit :

- Préférer des grep/rg ciblés (avec -l, -c, head) plutôt que des dumps massifs — tu le fais déjà via tes agents Explore qui lisent des extraits.
- Éviter de faire avaler à l'agent des sorties verbeuses inutiles.

Le vrai enseignement de l'article pour toi est plutôt méthodologique : se méfier des promesses « -90 % de tokens » qui comparent une seule commande au lieu de la facture réelle. Le levier qui compte vraiment sur ta facture, c'est le cache (cache_create/cache_read) et l'output, pas la compaction de sorties shell.

Message édité par jix le 26-06-2026 à 15:01:55

---------------
Finalement ça va bien s'passer ..

joce

"BugHunter"

Pour le gain de headroom on est largement au delà des 3.7% (je suis plus autour de 37% pour le coup).
RTK je suis plus dubitatif parce qu'effectivement souvent les agents voient que l'output est tronqué et passe par un Read non tronqué, donc au final tu consommes plus.

Message cité 1 fois

---------------
Try tamag0: Turn your company AI-native

bulldozer_fusion

rip Mekthoub & Marc

headroom + caveman c'est vraiment le top
RTK beaucoup moins même si ça aide un petit peu mais c'est bien plus limité

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

XaTriX

url headroom ?

---------------
[:dawa]

joce

"BugHunter"

XaTriX a écrit :

url headroom ?

https://github.com/chopratejas/headroom

c'est intégré dans tamag0, le build avec support codex arrive

---------------
Try tamag0: Turn your company AI-native

XaTriX

ce lobbying

Message cité 1 fois

---------------
[:dawa]

XaTriX

abusé les artefacts claude
https://forumhfr.github.io/artifact [...] d-spacing/

---------------
[:dawa]

joce

"BugHunter"

XaTriX a écrit :

ce lobbying

grave

---------------
Try tamag0: Turn your company AI-native

memaster

M.arc a volé mon 62

j'ai installé un autre assistant ollama/phi3 sur une autre machine pour comparer.
c'étrange, mais les 2 assistants n'ont pas le même comportement.

il y en a un : mon premier est très coopératif dans ce que je lui demande,
du genre des infos sur le sys et des commandes à tapper pour résoudre tel ou tel pb.
notamment sur openclaw...

le 2nd : le plus jeune essaye de me vendre des tokens de cloud alors que je lui dis qu'il tourne en local.
il arrete pas de me repeter que c'est microsoft à distance qui gère ses réponses...

hallucinant :pt1cable:

Message cité 1 fois

---------------
ma conduite intérieure .:R | memaster pilote officiel de la HFR Badoit-Auchan F1 Team | zéro tracas, zéro blabla MMa.ster

Nr13

joce a écrit :

Ha oui c'est une différence drastique là. Comment ça se fait?

Message cité 1 fois

joce

"BugHunter"

Nr13 a écrit :

Ha oui c'est une différence drastique là. Comment ça se fait?

peut être la façon dont le bench a été fait, c'est pas de l'usage réel au final, il a sample 500 sessions et a fait des tests dessus. Mon hypothèse c'est que comme la compression de headroom n'est pas immédiate à se construire et qu'il y a un petit temps d'apprentissage, ca doit biaiser sa méthode de mesure.

---------------
Try tamag0: Turn your company AI-native

Page : 1 2

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Intelligence Artificielle

Communauté de l'IA

Sujets relatifs
La communauté de l'IA	Les métiers disparus du fait de l'IA
liste des agrégateurs d'AI et apps d'IA Local:	[Topic unique] Développement via IA
Le topic des agents IA	OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)
Les anti IA	L'IA et ses implications sociétales : droit d'auteur, éthique, dérives
[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires
Plus de sujets relatifs à : Communauté de l'IA

Page générée en 0.066 secondes