[Topic unique] Développement via IA

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 6 .. 42 43 44 45 46 47 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic unique] Développement via IA

the_fennec

f3nn3cUs z3rd4

Reprise du message précédent :

jo la pate a écrit :

J'ai pas vu passer opencode sur ce topic
https://github.com/anomalyco/opencode

Je l'utilise depuis quelques mois et c'est plutôt pas mal

Concernant les providers, j'utilise aussi Chutes.ai et Synthetic.new, c'est pas mal aussi

Je viens de tester avec mon llama local, ça marche mais c'est très épuré Et il s’embête pas trop avec les autorisations pour faire des trucs :lol: .

---------------
Faudra que je teste un jour :o

bulldozer_fusion

rip Mekthoub & Marc

En parlant de ça, on aura peut être qwen 3.5 cette semaine

Message édité par bulldozer_fusion le 15-02-2026 à 22:18:53

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

jo la pate

the_fennec a écrit :

Je viens de tester avec mon llama local, ça marche mais c'est très épuré Et il s’embête pas trop avec les autorisations pour faire des trucs :lol: .

Pour les autorisations, ça se config sur le opencode.json, ou fichiers d'agents

the_fennec

f3nn3cUs z3rd4

jo la pate a écrit :

Pour les autorisations, ça se config sur le opencode.json, ou fichiers d'agents

Merci, mais je vais pas l'utiliser, je testais juste pour voir. Trop différent de ce que j'utilise tous les jours (IntelliJ/Kiro/Cursor/VSCode).

---------------
Faudra que je teste un jour :o

bulldozer_fusion

rip Mekthoub & Marc

bulldozer_fusion a écrit :

En parlant de ça, on aura peut être qwen 3.5 cette semaine

Dispo

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

XaTriX

Et c'est bien ça comme situation Qwen 3.5 ?

---------------
[:dawa]

speedboyz30

Guide Michelin :o

XaTriX a écrit :

Et c'est bien ça comme situation Qwen 3.5 ?

:lol:

kaloskagatos

the_fennec a écrit :

Petit success du WE

En partant de ce post sur Qwen3-Coder-Next, j'ai réussi a avoir un modèle local pour coder qui est "utilisable":
https://old.reddit.com/r/LocalLLaMA [...] lm_to_use/
modèle: https://huggingface.co/noctrex/Qwen [...] 4_MOE-GGUF

Ma config est une VM Windows Server avec 32GB RAM et une RTX 4060Ti 16GB VRAM sur le dernier llama.cpp + cudart 13.1:

Code :

llama-server -m Qwen3-Coder-Next-REAP-48B-A3B-MXFP4_MOE.gguf --host 0.0.0.0 --port 8080 -fa on -ctk q8_0 -ctv q8_0 -c 131072 -n 131072 --temp 1.0 --top-k 40 --top-p 0.95 --min-p 0.01 --jinja -t 8 -ncmoe 32 --cache-reuse 256 --backend-sampling

J'ai juste passé ncmoe de 46 a 32, sans ça j'avais que 7GB de VRAM de pris. J'imagine que ça permet de tourner avec juste 8GB de VRAM! Par contre il bouffe bien les 32GB de RAM.

J'ai ensuite un VScode avec ROO CODE et ça marche pas mal. Le premier démarrage est un peu long, 2/3 minutes, mais ensuite les temps de réponse sont très corrects. J'ai 130k de contexte, et il se débrouille, il est parti en boucle une ou deux fois, il faut le guider un peu, mais pour le prix ça le fait bien! Je pense que c'est tout a fait utilisable en local pour du dev. Je lui ait fait fixer des tests d'intégration sur un petit projet Java, un tunnel POP3/IMAP pour quand GMail va virer le pop de compte, et ça à marché. J'imagine que Cursor/Kiro aurait torché ça 10x plus vite, mais pas au même prix .

ncmoe c'est quoi ? J'ai bien trouvé quelques trucs mais je vois pas la doc officielle. C'est lié à un nombre de couches chargées ou offloadées ? Une idée si ça existe sur ollama ? llamacpp c'est meilleur que ollama ?

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »

XaTriX

Bon Claude Code qui trouve plus mon nav chrome et son extension
Pourtant marqué comme connecté via /chrome
J'ai changé de session Chrome pour lui donner un profil à lui et pas polluer mon perso, après j'utilise FF mais bon.

Je capte pas comment le reconnect [:transparency]

---------------
[:dawa]

XaTriX

bug aussi si je --resume avec une conversation que j'ai nommé
spasse rien, la moitié des commandes donnent rien o_O

---------------
[:dawa]

the_fennec

f3nn3cUs z3rd4

kaloskagatos a écrit :

--ncmoe (ou --n-cpu-moe) c'est effectivement le nombre de couches Mixture-of-Experts a envoyer au CPU, donc ça contrôle le ratio de RAM utilisé entre RAM et VRAM.

Je sais pas si l'option existe sur ollama.

Ollama est un wrapper de llamacpp avec des bidules en plus, je l'ai pas trop utilisé, mais j'ai souvent lu (sur Reddit) que ça servait a rien et qu'il valait mieux utiliser llamacpp directement. Je trouve effectivement que c'est mieux que LMStudio (au moins), et que je trouve souvent des settings ou des fix qui existent pas ailleurs que dans llamacpp.

---------------
Faudra que je teste un jour :o

kaloskagatos

OK merci. Ollama c'est assez pratique car j'utilise un gpu en remote, mais je me suis pas penché sur llamacpp. Faudra que je regarde si c'est aussi facile de pull un modèle et exposer des api, ou si les perf sont meilleures.

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »

the_fennec

f3nn3cUs z3rd4

kaloskagatos a écrit :

Lamacpp a un UI très simple mais c'est juste pour le chat, tu peux pas lui demander de charger un modèle a la volée. Il y a le paramètre -hf pour DL un modèle, mais je l'ai jamais utilisé.
https://github.com/ggml-org/llama.c [...] ols/server

J'ai tout dans une VM (Esxi) avec le GPU en passthrough, mais le RDP aide bien pour ça.

Message édité par the_fennec le 16-02-2026 à 17:06:08

---------------
Faudra que je teste un jour :o

XaTriX

Me reste un ou deux slots Claude Team à 6€80 le mois (règlement biannuel), si ça interesse du monde

---------------
[:dawa]

speedboyz30

Guide Michelin :o

XaTriX a écrit :

Me reste un ou deux slots Claude Team à 6€80 le mois (règlement biannuel), si ça interesse du monde

Alors les quotas te semblent meilleurs que le mode pro?

XaTriX

Ils annoncent +25%, c'est pas facile de voir la différence

---------------
[:dawa]

speedboyz30

Guide Michelin :o

D'ailleurs un seat c'est pas 20$ ? Comment tu t'y retrouves à 6.80?

XaTriX

[:18e:2]

---------------
[:dawa]

speedboyz30

Guide Michelin :o

Ah oui je me souviens

MP sur le process ?

XaTriX

Envoi

---------------
[:dawa]

kaloskagatos

Excellents plugins (/plugin) dans Claude Code :

Ce skill analyse le repo et propose des skills/MCP adaptés au projet, et m'a proposé de créer des skills suite aux discussions précédentes :
https://claude.com/plugins/claude-code-setup

Ce skill fait un audit de CLAUDE.md
https://claude.com/plugins/claude-md-management

Message édité par kaloskagatos le 17-02-2026 à 15:45:46

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »

bulldozer_fusion

rip Mekthoub & Marc

kaloskagatos a écrit :

Excellents plugins (/plugin) dans Claude Code :

Ce skill analyse le repo et propose des skills/MCP adaptés au projet, et m'a proposé de créer des skills suite aux discussions précédentes :
https://claude.com/plugins/claude-code-setup

Ce skill fait un audit de CLAUDE.md
https://claude.com/plugins/claude-md-management

[:implosion du tibia]

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

XaTriX

kaloskagatos a écrit :

Excellents plugins (/plugin) dans Claude Code :

Ce skill analyse le repo et propose des skills/MCP adaptés au projet, et m'a proposé de créer des skills suite aux discussions précédentes :
https://claude.com/plugins/claude-code-setup

Ce skill fait un audit de CLAUDE.md
https://claude.com/plugins/claude-md-management

abusé
je prend

---------------
[:dawa]

ionik

kaloskagatos a écrit :

Merci pour l'info je test

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR

XaTriX

---------------
[:dawa]

XaTriX

XaTriX a écrit :

J'ai testé rtk pour la réduction de token, pas encore assez convaincu mais je continue avec.
* Il agit que sur les tokens "in", chez moi c'est 1 tiers des tokens consommés, le reste étant les "out" bien sur.
* Opus 4.6 c'est un truc genre 5$/m token en in et 25$ en out. Donc sur une base 1m je consomme 50$ d'out et 5$ d'in. Et sur ce total je peux économiser disons 50% du in. Donc sur une facture à 55$ je peux économiser 2.5$, euh ..
* Quelques bugs, j'ai noté celui avec `find` dont il prend pas en argument "--name" et bug.
* On peut tout passer par rtk et si c'est pas pris en compte par rtk il passe les arguments à la commande, normalement c'est transparent => source de bug en tout genre
* L'output est trop tronqué pour git log par exemple, peut être que CC s'adapte et demande en conséquence mais ça coupe carrément le nom du commit, donc exit les commentaires en plus, c'est à prendre en compte.
* pareil pour ls `ls -al` filtre aussi donc le time, owner, group, .. pourquoi pas mais un changement de comportement sur ce genre d'outils c'est un coup à perdre CC en route

J'ai posté ça topic LLM mais ça aurait peut être plutôt sa place ici. Faut que ce topic soit plus actif que je prennele reflexe d'y poster

* Sinon on peut mettre Claude Code dans le titre pour attirer du monde

* Autre demande: dans votre AGENTS.md ou CLAUDE.md pour les trucs de base vous avez un kickstarter, fin un truc de base réutilisable ? Pareil pour les skills.
Le but serait d'éviter de rencontrer des merdes et les régler au fur et à mesure.

Par exemple là j'ai fait trimer une session sur un audit d'une partie d'un "petit" projet et questions sur les paradigmes mais il a pas vu que le repo remote était à jour et que j'avais déjà bossé sur une partie des changements.. :fou:
Donc ajout dans CLAUDE.md mais bon fait chier, fleme de perdre du temps avec ça

---------------
[:dawa]

SekYo

XaTriX a écrit :

Donc ajout dans CLAUDE.md mais bon fait chier, fleme de perdre du temps avec ça

Je suis pas convaincu qu'avoir des templates pour le Claude.md soit une bonne chose en vrai. T'as pleins de retours de mecs sur le net qui chouinent parce que Claude prend pas en compte les instructions dans le Claude.md, mais quand tu creuses souvent leur doc fais plusieurs pages.
Pour mes deux "gros projets", mes deux Claude.md font respectivement 25 et 80 lignes, en incluant les sauts de lignes.
Je suis parti sur un truc vraiment light genre:
1/ Stack: quelques lignes avec les conventions de codes ou tools à utiliser en fonction des langages (genre `uv` pour Python, sinon Claude avait tendance à directement utiliser `pip`)
2/ Workflow: checkout main, création de branche, PR

Et au début c'est tout. Puis après j'ajoute pour corriger les erreurs fréquentes qu'il fait. Genre des fois il essaye de lancer des commandes `sudo`, forcément il y arrive pas, donc je lui ait dit que pour ça je les executent à la main.

Pour rtk je vais peut être tester, parce que avec l'abonnement CC tu n'as accès que à 200k tokens de contexte avec Opus (et pas 500 ou 1M comme avec l'API) et du coup moi c'est souvent ça qui me limite dans les taches un peu complexes.

XaTriX

Je crois que tu peux accéder au contexte 1M mais facturation en sus du quota ?
Essaie /model sonnet[1m]
=> Ok je viens de tester, ça m'envoie chier, certainement parce que j'ai bloqué la facturation en sus (sur mon autre compte j'avais du dollar en plus, c'était accepté).

En fait, je pensais aussi à un générateur de CLAUDE.md, choisir/cocher ce qui nous interesse, etc. Tout en essayant de faire sobre. C'est bien sur difficile mais perdre du temps et des token sur des erreurs de base, c'est chiant.

Pour le contexte faible, regarde avec /context et chez moi ce qui bouffait c'était Messages (genre 50%) et les MCP chargés inutilement.
Tu peux te faire un skill pour compacter plus tôt. Et /compact toi même sinon, ça te redonne de la marge pour le contexte.

Sinon je crois que le 500k n'est disponible qu'en version Entreprise

---------------
[:dawa]

bulldozer_fusion

rip Mekthoub & Marc

En fait avec la version Claude que tu as, t'as accès à quoi?

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

XaTriX

Tous les modèles :sol: mais en 200k

---------------
[:dawa]

XaTriX

Je vais regrouper mes sessions de CC aussi, elles sont dispersées sur plusieurs PC et c'est relou.
Au finall ssh/tmux vers une box/un pc et basta tout depuis là.
Voir même une VM/VPS en ligne, de toute façon ça bosse pas sans le net.

---------------
[:dawa]

bulldozer_fusion

rip Mekthoub & Marc

XaTriX a écrit :

Tous les modèles :sol: mais en 200k

Je pensais qu'en payant ça montait jusqu'à 500

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

XaTriX

bulldozer_fusion a écrit :

Je pensais qu'en payant ça montait jusqu'à 500

Il me semble uniquement avec Claude Entreprise. Sauf avec l'extra-usage je suppose.

Message édité par XaTriX le 01-03-2026 à 19:39:15

---------------
[:dawa]

bulldozer_fusion

rip Mekthoub & Marc

XaTriX a écrit :

Il me semble uniquement avec Claude Entreprise. Sauf avec l'extra-usage je suppose.

Ah ouais ok

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

SekYo

XaTriX a écrit :

Pour le contexte faible, regarde avec /context et chez moi ce qui bouffait c'était Messages (genre 50%) et les MCP chargés inutilement.
Tu peux te faire un skill pour compacter plus tôt. Et /compact toi même sinon, ça te redonne de la marge pour le contexte./

J'ai 0 MCP (et un seul Skill custom) et j'ai désactivé le truc qui réserve 10 ou 15% du context pour le compactage, donc t’inquiète que en outils built in, j'ai déjà optimisé tout ce que je pouvais, c'est pour ça que des outils comme rtk me font de l'oeil

XaTriX a écrit :

Je crois que tu peux accéder au contexte 1M mais facturation en sus du quota ?
Essaie /model sonnet[1m]
=> Ok je viens de tester, ça m'envoie chier,

C'est pour des projets persos, c'est pas ma boite qui paie, jamais je paye au token
J'avais des crédits openrouteur, j'ai voulu tester Codex/GPT 5.2High une fois, en 2 taches il m'avait cramé pour ~10 dollars. Faut être millionnaire (ou dev 2h une fois tous les 3 mois) pour payer à l'API sans un abonnement

XaTriX

tu peux faire du batch et caching via api pour éco
prend un mois d'essais a gpt avec une ip neerlandaise et teste codex

---------------
[:dawa]

fabien

Vive la super 5 !

vous procéder comment pour tester les llm pour le dev et savoir lequel est meilleur ? 2 fois le même projet/parti de projet ?
Claude est réputé pour le code, mais peut être qu'un autre est spécialisée design a partir d'un screen.

---------------
✈ Découvre le HFRcoin ✈ - smilies ♥

ionik

XaTriX a écrit :

tu peux faire du batch et caching via api pour éco
prend un mois d'essais a gpt avec une ip neerlandaise et teste codex

ça change quoi l'ip néerlandaise

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR

XaTriX

le mois gratuit

---------------
[:dawa]

ionik

Tiens je viens de voir que je suis passé sur le contexte 1M sur Opus alors que je n'ai rien changé.

Abo Max

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR

XaTriX

Max 5 ou 20 ?

---------------
[:dawa]

Page : 1 2 3 4 5 6 .. 42 43 44 45 46 47

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Intelligence Artificielle

[Topic unique] Développement via IA

Sujets relatifs
Le topic des agents IA	[Topic Unique] Machine Learning & Data Science
OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)	Les anti IA
L'IA et ses implications sociétales : droit d'auteur, éthique, dérives	[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires
Les images/vidéos générées en IA: Midjourney Dall-e StableDiffusion...	[Topic Unique] Claude by Anthropic
Infra IA : aide au choix et troubleshot de LLM locaux
Plus de sujets relatifs à : [Topic unique] Développement via IA

Page générée en 0.055 secondes