Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2169 connectés 

 


 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  6  ..  39  40  41  42  43  44
Auteur Sujet :

[Topic unique] Développement via IA

n°36053
the_fennec
f3nn3cUs z3rd4
Posté le 15-02-2026 à 22:18:24  profilanswer
 

Reprise du message précédent :

jo la pate a écrit :

J'ai pas vu passer opencode sur ce topic  
https://github.com/anomalyco/opencode
 
Je l'utilise depuis quelques mois et c'est plutôt pas mal  :O
 
Concernant les providers, j'utilise aussi Chutes.ai et Synthetic.new, c'est pas mal aussi


 
Je viens de tester avec mon llama local, ça marche mais c'est très épuré :o Et il s’embête pas trop avec les autorisations pour faire des trucs :lol:.


---------------
Faudra que je teste un jour :o
n°36054
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 15-02-2026 à 22:18:44  profilanswer
 

En parlant de ça, on aura peut être qwen 3.5 cette semaine


Message édité par bulldozer_fusion le 15-02-2026 à 22:18:53

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36055
jo la pate
Posté le 16-02-2026 à 09:12:26  profilanswer
 

the_fennec a écrit :

 

Je viens de tester avec mon llama local, ça marche mais c'est très épuré :o Et il s’embête pas trop avec les autorisations pour faire des trucs :lol:.


Pour les autorisations, ça se config sur le opencode.json, ou fichiers d'agents

n°36056
the_fennec
f3nn3cUs z3rd4
Posté le 16-02-2026 à 09:43:46  profilanswer
 

jo la pate a écrit :


Pour les autorisations, ça se config sur le opencode.json, ou fichiers d'agents


 
Merci, mais je vais pas l'utiliser, je testais juste pour voir. Trop différent de ce que j'utilise tous les jours (IntelliJ/Kiro/Cursor/VSCode).


---------------
Faudra que je teste un jour :o
n°36057
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 16-02-2026 à 10:08:18  profilanswer
 

bulldozer_fusion a écrit :

En parlant de ça, on aura peut être qwen 3.5 cette semaine


https://rehost.diberie.com/Picture/Get/r/490841
Dispo  :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36058
XaTriX
Posté le 16-02-2026 à 10:12:28  profilanswer
 

Et c'est bien ça comme situation Qwen 3.5 ? :o


---------------
[:dawa]
n°36059
speedboyz3​0
Guide Michelin :o
Posté le 16-02-2026 à 10:39:26  profilanswer
 

XaTriX a écrit :

Et c'est bien ça comme situation Qwen 3.5 ? :o


 
 :lol:

n°36060
kaloskagat​os
Posté le 16-02-2026 à 12:17:26  profilanswer
 

the_fennec a écrit :

Petit success du WE :D
 
En partant de ce post sur Qwen3-Coder-Next, j'ai réussi a avoir un modèle local pour coder qui est "utilisable":
https://old.reddit.com/r/LocalLLaMA [...] lm_to_use/
modèle: https://huggingface.co/noctrex/Qwen [...] 4_MOE-GGUF
 
Ma config est une VM Windows Server avec 32GB RAM et une RTX 4060Ti 16GB VRAM sur le dernier llama.cpp + cudart 13.1:

Code :
  1. llama-server -m Qwen3-Coder-Next-REAP-48B-A3B-MXFP4_MOE.gguf --host 0.0.0.0 --port 8080 -fa on -ctk q8_0 -ctv q8_0 -c 131072 -n 131072 --temp 1.0 --top-k 40 --top-p 0.95 --min-p 0.01 --jinja -t 8 -ncmoe 32 --cache-reuse 256 --backend-sampling


 
J'ai juste passé ncmoe de 46 a 32, sans ça j'avais que 7GB de VRAM de pris. J'imagine que ça permet de tourner avec juste 8GB de VRAM! Par contre il bouffe bien les 32GB de RAM.
 
J'ai ensuite un VScode avec ROO CODE et ça marche pas mal. Le premier démarrage est un peu long, 2/3 minutes, mais ensuite les temps de réponse sont très corrects. J'ai 130k de contexte, et il se débrouille, il est parti en boucle une ou deux fois, il faut le guider un peu, mais pour le prix ça le fait bien! Je pense que c'est tout a fait utilisable en local pour du dev. Je lui ait fait fixer des tests d'intégration sur un petit projet Java, un tunnel POP3/IMAP pour quand GMail va virer le pop de compte, et ça à marché. J'imagine que Cursor/Kiro aurait torché ça 10x plus vite, mais pas au même prix :o.
 


 
 
ncmoe c'est quoi ? J'ai bien trouvé quelques trucs mais je vois pas la doc officielle. C'est lié à un nombre de couches chargées ou offloadées ? Une idée si ça existe sur ollama ? llamacpp c'est meilleur que ollama ?


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°36061
XaTriX
Posté le 16-02-2026 à 13:09:50  profilanswer
 

Bon Claude Code qui trouve plus mon nav chrome et son extension :/
Pourtant marqué comme connecté via /chrome
J'ai changé de session Chrome pour lui donner un profil à lui et pas polluer mon perso, après j'utilise FF mais bon.
 
Je capte pas comment le reconnect [:transparency]


---------------
[:dawa]
n°36062
XaTriX
Posté le 16-02-2026 à 13:18:09  profilanswer
 

https://i.imgur.com/5eZVgQ5.png
 
bug aussi si je --resume avec une conversation que j'ai nommé
spasse rien, la moitié des commandes donnent rien o_O


---------------
[:dawa]
n°36063
the_fennec
f3nn3cUs z3rd4
Posté le 16-02-2026 à 15:07:02  profilanswer
 

kaloskagatos a écrit :


ncmoe c'est quoi ? J'ai bien trouvé quelques trucs mais je vois pas la doc officielle. C'est lié à un nombre de couches chargées ou offloadées ? Une idée si ça existe sur ollama ? llamacpp c'est meilleur que ollama ?


 
--ncmoe (ou --n-cpu-moe) c'est effectivement le nombre de couches Mixture-of-Experts a envoyer au CPU, donc ça contrôle le ratio de RAM utilisé entre RAM et VRAM.
 
Je sais pas si l'option existe sur ollama.
 
Ollama est un wrapper de llamacpp avec des bidules en plus, je l'ai pas trop utilisé, mais j'ai souvent lu (sur Reddit) que ça servait a rien et qu'il valait mieux utiliser llamacpp directement. Je trouve effectivement que c'est mieux que LMStudio (au moins), et que je trouve souvent des settings ou des fix qui existent pas ailleurs que dans llamacpp.


---------------
Faudra que je teste un jour :o
n°36064
kaloskagat​os
Posté le 16-02-2026 à 15:49:38  profilanswer
 

OK merci. Ollama c'est assez pratique car j'utilise un gpu en remote, mais je me suis pas penché sur llamacpp. Faudra que je regarde si c'est aussi facile de pull un modèle et exposer des api, ou si les perf sont meilleures.


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°36065
the_fennec
f3nn3cUs z3rd4
Posté le 16-02-2026 à 17:04:26  profilanswer
 

kaloskagatos a écrit :

OK merci. Ollama c'est assez pratique car j'utilise un gpu en remote, mais je me suis pas penché sur llamacpp. Faudra que je regarde si c'est aussi facile de pull un modèle et exposer des api, ou si les perf sont meilleures.


 
Lamacpp a un UI très simple mais c'est juste pour le chat, tu peux pas lui demander de charger un modèle a la volée. Il y a le paramètre -hf pour DL un modèle, mais je l'ai jamais utilisé.
https://github.com/ggml-org/llama.c [...] ols/server
 
J'ai tout dans une VM (Esxi) avec le GPU en passthrough, mais le RDP aide bien pour ça.


Message édité par the_fennec le 16-02-2026 à 17:06:08

---------------
Faudra que je teste un jour :o
n°36066
XaTriX
Posté le 17-02-2026 à 09:35:48  profilanswer
 

Me reste un ou deux slots Claude Team à 6€80 le mois (règlement biannuel), si ça interesse du monde :o


---------------
[:dawa]
n°36067
speedboyz3​0
Guide Michelin :o
Posté le 17-02-2026 à 09:51:14  profilanswer
 

XaTriX a écrit :

Me reste un ou deux slots Claude Team à 6€80 le mois (règlement biannuel), si ça interesse du monde :o


 
Alors les quotas te semblent meilleurs que le mode pro?

n°36068
XaTriX
Posté le 17-02-2026 à 09:53:44  profilanswer
 

Ils annoncent +25%, c'est pas facile de voir la différence :o


---------------
[:dawa]
n°36069
speedboyz3​0
Guide Michelin :o
Posté le 17-02-2026 à 10:00:35  profilanswer
 

D'ailleurs un seat c'est pas 20$ ? Comment tu t'y retrouves à 6.80?

n°36070
XaTriX
Posté le 17-02-2026 à 10:01:29  profilanswer
 

[:18e:2]


---------------
[:dawa]
n°36071
speedboyz3​0
Guide Michelin :o
Posté le 17-02-2026 à 10:19:08  profilanswer
 

Ah oui je me souviens :o
 
MP sur le process ? :o

n°36072
XaTriX
Posté le 17-02-2026 à 12:22:19  profilanswer
 

Envoi :o


---------------
[:dawa]
n°36073
kaloskagat​os
Posté le 17-02-2026 à 15:26:58  profilanswer
 

Excellents plugins (/plugin) dans Claude Code :

 

Ce skill analyse le repo et propose des skills/MCP adaptés au projet, et m'a proposé de créer des skills suite aux discussions précédentes :
https://claude.com/plugins/claude-code-setup

 


Ce skill fait un audit de CLAUDE.md
https://claude.com/plugins/claude-md-management


Message édité par kaloskagatos le 17-02-2026 à 15:45:46

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°36074
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 17-02-2026 à 16:46:27  profilanswer
 

kaloskagatos a écrit :

Excellents plugins (/plugin) dans Claude Code :

 

Ce skill analyse le repo et propose des skills/MCP adaptés au projet, et m'a proposé de créer des skills suite aux discussions précédentes :
https://claude.com/plugins/claude-code-setup

 


Ce skill fait un audit de CLAUDE.md
https://claude.com/plugins/claude-md-management


 [:implosion du tibia]


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36075
XaTriX
Posté le 17-02-2026 à 18:09:00  profilanswer
 

kaloskagatos a écrit :

Excellents plugins (/plugin) dans Claude Code :
 
Ce skill analyse le repo et propose des skills/MCP adaptés au projet, et m'a proposé de créer des skills suite aux discussions précédentes :
https://claude.com/plugins/claude-code-setup
 
 
Ce skill fait un audit de CLAUDE.md
https://claude.com/plugins/claude-md-management


abusé
je prend


---------------
[:dawa]
n°36076
ionik
Posté le 17-02-2026 à 18:29:48  profilanswer
 

kaloskagatos a écrit :

Excellents plugins (/plugin) dans Claude Code :
 
Ce skill analyse le repo et propose des skills/MCP adaptés au projet, et m'a proposé de créer des skills suite aux discussions précédentes :
https://claude.com/plugins/claude-code-setup
 
 
Ce skill fait un audit de CLAUDE.md
https://claude.com/plugins/claude-md-management


Merci pour l'info je test


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°36077
XaTriX
Posté le 19-02-2026 à 12:51:39  profilanswer
 

https://rehost.diberie.com/Picture/Get/r/491689


---------------
[:dawa]
n°36078
XaTriX
Posté le 01-03-2026 à 17:20:59  profilanswer
 

XaTriX a écrit :

J'ai testé rtk pour la réduction de token, pas encore assez convaincu mais je continue avec.
* Il agit que sur les tokens "in", chez moi c'est 1 tiers des tokens consommés, le reste étant les "out" bien sur.
    * Opus 4.6 c'est un truc genre 5$/m token en in et 25$ en out. Donc sur une base 1m je consomme 50$ d'out et 5$ d'in. Et sur ce total je peux économiser disons 50% du in. Donc sur une facture à 55$ je peux économiser 2.5$, euh .. :o
* Quelques bugs, j'ai noté celui avec `find` dont il prend pas en argument "--name" et bug.
* On peut tout passer par rtk et si c'est pas pris en compte par rtk il passe les arguments à la commande, normalement c'est transparent => source de bug en tout genre
* L'output est trop tronqué pour git log par exemple, peut être que CC s'adapte et demande en conséquence mais ça coupe carrément le nom du commit, donc exit les commentaires en plus, c'est à prendre en compte.
    * pareil pour ls `ls -al` filtre aussi donc le time, owner, group, .. pourquoi pas mais un changement de comportement sur ce genre d'outils c'est un coup à perdre CC en route


J'ai posté ça topic LLM mais ça aurait peut être plutôt sa place ici. Faut que ce topic soit plus actif que je prennele reflexe d'y poster :o
 
* Sinon on peut mettre Claude Code dans le titre pour attirer du monde :o :o
 
* Autre demande: dans votre AGENTS.md ou CLAUDE.md pour les trucs de base vous avez un kickstarter, fin un truc de base réutilisable ? Pareil pour les skills.
Le but serait d'éviter de rencontrer des merdes et les régler au fur et à mesure.
 
Par exemple là j'ai fait trimer une session sur un audit d'une partie d'un "petit" projet et questions sur les paradigmes mais il a pas vu que le repo remote était à jour et que j'avais déjà bossé sur une partie des changements.. :fou:
Donc ajout dans CLAUDE.md mais bon fait chier, fleme de perdre du temps avec ça
 


---------------
[:dawa]
n°36079
SekYo
Posté le 01-03-2026 à 17:32:25  profilanswer
 

XaTriX a écrit :


Donc ajout dans CLAUDE.md mais bon fait chier, fleme de perdre du temps avec ça


Je suis pas convaincu qu'avoir des templates pour le Claude.md soit une bonne chose en vrai. T'as pleins de retours de mecs sur le net qui chouinent parce que Claude prend pas en compte les instructions dans le Claude.md, mais quand tu creuses souvent  leur doc fais plusieurs pages.
Pour mes deux "gros projets", mes deux Claude.md font respectivement 25 et 80 lignes, en incluant les sauts de lignes.
Je suis parti sur un truc vraiment light genre:
1/ Stack: quelques lignes avec les conventions de codes ou tools à utiliser en fonction des langages (genre `uv` pour Python, sinon Claude avait tendance à directement utiliser `pip`)
2/ Workflow: checkout main, création  de branche, PR
 
Et au début c'est tout. Puis après j'ajoute pour corriger les erreurs fréquentes qu'il fait. Genre des fois il essaye de lancer des commandes `sudo`, forcément il y arrive pas, donc je lui ait dit que pour ça je les executent à la main.
 
 
Pour rtk je vais peut être tester, parce que avec l'abonnement CC tu n'as accès que à 200k tokens de contexte avec Opus (et pas 500 ou 1M comme avec l'API) et du coup moi c'est souvent ça qui me limite dans les taches un peu complexes.

n°36080
XaTriX
Posté le 01-03-2026 à 17:46:02  profilanswer
 

Je crois que tu peux accéder au contexte 1M mais facturation en sus du quota ?
Essaie /model sonnet[1m]
=> Ok je viens de tester, ça m'envoie chier, certainement parce que j'ai bloqué la facturation en sus (sur mon autre compte j'avais du dollar en plus, c'était accepté).
 
En fait, je pensais aussi à un générateur de CLAUDE.md, choisir/cocher ce qui nous interesse, etc. Tout en essayant de faire sobre. C'est bien sur difficile mais perdre du temps et des token sur des erreurs de base, c'est chiant.
 
Pour le contexte faible, regarde avec /context et chez moi ce qui bouffait c'était Messages (genre 50%) et les MCP chargés inutilement.  
Tu peux te faire un skill pour compacter plus tôt. Et /compact toi même sinon, ça te redonne de la marge pour le contexte.
 
Sinon je crois que le 500k n'est disponible qu'en version Entreprise :/


---------------
[:dawa]
n°36081
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 01-03-2026 à 17:53:58  profilanswer
 

En fait avec la version Claude que tu as, t'as accès à quoi? :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36082
XaTriX
Posté le 01-03-2026 à 18:06:18  profilanswer
 

Tous les modèles :sol: mais en 200k :o


---------------
[:dawa]
n°36083
XaTriX
Posté le 01-03-2026 à 18:18:35  profilanswer
 

Je vais regrouper mes sessions de CC aussi, elles sont dispersées sur plusieurs PC et c'est relou.
Au finall ssh/tmux vers une box/un pc et basta tout depuis là.
Voir même une VM/VPS en ligne, de toute façon ça bosse pas sans le net.


---------------
[:dawa]
n°36084
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 01-03-2026 à 18:29:46  profilanswer
 

XaTriX a écrit :

Tous les modèles :sol: mais en 200k :o


 :D
Je pensais qu'en payant ça montait jusqu'à 500


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36085
XaTriX
Posté le 01-03-2026 à 19:39:01  profilanswer
 

bulldozer_fusion a écrit :


 :D
Je pensais qu'en payant ça montait jusqu'à 500


Il me semble uniquement avec Claude Entreprise. Sauf avec l'extra-usage je suppose.


Message édité par XaTriX le 01-03-2026 à 19:39:15

---------------
[:dawa]
n°36086
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 01-03-2026 à 20:44:38  profilanswer
 

XaTriX a écrit :


Il me semble uniquement avec Claude Entreprise. Sauf avec l'extra-usage je suppose.


Ah ouais ok


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36087
SekYo
Posté le 01-03-2026 à 20:59:30  profilanswer
 

XaTriX a écrit :


Pour le contexte faible, regarde avec /context et chez moi ce qui bouffait c'était Messages (genre 50%) et les MCP chargés inutilement.  
Tu peux te faire un skill pour compacter plus tôt. Et /compact toi même sinon, ça te redonne de la marge pour le contexte./


J'ai 0 MCP (et un seul Skill custom) et j'ai désactivé le truc qui réserve 10 ou 15% du context pour le compactage, donc t’inquiète que en outils built in, j'ai déjà optimisé tout ce que je pouvais, c'est pour ça que des outils comme rtk me font de l'oeil :D
 
 

XaTriX a écrit :

Je crois que tu peux accéder au contexte 1M mais facturation en sus du quota ?
Essaie /model sonnet[1m]
=> Ok je viens de tester, ça m'envoie chier,


C'est pour des projets persos, c'est pas ma boite qui paie, jamais je paye au token :o
J'avais des crédits openrouteur, j'ai voulu tester Codex/GPT 5.2High une fois, en 2 taches il m'avait cramé pour ~10 dollars. Faut être millionnaire (ou dev 2h une fois tous les 3 mois) pour payer à l'API sans un abonnement :D

n°36088
XaTriX
Posté le 01-03-2026 à 21:36:04  profilanswer
 

tu peux faire du batch et caching via api pour éco
prend un mois d'essais a gpt avec une ip neerlandaise et teste codex :o


---------------
[:dawa]
n°36089
fabien
Vive la super 5 !
Posté le 01-03-2026 à 21:39:16  profilanswer
 

vous procéder comment pour tester les llm pour le dev et savoir lequel est meilleur ? 2 fois le même projet/parti de projet ?
Claude est réputé pour le code, mais peut être qu'un autre est spécialisée design a partir d'un screen.

 


---------------
Découvre le HFRcoin ✈ - smilies
n°36090
ionik
Posté le 02-03-2026 à 09:24:30  profilanswer
 

XaTriX a écrit :

tu peux faire du batch et caching via api pour éco
prend un mois d'essais a gpt avec une ip neerlandaise et teste codex :o


ça change quoi l'ip néerlandaise :o


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°36091
XaTriX
Posté le 02-03-2026 à 09:30:23  profilanswer
 

le mois gratuit :o


---------------
[:dawa]
n°36092
ionik
Posté le 02-03-2026 à 11:47:16  profilanswer
 

Tiens je viens de voir que je suis passé sur le contexte 1M sur Opus alors que je n'ai rien changé.
 
Abo Max


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°36093
XaTriX
Posté le 02-03-2026 à 11:56:56  profilanswer
 

Max 5 ou 20 ?


---------------
[:dawa]
 Page :   1  2  3  4  5  6  ..  39  40  41  42  43  44

Aller à :
Ajouter une réponse
 

Sujets relatifs
Le topic des agents IA[Topic Unique] Machine Learning & Data Science
OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)Les anti IA
L'IA et ses implications sociétales : droit d'auteur, éthique, dérives[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires
Les images/vidéos générées en IA: Midjourney Dall-e StableDiffusion...[Topic Unique] Claude by Anthropic
Infra IA : aide au choix et troubleshot de LLM locaux 
Plus de sujets relatifs à : [Topic unique] Développement via IA


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)