Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1992 connectés 

 


 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  17  18  19  20  21  22
Page Suivante
Auteur Sujet :

[Topic unique] Développement via IA

n°2522343
the_fennec
f3nn3cUs z3rd4
Posté le 15-04-2026 à 14:45:56  profilanswer
 

Reprise du message précédent :

incassable a écrit :

ou ca exactement ?


 
Il faut avoir fait un compte, ensuite tu as un lien dans la fiche du modèle et ça donne ça:
https://i.imgur.com/HQE7xM8.png

Message cité 2 fois
Message édité par the_fennec le 15-04-2026 à 14:46:22

---------------
Faudra que je teste un jour :o
mood
Publicité
Posté le 15-04-2026 à 14:45:56  profilanswer
 

n°2522345
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 15-04-2026 à 14:47:04  profilanswer
 

Je savais pas qu'il y avait ça


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522346
incassable
Posté le 15-04-2026 à 14:49:36  profilanswer
 

the_fennec a écrit :


 
Il faut avoir fait un compte, ensuite tu as un lien dans la fiche du modèle et ça donne ça:
https://i.imgur.com/HQE7xM8.png


 
ca check que ton HW fit, mais ca va pas te guider en amont non ?

n°2522349
the_fennec
f3nn3cUs z3rd4
Posté le 15-04-2026 à 15:12:15  profilanswer
 

incassable a écrit :


 
ca check que ton HW fit, mais ca va pas te guider en amont non ?


 
Oui c'est tout, tu sais juste si le modèle rentre.


---------------
Faudra que je teste un jour :o
n°2522368
kaloskagat​os
Posté le 15-04-2026 à 17:40:44  profilanswer
 

the_fennec a écrit :

 

Il faut avoir fait un compte, ensuite tu as un lien dans la fiche du modèle et ça donne ça:
https://i.imgur.com/HQE7xM8.png

 

Je viens de renseigner mon matos mais y'a rien qui apparraît dans les fiches de modèle :/ Une idée ?

 

J'ai fait Add Item dans https://huggingface.co/settings/local-apps

 


edit: ha si, sur les page des GGUF :jap:


Message édité par kaloskagatos le 15-04-2026 à 17:43:22

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°2522369
the_fennec
f3nn3cUs z3rd4
Posté le 15-04-2026 à 17:48:02  profilanswer
 

Je comprends pas pourquoi ils ne le montrent que sur les GGUF en effet.


---------------
Faudra que je teste un jour :o
n°2522370
sashock
Posté le 15-04-2026 à 18:00:06  profilanswer
 

on pourrait ajouter en lien à ce topic (et aux autres)  les 12 topics qui parlent de "dev avec IA" open claw toussa?

n°2522371
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 15-04-2026 à 18:44:50  profilanswer
 

https://rehost.diberie.com/Picture/Get/f/506507

Citation :

Built-in subagents have been active for a bit but custom subagents are now out of experimental.


Trop bien ça !!
https://x.com/JackWoth98/status/2044448684851523849


Message édité par bulldozer_fusion le 15-04-2026 à 18:45:05

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522372
XaTriX
Posté le 15-04-2026 à 18:45:27  profilanswer
 

ouais bah quand il me donnera accès à sa cli avec un bon model on pourra en reparler :o


---------------
Proxytaf ? non rien
n°2522373
XaTriX
Posté le 15-04-2026 à 18:50:46  profilanswer
 

qui est un vrai dev ici ? :o ou associé
le but serait d'utiliser vos compétences et votre intérêt pour les LLM plutôt en mode : faire des super specs, du CRUD, du RALPH, qu'mporte tant que c'est sérieux et pas un truc hype pour la hype dans le but de dev une nouvelle app pour HFR ? :o (android)
 
qui veut participer ? :o


---------------
Proxytaf ? non rien
mood
Publicité
Posté le 15-04-2026 à 18:50:46  profilanswer
 

n°2522376
the_fennec
f3nn3cUs z3rd4
Posté le 15-04-2026 à 20:45:37  profilanswer
 

Pas sur de comprendre ce que tu veux, mais je suis dev backend/db/cloud.


---------------
Faudra que je teste un jour :o
n°2522378
the_fennec
f3nn3cUs z3rd4
Posté le 15-04-2026 à 20:51:46  profilanswer
 

the_fennec a écrit :

Je suis faible, j'ai pris une autre BC-250
94 euros (par Paypal)
https://www.ebay.fr/

Spoiler :

j'ai failli en prendre deux


 
edit: les avis sont pourris je vais annuler


 
J'ai été remboursé par le vendeur après ma demande d'annulation ... Si ça se trouve c'était pas une arnaque :pt1cable:


---------------
Faudra que je teste un jour :o
n°2522379
XaTriX
Posté le 15-04-2026 à 20:52:40  profilanswer
 

Est-ce que tu utilises du LLM/agentic dans le boulot ? De façon plus ou moins généralisé. Avec des repos bien fichus avec des règles pour LLM, etc.


---------------
Proxytaf ? non rien
n°2522380
the_fennec
f3nn3cUs z3rd4
Posté le 15-04-2026 à 21:04:36  profilanswer
 

Oui, Kiro et Cursor, Bedrock et un peu de llama en plus. J'ai des fichiers AGENTS persos dans mes repos. J'utilise des MCPs, officiels et des custom.
 
On a une équipe devpos qui fait en plus un outil pour synchroniser des skills/mcp/auth pour tout le monde, mais c'est nouveau et je l'utilise pas encore, même si je beta test des skills.


---------------
Faudra que je teste un jour :o
n°2522382
XaTriX
Posté le 15-04-2026 à 21:57:27  profilanswer
 

Ah bah j'aimerais que tu développes à l'occase, c'est un sujet qui m'interesse.  
Vous avez quoi comme quota dev classique / dev LLM ? Je veux dire par exemple le ratio de LoC fait par LLM.
 
Le sujet dont je parlais c'est de me (nous) filer un coup de main pour organiser un repo pour la réécriture de l'app Redface from scratch, voir le topic dédié: https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0


---------------
Proxytaf ? non rien
n°2522386
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 15-04-2026 à 23:44:27  profilanswer
 
n°2522388
LibreArbit​re
La /root est longue
Posté le 16-04-2026 à 08:40:51  profilanswer
 

La bonne nouvelle c'est surtout pour eux, au détriment des clients... Ils donnent vraiment le bâton pour se faire battre, surtout que toutes les autres offres permettaient de positionner des limites mensuelles, vla la révolution chez Google...


---------------
Hebergement d'images
n°2522390
kaloskagat​os
Posté le 16-04-2026 à 10:15:44  profilanswer
 

kaloskagatos a écrit :

Vous pensez que changer de modèle au milieu d'une conversation avec un agent CLI ça casse le cache et ça consomme plus de tokens ? J'ai une peur irrationnel de ça :D


 

XaTriX a écrit :

dans quoi ?
Dans CC non


 
 
Bon, mise à jour de Claude Code, je tente le changement de modèle en cours de session :
 

Citation :

This conversation is cached for the current model. Switching to Opus 4.6 (1M context) means the full history gets re-read on your next message.


 
Donc voilà je suis fixé


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°2522391
XaTriX
Posté le 16-04-2026 à 10:16:57  profilanswer
 

ah :o


---------------
Proxytaf ? non rien
n°2522408
bounty2k
Posté le 16-04-2026 à 17:19:28  profilanswer
 

the_fennec a écrit :


 
Regardes mon post plus haut, j'ai passé un modèle de 38Go sur mon MBP 48Go avec plein de trucs qui tournent en plus dont une VM docker de 8Go. Donc je pense que tu dois pouvoir essayer un modèle de 12/13Go, il va swaper mais ça se teste.


Je répond a ce vieux post, mais je viens de tester Qwen3.6 35B Q3 XXS (qui est un MOE) sur mon M4 avec 16 Go de RAM sur llamaCPP et ça fini toujours avec une erreur mémoire : error: Insufficient Memory (00000008:kIOGPUCommandBufferCallbackErrorOutOfMemory)
J'ai beau tout fermer et démarrer avec 6Go de RAM occupé, diminuer la taille du contexte a 8k, mais rien a faire  :(  
J'avais déja testé un modèle en 12B (non MOE) qui faisait carrément freezer MacOS,
Je vais attendre la version 9B pour tester Qwen 3.6  :(

n°2522410
the_fennec
f3nn3cUs z3rd4
Posté le 16-04-2026 à 17:37:03  profilanswer
 

XaTriX a écrit :

Ah bah j'aimerais que tu développes à l'occase, c'est un sujet qui m'interesse.  
Vous avez quoi comme quota dev classique / dev LLM ? Je veux dire par exemple le ratio de LoC fait par LLM.


J'en avais parlé pas mal sur le topic génération de texte il me semble.
 
Pour le quota c'est difficile a généraliser, je sais pas trop ce que font les autres devs.
Perso c'est du 90/10 IA/Humain :o mais c'est biaisé car je laisse l'IA écrire des tonnes de tests que j'aurais jamais écris a la main sinon. Je la laisse écrire le code business (pendant les meetings :o) et je repasse dessus après.
 

XaTriX a écrit :


Le sujet dont je parlais c'est de me (nous) filer un coup de main pour organiser un repo pour la réécriture de l'app Redface from scratch, voir le topic dédié: https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0


 
Je watch le topoc, je peux essayer d'aider :jap:.


---------------
Faudra que je teste un jour :o
n°2522411
XaTriX
Posté le 16-04-2026 à 17:40:02  profilanswer
 

:love:
 
Opus 4.7 est sorti au fait https://www.anthropic.com/news/claude-opus-4-7


---------------
Proxytaf ? non rien
n°2522412
the_fennec
f3nn3cUs z3rd4
Posté le 16-04-2026 à 17:46:36  profilanswer
 

bounty2k a écrit :


Je répond a ce vieux post, mais je viens de tester Qwen3.6 35B Q3 XXS (qui est un MOE) sur mon M4 avec 16 Go de RAM sur llamaCPP et ça fini toujours avec une erreur mémoire : error: Insufficient Memory (00000008:kIOGPUCommandBufferCallbackErrorOutOfMemory)
J'ai beau tout fermer et démarrer avec 6Go de RAM occupé, diminuer la taille du contexte a 8k, mais rien a faire  :(  
J'avais déja testé un modèle en 12B (non MOE) qui faisait carrément freezer MacOS,
Je vais attendre la version 9B pour tester Qwen 3.6  :(


 
Tu peux partager ta ligne de commande?
 
Tu peux essayer ça pour augmenter la limite d'allocation VRAM?:

Code :
  1. sudo sysctl iogpu.unified_memory_limit_mtl=15360


 
C'est pas permanent donc au pire tu reboot :o
 
est-ce que tu as bien cette ligne?

Code :
  1. load_tensors: loading model tensors, this can take a while... (mmap = true, direct_io = false)


mmap = true est important


---------------
Faudra que je teste un jour :o
n°2522413
bounty2k
Posté le 16-04-2026 à 17:49:11  profilanswer
 

the_fennec a écrit :

 

Tu peux partager ta ligne de commande?

 

Tu peux essayer ça pour augmenter la limite d'allocation VRAM?:

Code :
  1. sudo sysctl iogpu.unified_memory_limit_mtl=15360
 

C'est pas permanent donc au pire tu reboot :o

 

est-ce que tu as bien cette ligne?

Code :
  1. load_tensors: loading model tensors, this can take a while... (mmap = true, direct_io = false)


mmap = true est important


J’utilise ces paramètres :

Code :
  1. --jinja -c 8192 --port 8080 --mmap --swa-full -fa on -ngl 99 --reasoning off


Je vais tenter la commande pour la VRAM

Message cité 1 fois
Message édité par bounty2k le 16-04-2026 à 17:49:36
n°2522414
the_fennec
f3nn3cUs z3rd4
Posté le 16-04-2026 à 17:58:45  profilanswer
 


 
Cool en 1M de contexte en plus (Opus 4.6 high est a 200k pour moi):  
https://i.imgur.com/VsUoLvU.png
 
Bon faut que je profite de Cursor avant qu'ils nous le virent :lol:
 


---------------
Faudra que je teste un jour :o
n°2522415
the_fennec
f3nn3cUs z3rd4
Posté le 16-04-2026 à 18:00:29  profilanswer
 

bounty2k a écrit :


J’utilise ces paramètres :  

Code :
  1. --jinja -c 8192 --port 8080 --mmap --swa-full -fa on -ngl 99 --reasoning off


Je vais tenter la commande pour la VRAM


 
C'est le "-ngl 99" ton problème, vire le, ça dit de forcer tout le modèle en VRAM.  
 
Essaye juste:

Code :
  1. --jinja -c 8192 --port 8080 -fa on


---------------
Faudra que je teste un jour :o
n°2522417
Implosion ​du Sord
Fesseur de chameaux
Posté le 16-04-2026 à 18:07:16  profilanswer
 


nouveau niveau d'effort disponible : xhigh
https://rehost.diberie.com/Picture/Get/f/506794


---------------
[VDS]AIO Fractal Design Celsius S36 | Carte Wifi N Intel 5100 mPCIe | divers accessoire boitier Fractal Design | Away from keyboard, close to your breast
n°2522419
XaTriX
Posté le 16-04-2026 à 18:27:38  profilanswer
 

yes le quota qui va s'évaporer :love:


---------------
Proxytaf ? non rien
n°2522421
XaTriX
Posté le 16-04-2026 à 18:44:32  profilanswer
 

https://i.imgur.com/JZo3HWh.png
 
 [:barthaliastoxik]


Message édité par XaTriX le 16-04-2026 à 18:44:40

---------------
Proxytaf ? non rien
n°2522422
XaTriX
Posté le 16-04-2026 à 18:45:40  profilanswer
 

https://i.imgur.com/BeExvUD.png
 
ouf :o


---------------
Proxytaf ? non rien
n°2522423
XaTriX
Posté le 16-04-2026 à 19:17:44  profilanswer
 

Je génère un mega prompt pour reprendre le nouveau dépot Redface2 avec analyse de Redface 1 & co.
Je compte pousser le curseur à fond [:prodigy]

 

https://i.imgur.com/052re7Bl.png

 


edit :D
redface2/drafts/deep-audit-prompt-v04.md at main · ForumHFR/redface2

 

https://opengraph.githubassets.com/d23445177f7987e896b3f3b7ba09bf603fe9a4ca2d3ef374e2f014ee58edce8d/ForumHFR/redface2


Message édité par XaTriX le 16-04-2026 à 19:23:27

---------------
Proxytaf ? non rien
n°2522424
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 16-04-2026 à 19:23:50  profilanswer
 

 
XaTriX a écrit :

yes le quota qui va s'évaporer :love:


Encore plus vite  :lol:


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522425
XaTriX
Posté le 16-04-2026 à 19:56:10  profilanswer
 

Je viens de lui faire bouffer le prompt  
https://i.imgur.com/fwVNcYGl.png
https://i.imgur.com/OELigme.png


---------------
Proxytaf ? non rien
n°2522426
XaTriX
Posté le 16-04-2026 à 20:16:11  profilanswer
 

https://i.imgur.com/8fBYZvJ.png
 
putain ça nique tout :fou:


---------------
Proxytaf ? non rien
n°2522430
the_fennec
f3nn3cUs z3rd4
Posté le 16-04-2026 à 22:21:39  profilanswer
 

Qwen 3.6 en place, Unsloth Qwen3.6-35B-A3B-UD-Q5_K_M.gguf et avec la mémoire gagnée par rapport à coder-next, j'en ai profité pour passer à 128k de contexte.
Comme toujours le 35B est rapide, 35 tgs et 150 pps, la ou coder-next est tout juste a 10tgs et 70 pps.
Les tools marchent bien pour le moment et il a repris la ou j'ai stoppé coder-next.
 
https://i.imgur.com/cBjwqCt.png
 
On verra ou il en est demain matin sur le portage de Linux 7.0 sur Amiga 500 :lol:


---------------
Faudra que je teste un jour :o
n°2522439
the_fennec
f3nn3cUs z3rd4
Posté le 17-04-2026 à 12:35:56  profilanswer
 

Bon ça m'a l'air pas mal du tout ce Qwen3.6-35B-A3B-UD-Q5_K_M!
 
Opencode utilise bien les tools et même les subagents tout en étant plus rapide a l’exécution. C'est un peut difficile a dire si le projet progresse plus vite mais je vais le laisser tourner.
 
Le vitesse a chuté un peu:

Code :
  1. prompt eval time =  257320.34 ms / 29765 tokens (    8.65 ms per token,   115.67 tokens per second)
  2.        eval time =    3507.58 ms /    97 tokens (   36.16 ms per token,    27.65 tokens per second)
  3.       total time =  260827.92 ms / 29862 tokens


 
edit: je vais relancer avec Qwen3.6-35B-A3B-UD-Q6_K mais 64k de contexte pour voir.


Message édité par the_fennec le 17-04-2026 à 12:48:40

---------------
Faudra que je teste un jour :o
mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  17  18  19  20  21  22
Page Suivante

Aller à :
Ajouter une réponse
 

Sujets relatifs
Un assistant IA m’a pondu un script Bash… et une blague en bonus ![React] Comment changer le state de manière unique dans une map
Macros MS Publisher 2007 (Topic Unique ?)Environnement de développement modulaire basé sur node.js avec docker
Les truc indispensable sur du gros développementIA
MonoGame 3.8 - Le topic Unique[Développement Web] Votre parcours en tant que développeur web
[POSTGRESQL] WTF création unique impossibeondage sur votre expérience en développement web (dette technique)
Plus de sujets relatifs à : [Topic unique] Développement via IA


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)