Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
4370 connectés 

 


 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  13  14  15  ..  40  41  42  43  44  45
Auteur Sujet :

[Topic unique] Développement via IA

n°36413
ionik
Posté le 01-04-2026 à 08:37:47  profilanswer
 

Reprise du message précédent :

the_fennec a écrit :


 
Non, je pensais pareil avec Qwen 3.5 en 35B A3B, mais en fait non. Comme le 32B ce sont des modèles MoE, dans le cas du 35B il n'a que 3B d'actif. Dans mes tests le 27B était bien meilleur que le 35B, mais beaucoup plus lent, dans les 10/15 tg/s la ou 35B montait facilement a 50 tg/s.
 


Encore une fois le problème n'est pas la rapidité mais la qualité des réponses.


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°36414
the_fennec
f3nn3cUs z3rd4
Posté le 01-04-2026 à 10:44:01  profilanswer
 

ionik a écrit :


Encore une fois le problème n'est pas la rapidité mais la qualité des réponses.


 
C'est ce que je dis, Qwen3.5 27B est plus lent mais la qualité des réponses est bien meilleure que 35BA3B.


---------------
Faudra que je teste un jour :o
n°36415
ionik
Posté le 01-04-2026 à 11:01:31  profilanswer
 

the_fennec a écrit :


 
C'est ce que je dis, Qwen3.5 27B est plus lent mais la qualité des réponses est bien meilleure que 35BA3B.


J'ai utilisé le 27/30/32 sans MOE


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°36416
the_fennec
f3nn3cUs z3rd4
Posté le 01-04-2026 à 12:21:13  profilanswer
 

ionik a écrit :


J'ai utilisé le 27/30/32 sans MOE


 
C'est possible? Comment tu fais? Je pensais que ça faisait partie du modèle et pas que c'est quelque chose qu'on peut controller.


---------------
Faudra que je teste un jour :o
n°36417
the_fennec
f3nn3cUs z3rd4
Posté le 01-04-2026 à 12:22:23  profilanswer
 

https://prismml.com/news/bonsai-8b
https://huggingface.co/prism-ml/Bonsai-8B-gguf
 
Ça sent le poisson :o
 

Citation :

1-bit Bonsai 8B implements a proprietary 1-bit model design across the entire network: embeddings, attention layers, MLP layers, and the LM head are all 1-bit. There are no higher-precision escape hatches. It is a true 1-bit model, end to end, across 8.2 billion parameters.
 
Despite being 14x smaller than the 8B (16-bit) full-precision models in its parameter-count class, it performs competitively on standard benchmarks while operating at radically higher efficiency.


 
https://cdn.prod.website-files.com/699604cc2b9dd89bdbda0608/69c95988a858e3b0a355401e_64b61e17.png
 
https://www.reddit.com/r/LocalLLaMA [...] the_first/


Message édité par the_fennec le 01-04-2026 à 12:23:43

---------------
Faudra que je teste un jour :o
n°36418
ionik
Posté le 01-04-2026 à 12:54:09  profilanswer
 

the_fennec a écrit :


 
C'est possible? Comment tu fais? Je pensais que ça faisait partie du modèle et pas que c'est quelque chose qu'on peut controller.


Tu ne contrôle pas, ça fait partie du modèle mais il sorte souvent 2 ou 3 version (dans les 27 a 32B) dont une avec MOE juste.


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°36419
the_fennec
f3nn3cUs z3rd4
Posté le 01-04-2026 à 14:07:30  profilanswer
 

ionik a écrit :


Tu ne contrôle pas, ça fait partie du modèle mais il sorte souvent 2 ou 3 version (dans les 27 a 32B) dont une avec MOE juste.


 
OK, ce sont des modèles différents avec un training différent.
 
Perso je pensais que le 35B A3B MoE donc serait supérieur au 27B, mais c'est pas le cas dans mes tests.


---------------
Faudra que je teste un jour :o
n°36420
le canard ​nouveau
coin
Posté le 01-04-2026 à 14:38:30  profilanswer
 

https://korben.info/claude-code-fui [...] -maps.html
 

Citation :

60 Mo de source maps (ces fichiers qui permettent de remonter du code minifié à l'original) ont été oubliés dans un paquet npm. Et voilà comment Anthropic a involontairement balancé en public le code source complet de Claude Code, son outil à 2.5 milliards de dollars de revenus annuels.
 
Alors qu'est-ce qui s'est passé exactement ?
 
Hé bien hier, la version 2.1.88 du package  
@anthropic-ai/claude-code
 
 sur le registre npm embarquait un fichier  
.map
 
 de 59.8 Mo. Un truc normalement réservé au debug interne, sauf que ce fichier  
.map
 
 contenait les pointeurs vers les 1 900 fichiers TypeScript originaux, en clair. Chaofan Shou, un développeur chez Solayer Labs, a alors repéré la boulette et l'a partagée sur X. Le temps qu'Anthropic réagisse, le code était déjà mirroré partout sur GitHub, avec 41 500+ forks en quelques heures. Autant dire que le dentifrice ne rentrera pas dans le tube !
 
Pour ma part, j'avais un petit dépôt à moi assez ancien avec quelques trucs relatifs à Claude Code, qui n'avait rien à voir avec tout ça, qui s'est même retrouvé striké... Ils ratissent large avec leur DMCA donc.
 


---------------
Sivouplé, un referral scam citizen https://robertsspaceindustries.com/ [...] -SVBP-3PT3
n°36421
le canard ​nouveau
coin
Posté le 01-04-2026 à 14:39:24  profilanswer
 

Ca sent le poisson ou :o ?

 

EDIT: même pas :lol:


Message édité par le canard nouveau le 01-04-2026 à 14:41:36

---------------
Sivouplé, un referral scam citizen https://robertsspaceindustries.com/ [...] -SVBP-3PT3
n°36422
LibreArbit​re
La /root est longue
Posté le 01-04-2026 à 15:06:47  profilanswer
 

le canard nouveau a écrit :

Ca sent le poisson ou :o ?

 

EDIT: même pas :lol:


Nope, tous les repos connus ont disparu, j'ai bien fait de récupérer l'archive du repo avec le plus d'étoiles :o

 

Mais bon, le mal est fait...

 
Citation :

Je trouve ça assez marrant que le code proprio d'une boite qui a aspiré tout l'open source du monde voire plus, sans autorisation, pour le revendre sous la forme de temps machine / tokens, devienne lui aussi en quelque sorte "open source" sans qu'on leur demande leur avis ^^. La vie est bien faite.


Bien dit Korben !


Message édité par LibreArbitre le 01-04-2026 à 15:10:58

---------------
Pharyo | Cinépite | Capvirage
n°36423
le canard ​nouveau
coin
Posté le 01-04-2026 à 15:17:39  profilanswer
 

LibreArbitre a écrit :


Nope, tous les repos connus ont disparu, j'ai bien fait de récupérer l'archive du repo avec le plus d'étoiles :o
 
Mais bon, le mal est fait...
 

Citation :

Je trouve ça assez marrant que le code proprio d'une boite qui a aspiré tout l'open source du monde voire plus, sans autorisation, pour le revendre sous la forme de temps machine / tokens, devienne lui aussi en quelque sorte "open source" sans qu'on leur demande leur avis ^^. La vie est bien faite.


Bien dit Korben !


Fais péter lô :D


---------------
Sivouplé, un referral scam citizen https://robertsspaceindustries.com/ [...] -SVBP-3PT3
n°36424
LibreArbit​re
La /root est longue
Posté le 01-04-2026 à 15:21:29  profilanswer
 


Partagé sur le DT :jap:


Message édité par LibreArbitre le 01-04-2026 à 15:21:44

---------------
Pharyo | Cinépite | Capvirage
n°36425
the_fennec
f3nn3cUs z3rd4
Posté le 01-04-2026 à 15:32:16  profilanswer
 

LibreArbitre a écrit :


Partagé sur le DT :jap:


 
J'veux bien une invite :o


---------------
Faudra que je teste un jour :o
n°36426
le canard ​nouveau
coin
Posté le 01-04-2026 à 16:35:27  profilanswer
 

the_fennec a écrit :


 
J'veux bien une invite :o


idem :o


---------------
Sivouplé, un referral scam citizen https://robertsspaceindustries.com/ [...] -SVBP-3PT3
n°36427
the_fennec
f3nn3cUs z3rd4
Posté le 01-04-2026 à 17:30:55  profilanswer
 

[:tenaka]
 

Citation :


uninstall oh-my-opencode-slim
...
 
The package doesn't have an uninstall command. I'll manually remove the configuration and installed skills:
...
 
opencode uninstall --force --keep-config=false --keep-data=false
...
┌  Uninstall OpenCode

...
◆  Thank you for using OpenCode!

└  Done
 
Done. Uninstalled:
    oh-my-opencode-slim plugin
    OpenCode and all related files (data, cache, config, state, binary)
    Skills (simplify, agent-browser, cartography)
 


 
Au moins c'est propre maintenant :o


---------------
Faudra que je teste un jour :o
n°36428
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 01-04-2026 à 17:46:43  profilanswer
 

LibreArbitre a écrit :


Nope, tous les repos connus ont disparu, j'ai bien fait de récupérer l'archive du repo avec le plus d'étoiles :o

 

Mais bon, le mal est fait...

 
Citation :

Je trouve ça assez marrant que le code proprio d'une boite qui a aspiré tout l'open source du monde voire plus, sans autorisation, pour le revendre sous la forme de temps machine / tokens, devienne lui aussi en quelque sorte "open source" sans qu'on leur demande leur avis ^^. La vie est bien faite.


Bien dit Korben !


 [:jiejie999]


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36429
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 01-04-2026 à 22:34:40  profilanswer
 

fabien a écrit :

oue ca bloque quand il veut faire certaines commandes sensible, ca veut créer une sandbox.


c'est pour github que tu as ça?
si c'est le cas tu dois passer en MCP github et lui dire dans le chat de passer par ce protocole tout le temps
sinon effectivement tu as

Citation :

Ah... Je viens de me heurter au bac à sable de votre système Windows qui bloque mon accès direct au terminal PowerShell local (sandbox not supported on Windows) ! C'est ce qui m'empêchait d'utiliser la commande git native chez vous


Message édité par bulldozer_fusion le 01-04-2026 à 22:35:11

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36430
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 02-04-2026 à 04:31:57  profilanswer
 

https://huggingface.co/mudler/Qwen3.5-35B-A3B-APEX-GGUF

 

Apex pour les Moe qui fait mieux que unsloth  [:implosion du tibia]

 

Et surtout avec le turbo quant, qwen 3.5 27b qui tient dans un gpu de 16gb tout en étant proche du Q4 https://huggingface.co/YTan2000/Qwen3.5-27B-TQ3_1S


---------------
Victime de girafophobie, mais se soigne.
n°36431
the_fennec
f3nn3cUs z3rd4
Posté le 02-04-2026 à 09:47:42  profilanswer
 

Tronklou a écrit :

https://huggingface.co/mudler/Qwen3.5-35B-A3B-APEX-GGUF
 
Apex pour les Moe qui fait mieux que unsloth  [:implosion du tibia]  
 
Et surtout avec le turbo quant, qwen 3.5 27b qui tient dans un gpu de 16gb tout en étant proche du Q4 https://huggingface.co/YTan2000/Qwen3.5-27B-TQ3_1S


 
Très intéressant le APEX! Faut que je teste ça...  
 
Pour le TQ en quantization; il me semble qu'il a pas mal de limitations pour le moment. Il y a un coût de traitement plus élevé mais si tout tient en VRAM au lieu split avec la RAM; le gain est positif. Combiné avec le TQ en KV ça va vraiment être une aubaine pour le 100% local. Vivement qu'ils mergent tout en plus du speculative checkpointing:
 
Speculative Checkpointing:
https://github.com/ggml-org/llama.c [...] 57ac5f2629
TQ:
https://github.com/ggml-org/llama.cpp/discussions/20969


---------------
Faudra que je teste un jour :o
n°36432
kaloskagat​os
Posté le 02-04-2026 à 19:53:56  profilanswer
 

LibreArbitre a écrit :


Partagé sur le DT :jap:


 
 
Quel DT ? :o


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°36433
kaloskagat​os
Posté le 02-04-2026 à 19:55:34  profilanswer
 

Sinon mon usage de codex de la fenêtre de 5h est passé de 50% à 0% instantanément, le x2 se terminait aujourd'hui non ?


Message édité par kaloskagatos le 02-04-2026 à 19:55:46

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°36434
kaloskagat​os
Posté le 02-04-2026 à 19:57:27  profilanswer
 

J'ai découvert que j'avais accès à ça https://chatgpt.com/codex/security/scans/
 
 
Codex Security is in Research Preview
Codex Security is in Research Preview with limits on the number of scans you can perform. If you'd like early access to the paid version, please let us know.
 
> Yes, get in touch with me
 
> Maybe later
 
> No thanks


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°36435
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 02-04-2026 à 22:10:14  profilanswer
 

Tiens c'est mieux ce soir antigravity, même utilisation que les derniers jours, ça part moins vite :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36436
fabien
Vive la super 5 !
Posté le 02-04-2026 à 22:14:10  profilanswer
 

bulldozer_fusion a écrit :


c'est pour github que tu as ça?
si c'est le cas tu dois passer en MCP github et lui dire dans le chat de passer par ce protocole tout le temps
sinon effectivement tu as  

Citation :

Ah... Je viens de me heurter au bac à sable de votre système Windows qui bloque mon accès direct au terminal PowerShell local (sandbox not supported on Windows) ! C'est ce qui m'empêchait d'utiliser la commande git native chez vous



je l'ai mis en mode "strict" donc a chaque commande, je dois confirmer, par exemple supprimer un fichier et ça met cette erreur.
Il peut créer des fichiers, les modifier, mais dès que c'est une commande sensible, ça ne passe plus.


---------------
Découvre le HFRcoin ✈ - smilies
n°36437
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 02-04-2026 à 22:23:47  profilanswer
 

fabien a écrit :


je l'ai mis en mode "strict" donc a chaque commande, je dois confirmer, par exemple supprimer un fichier et ça met cette erreur.
Il peut créer des fichiers, les modifier, mais dès que c'est une commande sensible, ça ne passe plus.


Faut attendre qu'ils mettent à jour l'application...


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36438
fabien
Vive la super 5 !
Posté le 02-04-2026 à 22:45:50  profilanswer
 

bulldozer_fusion a écrit :


Faut attendre qu'ils mettent à jour l'application...


hier il ya eu une maj, rien réglé.  on verra, c'est une sandbox pour Linux, je sais pas pourquoi ça s'active sur Windows.


---------------
Découvre le HFRcoin ✈ - smilies
n°36439
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 02-04-2026 à 22:50:34  profilanswer
 

fabien a écrit :


hier il ya eu une maj, rien réglé.  on verra, c'est une sandbox pour Linux, je sais pas pourquoi ça s'active sur Windows.


Ils ont oublié :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36440
the_fennec
f3nn3cUs z3rd4
Posté le 02-04-2026 à 23:12:01  profilanswer
 

Tronklou a écrit :

https://huggingface.co/mudler/Qwen3.5-35B-A3B-APEX-GGUF
 
Apex pour les Moe qui fait mieux que unsloth  [:implosion du tibia]  
 
Et surtout avec le turbo quant, qwen 3.5 27b qui tient dans un gpu de 16gb tout en étant proche du Q4 https://huggingface.co/YTan2000/Qwen3.5-27B-TQ3_1S


 
Petit test rapide des APEX, semble semble moins bon que les Unsloth, pourtant j'ai pris les Balanced.


---------------
Faudra que je teste un jour :o
n°36441
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 03-04-2026 à 00:17:49  profilanswer
 

J'ai pas encore testé les différentes quantifications, je ferais un retour pour comparer  :sweat:

 

Sinon google qui sort une master class avec gemma 4, hâte aussi d'essayer  :love:


---------------
Victime de girafophobie, mais se soigne.
n°36442
the_fennec
f3nn3cUs z3rd4
Posté le 03-04-2026 à 08:28:50  profilanswer
 

Bof bof, j'ai testé gemma-4 et il est super lent, 11 tg/s. Je reste sur Qwen Coder pour le moment.


---------------
Faudra que je teste un jour :o
n°36443
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 03-04-2026 à 10:09:33  profilanswer
 

Il y a encore beaucoup de problèmes,mais je ne perds pas espoir :D
https://www.reddit.com/r/LocalLLaMA/s/muGxaOBn8B


---------------
Victime de girafophobie, mais se soigne.
n°36444
the_fennec
f3nn3cUs z3rd4
Posté le 03-04-2026 à 11:18:27  profilanswer
 

Tronklou a écrit :

Il y a encore beaucoup de problèmes,mais je ne perds pas espoir :D  
https://www.reddit.com/r/LocalLLaMA/s/muGxaOBn8B


 
Oui, au début il chargeait même pas, puis des PB de tags, il reste encore pas mal de taf'.


---------------
Faudra que je teste un jour :o
n°36445
LibreArbit​re
La /root est longue
Posté le 03-04-2026 à 22:45:22  profilanswer
 


Lien partagé ;)


---------------
Pharyo | Cinépite | Capvirage
n°36446
the_fennec
f3nn3cUs z3rd4
Posté le 04-04-2026 à 02:08:28  profilanswer
 


J'ai rien eu :O


---------------
Faudra que je teste un jour :o
n°36447
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 04-04-2026 à 06:00:52  profilanswer
 

@the__fennec : c'est toi ? :D https://github.com/akandr/bc250


---------------
Victime de girafophobie, mais se soigne.
n°36448
the_fennec
f3nn3cUs z3rd4
Posté le 04-04-2026 à 09:10:59  profilanswer
 


Non beaucoup trop de slop pour moi, mais je vais regarder quand même.


---------------
Faudra que je teste un jour :o
n°36449
the_fennec
f3nn3cUs z3rd4
Posté le 04-04-2026 à 12:00:23  profilanswer
 


 
J'en retire une info sur le tuning Kernel que je vais tester pour exposer les 16GB de VRAM entièrement dans grub:

Citation :

With ttm.pages_limit=4194304 alone, GTT grew from 14→16 GiB and Vulkan available from 14.0→16.5 GiB.


 
Le reste est moins intéressant, il utilise Ollama et perds sacrément en tg/s, 65 vs 37 pour Qwen3 35B-A3B qu'il a choisis. En plus il prends le IQ2_M, je suis surpris qu'il arrive a faire tourner des trucs avancés. Il a pas tuné le governor, il descends pas en dessous de 1Ghz en idle.
 
Sinon le reste du setup est intéressant avec le modèle que se décharge tout seul pour lancer Flux ou Wan!


---------------
Faudra que je teste un jour :o
n°36450
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 04-04-2026 à 12:05:12  profilanswer
 

Oui il y a des bonnes idées mais il aurait pu pousser davantage sur le bios.


---------------
Victime de girafophobie, mais se soigne.
n°36451
the_fennec
f3nn3cUs z3rd4
Posté le 04-04-2026 à 18:10:59  profilanswer
 

Je pense pas qu'il utilise vraiment son truc h24. En tout cas je suis a 29W en idle a 350Mhz, lui 1Ghz.


---------------
Faudra que je teste un jour :o
n°36452
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 04-04-2026 à 19:58:05  profilanswer
 

J'ai un mini pc en n95 pour la gestion et les bc250 seront pilotés via un esp32 ( appel mqtt je pense) avec auto shutdown de la bc250 pour éviter la consommation dans le vent :D


---------------
Victime de girafophobie, mais se soigne.
n°36453
XaTriX
Posté le 04-04-2026 à 23:01:34  profilanswer
 

Tiens, petit retour sur comment bosser avec Claude Code + GitHub de manière un peu structurée :o

 

Depuis quelques jours je fais évoluer un projet (un MCP pour poster sur HFR, pour les curieux) et j'ai mis en place un workflow complet piloté quasi entièrement par l'IA :

 

Issues comme spec
Chaque feature ou bug a son issue GitHub avec le contexte technique. L'IA les lit, les crée, les met à jour, les ferme avec un commentaire explicatif. Les issues deviennent la mémoire du projet — plus besoin de se souvenir de ce qu'on a décidé et pourquoi.

 

Labels + Milestone v1.0
Un label v1.0 regroupe tout ce qui doit être fait pour la release. Les issues sont taggées bug, enhancement, documentation. Ça permet de filter et prioriser sans se prendre la tête.

 

GitHub Project (kanban cross-repo)
Un seul board "HFR Ecosystem" au niveau user qui agrège les issues de 3 repos différents (hfr-mcp, hfr-redkit, ForumHFR/Redface). Vue kanban Todo/In Progress/Done + vue Roadmap avec des dates start/end sur chaque issue. Tout géré via gh project en CLI.

 

Le flow concret
1. On discute d'une feature ou d'un bug
2. L'IA crée l'issue avec le contexte technique
3. On code (l'IA fait le gros du boulot, review humaine)
4. Commit avec Closes #N → auto-close + commentaire
5. Le board se met à jour tout seul

 

Le truc qui m'a surpris c'est à quel point l'IA est bonne pour la gestion de projet "boring" : trier les issues, mettre les bons labels, écrire les commentaires de closing, maintenir la roadmap. C'est la partie que personne veut faire et qui finit toujours en bordel sur un side project.

 

Par contre faut être directif : si tu lui dis pas de commenter quand elle ferme une issue, elle le fera pas. Si tu lui dis pas de vérifier les labels, elle oublie. Le secret c'est de sauvegarder ces règles en mémoire persistante pour qu'elle les applique automatiquement dans les futures sessions.

 

Le board : https://github.com/users/XaaT/projects/2


Message édité par XaTriX le 04-04-2026 à 23:03:16

---------------
[:dawa]
 Page :   1  2  3  4  5  ..  13  14  15  ..  40  41  42  43  44  45

Aller à :
Ajouter une réponse
 

Sujets relatifs
Le topic des agents IA[Topic Unique] Machine Learning & Data Science
OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)Les anti IA
L'IA et ses implications sociétales : droit d'auteur, éthique, dérives[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires
Les images/vidéos générées en IA: Midjourney Dall-e StableDiffusion...[Topic Unique] Claude by Anthropic
Infra IA : aide au choix et troubleshot de LLM locaux 
Plus de sujets relatifs à : [Topic unique] Développement via IA


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)