Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1434 connectés 

 


 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  24  25  26  ..  38  39  40  41  42  43
Auteur Sujet :

[Topic unique] Développement via IA

n°36853
the_fennec
f3nn3cUs z3rd4
Posté le 21-04-2026 à 13:10:51  profilanswer
 

Reprise du message précédent :
Stop le HS :o
 
J'ai testé le speculative checkpointing dans llama.cpp:
https://github.com/ggml-org/llama.cpp/pull/19493
 
Aucun benef avec Qwen3.6, voir pire. Je vois que quelqu'un a posté une config différente, je verrais ce soit si j'oublie pas.


---------------
Faudra que je teste un jour :o
n°36854
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 21-04-2026 à 13:11:42  profilanswer
 

Tronklou a écrit :

 

Assez déçu de l'offre open code go, j'ai régulièrement des périodes de Time Out sur glm 5.1  :fou:

 

J'ai pris ollama a côté, c'est largement mieux aussi bien en disponibilité que en quotas


Ok bon à savoir


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36855
the_fennec
f3nn3cUs z3rd4
Posté le 21-04-2026 à 13:55:50  profilanswer
 

the_fennec a écrit :

Stop le HS :o
 
J'ai testé le speculative checkpointing dans llama.cpp:
https://github.com/ggml-org/llama.cpp/pull/19493
 
Aucun benef avec Qwen3.6, voir pire. Je vois que quelqu'un a posté une config différente, je verrais ce soit si j'oublie pas.


 
Avec cette config je vois pas de différence. Par contre je viens d'avoir le meilleur Flappy Bird que j'ai jamais eu jusqu’à présent!
 

Citation :

write an html5 clone of flappy bird


 
https://hashed-hainanese-362n.pagedrop.io
 
Me config:

Code :
  1. llama-server --alias default --host 0.0.0.0 --rpc lain:50000 --port 8080 -m Qwen3.6-35B-A3B-UD-Q6_K.gguf -ngl 99 -ts 20,23 --ctx-size 65536 --temp 0.6 --top-p 0.95 --min-p 0.0 --top-k 20 --presence-penalty 0.0 --repeat_penalty 1.0 --jinja --flash-attn on --chat-template-kwargs "{\"preserve_thinking\": true}" -ctk q8_0 -ctv q8_0 --draft-max 128 --spec-ngram-size-n 48 --draft-min 2 --spec-type ngram-mod


---------------
Faudra que je teste un jour :o
n°36856
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 21-04-2026 à 16:02:42  profilanswer
 

J'arrive même pas a passer le premier tube :O
 
Très propre, surtout pour un model local :D
 
J'essaye de modifier le bios pour activer un semblant de fastboot sur le bios de la bc250


---------------
Victime de girafophobie, mais se soigne.
n°36857
the_fennec
f3nn3cUs z3rd4
Posté le 21-04-2026 à 16:15:03  profilanswer
 

fastboot? elle doit booter en 3s chrono
 
Pour la science, le flappy bird de Opus 4.7:
https://petite-trend-7yq4.pagedrop.io
 


---------------
Faudra que je teste un jour :o
n°36858
LibreArbit​re
La /root est longue
Posté le 21-04-2026 à 16:19:37  profilanswer
 

Les bruitages de l'enfer :lol:


---------------
Pharyo | Cinépite | Capvirage
n°36859
fabien
Vive la super 5 !
Posté le 21-04-2026 à 17:11:45  profilanswer
 

Les futurs artisans :o

 

https://youtube.com/shorts/gR-765jj7G0


---------------
Découvre le HFRcoin ✈ - smilies
n°36860
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 21-04-2026 à 18:29:01  profilanswer
 

the_fennec a écrit :

fastboot? elle doit booter en 3s chrono
 
Pour la science, le flappy bird de Opus 4.7:
https://petite-trend-7yq4.pagedrop.io
 


 
Y a bien les offsets pour mais impossible de l'activer via la nvram, je tenterais un autre jours en modifiant directement le bios sur l'eeprom avec un prog externe.
Pour le moment ca stagne a 24s entre le bouton ON et l'arrivée sur le shell  :sweat:


---------------
Victime de girafophobie, mais se soigne.
n°36861
the_fennec
f3nn3cUs z3rd4
Posté le 21-04-2026 à 18:31:24  profilanswer
 

Tronklou a écrit :


 
Y a bien les offsets pour mais impossible de l'activer via la nvram, je tenterais un autre jours en modifiant directement le bios sur l'eeprom avec un prog externe.
Pour le moment ca stagne a 24s entre le bouton ON et l'arrivée sur le shell  :sweat:


 
T'as viré le netboot? Ça prends des plombes.
T'as quoi comme distrib?
 
A oui, tu as raison:

Code :
  1. systemd-analyze
  2. Startup finished in 22.667s (firmware) + 6.142s (loader) + 2.376s (kernel) + 2.318s (userspace) = 33.504s
  3. graphical.target reached after 2.224s in userspace.


 
Je reboot pas souvent depuis que j'ai mes bon settings grub.


Message édité par the_fennec le 21-04-2026 à 18:44:25

---------------
Faudra que je teste un jour :o
n°36862
extenue1
Posté le 21-04-2026 à 19:21:33  profilanswer
 

Tss tsss on se reconcentre sur l'Amiga siouplé  :O

n°36863
the_fennec
f3nn3cUs z3rd4
Posté le 22-04-2026 à 09:04:58  profilanswer
 

extenue1 a écrit :

Tss tsss on se reconcentre sur l'Amiga siouplé  :O


 
ça tourne ;) Mais il faut que je bouge un peu les projets, la il test avec Qemu 68k, mais il faut que je le mette a bosser sur le bootloader et a utiliser fs-uae.


---------------
Faudra que je teste un jour :o
n°36864
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 22-04-2026 à 09:50:45  profilanswer
 

GPT 5.3 codex et GPT 5.4 vous disiez ici c'est pareil mais moins cher avec GPT 5.3 codex?


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36865
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 22-04-2026 à 10:19:14  profilanswer
 

Ça arrive :love:
https://rehost.diberie.com/Picture/Get/r/508299


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36866
XaTriX
Posté le 22-04-2026 à 10:22:43  profilanswer
 

j'ai pas :fou:


---------------
Celui qui lit ça est un con
n°36867
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 22-04-2026 à 10:25:32  profilanswer
 


Ils avaient appuyé sur le bouton trop tôt
Ça devrait sortir ce soir ou demain :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36868
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 22-04-2026 à 10:27:21  profilanswer
 
n°36869
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 22-04-2026 à 11:22:21  profilanswer
 

the_fennec a écrit :

 

T'as viré le netboot? Ça prends des plombes.
T'as quoi comme distrib?

 

A oui, tu as raison:

Code :
  1. systemd-analyze
  2. Startup finished in 22.667s (firmware) + 6.142s (loader) + 2.376s (kernel) + 2.318s (userspace) = 33.504s
  3. graphical.target reached after 2.224s in userspace.
 

Je reboot pas souvent depuis que j'ai mes bon settings grub.

 


J'ai mis un fedora server, de base ça bootait en 32s environ, en virant tous les services inutiles et diverses optimisations je suis descendus a 24. Mais le bios a lui seul c'est presque 15s  :sweat:


---------------
Victime de girafophobie, mais se soigne.
n°36870
the_fennec
f3nn3cUs z3rd4
Posté le 22-04-2026 à 17:51:26  profilanswer
 

Qwen3.6 27B est dispo:
https://qwen.ai/blog?id=qwen3.6-27b
https://huggingface.co/unsloth/Qwen3.6-27B-GGUF
 
J'ai swap le 35B pour Qwen3.6-27B-UD-Q6_K_XL, pas de miracle, j'ai juste 10 tgs et le flappy bird est top :love: :
https://vast-byte-r9eq.pagedrop.io
 

Code :
  1. prompt eval time =     748.54 ms /    19 tokens (   39.40 ms per token,    25.38 tokens per second)
  2.        eval time =  710907.64 ms /  7099 tokens (  100.14 ms per token,     9.99 tokens per second)
  3.       total time =  711656.18 ms /  7118 tokens


 
Je vais le mettre au boulot sur Linux 7.x pour Amiga 500 pour la nuit.
 
Assez content du speculative decoding finalement, après 24h de boulot, je vois des boosts en tgs a 40 alors que ma moyenne est dans les 30/35. Je vais le laisser avec 27B pour voir.

Code :
  1. --draft-max 128 --spec-ngram-size-n 48 --draft-min 2 --spec-type ngram-mod


Message édité par the_fennec le 22-04-2026 à 17:56:00

---------------
Faudra que je teste un jour :o
n°36871
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 22-04-2026 à 18:42:26  profilanswer
 

https://rehost.diberie.com/Picture/Get/r/508436

 


J'attend le model en APEX  :D


Message édité par Tronklou le 22-04-2026 à 18:47:09

---------------
Victime de girafophobie, mais se soigne.
n°36872
the_fennec
f3nn3cUs z3rd4
Posté le 22-04-2026 à 18:55:04  profilanswer
 

J'ai jamais réussi a tirer quoi que ce soit d'un APEX.


---------------
Faudra que je teste un jour :o
n°36873
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 22-04-2026 à 19:03:03  profilanswer
 

Agréablement surpris sur le 3.5 donc je me dit qu'on peut l'être également sur le 3.6  :D


---------------
Victime de girafophobie, mais se soigne.
n°36874
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 22-04-2026 à 19:38:15  profilanswer
 
n°36875
the_fennec
f3nn3cUs z3rd4
Posté le 22-04-2026 à 21:09:26  profilanswer
 

Tronklou a écrit :

Agréablement surpris sur le 3.5 donc je me dit qu'on peut l'être également sur le 3.6  :D


 
Quelle diff avec Unsloth?
Sur Qwen3-coder il y avait des APEX plus petits, mais il faisaient n'importe quoi


---------------
Faudra que je teste un jour :o
n°36876
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 22-04-2026 à 21:59:50  profilanswer
 

Qui c'est qui a brick sa bc250 en bidouillant le bios a coup d'éditeur hexa ?  :lol:

 

https://rehost.diberie.com/Picture/Get/r/508481


---------------
Victime de girafophobie, mais se soigne.
n°36877
Olivie
SUUUUUUUUUUUUUU
Posté le 22-04-2026 à 23:09:36  profilanswer
 


Faudrait qu’on concentre toute les annonces sur les modèles sur le topik principal = topik news/twitter :o


---------------

n°36878
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 22-04-2026 à 23:10:39  profilanswer
 

C'est vous qui voyez :O


---------------
Victime de girafophobie, mais se soigne.
n°36879
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 22-04-2026 à 23:15:52  profilanswer
 

Olivie a écrit :


Faudrait qu’on concentre toute les annonces sur les modèles sur le topik principal = topik news/twitter :o


Y a tellement d'infos que on ne sait plus où donner de la tête :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36880
Quich
Pouet ?
Posté le 22-04-2026 à 23:43:37  profilanswer
 

Tronklou a écrit :

Qui c'est qui a brick sa bc250 en bidouillant le bios a coup d'éditeur hexa ?  :lol:

 

https://rehost.diberie.com/Picture/Get/r/508481


Qu'est-ce que tu cherchais à faire ?


---------------
Feedback
n°36881
XaTriX
Posté le 22-04-2026 à 23:44:23  profilanswer
 

une extension :o


---------------
Celui qui lit ça est un con
n°36882
the_fennec
f3nn3cUs z3rd4
Posté le 22-04-2026 à 23:45:16  profilanswer
 

Tronklou a écrit :

Qui c'est qui a brick sa bc250 en bidouillant le bios a coup d'éditeur hexa ?  :lol:  
 
https://rehost.diberie.com/Picture/Get/r/508481


 
Bien joué :D ... d'avoir un CH341 3.3V en rab' enfin j'imagine que t'aurais pas pris le risque sans!
 
Sinon ya un BIOS v5 qui traîne avec des trucs en plus, mais je sais pas ce que ça apporte ou quel est le risque:
https://theretroweb.com/bios?itemsP [...] chipsetIds[]=1990


---------------
Faudra que je teste un jour :o
n°36883
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 22-04-2026 à 23:45:32  profilanswer
 

Activer le fastboot, j'ai cru qu'il etait disponible mais pas activé ( et pas affiché) seulement en modifiant en hexa, j'ai bloqué la carte :D  
 
Bon en reflashant le bios d'origine puis reflash du custom du wiki bc250 c'est repartis comme en 40.


---------------
Victime de girafophobie, mais se soigne.
n°36884
the_fennec
f3nn3cUs z3rd4
Posté le 22-04-2026 à 23:46:35  profilanswer
 

fastboot c'est pas un truc Windows seulement?


---------------
Faudra que je teste un jour :o
n°36885
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 22-04-2026 à 23:57:41  profilanswer
 

Profitez
https://rehost.diberie.com/Picture/Get/r/508499


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36886
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 00:04:31  profilanswer
 

27B c'est nul :o
 
Je suis repassé sur 35B pour la nuit, je pense qu'il a un soucis avec le speculative decoding, il s’arrête tout seul.


---------------
Faudra que je teste un jour :o
n°36887
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 23-04-2026 à 00:34:33  profilanswer
 

the_fennec a écrit :


 
Bien joué :D ... d'avoir un CH341 3.3V en rab' enfin j'imagine que t'aurais pas pris le risque sans!
 
Sinon ya un BIOS v5 qui traîne avec des trucs en plus, mais je sais pas ce que ça apporte ou quel est le risque:
https://theretroweb.com/bios?itemsP [...] chipsetIds[]=1990


 
Je l'ai vus apres avoir commencé a bidouiller le 3.00  :sweat:  
Non j'ai pas utilisé de CH341, le mien est full 5V ( pour certaines vieille cm) , j'ai soudé à l'arrache des pin header sur un rp2040 zero qui traînais dans un tiroir  :lol:  
 

the_fennec a écrit :

fastboot c'est pas un truc Windows seulement?


 
Je voulais dire le "boot rapide" dispo dans certains bios/EFI, ca permet de skip certaines étapes du boot, m'enfin je pense que je vais pas chercher plus... 20 minutes pour reflasher proprement la carte a chaque fois :O
 
Sinon j'ai continué a jouer avec les optimisations sur la conso, il y a un beau delta entre la 1ere carte peu optimisée avec juste le patch kernel et governor non tuné, et la deuxième ou j'ai poussé au max :  
 
https://i.imgur.com/zt48uhd.png


Message édité par Tronklou le 23-04-2026 à 00:46:09

---------------
Victime de girafophobie, mais se soigne.
n°36888
neo world
Posté le 23-04-2026 à 08:21:49  profilanswer
 

Pour ceux qui sont limités en RAM, il y a des techniques de turboquant qui arrivent et permettent de jouer avec des modèles de taille respectable avec peu de VRAM :  
https://youtu.be/XLlQDfhyBjc?is=KrNWtbzMtYYLNguZ
 
J’ai pas testé personnellement comme les modèles 3.6 / 3.6 plus passent nickel dans 40GB.
 
Je joue d’ailleurs avec une version non officielle 3.6 plus. La partie thinking est assez bluffante de détails et ça améliore bien l’output même avec des prompts de départ assez courts.
 
Je galère à trouver le temps de monter le CI/CD mais j’ai mon cluster K8s dans OCI de prêt (4 cpu et 24 GO de ram gratuits au total pour le cluster. Un peu à mes risques et périls comme j’ai vu des gens se faire avoir sur Reddit et recevoir des factures parce qu’ils avaient activé par accident des produits non gratuits).

n°36889
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 09:46:00  profilanswer
 

J'ai tenté les turboquant, mais comme j'ai une config split CUDA/Vulkan j'ai pas trouvé de fork qui supporte les deux.
 
Après, il faut relativiser les gains annoncés par les "créateurs". La perplexité est aux fraises si tu mets les keys en TQ et souvent les configs sont en q8 pour les keys et tq4 pour les values. Le gain final est pas si énorme pour les modèles Qwen en tout cas, genre 10/15% par rapport a du q8/q8. De plus il y a un coût en décodage et on perds en tokens/s.


---------------
Faudra que je teste un jour :o
n°36890
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 23-04-2026 à 10:16:49  profilanswer
 

https://rehost.diberie.com/Picture/Get/r/508556
https://github.com/usestrix/strix


Message édité par bulldozer_fusion le 23-04-2026 à 10:17:03

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°36891
neo world
Posté le 23-04-2026 à 10:58:20  profilanswer
 

the_fennec a écrit :

J'ai tenté les turboquant, mais comme j'ai une config split CUDA/Vulkan j'ai pas trouvé de fork qui supporte les deux.
 
Après, il faut relativiser les gains annoncés par les "créateurs". La perplexité est aux fraises si tu mets les keys en TQ et souvent les configs sont en q8 pour les keys et tq4 pour les values. Le gain final est pas si énorme pour les modèles Qwen en tout cas, genre 10/15% par rapport a du q8/q8. De plus il y a un coût en décodage et on perds en tokens/s.


En fait ça a l’air surtout efficace pour la partie cache ( donc augmenter in fine la fenêtre de contexte max même sur un gpu limite en vram ). La vidéo reprend les résultats sur un bench « qualité » (retrouver les mots cachés dans un texte super long) et si le gpu n’est pas à l’agonie en q8 tu arrives à une perte assez négligeable en performance ( de l’ordre de 10% vs sans turboquant) largement rattrapé par le fait que désormais tout le modèle et son cache peut être hébergé en vram plutôt que décharger une partie sur cpu  :love:  
 
Mon impression c’est que, si la qualité ne part pas dans les fraises, on devrait pouvoir tester dans de très bonnes conditions des modèles qui initialement étaient très limités en jetons max par session à cause de leur taille de départ :D

n°36892
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 14:43:05  profilanswer
 

neo world a écrit :


En fait ça a l’air surtout efficace pour la partie cache ( donc augmenter in fine la fenêtre de contexte max même sur un gpu limite en vram ). La vidéo reprend les résultats sur un bench « qualité » (retrouver les mots cachés dans un texte super long) et si le gpu n’est pas à l’agonie en q8 tu arrives à une perte assez négligeable en performance ( de l’ordre de 10% vs sans turboquant) largement rattrapé par le fait que désormais tout le modèle et son cache peut être hébergé en vram plutôt que décharger une partie sur cpu  :love:  
 
Mon impression c’est que, si la qualité ne part pas dans les fraises, on devrait pouvoir tester dans de très bonnes conditions des modèles qui initialement étaient très limités en jetons max par session à cause de leur taille de départ :D


 
Pour le moment le TQ n'est appliqué qu'au KV, j'ai vu des forks qui essayent de l'appliquer au modèle, mais ça marche juste pas du tout. La vidéo est pas mal pour de la vulgarisation, mais le TQ est très loin d'être au point, ça à l'air d'aller pour quelques tests, mais ya quand même pas mal de retours négatif ou le contexte fini pas être corrompus. Il n'y a pas de fork qui couvre les archis principales a la fois, CUDA, Metal ET Vulkan. Chacun a sa petite popote et la hype semble être passée. Je pense qu'il faudrait qu'une boite s'y mette sérieusement avec pas mal de dev en plus derrière. Bref c'est pas pour tout de suite un merge dans llama.cpp.
 
Si tu veux voir plein de benchs et résultats, c'est la que ça se passe:
https://github.com/ggml-org/llama.cpp/discussions/20969


---------------
Faudra que je teste un jour :o
n°36893
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 23-04-2026 à 17:13:20  profilanswer
 

Même constat de mon côté, plus le fait d'avoir une configuration boiteuse qui exige beaucoup de test pour peu de gain... Je suis repassé sur llama officiel et basta  :D


---------------
Victime de girafophobie, mais se soigne.
 Page :   1  2  3  4  5  ..  24  25  26  ..  38  39  40  41  42  43

Aller à :
Ajouter une réponse
 

Sujets relatifs
Le topic des agents IA[Topic Unique] Machine Learning & Data Science
OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)Les anti IA
L'IA et ses implications sociétales : droit d'auteur, éthique, dérives[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires
Les images/vidéos générées en IA: Midjourney Dall-e StableDiffusion...[Topic Unique] Claude by Anthropic
Infra IA : aide au choix et troubleshot de LLM locaux 
Plus de sujets relatifs à : [Topic unique] Développement via IA


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)