[Topic unique] Développement via IA

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 .. 24 25 26 .. 38 39 40 41 42 43 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic unique] Développement via IA

the_fennec

f3nn3cUs z3rd4

Reprise du message précédent :
Stop le HS

J'ai testé le speculative checkpointing dans llama.cpp:
https://github.com/ggml-org/llama.cpp/pull/19493

Aucun benef avec Qwen3.6, voir pire. Je vois que quelqu'un a posté une config différente, je verrais ce soit si j'oublie pas.

---------------
Faudra que je teste un jour :o

bulldozer_fusion

rip Mekthoub & Marc

Tronklou a écrit :

Assez déçu de l'offre open code go, j'ai régulièrement des périodes de Time Out sur glm 5.1 :fou:

J'ai pris ollama a côté, c'est largement mieux aussi bien en disponibilité que en quotas

Ok bon à savoir

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

the_fennec

f3nn3cUs z3rd4

the_fennec a écrit :

Stop le HS

J'ai testé le speculative checkpointing dans llama.cpp:
https://github.com/ggml-org/llama.cpp/pull/19493

Aucun benef avec Qwen3.6, voir pire. Je vois que quelqu'un a posté une config différente, je verrais ce soit si j'oublie pas.

Avec cette config je vois pas de différence. Par contre je viens d'avoir le meilleur Flappy Bird que j'ai jamais eu jusqu’à présent!

Citation :

write an html5 clone of flappy bird

https://hashed-hainanese-362n.pagedrop.io

Me config:

Code :

llama-server --alias default --host 0.0.0.0 --rpc lain:50000 --port 8080 -m Qwen3.6-35B-A3B-UD-Q6_K.gguf -ngl 99 -ts 20,23 --ctx-size 65536 --temp 0.6 --top-p 0.95 --min-p 0.0 --top-k 20 --presence-penalty 0.0 --repeat_penalty 1.0 --jinja --flash-attn on --chat-template-kwargs "{\"preserve_thinking\": true}" -ctk q8_0 -ctv q8_0 --draft-max 128 --spec-ngram-size-n 48 --draft-min 2 --spec-type ngram-mod

---------------
Faudra que je teste un jour :o

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

J'arrive même pas a passer le premier tube

Très propre, surtout pour un model local

J'essaye de modifier le bios pour activer un semblant de fastboot sur le bios de la bc250

---------------
Victime de girafophobie, mais se soigne.

the_fennec

f3nn3cUs z3rd4

fastboot? elle doit booter en 3s chrono

Pour la science, le flappy bird de Opus 4.7:
https://petite-trend-7yq4.pagedrop.io

---------------
Faudra que je teste un jour :o

LibreArbitre

La /root est longue

Les bruitages de l'enfer :lol:

---------------
Pharyo | Cinépite | Capvirage

fabien

Vive la super 5 !

Les futurs artisans

https://youtube.com/shorts/gR-765jj7G0

---------------
✈ Découvre le HFRcoin ✈ - smilies ♥

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

the_fennec a écrit :

fastboot? elle doit booter en 3s chrono

Pour la science, le flappy bird de Opus 4.7:
https://petite-trend-7yq4.pagedrop.io

Y a bien les offsets pour mais impossible de l'activer via la nvram, je tenterais un autre jours en modifiant directement le bios sur l'eeprom avec un prog externe.
Pour le moment ca stagne a 24s entre le bouton ON et l'arrivée sur le shell :sweat:

---------------
Victime de girafophobie, mais se soigne.

the_fennec

f3nn3cUs z3rd4

Tronklou a écrit :

T'as viré le netboot? Ça prends des plombes.
T'as quoi comme distrib?

A oui, tu as raison:

Code :

systemd-analyze
Startup finished in 22.667s (firmware) + 6.142s (loader) + 2.376s (kernel) + 2.318s (userspace) = 33.504s
graphical.target reached after 2.224s in userspace.

Je reboot pas souvent depuis que j'ai mes bon settings grub.

Message édité par the_fennec le 21-04-2026 à 18:44:25

---------------
Faudra que je teste un jour :o

extenue1

Tss tsss on se reconcentre sur l'Amiga siouplé

the_fennec

f3nn3cUs z3rd4

extenue1 a écrit :

Tss tsss on se reconcentre sur l'Amiga siouplé

ça tourne Mais il faut que je bouge un peu les projets, la il test avec Qemu 68k, mais il faut que je le mette a bosser sur le bootloader et a utiliser fs-uae.

---------------
Faudra que je teste un jour :o

bulldozer_fusion

rip Mekthoub & Marc

GPT 5.3 codex et GPT 5.4 vous disiez ici c'est pareil mais moins cher avec GPT 5.3 codex?

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

bulldozer_fusion

rip Mekthoub & Marc

Ça arrive :love:

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

XaTriX

j'ai pas :fou:

---------------
Celui qui lit ça est un con

bulldozer_fusion

rip Mekthoub & Marc

XaTriX a écrit :

j'ai pas :fou:

Ils avaient appuyé sur le bouton trop tôt
Ça devrait sortir ce soir ou demain

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

bulldozer_fusion

rip Mekthoub & Marc

https://x.com/i/status/2046803980089536718

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

the_fennec a écrit :

T'as viré le netboot? Ça prends des plombes.
T'as quoi comme distrib?

A oui, tu as raison:

Code :

systemd-analyze
Startup finished in 22.667s (firmware) + 6.142s (loader) + 2.376s (kernel) + 2.318s (userspace) = 33.504s
graphical.target reached after 2.224s in userspace.

Je reboot pas souvent depuis que j'ai mes bon settings grub.

J'ai mis un fedora server, de base ça bootait en 32s environ, en virant tous les services inutiles et diverses optimisations je suis descendus a 24. Mais le bios a lui seul c'est presque 15s :sweat:

---------------
Victime de girafophobie, mais se soigne.

the_fennec

f3nn3cUs z3rd4

Qwen3.6 27B est dispo:
https://qwen.ai/blog?id=qwen3.6-27b
https://huggingface.co/unsloth/Qwen3.6-27B-GGUF

J'ai swap le 35B pour Qwen3.6-27B-UD-Q6_K_XL, pas de miracle, j'ai juste 10 tgs et le flappy bird est top :love: :
https://vast-byte-r9eq.pagedrop.io

Code :

prompt eval time = 748.54 ms / 19 tokens ( 39.40 ms per token, 25.38 tokens per second)
eval time = 710907.64 ms / 7099 tokens ( 100.14 ms per token, 9.99 tokens per second)
total time = 711656.18 ms / 7118 tokens

Je vais le mettre au boulot sur Linux 7.x pour Amiga 500 pour la nuit.

Assez content du speculative decoding finalement, après 24h de boulot, je vois des boosts en tgs a 40 alors que ma moyenne est dans les 30/35. Je vais le laisser avec 27B pour voir.

Code :

--draft-max 128 --spec-ngram-size-n 48 --draft-min 2 --spec-type ngram-mod

Message édité par the_fennec le 22-04-2026 à 17:56:00

---------------
Faudra que je teste un jour :o

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

J'attend le model en APEX

Message édité par Tronklou le 22-04-2026 à 18:47:09

---------------
Victime de girafophobie, mais se soigne.

the_fennec

f3nn3cUs z3rd4

J'ai jamais réussi a tirer quoi que ce soit d'un APEX.

---------------
Faudra que je teste un jour :o

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

Agréablement surpris sur le 3.5 donc je me dit qu'on peut l'être également sur le 3.6

---------------
Victime de girafophobie, mais se soigne.

bulldozer_fusion

rip Mekthoub & Marc

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

the_fennec

f3nn3cUs z3rd4

Tronklou a écrit :

Agréablement surpris sur le 3.5 donc je me dit qu'on peut l'être également sur le 3.6

Quelle diff avec Unsloth?
Sur Qwen3-coder il y avait des APEX plus petits, mais il faisaient n'importe quoi

---------------
Faudra que je teste un jour :o

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

Qui c'est qui a brick sa bc250 en bidouillant le bios a coup d'éditeur hexa ? :lol:

---------------
Victime de girafophobie, mais se soigne.

Olivie

SUUUUUUUUUUUUUU

bulldozer_fusion a écrit :

https://rehost.diberie.com/Picture/Get/f/508445

Faudrait qu’on concentre toute les annonces sur les modèles sur le topik principal = topik news/twitter

---------------

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

C'est vous qui voyez

---------------
Victime de girafophobie, mais se soigne.

bulldozer_fusion

rip Mekthoub & Marc

Olivie a écrit :

Faudrait qu’on concentre toute les annonces sur les modèles sur le topik principal = topik news/twitter

Y a tellement d'infos que on ne sait plus où donner de la tête

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

Quich

Pouet ?

Tronklou a écrit :

Qui c'est qui a brick sa bc250 en bidouillant le bios a coup d'éditeur hexa ? :lol:

https://rehost.diberie.com/Picture/Get/r/508481

Qu'est-ce que tu cherchais à faire ?

---------------
Feedback

XaTriX

une extension

---------------
Celui qui lit ça est un con

the_fennec

f3nn3cUs z3rd4

Tronklou a écrit :

Qui c'est qui a brick sa bc250 en bidouillant le bios a coup d'éditeur hexa ? :lol:

https://rehost.diberie.com/Picture/Get/r/508481

Bien joué ... d'avoir un CH341 3.3V en rab' enfin j'imagine que t'aurais pas pris le risque sans!

Sinon ya un BIOS v5 qui traîne avec des trucs en plus, mais je sais pas ce que ça apporte ou quel est le risque:
https://theretroweb.com/bios?itemsP [...] chipsetIds[]=1990

---------------
Faudra que je teste un jour :o

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

Activer le fastboot, j'ai cru qu'il etait disponible mais pas activé ( et pas affiché) seulement en modifiant en hexa, j'ai bloqué la carte

Bon en reflashant le bios d'origine puis reflash du custom du wiki bc250 c'est repartis comme en 40.

---------------
Victime de girafophobie, mais se soigne.

the_fennec

f3nn3cUs z3rd4

fastboot c'est pas un truc Windows seulement?

---------------
Faudra que je teste un jour :o

bulldozer_fusion

rip Mekthoub & Marc

Profitez

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

the_fennec

f3nn3cUs z3rd4

27B c'est nul

Je suis repassé sur 35B pour la nuit, je pense qu'il a un soucis avec le speculative decoding, il s’arrête tout seul.

---------------
Faudra que je teste un jour :o

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

the_fennec a écrit :

Je l'ai vus apres avoir commencé a bidouiller le 3.00 :sweat:
Non j'ai pas utilisé de CH341, le mien est full 5V ( pour certaines vieille cm) , j'ai soudé à l'arrache des pin header sur un rp2040 zero qui traînais dans un tiroir :lol:

the_fennec a écrit :

fastboot c'est pas un truc Windows seulement?

Je voulais dire le "boot rapide" dispo dans certains bios/EFI, ca permet de skip certaines étapes du boot, m'enfin je pense que je vais pas chercher plus... 20 minutes pour reflasher proprement la carte a chaque fois

Sinon j'ai continué a jouer avec les optimisations sur la conso, il y a un beau delta entre la 1ere carte peu optimisée avec juste le patch kernel et governor non tuné, et la deuxième ou j'ai poussé au max :

Message édité par Tronklou le 23-04-2026 à 00:46:09

---------------
Victime de girafophobie, mais se soigne.

neo world

Pour ceux qui sont limités en RAM, il y a des techniques de turboquant qui arrivent et permettent de jouer avec des modèles de taille respectable avec peu de VRAM :
https://youtu.be/XLlQDfhyBjc?is=KrNWtbzMtYYLNguZ

J’ai pas testé personnellement comme les modèles 3.6 / 3.6 plus passent nickel dans 40GB.

Je joue d’ailleurs avec une version non officielle 3.6 plus. La partie thinking est assez bluffante de détails et ça améliore bien l’output même avec des prompts de départ assez courts.

Je galère à trouver le temps de monter le CI/CD mais j’ai mon cluster K8s dans OCI de prêt (4 cpu et 24 GO de ram gratuits au total pour le cluster. Un peu à mes risques et périls comme j’ai vu des gens se faire avoir sur Reddit et recevoir des factures parce qu’ils avaient activé par accident des produits non gratuits).

the_fennec

f3nn3cUs z3rd4

J'ai tenté les turboquant, mais comme j'ai une config split CUDA/Vulkan j'ai pas trouvé de fork qui supporte les deux.

Après, il faut relativiser les gains annoncés par les "créateurs". La perplexité est aux fraises si tu mets les keys en TQ et souvent les configs sont en q8 pour les keys et tq4 pour les values. Le gain final est pas si énorme pour les modèles Qwen en tout cas, genre 10/15% par rapport a du q8/q8. De plus il y a un coût en décodage et on perds en tokens/s.

---------------
Faudra que je teste un jour :o

bulldozer_fusion

rip Mekthoub & Marc

https://github.com/usestrix/strix

Message édité par bulldozer_fusion le 23-04-2026 à 10:17:03

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

neo world

the_fennec a écrit :

En fait ça a l’air surtout efficace pour la partie cache ( donc augmenter in fine la fenêtre de contexte max même sur un gpu limite en vram ). La vidéo reprend les résultats sur un bench « qualité » (retrouver les mots cachés dans un texte super long) et si le gpu n’est pas à l’agonie en q8 tu arrives à une perte assez négligeable en performance ( de l’ordre de 10% vs sans turboquant) largement rattrapé par le fait que désormais tout le modèle et son cache peut être hébergé en vram plutôt que décharger une partie sur cpu :love:

Mon impression c’est que, si la qualité ne part pas dans les fraises, on devrait pouvoir tester dans de très bonnes conditions des modèles qui initialement étaient très limités en jetons max par session à cause de leur taille de départ

the_fennec

f3nn3cUs z3rd4

neo world a écrit :

Pour le moment le TQ n'est appliqué qu'au KV, j'ai vu des forks qui essayent de l'appliquer au modèle, mais ça marche juste pas du tout. La vidéo est pas mal pour de la vulgarisation, mais le TQ est très loin d'être au point, ça à l'air d'aller pour quelques tests, mais ya quand même pas mal de retours négatif ou le contexte fini pas être corrompus. Il n'y a pas de fork qui couvre les archis principales a la fois, CUDA, Metal ET Vulkan. Chacun a sa petite popote et la hype semble être passée. Je pense qu'il faudrait qu'une boite s'y mette sérieusement avec pas mal de dev en plus derrière. Bref c'est pas pour tout de suite un merge dans llama.cpp.

Si tu veux voir plein de benchs et résultats, c'est la que ça se passe:
https://github.com/ggml-org/llama.cpp/discussions/20969

---------------
Faudra que je teste un jour :o

Tronklou

❤❤ Vrp Bambulab à mi-temps ❤❤

Même constat de mon côté, plus le fait d'avoir une configuration boiteuse qui exige beaucoup de test pour peu de gain... Je suis repassé sur llama officiel et basta

---------------
Victime de girafophobie, mais se soigne.

Page : 1 2 3 4 5 .. 24 25 26 .. 38 39 40 41 42 43

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Intelligence Artificielle

[Topic unique] Développement via IA

Sujets relatifs
Le topic des agents IA	[Topic Unique] Machine Learning & Data Science
OpenClaw : L'assistant IA personnel et open-source (et Hermes Agent)	Les anti IA
L'IA et ses implications sociétales : droit d'auteur, éthique, dérives	[Topic unique] Veille IA - Actu, lectures, podcasts & documentaires
Les images/vidéos générées en IA: Midjourney Dall-e StableDiffusion...	[Topic Unique] Claude by Anthropic
Infra IA : aide au choix et troubleshot de LLM locaux
Plus de sujets relatifs à : [Topic unique] Développement via IA

Page générée en 0.084 secondes