Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
3701 connectés 

 


 Mot :   Pseudo :  
 
 Page :   1  2  3  4  5  6  7  8  9  10
Page Suivante
Auteur Sujet :

[Topic unique] Développement via IA

n°2520732
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 21-03-2026 à 22:32:35  profilanswer
 

Reprise du message précédent :
C'est pas mal du tout :D
 
Tu monte a combien de token second sur un qwen 3.5 9B en 4b ?


---------------
Victime de girafophobie, mais se soigne.
mood
Publicité
Posté le 21-03-2026 à 22:32:35  profilanswer
 

n°2520733
Quich
Pouet ?
Posté le 21-03-2026 à 23:16:27  profilanswer
 

the_fennec a écrit :

 

Tu fais du jeu dessus?


Oui, enfin c'est censé servir à ça mais pour le moment je n'ai pas le temps :o


---------------
Feedback
n°2520734
the_fennec
f3nn3cUs z3rd4
Posté le 21-03-2026 à 23:45:46  profilanswer
 

Tronklou a écrit :

C'est pas mal du tout :D
 
Tu monte a combien de token second sur un qwen 3.5 9B en 4b ?


 
Voila en 9B Q4:

Code :
  1. build/bin/llama-server --alias default --host 0.0.0.0 --port 8080 -hf unsloth/Qwen3.5-9B-GGUF:Q4_K_M --ctx-size 16000
  2. prompt eval time =     265.48 ms /    19 tokens (   13.97 ms per token,    71.57 tokens per second)
  3.        eval time =   86665.70 ms /  2766 tokens (   31.33 ms per token,    31.92 tokens per second)
  4.       total time =   86931.18 ms /  2785 tokens


 
J'essaye de charger Mistral-Small-4-119B-2603-IQ1_S.gguf pour le fun, mais le server rpc plante, j'imagine que -1.8GB de free c'est pas bon :o

Code :
  1. llama_params_fit_impl:   - RPC0 (lain:50000)         :  16012 total,  17858 used,  -1864 free vs. target of   1024
  2. llama_params_fit_impl:   - CUDA0 (NVIDIA GeForce RTX 4060 Ti):  16379 total,  11296 used,   2290 free vs. target of   1024


 

Code :
  1. [ 1090.163002] oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=/,mems_allowed=0,global_oom,task_memcg=/user.slice/user-1000.slice/session-1.scope,task=rpc-server,pid=1726,uid=1000
  2. [ 1090.163020] Out of memory: Killed process 1726 (rpc-server) total-vm:1544280kB, anon-rss:40kB, file-rss:0kB, shmem-rss:0kB, UID:1000 pgtables:2744kB oom_score_adj:0


 
J'ai pas eu de soucis avec Qwen3.5-35B-A3B-UD-Q4_K_L, je dois juste avoir une limite de travers.


---------------
Faudra que je teste un jour :o
n°2520735
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 22-03-2026 à 00:09:15  profilanswer
 

Je ne pensais pas que ça sortirait autant ! Ils ont fait un travail de fou en optimisation les deg entre cet été et aujourd'hui  :sol:

 


---------------
Victime de girafophobie, mais se soigne.
mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  6  7  8  9  10
Page Suivante

Aller à :
Ajouter une réponse
 

Sujets relatifs
Un assistant IA m’a pondu un script Bash… et une blague en bonus ![React] Comment changer le state de manière unique dans une map
Macros MS Publisher 2007 (Topic Unique ?)Environnement de développement modulaire basé sur node.js avec docker
Les truc indispensable sur du gros développementIA
MonoGame 3.8 - Le topic Unique[Développement Web] Votre parcours en tant que développeur web
[POSTGRESQL] WTF création unique impossibeondage sur votre expérience en développement web (dette technique)
Plus de sujets relatifs à : [Topic unique] Développement via IA


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)