Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
7713 connectés 

 


 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  25  26  27  ..  31  32  33  34  35  36
Auteur Sujet :

[Topic unique] Développement via IA

n°2522771
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 23-04-2026 à 17:13:20  profilanswer
 

Reprise du message précédent :
Même constat de mon côté, plus le fait d'avoir une configuration boiteuse qui exige beaucoup de test pour peu de gain... Je suis repassé sur llama officiel et basta  :D


---------------
Victime de girafophobie, mais se soigne.
mood
Publicité
Posté le 23-04-2026 à 17:13:20  profilanswer
 

n°2522774
bounty2k
Posté le 23-04-2026 à 17:33:51  profilanswer
 

J'ai tout tenté pour faire tourner Qwen3.6 sur mon M4 avec 16 go de RAM et j'ai enfin réussi .... avec la version 35B en Q1  :lol: , toutes les autres versions plantaient systématiquement au démarrage quelque soit le paramétrage, y compris les models en Q2.
 
J'ai fait le test de lui faire générer flappybird et le résultat est plutot bon graphiquement (identique à la version de the_fennec) mais les tubes sont systématiquement mal placés et ne permette pas d'y jouer  (il n'y a pas l'espace pour faire passer l'oiseau), surement inhérent à la version Q1. Par contre le model à l'air vraiment très très bon et rapide, dommage de ne pas pouvoir le lancer une version Q3 ou Q4.
J'en ai également profité pour tester le même prompt (flappybird) avec Gemma 4 en 9B, qui lui, a généré un flappybird parfaitement jouable mais graphiquement ultra basique (un rond et des rectangles)

n°2522775
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 17:50:25  profilanswer
 

T'as pris quel model?  
C'est quoi ta ligne de commande?
T'as quoi d'autre qui tourne?

Message cité 1 fois
Message édité par the_fennec le 23-04-2026 à 17:56:08

---------------
Faudra que je teste un jour :o
n°2522776
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 23-04-2026 à 17:53:08  profilanswer
 

Sur du metal il y a des optimisations intéressantes, maintenant oui un 16gb quoi que tu fasse ça va rester très limité


---------------
Victime de girafophobie, mais se soigne.
n°2522777
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 17:57:57  profilanswer
 

Faudrait que je teste sur le m1 de ma femme, mais je vois pas pourquoi on pourrait pas charger un modèle de 12GB comme le Qwen3.6-27B-UD-IQ3_XXS.


---------------
Faudra que je teste un jour :o
n°2522779
bounty2k
Posté le 23-04-2026 à 18:37:11  profilanswer
 

the_fennec a écrit :

T'as pris quel model?
C'est quoi ta ligne de commande?
T'as quoi d'autre qui tourne?


J'ai tenté a peu pret tout ce qui était possible, du plus simple au plus compliqué (toujours avec mmap d'activé) , même avec un context de 4096 ça ne passait pas (je partais avec 0 appli ouverte à coté) .
Parmis les tests :
--jinja -c 4096 --port 8080 -ngl 99 --mmap
--jinja -c 4096 --port 8080 -ngl 99 --mmap --swa-full -fa on --reasoning off
--jinja -c 4096 --port 8080 -ngl 99 --mmap --swa-full --reasoning off
--jinja -c 4096 --port 8080

 
Tronklou a écrit :

Sur du metal il y a des optimisations intéressantes, maintenant oui un 16gb quoi que tu fasse ça va rester très limité


Il faudrait que je teste cette piste en effet  :jap: , a priori il y a des gains substantiels à la clé, au moins en tg/s

 


EDIT : j'ai réussi à lancer la version Q2 XXS, mais on voit que l'allocation de la RAM fait le yoyo, c'est le seul model qui me fait ça.
Et même en Q2 le model est trop imprécis ex  :
Prompt : Combien de R y a t-il dans le mot "fraise"
Réponse : Il y a 0 lettre "R" dans le mot "fraise".
Prompt : En es-tu sur ?
Réponse : Oui, je suis certain. Si tu regardes bien le mot fraise, il est composé des lettres : F - A - I - S - E. Il n'y a aucune lettre "R".


Message édité par bounty2k le 23-04-2026 à 18:51:54
n°2522781
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 19:32:32  profilanswer
 

N'utilises pas -ngl 99, ça force a charger tout le modèle en mémoire. mmap est actif par défaut. Utilise --ctk q4_0 --ctv q4_0 pour compresser le contexte (a mort :o).
 
T'as essayé ça?

Code :
  1. sudo sysctl iogpu.unified_memory_limit_mtl=15360


 
Laisse tomber les tests de logique, surtout en français, ça n'a aucun intérêt technique. Un LLM c'est que des stats.
 
T'as d'autres trucs qui tournent en plus?


---------------
Faudra que je teste un jour :o
n°2522782
bounty2k
Posté le 23-04-2026 à 19:53:38  profilanswer
 

the_fennec a écrit :

N'utilises pas -ngl 99, ça force a charger tout le modèle en mémoire. mmap est actif par défaut. Utilise --ctk q4_0 --ctv q4_0 pour compresser le contexte (a mort :o).
 
T'as essayé ça?

Code :
  1. sudo sysctl iogpu.unified_memory_limit_mtl=15360


 
Laisse tomber les tests de logique, surtout en français, ça n'a aucun intérêt technique. Un LLM c'est que des stats.
 
T'as d'autres trucs qui tournent en plus?


J'avais essayé sans le ngl et avec les ctk q4_0 et ctv q4_o, sans que cela change quoique ce soit.
Je n'ai pas encore testé ta commande sysctl cependant, je regarderais ça demain  :jap:  
Rien d'autre qui tourne, même pas de navigateur web.
 
Pour le test de logique linguistique, Qwen 3.6 Plus le passe sans problème, je suspecte que c'est la quantification excessive qui rend le model local un peu bête.

n°2522785
neo world
Posté le 23-04-2026 à 20:00:14  profilanswer
 

Merci pour vos réponses et retours d’expérience :D

n°2522786
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 20:01:08  profilanswer
 

Sinon pour Qwen 3.6, je pense qu'il y a des petits soucis, je pensais que c'était le speculative decoding, mais non, 27B et 35B semblent s'arrêter tout seuls au bout de quelques heures, ensuite il faut souvent relancer llama.cpp.
 


---------------
Faudra que je teste un jour :o
mood
Publicité
Posté le 23-04-2026 à 20:01:08  profilanswer
 

n°2522787
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 20:02:35  profilanswer
 

bounty2k a écrit :


J'avais essayé sans le ngl et avec les ctk q4_0 et ctv q4_o, sans que cela change quoique ce soit.
Je n'ai pas encore testé ta commande sysctl cependant, je regarderais ça demain  :jap:  
Rien d'autre qui tourne, même pas de navigateur web.
 
Pour le test de logique linguistique, Qwen 3.6 Plus le passe sans problème, je suspecte que c'est la quantification excessive qui rend le model local un peu bête.


 
Qwen 3.6 Plus doit faire 500GB et tourner sur 10xA100, c'est pas comparable ...


---------------
Faudra que je teste un jour :o
n°2522790
neo world
Posté le 23-04-2026 à 21:45:38  profilanswer
 

J’ai pas remarqué de soucis de mon côté sur Mac avec LM Studio. J’ai fait une session de 61k tokens au total avec Qwen 3.6 plus 35B A3B Q8. Les performances ce sont dégradées progressivement (les premiers messages tournaient à 49 tokens / seconde mais les derniers plafonnent à 36,14 tokens par seconde avec un Time to first token régulièrement supérieur à 30 secondes. Ce weekend je m’occupe enfin de la partie CI/CD et je vais le faire cravacher sur des apps K8s :D

Message cité 1 fois
Message édité par neo world le 23-04-2026 à 21:52:12
n°2522791
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 23-04-2026 à 21:45:51  profilanswer
 
n°2522793
the_fennec
f3nn3cUs z3rd4
Posté le 23-04-2026 à 23:53:24  profilanswer
 

neo world a écrit :

J’ai pas remarqué de soucis de mon côté sur Mac avec LM Studio. J’ai fait une session de 61k tokens au total avec Qwen 3.6 plus 35B A3B Q8. Les performances ce sont dégradées progressivement (les premiers messages tournaient à 49 tokens / seconde mais les derniers plafonnent à 36,14 tokens par seconde avec un Time to first token régulièrement supérieur à 30 secondes. Ce weekend je m’occupe enfin de la partie CI/CD et je vais le faire cravacher sur des apps K8s :D


 
Tant que tu n'as pas remplis ton contexte et compacté au moins une fois, je trouve qu'on a pas des perf stables, on commence vite et ça descends un peu puis ça se stabilise.


---------------
Faudra que je teste un jour :o
n°2522814
the_fennec
f3nn3cUs z3rd4
Posté le 24-04-2026 à 14:21:16  profilanswer
 

Bon je repasse sur Qwen3-coder-next, je veux voir si mes soucis de perf/halt sont dus a Qwen 3.6.
 
La j'étais sur 35B et tombé a 3 tgs au lieu de 35 au bout de 12h de code.


---------------
Faudra que je teste un jour :o
n°2522824
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 24-04-2026 à 19:23:39  profilanswer
 
n°2522839
neo world
Posté le 24-04-2026 à 22:21:39  profilanswer
 

the_fennec a écrit :

Bon je repasse sur Qwen3-coder-next, je veux voir si mes soucis de perf/halt sont dus a Qwen 3.6.
 
La j'étais sur 35B et tombé a 3 tgs au lieu de 35 au bout de 12h de code.


Je pensais que tu avais un gros cluster de GPU ? Pas d’intérêt pour switcher sur le dernier truc trendy mais obèse en VRAM (je pense à Kimi 2.6) ?
 
Pour faire deux scripts dans un coin c’est overkill je note mais si tes modèles tournent 12h d’affilée à priori c’est pas pour sortir un nouveau flappy bird :o

Message cité 1 fois
Message édité par neo world le 24-04-2026 à 23:19:59
n°2522842
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 24-04-2026 à 22:38:15  profilanswer
 

Citation :

DeepSeek-V4-Flash is now available to run on Ollama's cloud using the latest NVIDIA Blackwell hardware.


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522852
ionik
Posté le 25-04-2026 à 09:22:26  profilanswer
 


Si quelqu'un test le pro et flash je veux bien un retour même si 5 euros ça pourrait être rentable a tester sur un mois  :O


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°2522853
XaTriX
Posté le 25-04-2026 à 09:42:58  profilanswer
 

https://i.imgur.com/YJ6ctxDl.png
 
J'échange parfois les messages/sorties entre Claude et Codex. Il me faut vraiment une façon de les faire communiquer dans ce cadre :D
 
Des idées ?


---------------
Proxytaf ? non rien
n°2522854
ionik
Posté le 25-04-2026 à 09:54:25  profilanswer
 

Tu peux demander a l'un ou a l'autre d'utiliser la commande par exemple claude -p qui fait directement un echo et sortie de la réponse que peu récupérer codex non ? après ça reste du one shot comme demande pas de la communication en temps réelle


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°2522855
the_fennec
f3nn3cUs z3rd4
Posté le 25-04-2026 à 09:54:57  profilanswer
 

neo world a écrit :


Je pensais que tu avais un gros cluster de GPU ? Pas d’intérêt pour switcher sur le dernier truc trendy mais obèse en VRAM (je pense à Kimi 2.6) ?
 
Pour faire deux scripts dans un coin c’est overkill je note mais si tes modèles tournent 12h d’affilée à priori c’est pas pour sortir un nouveau flappy bird :o


 
Mon "cluster" c'est une RTX 4060Ti 16GB et un carte BC-250 16GB, c'est tout. Le plus gros modèle que j'arrive a charger c'est Qwen3-Coder-Next-UD-IQ3_S.gguf qui fait 29GB et j'ai un contexte de 64k. Impossible de charger Kimi.
 
Il tourne depuis plus d'une semaine a porter le Kernel Linux 7.x sur Amiga 500 :o (avec quelques arrêts pour test/crash/swap). Ça sert strictement a rien, mais c'est fun et ça me permet de jouer avec llama et apprendre un peu comment ça marche. J'ai accès à Kiro/Cursor pour le taf, mais j'aime bien le fait d'avoir un truc en local pour faire des expériences.
 
L'étape d'après c'est de faire tourner le kernel dans un émulateur que j'ai modifié avec la même config pour ajouter une API REST pour que le LLM puisse bidouille. Ensuite si tout marche bien, sur mon Amiga 500 :D.
 
Si tout ça marche, ensuite j'aimerais tester de bidouiller ReactOS...


---------------
Faudra que je teste un jour :o
n°2522856
XaTriX
Posté le 25-04-2026 à 10:00:04  profilanswer
 

ionik a écrit :

Tu peux demander a l'un ou a l'autre d'utiliser la commande par exemple claude -p qui fait directement un echo et sortie de la réponse que peu récupérer codex non ? après ça reste du one shot comme demande pas de la communication en temps réelle


Je vois pas trop comment ça peut s'intégrer dans le worfklow là [:transparency]


---------------
Proxytaf ? non rien
n°2522857
XaTriX
Posté le 25-04-2026 à 10:00:41  profilanswer
 

P'tet un skill avec inotify et partage d'un dossier tmp avec fichiers codex_0001.tmp et claude_0001.tmp ?


---------------
Proxytaf ? non rien
n°2522858
ionik
Posté le 25-04-2026 à 10:09:53  profilanswer
 

Non tu lui dit de demande a claude en tant que skill il lance claude -p 'PROMPT' et voir le retour tout simplement, il me semble que le cli codex a le même paramètre
 
Edit : même sans skill ça doit fonctionner, en lui demandant de lancer la commande, test tu verras.


Message édité par ionik le 25-04-2026 à 10:10:41

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°2522859
XaTriX
Posté le 25-04-2026 à 10:10:23  profilanswer
 

Tu vois pas mon screen :??:


---------------
Proxytaf ? non rien
n°2522860
neo world
Posté le 25-04-2026 à 10:20:48  profilanswer
 

the_fennec a écrit :


 
Mon "cluster" c'est une RTX 4060Ti 16GB et un carte BC-250 16GB, c'est tout. Le plus gros modèle que j'arrive a charger c'est Qwen3-Coder-Next-UD-IQ3_S.gguf qui fait 29GB et j'ai un contexte de 64k. Impossible de charger Kimi.
 
Il tourne depuis plus d'une semaine a porter le Kernel Linux 7.x sur Amiga 500 :o (avec quelques arrêts pour test/crash/swap). Ça sert strictement a rien, mais c'est fun et ça me permet de jouer avec llama et apprendre un peu comment ça marche. J'ai accès à Kiro/Cursor pour le taf, mais j'aime bien le fait d'avoir un truc en local pour faire des expériences.
 
L'étape d'après c'est de faire tourner le kernel dans un émulateur que j'ai modifié avec la même config pour ajouter une API REST pour que le LLM puisse bidouille. Ensuite si tout marche bien, sur mon Amiga 500 :D.
 
Si tout ça marche, ensuite j'aimerais tester de bidouiller ReactOS...


:jap:
 
On va finir par se cotiser sur le topic pour prendre 8H100 et jouer avec les derniers modèles à la mode hfrstyle :o
 
Quelqu’un a déjà monté des RAG (ou équivalent) sur ses repos git hub ou sur des documents (drive ou local) ?

n°2522861
Tronklou
❤❤ Vrp Bambulab à mi-temps ❤❤
Posté le 25-04-2026 à 10:24:28  profilanswer
 

J'ai écouté la voie de la raison : j'ai mis une debian sur la bc250. Moins performant que mon ancienne installation fedora, mais tellement plus stable  :love:  
 
Il faut encore que je règle le souci de montée en fréquence du gpu qui se traîne beaucoup trop avec le governor et éventuellement tester le custom kernel proposé sur le wiki.
 
Par contre impossible de passer sous les 32w en idle
 
EDIT :  
 
https://i.imgur.com/fgeSMIS.png
 
Un petit watchdog sur le slot utilisé par llama, dès que l'inférence se lance ca boost a 2ghz le gpu, le gain est massif  :sol:
 
# BC-250 + llama.cpp : +42% token/s avec GPU DPM Watchdog
## Le problème
Le GPU BC-250 (Cyan Skillfish) bloque à ~1200 MHz en DPM auto pendant l'inférence,  
au lieu des 2000 MHz possibles.
## Le fix : watchdog D-Bus vers le governor SMU
Le driver amdgpu ne permet pas de forcer le DPM manuellement sur cette carte.
Mais le cyan-skillfish-governor-smu expose une API D-Bus pour forcer la fréquence.
 
### 1. Config du governor (`/etc/cyan-skillfish-governor-smu/config.toml`)
 

Code :
  1. ```toml
  2. [[safe-points]]
  3. frequency = 350
  4. voltage = 700
  5. [[safe-points]]
  6. frequency = 1000
  7. voltage = 800
  8. [[safe-points]]
  9. frequency = 1500
  10. voltage = 900
  11. [[safe-points]]
  12. frequency = 1800
  13. voltage = 950
  14. [[safe-points]]
  15. frequency = 2000
  16. voltage = 1000
  17. [dbus]
  18. enabled = true
  19. [load-target]
  20. lower = 70
  21. upper = 95


 
2. Policy D-Bus (/etc/dbus-1/system.d/cyan-skillfish-governor.conf)

Code :
  1. <!DOCTYPE busconfig PUBLIC "-//freedesktop//DTD D-BUS Bus Configuration 1.0//EN"
  2. "http://www.freedesktop.org/standards/dbus/1.0/busconfig.dtd">
  3. <busconfig>
  4.   <policy user="root">
  5.     <allow own="com.cyan.SkillFishGovernor"/>
  6.     <allow send_destination="com.cyan.SkillFishGovernor"/>
  7.   </policy>
  8.   <policy context="default">
  9.     <allow send_destination="com.cyan.SkillFishGovernor"/>
  10.   </policy>
  11. </busconfig>


 
3. Watchdog (/usr/local/bin/gpu-dpm-watchdog.sh)
 

Code :
  1. #!/bin/bash
  2. # Monitor llama-server /slots, force GPU 2000 MHz via SMU D-Bus during inference
  3. SLOTS_URL="http://localhost:8080/slots"
  4. CHECK_INTERVAL=0.3
  5. COOLDOWN_SEC=2
  6. current_state="auto"
  7. set_high() {
  8.     [ "$current_state" = "high" ] && return
  9.     busctl --system call com.cyan.SkillFishGovernor \
  10.       /com/cyan/SkillFishGovernor \
  11.       com.cyan.SkillFishGovernor.PerformanceMode \
  12.       SetFixedFrequency u 2000 >/dev/null 2>&1
  13.     current_state="high"
  14. }
  15. set_auto() {
  16.     [ "$current_state" = "auto" ] && return
  17.     busctl --system call com.cyan.SkillFishGovernor \
  18.       /com/cyan/SkillFishGovernor \
  19.       com.cyan.SkillFishGovernor.PerformanceMode \
  20.       Disable >/dev/null 2>&1
  21.     current_state="auto"
  22. }
  23. idle_since=0
  24. while true; do
  25.     slots=$(curl -s --max-time 2 "$SLOTS_URL" 2>/dev/null)
  26.     [ -z "$slots" ] && { set_auto; sleep "$COOLDOWN_SEC"; continue; }
  27.     if echo "$slots" | grep -qE '"is_processing":[[:space:]]*true|"state":[[:space:]]*[1-9]'; then
  28.         set_high; idle_since=0
  29.     else
  30.         [ "$idle_since" -eq 0 ] && idle_since=$(date +%s)
  31.         [ $(( $(date +%s) - idle_since )) -ge "$COOLDOWN_SEC" ] && set_auto
  32.     fi
  33.     sleep "$CHECK_INTERVAL"
  34. done


 
4. Service systemd (/etc/systemd/system/gpu-dpm-watchdog.service)
 

Code :
  1. [Unit]
  2. Description=GPU DPM Watchdog for llama-server
  3. After=network.target
  4. [Service]
  5. Type=simple
  6. ExecStart=/usr/local/bin/gpu-dpm-watchdog.sh
  7. Restart=on-failure
  8. RestartSec=5
  9. [Install]
  10. WantedBy=multi-user.target


 
5. Activation
 
chmod +x /usr/local/bin/gpu-dpm-watchdog.sh
systemctl restart cyan-skillfish-governor-smu
systemctl daemon-reload
systemctl enable --now gpu-dpm-watchdog

Message cité 1 fois
Message édité par Tronklou le 25-04-2026 à 11:13:38

---------------
Victime de girafophobie, mais se soigne.
n°2522862
ionik
Posté le 25-04-2026 à 11:15:26  profilanswer
 

XaTriX a écrit :

Tu vois pas mon screen :??:


Si mais je ne sais pas comment tu pourrais faire soit via un MCP soit via un répertoire partagé qui verifie régulièrement le contenu avec un repertoire pour chaque, mais il me semble avoir lu quelque part que certain l'avait fait.
 
 
Sinon demande leur directement comment faire ^^


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°2522863
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 25-04-2026 à 11:52:49  profilanswer
 

ionik a écrit :


Si quelqu'un test le pro et flash je veux bien un retour même si 5 euros ça pourrait être rentable a tester sur un mois  :O


 :jap:


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522864
bounty2k
Posté le 25-04-2026 à 12:33:10  profilanswer
 

neo world a écrit :


:jap:
 
On va finir par se cotiser sur le topic pour prendre 8H100 et jouer avec les derniers modèles à la mode hfrstyle :o
 
Quelqu’un a déjà monté des RAG (ou équivalent) sur ses repos git hub ou sur des documents (drive ou local) ?


Je teste Anything LLM en ce moment qui a pas mal de possibilités agentiques et de RAG, très simple d'utilisation, il a sa propre base vectorielle, s'adapte à toute sorte de LLM. Il a des connecteurs Github, Confluence etc ...

n°2522865
XaTriX
Posté le 25-04-2026 à 12:33:47  profilanswer
 

Je vais devoir prendre un 2eme abo codex :lol:
https://i.imgur.com/EIJEO1K.png
 
Heuresement que j'ai des prix parce que sinon.. entre le team premium chez Anthropic (125$ normalement) et les Biz chez OpenAI à 21€ et tout ça hors TVA :o
 
Après si Anthropic avait pas chié dans la colle avec opus lô :o le Max20 serait une super offre, même à 200$ :o je parle pour les autres bien sur :o


---------------
Proxytaf ? non rien
n°2522866
Winpoks
Posté le 25-04-2026 à 12:48:15  profilanswer
 

21€ avec un gros quota ?  :O

n°2522867
XaTriX
Posté le 25-04-2026 à 12:50:06  profilanswer
 

bah classique non ? c'est le prix avant réduc je veux dire
pas de compte premium dispo pour moi sur openai, faut que j'enchaine les comptes :o  
sinon c'est paiement au token LOL


---------------
Proxytaf ? non rien
n°2522868
neo world
Posté le 25-04-2026 à 13:08:44  profilanswer
 

bounty2k a écrit :


Je teste Anything LLM en ce moment qui a pas mal de possibilités agentiques et de RAG, très simple d'utilisation, il a sa propre base vectorielle, s'adapte à toute sorte de LLM. Il a des connecteurs Github, Confluence etc ...


Merci  :jap:

n°2522869
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 25-04-2026 à 13:44:34  profilanswer
 

XaTriX a écrit :

bah classique non ? c'est le prix avant réduc je veux dire
pas de compte premium dispo pour moi sur openai, faut que j'enchaine les comptes :o
sinon c'est paiement au token LOL


Tu envoies la facture à ldlc :O  :whistle:


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522870
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 25-04-2026 à 14:37:56  profilanswer
 

Cross topic

Citation :

I Xiaomi’s MiMo V2.5 Pro has landed at 54 in the Artificial Analysis Intelligence Index, tied with Moonshot’s Kimi K2.6 - the current top open weights model. MiMo V2.5 Pro’s weights are expected to be released soon, which would make MiMo V2.5 Pro the first equal open weights model - slightly ahead of DeepSeek V4 Pro

 

@Xiaomi’s MiMo V2.5 Pro shows an impressive improvement over MiMo V2 Pro (49), the previous generation of Xiaomi's flagship model family, which was released just over a month ago on March 19, 2026.

 

Key takeaways:

 

➤ MiMo V2.5 Pro is on the pareto frontier of our Intelligence Index vs Cost to Run Intelligence Index chart. It was slightly cheaper to run than GLM-5.1, and slightly more intelligent. It was significantly cheaper to run than Kimi K2.6, driven by using just over half the number of output tokens.

 

➤ MiMo V2.5 Pro will be the leading open weights model in GDPval-AA, our agentic real-world work tasks benchmark. It scores 1578, ahead of DeepSeek V4 Pro (1554), GLM-5.1 (1535), MiniMax-M2.7 (1514), and Kimi K2.6 (1484).


Citation :

Priced at $1.00/$3.00 per million input/output tokens on Xiaomi’s first-party API, MiMo V2.5 Pro is relatively cost-efficient for its intelligence tier. It costs only $462 to run the Artificial Analysis Intelligence Index, compared to $948 for Kimi K2.6 and $544 for GLM 5.1.


Xiaomi sorti de nul part qui est le meilleur rapport qualité prix perf avec cette nouvelle version v2. 5 pro à venir [:shaft_d0:2]
https://rehost.diberie.com/Picture/Get/r/509166
https://rehost.diberie.com/Picture/Get/r/509170
https://x.com/i/status/2047799218828665093


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522871
neo world
Posté le 25-04-2026 à 15:04:39  profilanswer
 

les modèles chinois en train de refaire tout leur retard sur les modèles ricains ! y'a d'autres projets en Europe à suivre ou tout est chez Mistral et Albert ( :o ) ?

Message cité 2 fois
Message édité par neo world le 25-04-2026 à 15:04:51
n°2522872
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 25-04-2026 à 15:08:07  profilanswer
 

neo world a écrit :

les modèles chinois en train de refaire tout leur retard sur les modèles ricains ! y'a d'autres projets en Europe à suivre ou tout est chez Mistral et Albert ( :o ) ?


A part Mistral et h company on est largué


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°2522873
neo world
Posté le 25-04-2026 à 15:15:06  profilanswer
 

deux boîtes françaises. On est pas dans la merde sur le vieux continent :o

n°2522874
speedboyz3​0
Guide Michelin :o
Posté le 25-04-2026 à 15:25:45  profilanswer
 

XaTriX a écrit :

https://i.imgur.com/YJ6ctxDl.png
 
J'échange parfois les messages/sorties entre Claude et Codex. Il me faut vraiment une façon de les faire communiquer dans ce cadre :D
 
Des idées ?


 
.md files ?

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  25  26  27  ..  31  32  33  34  35  36

Aller à :
Ajouter une réponse
 

Sujets relatifs
Un assistant IA m’a pondu un script Bash… et une blague en bonus ![React] Comment changer le state de manière unique dans une map
Macros MS Publisher 2007 (Topic Unique ?)Environnement de développement modulaire basé sur node.js avec docker
Les truc indispensable sur du gros développementIA
MonoGame 3.8 - Le topic Unique[Développement Web] Votre parcours en tant que développeur web
[POSTGRESQL] WTF création unique impossibeondage sur votre expérience en développement web (dette technique)
Plus de sujets relatifs à : [Topic unique] Développement via IA


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)