| |||||
FORUM HardWare.fr

Intelligence Artificielle

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co| Auteur | Sujet : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co |
|---|---|
bulldozer_fusion rip Mekthoub & Marc |
--------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
bulldozer_fusion rip Mekthoub & Marc |
--------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
Tronklou ❤❤ Vrp Bambulab à mi-temps ❤❤ | Par contre j'ai renté kimi aujourd’hui, c'est mort. Dès que ca rentre dans le dur elle fait de la merde. --------------- Victime de girafophobie, mais se soigne. |
Olivie SUUUUUUUUUUUUUU | Xatrix tu testes sur tes PR app RedFace ? --------------- |
Olivie SUUUUUUUUUUUUUU | Qui a assez de ram pour tester ? --------------- |
bulldozer_fusion rip Mekthoub & Marc |
--------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
Olivie SUUUUUUUUUUUUUU |
--------------- |
bulldozer_fusion rip Mekthoub & Marc |
--------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
Olivie SUUUUUUUUUUUUUU |
--------------- |
Olivie SUUUUUUUUUUUUUU |
--------------- |
LibreArbitre La /root est longue |
falkon1000 | Avant les GPT parlaient comme ça aussi dans codex ou l’API au tout début |
bulldozer_fusion rip Mekthoub & Marc | Faut le vendre aux entreprises dont c'est normal --------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
Winpoks |
|
bulldozer_fusion rip Mekthoub & Marc |
--------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
docmaboul |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
falkon1000 | Tu as regardé comment fonctionne SWE Pro ? |
Olivie SUUUUUUUUUUUUUU |
--------------- |
bulldozer_fusion rip Mekthoub & Marc |
--------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
the_fennec f3nn3cUs z3rd4 |
Message édité par the_fennec le 28-04-2026 à 17:50:01 --------------- Faudra que je teste un jour :o |
falkon1000 | De mémoire c'est un pool glissant de 1800 PR diverses qui est demandé à chaque modèle, et ils mesurent le taux de succès en one shot, sur plusieurs langages mais effectivement avec une majorité de python. Tous les autres bench de codage ont minimum 90% de python Et la plupart des modèles sont surentrainés en Python, un peu moins sur d'autres langages. Un des effets troublants, c'est que Gemini 3.1 est pas hyper bien classé dans les bench bien que ce soit un des meilleurs modèles pour le PHP, juste par ce que ce n'est pas le meilleur en python. Quoi qu'il en soit il est quasi impossible de "benchmax" un SWE pro comme le disent les américains sur Reddit. Les cas sont trop variés et son renouvelés. Le seul moyen d'avoir un bon score c'est d'avoir un modèle très entrainé sur la résolution de conflits en python Si on faisait un bench qui évaluent les perfs en assembleur, en PHP, en C, etc. le classement serait très différent des classements actuels, surtout pour les modèles open Message édité par falkon1000 le 28-04-2026 à 18:21:54 |
klins |
|
LibreArbitre La /root est longue |
falkon1000 |
|
duckjerry | Vous arrivez à des résultats similaires pour vos usages entre codex, claude code et GLM / MiMo / Kimi / Deepseek ( / autre ?) ? Message édité par duckjerry le 28-04-2026 à 19:46:16 --------------- Mon Flickr - "Oh, people can come up with statistics to prove anything, Kent. 40% of people know that." (Homer J. Simpson) |
XaTriX | ah ça c'est moi --------------- [:dawa] |
bulldozer_fusion rip Mekthoub & Marc |
--------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
XaTriX | quoi --------------- [:dawa] |
bulldozer_fusion rip Mekthoub & Marc |
Message édité par bulldozer_fusion le 28-04-2026 à 20:13:41 --------------- feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas |
duckjerry |
--------------- Mon Flickr - "Oh, people can come up with statistics to prove anything, Kent. 40% of people know that." (Homer J. Simpson) |
XaTriX | le mec se fait surtout une pub pour le nom de truc --------------- [:dawa] |
klins |
|
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
duckjerry |
--------------- Mon Flickr - "Oh, people can come up with statistics to prove anything, Kent. 40% of people know that." (Homer J. Simpson) |

FORUM HardWare.fr

Intelligence Artificielle

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co| Sujets relatifs | |
|---|---|
| sécurité de l'IA / agentique et des Devs en roue libre | |
| Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co | |


