Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
3397 connectés 

 

 

Avez-vous basculé sur ChatGPT Plus ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  141  142  143  ..  254  255  256  257  258  259
Auteur Sujet :

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

n°72835836
gagaches
Posté le 05-05-2025 à 18:20:50  profilanswer
 

Reprise du message précédent :

LibreArbitre a écrit :


Ce n'est pas le cas des modèles à raisonnement...

 

C'est toujours des LLM.
Du coup, même si la stratégie d'entraînement est différente, ça ne reste que de la projection statistique


---------------

mood
Publicité
Posté le 05-05-2025 à 18:20:50  profilanswer
 

n°72835904
LibreArbit​re
La /root est longue
Posté le 05-05-2025 à 18:37:31  profilanswer
 

Le code que je ponds avec des modèles à raisonnement ne ressemble pourtant pas à de la régurgitation de GitHub comme avec les modèles sans raisonnement mais ça doit être un biais...


---------------
Hebergement d'images
n°72835929
Olivie
SUUUUUUUUUUUUUU
Posté le 05-05-2025 à 18:44:30  profilanswer
 

LibreArbitre a écrit :

Le code que je ponds avec des modèles à raisonnement ne ressemble pourtant pas à de la régurgitation de GitHub comme avec les modèles sans raisonnement mais ça doit être un biais...


C'est juste une impression. C'est pour ca qu'ils ne sont pas "intelligent".
Et les modèles qui créent des images, fondamentalement, devinent la couleur du prochain pixel. Même s'ils arrivent à faire des images en 8k  :D


---------------

n°72836226
kaloskagat​os
Posté le 05-05-2025 à 19:53:35  profilanswer
 

LibreArbitre a écrit :


Ce n'est pas le cas des modèles à raisonnement...

 


Regardez la dernière video de science étonnante sur le sujet
https://youtu.be/YcIbZGTRMjI

 
Spoiler :

Les modèles de raisonnement sont juste des modèles fine tunnés pour générer une chaîne de raisonnement avant la réponse finale


Message cité 2 fois
Message édité par kaloskagatos le 05-05-2025 à 19:53:47

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°72837779
docmaboul
Posté le 06-05-2025 à 07:38:24  profilanswer
 

Mevo a écrit :


C'est la capacité à poser cette question, ainsi qu'à ce qu'elle te vienne (j'aurais du mal à y répondre, néanmoins :jap: )
 
Une IA ne comprend même pas réellement ce que tu dis. Tu le crois grâce la qualité de son imitation de l'intelligence. Elle reproduit le "comportement linguistique" associé à la compréhension de quelque chose. C'est comme un acteur qui joue un role: il n'a pas les compétences du personnage, mais sa performance est suffisamment convaincante que tu en as l'impression.
 
Une IA ne fait que reproduire les schémas qu'elle a déjà vu, d'ailleurs (bien que j'ai l'impression qu'un certain nombre d'humains font effectivement un peu pareil :o ).
Je trouve également tout ca assez compliqué à conceptualiser, au final :jap:


 
En fait c'est un débat qui a déjà eu lieu, il y a des siècles.
 
L'animal n'est pas intelligent, pas comme l'Homme. Il ne fait que réagir de manière mécanique à des stimuli, par instinct. Si on pouvait connaître précisément le poids de ses paramètres et l'ensemble des calculs qui y sont appliqués, on saurait dire quel va être le prochain mot qu'il va produire :o
 
Ca s'appelait l'animal machine. Il y a un vieux préjugé selon lequel à partir du moment où l'on sait expliquer de manière mécanique l'intelligence, ce n'est plus de l'intelligence.
 
Parce que l'Homme est différent. C'est une créature divine lui. Dieu lui a donné le libre arbitre. C'est un mystère tu vois. On ne peut pas l'expliquer. Il n'est pas soumis aux lois physiques, comme les étoiles, comme le silicium de nos chipsets ou comme les autres animaux. Il pense, donc il est.
 
Bullshit (made in France, tout de même :o)
 
La pensée est un sens. C'est un sens comme les autres, qui nous permet de réagir aux stimuli. Nous ne sommes que des machines sensorielles, comme les autres animaux. Nous traitons nos informations avec des outils biologiques (tout notre système nerveux) mais sur le principe, il s'agit quand même de faire des opérations sur des entrées et de produire une sortie. Il n'y a pas réellement d'opposition de nature entre une opération biologique et une opération réalisée par un CPU. C'est une affaire de complexité, et d'un tine-tuning qui dure depuis plusieurs milliards d'années.
 
Bref, l'invocation de l'aspect calculatoire et mécanique comme argument opposé à l'intelligence est une supercherie.

Message cité 1 fois
Message édité par docmaboul le 06-05-2025 à 08:29:17
n°72837821
Mevo
Divergent
Posté le 06-05-2025 à 08:00:02  profilanswer
 

docmaboul a écrit :

En fait c'est un débat qui a déjà eu lieu, il y a des siècles.


Oui, sans doute. Et c'est tout un sujet qui doit aussi beaucoup faire débat encore aujourd'hui, je crois. Je n'ai pas la prétention de savoir ou de savoir répondre là-dessus :jap:
Oui, il semble qu'il y ait déjà la partie "émotions" qui manque chez les machines (dont les animaux me semblent dotés, à moins que je ne me trompe). Ensuite, il y a la volonté, le désir (je ne suis pas totalement sur de la distinction à faire entre animaux et humains là-dessus). La "conscience" (qui serait a priori spécifiquement humaine, là). En causant dans le passé avec une IA de ce sujet, justement, elle m'avait mentionné l'intuition, si je me souviens bien. Truc auquel j'avais répondu moi-même que je n'étais pas certain d'à quel point c'était différent de la "reconnaissance de schéma" par rapport à des trucs connus, donc typiquement ce que fait une IA. Le modèle semblait faire une distinction avec une sorte de capacité des humains à raisonner  sur quelque chose de purement inconnu.
 
Mais oui, ca me semble pas mal un sac de noeuds, et je t'avoue que je rame lorsque j'essaye de comprendre. Parce que la question d'en quoi une IA serait différente du raisonnement "humain", qu'est-ce que l'intelligence (certains te diront qu'il y a un tas "d'intelligences" différentes, aussi), quels sont les différences IA/humains, les recoupements, etc. sont des questions que je me pose également, et ... pfiou, ca ne me parait pas simple :o
 
Il semble qu'un tas de monde se casse la tete sur ce genre de questions :jap:
Il y a également possiblement des humains qui veulent se CROIRE intelligents et plus intelligents que les machines ne peuvent l’être :o Ca, ce serait l'ego. Au passage, les machines n'ont pas de connaissance "réelle" du monde, non plus. L'exemple que le modèle m'avait donné est qu'elle sait "reconnaître" un chat sur une image, elle sait que c'est associé au miaulement ou un tas de truc, mais elle ne sait pas vraiment ce qu'est un chat. Ouais, compliqué :o


---------------
"Dans la communication, le récepteur doit s'efforcer de voir selon le point de vue de l'émetteur, et non du sien. Sinon ca n'a aucun sens !" --Mevo
n°72837915
duckjerry
Posté le 06-05-2025 à 08:40:17  profilanswer
 

kaloskagatos a écrit :

 


Regardez la dernière video de science étonnante sur le sujet
https://youtu.be/YcIbZGTRMjI

 
Spoiler :

Les modèles de raisonnement sont juste des modèles fine tunnés pour générer une chaîne de raisonnement avant la réponse finale




Merci du partage, très clair comme toujours sur ses explications


---------------
Mon Flickr - "Oh, people can come up with statistics to prove anything, Kent. 40% of people know that." (Homer J. Simpson)
n°72838165
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 09:43:57  profilanswer
 

https://img3.super-h.fr/images/2025/05/06/snapshot_1622650073.jpg


---------------

n°72838168
bulldozer_​fusion
rip Mekthoub
Posté le 06-05-2025 à 09:45:14  profilanswer
 

Rien compris
C'est quoi l'intérêt ?


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72838183
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 09:47:30  profilanswer
 

bulldozer_fusion a écrit :

Rien compris
C'est quoi l'intérêt ?


Ne pas perdre son procès contre Musk ?  :??:  
 
Sinon Nvidia
 

Citation :

@NVIDIAAIDev
With our new Parakeet model (parakeet-tdt-0.6b-v2), we have achieved a new standard for automatic speech recognition (ASR) with an industry-best 6.05% Word Error Rate on the  
@HuggingFace Open-ASR-Leaderboard.  
 
Parakeet V2 takes performance to the next level with unmatched accuracy,blazing-fast inference (RTFx 3386, or 50x faster than alternatives), and innovative, pioneering capabilities like song-to-lyrics transcription and precise timestamp/number formatting.
 
Leaderboard: https://huggingface.co/spaces/hf-au [...] eaderboard  
Demo: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v2
Try NVIDIA Parakeet models: https://build.nvidia.com/explore/speech


---------------

mood
Publicité
Posté le 06-05-2025 à 09:47:30  profilanswer
 

n°72838190
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 09:49:22  profilanswer
 

Citation :

@Katie_Roof
 
OpenAI has now agreed to buy Windsurf formerly Codeium for about $3 billion, its largest acquisition yet. Bloomberg first broke the news of talks several weeks ago. Win for Kleiner, General Catalyst, Greenoaks. Scoop with @rachelmetz


---------------

n°72838235
bulldozer_​fusion
rip Mekthoub
Posté le 06-05-2025 à 09:56:03  profilanswer
 

Olivie a écrit :


Ne pas perdre son procès contre Musk ? :??:

 

Sinon Nvidia

 
Citation :

@NVIDIAAIDev
With our new Parakeet model (parakeet-tdt-0.6b-v2), we have achieved a new standard for automatic speech recognition (ASR) with an industry-best 6.05% Word Error Rate on the
@HuggingFace Open-ASR-Leaderboard.

 

Parakeet V2 takes performance to the next level with unmatched accuracy,blazing-fast inference (RTFx 3386, or 50x faster than alternatives), and innovative, pioneering capabilities like song-to-lyrics transcription and precise timestamp/number formatting.

 

Leaderboard: https://huggingface.co/spaces/hf-au [...] eaderboard
Demo: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v2
Try NVIDIA Parakeet models: https://build.nvidia.com/explore/speech



Ce que je veux comprendre c'est pas ça, c'est passer d'une entreprise non profit ou profit c'est quoi l'intérêt d'être sur ou l'autre


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72838301
Mevo
Divergent
Posté le 06-05-2025 à 10:04:59  profilanswer
 

bulldozer_fusion a écrit :

Rien compris
C'est quoi l'intérêt ?


Acter qu'il ne font pas ce qu'ils font (que) pour le pognon. Normalement. "Officiellement".
Quoique c'est très limité, surtout qu'une PBC reste une société "for profit", juste avec un un supposé "avoir un impact positif sur la société". ( https://en.wikipedia.org/wiki/Benefit_corporation )
 

bulldozer_fusion a écrit :


Ce que je veux comprendre c'est pas ça, c'est passer d'une entreprise non profit ou profit c'est quoi l'intérêt d'être sur ou l'autre


Une "non-profit" n'a pas d'actionnaires qui vont toucher les bénéfices.
Regarde éventuellement ceci: https://forum.hardware.fr/hfr/Discu [...] #t72657821

Message cité 1 fois
Message édité par Mevo le 06-05-2025 à 10:05:52

---------------
"Dans la communication, le récepteur doit s'efforcer de voir selon le point de vue de l'émetteur, et non du sien. Sinon ca n'a aucun sens !" --Mevo
n°72838302
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 10:05:07  profilanswer
 

bulldozer_fusion a écrit :


Ce que je veux comprendre c'est pas ça, c'est passer d'une entreprise non profit ou profit c'est quoi l'intérêt d'être sur ou l'autre


Ben le procès contre Musk c'est ca si je me souviens. Ils lui avaient déclaré que ca resterait une non profit d'où le non "Open" AI et Musk leur avait filé $100M
Et Musk les attaque sur ca. Donc ca permettrait de ne pas perdre le procès.

Message cité 1 fois
Message édité par Olivie le 06-05-2025 à 10:05:25

---------------

n°72838326
bulldozer_​fusion
rip Mekthoub
Posté le 06-05-2025 à 10:10:23  profilanswer
 


Mevo a écrit :


Acter qu'il ne font pas ce qu'ils font (que) pour le pognon. Normalement. "Officiellement".
Quoique c'est très limité, surtout qu'une PBC reste une société "for profit", juste avec un un supposé "avoir un impact positif sur la société". ( https://en.wikipedia.org/wiki/Benefit_corporation )

 


 
Mevo a écrit :


Une "non-profit" n'a pas d'actionnaires qui vont toucher les bénéfices.
Regarde éventuellement ceci: https://forum.hardware.fr/hfr/Discu [...] #t72657821


Merci ça répond à ce que je voulais savoir


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72838329
bulldozer_​fusion
rip Mekthoub
Posté le 06-05-2025 à 10:10:41  profilanswer
 

Olivie a écrit :


Ben le procès contre Musk c'est ca si je me souviens. Ils lui avaient déclaré que ca resterait une non profit d'où le non "Open" AI et Musk leur avait filé $100M
Et Musk les attaque sur ca. Donc ca permettrait de ne pas perdre le procès.


Pour le procès je savais


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72838348
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 10:13:13  profilanswer
 

bulldozer_fusion a écrit :


Pour le procès je savais


Ben pourquoi tu ne comprends pas que leur intérêt c'est de ne pas perdre leur procès ?  :D


---------------

n°72838753
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 11:21:09  profilanswer
 

Citation :

@BrianRoemmele
BOOM!
 
STANFORD LAUNCHES FRAMEPACK A FREE OPEN SOURCE AI THAT CAN RUN ON 6 GB LAPTOP GPU TO GENERATE MINUTE LONG 30FPS VIDEO FROM SINGLE IMAGE.
 
It is game changing…


https://huggingface.co/lllyasviel/F [...] Y_20250503


---------------

n°72838770
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 11:23:23  profilanswer
 

Y a Google I/O le 20 mai, en espérant qu'ils auront de grosse annonce
 

Citation :

@joshwoodward  
 
Papercut fixed: @GeminiApp now lets you upload multiple files at the same time.  
 
Sorry we didn't have this before - if you see other little annoying things like this, drop them here! We'll aim to fix the most common things that cause grumpiness.


 

Citation :

Google AI Mode and Lens are working on its own conversational ‘Live’ camera mode


 

Citation :

In essence, it appears that Google Search is getting an equivalent Gemini Live-Project Astra capability. The difference, however, appears to be a focus on searching rather than providing personal assistance.
 
Strings in the latest Google app beta (version 16.17) explain how: “With Live, you can have a real-time voice conversation with AI Mode to find exactly what you’re looking for. Tap the mute button to mute the microphone, tap close to exit.


https://9to5google.com/2025/05/05/g [...] -teardown/
 

Citation :

@scaling01
The Ultimate LLM Meta-Leaderboard averaged across the 28 best benchmarks
 
Gemini 2.5 Pro > o3 > Sonnet 3.7 Thinking
 
https://pbs.twimg.com/media/GqJtVHeWkAA_z3L?format=png&name=medium

Message cité 1 fois
Message édité par Olivie le 06-05-2025 à 11:29:16

---------------

n°72839350
LibreArbit​re
La /root est longue
Posté le 06-05-2025 à 13:13:11  profilanswer
 

kaloskagatos a écrit :

Regardez la dernière video de science étonnante sur le sujet
https://youtu.be/YcIbZGTRMjI


Excellente cette vidéo de vulgarisation, merci :jap:


---------------
Hebergement d'images
n°72839506
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 13:38:58  profilanswer
 

Je pensais à Fiverr y a quelques semaines justement.
Son CEO
 
https://img3.super-h.fr/images/2025/05/06/snapshot_984943658.jpg


---------------

n°72839692
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 14:11:42  profilanswer
 

https://img3.super-h.fr/images/2025/05/06/snapshot_470211272.jpg


---------------

n°72839861
croustx
Modoadorateur
Posté le 06-05-2025 à 14:43:58  profilanswer
 

Olivie a écrit :

Citation :

@BrianRoemmele
BOOM!
 
STANFORD LAUNCHES FRAMEPACK A FREE OPEN SOURCE AI THAT CAN RUN ON 6 GB LAPTOP GPU TO GENERATE MINUTE LONG 30FPS VIDEO FROM SINGLE IMAGE.
 
It is game changing…


https://huggingface.co/lllyasviel/F [...] Y_20250503


 
Vous avez testé ?

n°72840030
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 15:16:01  profilanswer
 

croustx a écrit :


 
Vous avez testé ?


Tu peux me tutoyer :o
Non j’ai pas testé  :(  
 
Sinon Google continue  :love:  
 
https://img3.super-h.fr/images/2025/05/06/snapshot_1457850878.jpg
https://img3.super-h.fr/images/2025/05/06/snapshot_1458777923.jpg
https://img3.super-h.fr/images/2025/05/06/snapshot_2007237709.jpg
 
 
 :pt1cable:  
 
https://img3.super-h.fr/images/2025/05/06/snapshot_1115438165.jpg


Message édité par Olivie le 06-05-2025 à 15:31:11

---------------

n°72840389
loulou le ​marlou
Posté le 06-05-2025 à 16:13:39  profilanswer
 

Sbien, ça ? https://fellou.ai/

n°72840426
XaTriX
Posté le 06-05-2025 à 16:18:56  profilanswer
 

Olivie a écrit :

Y a Google I/O le 20 mai, en espérant qu'ils auront de grosse annonce
 

Citation :

@joshwoodward  
 
Papercut fixed: @GeminiApp now lets you upload multiple files at the same time.  
 
Sorry we didn't have this before - if you see other little annoying things like this, drop them here! We'll aim to fix the most common things that cause grumpiness.


 

Citation :

Google AI Mode and Lens are working on its own conversational ‘Live’ camera mode


 

Citation :

In essence, it appears that Google Search is getting an equivalent Gemini Live-Project Astra capability. The difference, however, appears to be a focus on searching rather than providing personal assistance.
 
Strings in the latest Google app beta (version 16.17) explain how: “With Live, you can have a real-time voice conversation with AI Mode to find exactly what you’re looking for. Tap the mute button to mute the microphone, tap close to exit.


https://9to5google.com/2025/05/05/g [...] -teardown/
 

Citation :

@scaling01
The Ultimate LLM Meta-Leaderboard averaged across the 28 best benchmarks
 
Gemini 2.5 Pro > o3 > Sonnet 3.7 Thinking
 
https://pbs.twimg.com/media/GqJtVHe [...] ame=medium



Mistral https://media0.giphy.com/media/ulxHhvKW9X6459dtOn/giphy.gif?cid=78717991nnygr1aoumf6f8v89wwt3uioh3k5mv7dd22aocoy&ep=v1_gifs_search&rid=giphy.gif&ct=g


---------------
Proxytaf ? porn, xxx, hentai, camgirl, onlyfans, torrent, warez, crack, keygen, serials, darknet, tor, vpn, proxy, hacktool, metasploit, sql injection, password list, brute force, cp, gore, deepweb
n°72840562
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 16:43:18  profilanswer
 


Faut pas les comparer.
Google font parti des papas des LLM. Leur équipe a écrit le papier fondateur "Attention is all you need"

Citation :

"Attention Is All You Need" is a 2017 landmark research paper in machine learning authored by eight scientists working at Google. The paper introduced a new deep learning architecture known as the transformer, based on the attention mechanism proposed in 2014 by Bahdanau et al.  
 
It is considered a foundational paper in modern artificial intelligence, and a main contributor to the AI boom, as the transformer approach has become the main architecture of a wide variety of AI, such as large language models.
At the time, the focus of the research was on improving Seq2seq techniques for machine translation, but the authors go further in the paper, foreseeing the technique's potential for other tasks like question answering and what is now known as multimodal Generative AI.[1


https://en.wikipedia.org/wiki/Attention_Is_All_You_Need
 
Sans compter les milliards en infra qu'ils ont.
 


---------------

n°72841227
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 18:35:53  profilanswer
 

Benchmark Gemini 2.5 PRO

 

https://pbs.twimg.com/media/GqR1SscWkAE8I31?format=jpg&name=small

 

https://pbs.twimg.com/media/GqRpxHRX0AAwfIj?format=png&name=small

 
Citation :

@OfficialLoganK
Gemini 2.5 Pro just got an upgrade & is now even better at coding, with significant gains in front-end web dev, editing, and transformation.

 

We also fixed a bunch of function calling issues that folks have been reporting, it should now be much more reliable.

 

https://pbs.twimg.com/media/GqRgjC0WgAAJJsC?format=jpg&name=medium


Citation :

@OfficialLoganK

 

“The updated Gemini 2.5 Pro achieves leading performance on our junior-dev evals. It was the first-ever model that solved one of our evals involving a larger refactor of a request routing backend. It felt like a more senior developer because it was able to make correct judgement calls and choose good abstractions.”

 

– Silas Alberti, Founding Team, Cognition


Citation :

@chetaslua
·
Gemini 2.5 Pro was already a king now it's undisputed

 

Best model for everything not only for coding .

 

And it was king in @scaling01 test on previous version let's wait for new over-all benchmark

 

https://pbs.twimg.com/media/GqR1W2TWsAA0PS1?format=jpg&name=medium


Message édité par Olivie le 06-05-2025 à 18:38:26

---------------

n°72841367
dante2002
HEUUU NOOOOOOOOON
Posté le 06-05-2025 à 19:10:13  profilanswer
 

babaz2 a écrit :


 
Ça vaut quoi mistral ? J ai l impression que personne ne l utilise ici


 
Je l'utilise et je le trouve très bien


---------------
Parce que le vote pour Emmanuel Macron n'est pas un vote de conviction mais une nécessité démocratique
n°72841368
bulldozer_​fusion
rip Mekthoub
Posté le 06-05-2025 à 19:10:28  profilanswer
 

Olivie a écrit :


Ben pourquoi tu ne comprends pas que leur intérêt c'est de ne pas perdre leur procès ? :D


Tu n'as pas compris le sens de ma question :O


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72841553
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 19:58:55  profilanswer
 

bulldozer_fusion a écrit :


Tu n'as pas compris le sens de ma question :O


Demande à ChatGPT qu'il la reformule  :whistle:

 

Google a un autre modèle encore meilleur que celui qui vient de sortir, sans doute 2.5 Ultra (merci Samsung :o ) et qui serait peut etre annoncé à la Google I/O

 
Citation :

@legit_api

 

New Gemini 2.5 Pro Preview model is claybrook

 

for me, Nightwhisper was consistently better

 

I hope they release that model at some point

 

https://pbs.twimg.com/media/GqSDFKiWwAAKSrX?format=png&name=small


Citation :

@chetaslua

 

Confirmed News
>see fresh Gemini 2.5 Pro Preview checkpoint tagged “claybrook”  >Nightwhisper still beats it on coding & UI tests
>pray Google presses release on Nightwhisper soon
>Jump in Discord 5Vg24U7ccM


Message édité par Olivie le 06-05-2025 à 19:59:41

---------------

n°72841679
freddy021
Les Français qui dégomment
Posté le 06-05-2025 à 20:30:45  profilanswer
 

UI test ?


---------------
Israélien dans l’âme, français par hasard mais Macroniste invétéré.
n°72841709
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 20:36:04  profilanswer
 


User interface test  [:michel_cymerde:7]  
Sans doute le "meilleur design" en sortie.


---------------

n°72841753
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 20:44:12  profilanswer
 

Si j'avais encore tout mes neurones, j'essayerais de regarder :o

 
Citation :

@HarshaGadekar

 

Stanford literally dropped a 70-minute masterclass on how GPT works

 

https://pbs.twimg.com/media/GqSTfqPbAAQI3b2?format=jpg&name=medium

 

https://www.youtube.com/watch?v=JKbtWimlzAE


Message édité par Olivie le 06-05-2025 à 20:45:24

---------------

n°72841801
freddy021
Les Français qui dégomment
Posté le 06-05-2025 à 20:54:48  profilanswer
 

Olivie a écrit :


User interface test  [:michel_cymerde:7]  
Sans doute le "meilleur design" en sortie.


Encore un truc très objectif ça :o
 
Ça me fait penser qu’en cherchant ces derniers jours des benchmark qui se rapprochent de mon cas d’usage principal, je me rends compte qu’en parallèle du développement des modèles, y’a une vraie recherche pour pondre des benchmark pertinents et valables.


---------------
Israélien dans l’âme, français par hasard mais Macroniste invétéré.
n°72841812
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 20:57:07  profilanswer
 

freddy021 a écrit :


Encore un truc très objectif ça :o
 
Ça me fait penser qu’en cherchant ces derniers jours des benchmark qui se rapprochent de mon cas d’usage principal, je me rends compte qu’en parallèle du développement des modèles, y’a une vraie recherche pour pondre des benchmark pertinents et valables.


Même les benchmarks "objectifs" on sait que les boites qui sortent des modèles entrainent leur modèles avant leur sortie pour qu'ils soient performant pour les benchmarks.
Au final, ca ne m'étonne pas que Gemini 2.5 Pro soit quand même meilleur que Gemini 2.5  [:michel_cymerde:7]


---------------

n°72841927
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 21:16:31  profilanswer
 

Ils devraient arrêter de vouloir faire un super modèle qui fait tout.  
On veut un modèle spécialisé dans chaque tâche et ensuite un modèle qui peut jouer le role d'architecte/manager pour les gérer...
 

Citation :

@HCSolakoglu
 
I had prepared image below by collecting the model card and benchmark scores from the Google DeepMind blog. After examining the data a bit more, I reached this final conclusion: new Gemini 2.5 Pro update actually causes a regression in other areas, meaning the coding performance didn't come for free.
 
Areas of Improved Performance (Preview 05-06 vs. Experimental 03-25):
 
LiveCodeBench v5 (single attempt): +7.39% increase (70.4% → 75.6%)
Aider Polyglot (diff): +5.98% increase (68.6% → 72.7%)
Aider Polyglot (whole): +3.38% increase (74.0% → 76.5%)
 
Areas of Regressed Performance (Preview 05-06 vs. Experimental 03-25):
 
Vibe-Eval (Reka): -5.48% decrease (69.4% → 65.6%)
Humanity's Last Exam (no tools): -5.32% decrease (18.8% → 17.8%)
AIME 2025 (single attempt): -4.27% decrease (86.7% → 83.0%)
SimpleQA (single attempt): -3.97% decrease (52.9% → 50.8%)
MMMU (single attempt): -2.57% decrease (81.7% → 79.6%)
MRCR (128k average): -1.59% decrease (94.5% → 93.0%)
Global MMLU (Lite): -1.34% decrease (89.8% → 88.6%)
GPQA diamond (single attempt): -1.19% decrease (84.0% → 83.0%)
SWE-bench Verified: -0.94% decrease (63.8% → 63.2%)
MRCR (1M pointwise): -0.24% decrease (83.1% → 82.9%)


---------------

n°72842355
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 22:07:09  profilanswer
 

Citation :

@architjn
 
Just received this from Google.
 
https://pbs.twimg.com/media/GqSlyuHbAAQuxum?format=jpg&name=small


 
 


---------------

n°72842837
gagaches
Posté le 06-05-2025 à 22:53:00  profilanswer
 

Olivie a écrit :

Ils devraient arrêter de vouloir faire un super modèle qui fait tout.  
On veut un modèle spécialisé dans chaque tâche et ensuite un modèle qui peut jouer le role d'architecte/manager pour les gérer...


 
 :jap:  
 
tu es à fond de ton côté.
tu bosses pas pour avoir autant de temps pour checker tout ça ?  :o


---------------

n°72843225
Olivie
SUUUUUUUUUUUUUU
Posté le 06-05-2025 à 23:22:41  profilanswer
 

gagaches a écrit :


 
 :jap:  
 
tu es à fond de ton côté.
tu bosses pas pour avoir autant de temps pour checker tout ça ?  :o


Si si de temps en temps :o
 
Gemini 2.5 vs Claude 3.7 vs OpenAI 03 (rip openAI)

Citation :

@Yuchenj_UW
Gemini-2.5-Pro-preview-05-06 is now my top coding model.
 
It beats o3 and Claude 3.7 Sonnet on several of my hard prompts.
 
One example prompt: "Code simulation of water in a bucket that is rocking back and forth." See how it crushes o3 and Sonnet.
 
Google, call it Gemini 3!
 
https://s4.gifyu.com/images/bLf8s.gif


---------------

n°72843243
bulldozer_​fusion
rip Mekthoub
Posté le 06-05-2025 à 23:25:30  profilanswer
 

Le nouveau gemini 2.5 pro est déjà déployé dans l'application Gemini ?


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  141  142  143  ..  254  255  256  257  258  259

Aller à :
Ajouter une réponse
 

Sujets relatifs
THE GAME -S01Q86 - MDJ : MIZA, Histoire d'amour et de comptableNombre de réponses par page par défaut
Jeu du Dico : POPOLL Vainqueur de la S3 - RDV sur le topic de la S4Notification des réponses
mails d'avertissements des réponses sur hfr[Questions sans réponses] Timidité, rejet, décès
(voiture) casi achat, besoin de réponses[Le topic de toutes les réponses]
Je voudrais avoir vos réponses pour mes questionsAPL petite question sans réponses
Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)