[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 .. 145 146 147 .. 305 306 307 308 309 310 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Olivie

SUUUUUUUUUUUUUU

Reprise du message précédent :
Comme ils n'avaient pas assez de contenus de merde:

Citation :

@kingdavidyonko

TikTok has launched its first image to video AI tool
Source: @TechCrunch

https://pbs.twimg.com/media/Gq2mOMC [...] me=900x900

Message cité 1 fois

---------------

Publicité

bulldozer_fusion

rip Mekthoub & Marc

Olivie a écrit :

Comme ils n'avaient pas assez de contenus de merde:

Citation :

@kingdavidyonko

TikTok has launched its first image to video AI tool
Source: @TechCrunch

https://pbs.twimg.com/media/Gq2mOMC [...] me=900x900

:lol:

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

Olivie

SUUUUUUUUUUUUUU

Trop de demande pour Gemini (quand c'est gratuit)

Citation :

@OfficialLoganK
There continues to be huge demand for Gemini 2.5 Pro!!

We are going to temporarily pause the Gemini 2.5 Pro free tier access in the API in order to ensure devs building can keep scaling up. You can still access the model for free in http://ai.studio!

---------------

ionik

J'étais passé a côté d'une API gratuite

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR

Olivie

SUUUUUUUUUUUUUU

Google

Citation :

Large language models (LLMs) are remarkably versatile. They can summarize documents, generate code or even brainstorm new ideas. And now we’ve expanded these capabilities to target fundamental and highly complex problems in mathematics and modern computing.

Today, we’re announcing AlphaEvolve, an evolutionary coding agent powered by large language models for general-purpose algorithm discovery and optimization. AlphaEvolve pairs the creative problem-solving capabilities of our Gemini models with automated evaluators that verify answers, and uses an evolutionary framework to improve upon the most promising ideas.

AlphaEvolve enhanced the efficiency of Google's data centers, chip design and AI training processes — including training the large language models underlying AlphaEvolve itself. It has also helped design faster matrix multiplication algorithms and find new solutions to open mathematical problems, showing incredible promise for application across many areas.

Citation :

AlphaEvolve’s procedure found an algorithm to multiply 4x4 complex-valued matrices using 48 scalar multiplications, improving upon Strassen’s 1969 algorithm that was previously known as the best in this setting. This finding demonstrates a significant advance over our previous work, AlphaTensor, which specialized in matrix multiplication algorithms, and for 4x4 matrices, only found improvements for binary arithmetic.

To investigate AlphaEvolve’s breadth, we applied the system to over 50 open problems in mathematical analysis, geometry, combinatorics and number theory. The system’s flexibility enabled us to set up most experiments in a matter of hours. In roughly 75% of cases, it rediscovered state-of-the-art solutions, to the best of our knowledge.

And in 20% of cases, AlphaEvolve improved the previously best known solutions, making progress on the corresponding open problems. For example, it advanced the kissing number problem. This geometric challenge has fascinated mathematicians for over 300 years and concerns the maximum number of non-overlapping spheres that touch a common unit sphere. AlphaEvolve discovered a configuration of 593 outer spheres and established a new lower bound in 11 dimensions.

https://deepmind.google/discover/bl [...] lgorithms/

Message cité 1 fois

---------------

Olivie

SUUUUUUUUUUUUUU

Google I/O dans quelques jours:

Citation :

@JeffreyJonah5
·
7 Gemini changelogs lined up for Google I/O day?

Gemini Pro, Veo 3, Imagen 4, Flash, Wear OS takeover, a whole new assistant experience...

Looks like Google’s ready to throw all their cards on the table in one shot.

Donc les autres se préparent à également faire des annonces
Anthropic:

Citation :

@chetaslua

BREAKING: Anthropic’s testing “claude-neptune” —

Maybe Claude 3.8

Important point from image (speculation)
1. Thinking token - 128k
2. Max Token - 128k

Image : @testingcatalog

Citation :

@sithamet

So we are getting new Opus from Anthropic soon. The guy commenting is Anthropic's CPO

Guess it's the response to upcoming Gemini Ultra.

What a time to be alive

ChatGPT 4.1 dispo pour tous les payeurs

Citation :

@thegenioo
GPT 4.1 debuts on @ChatGPTapp

Rate limits are exactly same as GPT-4o
(80 messages every 3 hours for Plus users)

Message édité par Olivie le 15-05-2025 à 00:26:44

---------------

bulldozer_fusion

rip Mekthoub & Marc

Ça va tellement vite [:perco_35:2]

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

Olivie

SUUUUUUUUUUUUUU

Le jour où on aura des modèles comme Claude 3.7 ou Gemini capable de tourner en local sur un MacBook, on sera bien.

Je me demande si ca pourrait arriver dans moins d'un an.
Je ne comptais pas changer mon MBP M1 de sitôt, mais c'est le genre de truc qui me ferait passer au M4.

Message cité 2 fois
Message édité par Olivie le 15-05-2025 à 00:39:38

---------------

bulldozer_fusion

rip Mekthoub & Marc

Ça me paraît bien prématuré

Message cité 1 fois

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

Olivie

SUUUUUUUUUUUUUU

Citation :

@btibor91

The Information reports Anthropic has new versions of Claude Sonnet and Claude Opus set to come out in the upcoming weeks that can go back and forth between thinking and using external tools, applications and databases to find answers, according to two people who have used them

- If one of these models is using a tool to try and solve a problem but gets stuck, it can go back to "reasoning" mode to think about what's going wrong and self-correct, according to one of the people

- For code generation, the models will automatically test the code they created and if there's a mistake, they can stop to think about what might have gone wrong and correct it, according to people who have tested the model

---------------

Publicité

Olivie

SUUUUUUUUUUUUUU

Citation :

@M1Astra
OpenAI is preparing a “Record” feature in ChatGPT for built-in meeting, brainstorms, and ideas recording, transcription, and summarization.

(added in the latest mobile version)

Message cité 2 fois

---------------

bulldozer_fusion

rip Mekthoub & Marc

Olivie a écrit :

Citation :

@M1Astra
OpenAI is preparing a “Record” feature in ChatGPT for built-in meeting, brainstorms, and ideas recording, transcription, and summarization.

(added in the latest mobile version)

https://pbs.twimg.com/media/Gq3L4P6 [...] name=small

La CNIL va avoir du boulot :whistle:

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

olive127

Briseur de fonction d'onde

Olivie a écrit :

Citation :

@M1Astra
OpenAI is preparing a “Record” feature in ChatGPT for built-in meeting, brainstorms, and ideas recording, transcription, and summarization.

(added in the latest mobile version)

https://pbs.twimg.com/media/Gq3L4P6 [...] name=small

On a déjà ça dans Teams -> après le meeting, il y a cet IA qui te fait un résumé, te translate tout au cas où.
Alors oui, ça sera dans ChatGPT, mais ils inventent rien.

Message cité 1 fois

Olivie

SUUUUUUUUUUUUUU

olive127 a écrit :

On a déjà ça dans Teams -> après le meeting, il y a cet IA qui te fait un résumé, te translate tout au cas où.
Alors oui, ça sera dans ChatGPT, mais ils inventent rien.

Il me semble que ChatGPT ça fonctionnerait directement dans l’app? Genre on sort le téléphone, on le pose au milieu de la table de réunion et on ressort avec un compte rendu ?

Message cité 2 fois

---------------

olive127

Briseur de fonction d'onde

Olivie a écrit :

Il me semble que ChatGPT ça fonctionnerait directement dans l’app? Genre on sort le téléphone, on le pose au milieu de la table de réunion et on ressort avec un compte rendu ?

Non, ce dont je parle c'est l'enregistrement du meeting direct dans Teams, pour en ressortir le compte rendu. L'IA est donc intégrée.
Le résultat est...bluffant...

Message cité 1 fois
Message édité par olive127 le 15-05-2025 à 02:34:00

olive127

Briseur de fonction d'onde

Olivie a écrit :

Il me semble que ChatGPT ça fonctionnerait directement dans l’app? Genre on sort le téléphone, on le pose au milieu de la table de réunion et on ressort avec un compte rendu ?

lol, après relecture, tu as raison, c'est bien ça

gagaches

olive127 a écrit :

Non, ce dont je parle c'est l'enregistrement du meeting direct dans Teams, pour en ressortir le compte rendu. L'IA est donc intégrée.
Le résultat est...bluffant...

Pour tester l'équivalent google, le résultat est nul...
Comme quoi ça dépend des outils

---------------

docmaboul

Olivie a écrit :

Google

Citation :

https://deepmind.google/discover/bl [...] lgorithms/

Impressionnant. Je veux bien l'agent pour vscode

Olivie

SUUUUUUUUUUUUUU

Quelqu'un voit cette option ? Je ne l'ai pas encore:

Citation :

@btibor91
The new ChatGPT web app version includes an option to add custom connectors based on the Model Context Protocol (MCP)

---------------

Olivie

SUUUUUUUUUUUUUU

Citation :

/MistralAI According_to_Mission

Gmail and Google Calendar integration in le Chat
Is this new? I haven't noticed it before.

It's on the free tier of le Chat.

Message cité 1 fois

---------------

Damze

Olivie a écrit :

Le jour où on aura des modèles comme Claude 3.7 ou Gemini capable de tourner en local sur un MacBook, on sera bien.

Je me demande si ca pourrait arriver dans moins d'un an.
Je ne comptais pas changer mon MBP M1 de sitôt, mais c'est le genre de truc qui me ferait passer au M4.

Ca va être complicado vu la taille des modèles.
GPT-3 fait 350Go de taille, si tu veux un truc avec un peu de perf il faut le charger en RAM.
Le jour où y'aura des GPU avec 350GO de RAM accessible pourquoi pas

Message cité 1 fois

CoyoteErable

Dorée et Colorée

Sur une tâche spécifique vous pouvez très bien avoir un LLM 32B performant si correctement entraîné. Mais c'est sûr que ça ne se fera pas sur une fenêtre contextuelle de 1M de tokens.

Message cité 1 fois

---------------
Bloqué par Végétarien Garçon

Olivie

SUUUUUUUUUUUUUU

Damze a écrit :

CoyoteErable a écrit :

Sur une tâche spécifique vous pouvez très bien avoir un LLM 32B performant si correctement entraîné. Mais c'est sûr que ça ne se fera pas sur une fenêtre contextuelle de 1M de tokens.

Oui a mon avis, à terme on devrait avoir des LLM hyperspécialisés, genre un LLM spécialement pour coder, un pour l'écriture etc...Ca devrait passer dans un MBP M4 64GB de ram
Mais faut que des gens paient pour les entrainer pour que nous on puisse ensuite les utiliser gratuitement...

Pour le contexte, c'est fonction de quoi? RAM également ?

Message cité 1 fois

---------------

Olivie

SUUUUUUUUUUUUUU

On dirait que c'est clairement le contexte qui coute cher pour qu'ils soient radins à ce point

8k token en 2025
C'était le même contexte pour GPT 3 à sa sortie il me semble non ?
Et Claude 3.7 qui est l'un des plus chers avec 128k de contexte seulement.

Message édité par Olivie le 15-05-2025 à 11:53:51

---------------

Olivie

SUUUUUUUUUUUUUU

Si j’étais pas pauvre, pour $100 par mois c’est sans doute un des meilleurs forfaits

---------------

Olivie

SUUUUUUUUUUUUUU

---------------

Lemminkainen

Chantre de la lyre

Ils viennent de nous mettre Copilot au boulot. J'utilise chatGPT à titre perso en mode payant depuis 4 mois.

Je ne sais pas si c'est un Copilot bridé (ils ont désactivé la recherche web par exemple) mais j'ai l'impression d'être revenu en 2023.

Message cité 2 fois

---------------
Que vois-tu quand tu fermes les yeux ?

Winpoks

Lemminkainen a écrit :

Ils viennent de nous mettre Copilot au boulot. J'utilise chatGPT à titre perso en mode payant depuis 4 mois.

Je ne sais pas si c'est un Copilot bridé (ils ont désactivé la recherche web par exemple) mais j'ai l'impression d'être revenu en 2023.

Copilot c'est le meilleur.
Si t'aimes te faire du mal.

Message cité 1 fois

Mevo

Divergent

Olivie a écrit :

Pour le contexte, c'est fonction de quoi? RAM également ?

Tu peux faire tourner des modèles sur CPU, mais c'est plus lent (et il faut alors de la RAM derrière)
Sinon, il faut des GPU avec de la VRAM, mais ca coute bonbon. Les grosses cartes graphiques Nvidia "retail", c'est déjà 3000 EUR la carte avec une vingtaine de Go de VRAM.
Les fameuses "A100" (je crois que c'est les plus petites, en plus), ca semble etre 20K direct

En plus, Gemini ou pas mal de "bons" modèles ne sont pas open-source !
Tu peux faire tourner de plus petits modèles en local. "Gemma" de chez Google, c'est du mini-Gemini, et c'est pas mauvais en résultat :jap:

Note: Déjà rien que du modèle 32B, faut déjà la config derrière pour que ca tourne
Note2: Pour toi sur Mac, comme j'ai regardé un peu les histoires de modèles en local, dernièrement: Il y a un format open-source, le "MLX", qui semble bien fonctionner avec les puces Apple, et tu peux déjà faire tourner des trucs pas trop dégueus sur CPU seul.

Message édité par Mevo le 15-05-2025 à 14:47:42

---------------
"The problem isn't that Johnny can't read. The problem isn't even that Johnny can't think. The problem is that Johnny doesn't know what thinking is; he confuses it with feeling" --Thomas Sowell

Mevo

Divergent

Lemminkainen a écrit :

Perso, Copilot, Phi-4 (autre IA Microsoft que j'ai testé) et tous les Llama de Meta, je trouve ca vraiment moins bon que le reste (en tout cas, je n'aime pas du tout, et je n'aime pas l'utiliser).

Message cité 1 fois

Lemminkainen

Chantre de la lyre

Winpoks a écrit :

Copilot c'est le meilleur.
Si t'aimes te faire du mal.

C'est le meilleur pour faire quoi ? Tout est moins bon que le reste pour l'instant.

Edit : je viens de comprendre Je vais bientôt être remplacé par une IA vu ma lenteur.

Message cité 2 fois
Message édité par Lemminkainen le 15-05-2025 à 14:52:39

---------------
Que vois-tu quand tu fermes les yeux ?

Lemminkainen

Chantre de la lyre

Mevo a écrit :

Perso, Copilot, Phi-4 (autre IA Microsoft que j'ai testé) et tous les Llama de Meta, je trouve ca vraiment moins bon que le reste (en tout cas, je n'aime pas du tout, et je n'aime pas l'utiliser).

Ah voilà on est d'accord.

Le service IT interdit l'utilisation d'autre chose pour raison de sécurité. (Ce que je comprend parfaitement par contre.)

---------------
Que vois-tu quand tu fermes les yeux ?

Mevo

Divergent

Lemminkainen a écrit :

C'est le meilleur pour faire quoi ? Tout est moins bon que le reste pour l'instant.

Son trait d'humour est sympa, même si pas forcément tout de suite compréhensible => Faut prendre les deux phrases ensemble

Message cité 1 fois

Lemminkainen

Chantre de la lyre

Mevo a écrit :

Son trait d'humour est sympa, même si pas forcément tout de suite compréhensible => Faut prendre les deux phrases ensemble

Oui, merci. :jap: L’indentation m’a portée à confusion.
Mea culpa.

---------------
Que vois-tu quand tu fermes les yeux ?

Olivie

SUUUUUUUUUUUUUU

Musk, cette plaie pour l'IA (Il est sud africain et il a milité pour que les blancs SA soient rapatriés aux USA si j'ai bien compris)

Citation :

@MattBinder

very weird thing happening with Grok lol

Elon Musk's AI chatbot can't stop talking about South Africa and is replying to completely unrelated tweets on here about "white genocide" and "kill the boer"

Message cité 1 fois

---------------

Olivie

SUUUUUUUUUUUUUU

Windsurf lance ses propres modèles:

Citation :

Today, we are launching our first family of models, dubbed SWE-1, optimized for the entire software engineering process, not just the task of coding.

This family is currently comprised of three distinct models:

SWE-1: Approximately Claude 3.5 Sonnet levels of tool-call reasoning while being cheaper to serve. It will be available to all paid users for a promotional period of 0 credits per user prompt.

SWE-1-lite: A smaller model that replaces Cascade Base at better quality. It is available for unlimited use to all users, free or paid.

SWE-1-mini: A small, extremely fast model that powers the Windsurf Tab passive experience for all users, free or paid.

Why build SWE-1? Simply put, our goal is to accelerate software development by 99%. Writing code is only a fraction of what you do. A “coding-capable” model won’t cut it.

https://windsurf.com/blog/windsurf-wave-9-swe-1

---------------

Agile Toolkit

Olivie a écrit :

bulldozer_fusion a écrit :

Ça me paraît bien prématuré

Bonjour, la question d'Olivie est intéressante, je vais tenter d'y apporter une réponse.

Question : à partir de quand on pourra faire tourner un LLM tel que Claude ou Gemini en local sur un ordinateur standard (ordinateur de bureau ou portable, ça ne change pas grand chose). Est-ce que ça sera dans moins d'un an ?

Je vais faire beaucoup d'hypothèses pour aller très vite, mais ça donne une idée de l'ordre de grandeur du temps qu'il faudra attendre.
- je considère que les gros LLM tels que Claude 3.7 et Gemini sont équivalents à Llama 3.3. Llama 3.3 fait 70 milliards de paramètres, Claude 3.7 et Gemini je ne sais pas si ces infos sont connues mais ça doit être autour de 100 milliards donc c'est le même ordre de grandeur. Je vous parle de Llama 3.3 car c'est le plus gros modèle que je peux tester sur mon PC de bureau. Je fais donc l'hypothèse que Llama 3.3 est à peu près aussi bien que Claude 3.7 ou Gemini.
- Sur mon PC de bureau, quand je pose une question à Llama 3.3, il met environ 15 minutes à répondre
- Les specs de mon PC : i5-13600KF 3.50 GHz, 64 Go de RAM, SSD, NVIDIA Geforce RTX 4070 12 Go => C'est un PC puissant mais pas non plus extraordinaire donc je le prends comme référence
- Je suppose que la loi de Moore est respectée et je l'énonce comme ceci : la puissance de calcul double tous les 18 mois. C'est une simplification grossière mais c'est pour faire un calcul rapide
- Je suppose que le temps d'inférence est proportionnel à la puissance de calcul

Ceci me permet de produire le tableau suivant très facilement :
Llama 3.3 (70B ) - Temps d'une inférence (sec)
mi 2025 -> 900
fin 2026 -> 450
mi 2028 -> 225
fin 2029 -> 112.5
mi 2030 -> 56.25
fin 2032 -> 28.125

Avec toutes ces hypothèses, on passe sous la minute en 2030

Donc je pense que bulldozer_fusion a raison de dire que c'est prématuré

Sinon mes hypothèses sont-elles justes ? Tout peut se discuter mais cela prend du temps
- La loi de Moore n'est plus respectée depuis longtemps et cela risque d'empirer car on atteint les limites de la technologie actuelle
- Les LLM vont certainement connaitre des tas d'optimisations donc cela va aider
- On est pas obligé d'avoir des gros LLM de 100 milliards, on peut avoir plusieurs petits LLM spécialisés pour lesquels chaque inférence sera moins couteuse

En tout cas je suis à peu près convaincu que ce n'est pas pour dans un an, ni même dans 2 ans

Message cité 1 fois
Message édité par Agile Toolkit le 15-05-2025 à 21:24:42

Olivie

SUUUUUUUUUUUUUU

Agile Toolkit j'écoutais un podcast de Zuck entièrement sur l'IA et il disait (de ce que j'ai compris) qu'en ayant un très gros modèle, ca leur permettait d'entrainer un modèle beaucoup plus petit mais qui avait 90% de l'efficacité du gros modèle.
Donc la question c'est plutot si dans 1 an, on pourrait avoir des modèles aussi efficace que Sonnet 3.7 mais qui font 5 milliards de paramètres par exemple ?

Pour le podcast de Zuck: https://www.youtube.com/watch?v=rYXeQbTuVl0

Message cité 3 fois

---------------

Agile Toolkit

Olivie a écrit :

Merci Olivie, je regarderai mais avant même de regarder je dirais que Zuck est un chef d'entreprise qui doit avant tout vendre de la marchandise et pour cela il vend du rêve

Il y a quelques années Zuck mettait en avant le metaverse et ça a été un flop total

Agile Toolkit

Olivie a écrit :

Mais sinon 5 milliards de paramètre ça me parait pas mal et on peut déjà le faire tourner sur un PC standard dans de bonnes conditions. Donc si on a plusieurs LLM de 5 milliards de paramètres bien optimisés sur telle ou telle tâche, c'est tout à fait possible qu'on puisse avoir de très bon résultats en local sur tous nos ordis et nos téléphones, ça j'y crois davantage

ese-aSH

Welcome To Avalon

Lemminkainen a écrit :

C'est le meilleur pour faire quoi ? Tout est moins bon que le reste pour l'instant.

Edit : je viens de comprendre Je vais bientôt être remplacé par une IA vu ma lenteur.

C'est les seuls qui assurent une confidentialité des données à prix non exhorbitants (parceque absorbés dans les bundles de soft déjà vendus) + intégration avec les outils déjà déployés (github / teams / office / outlook / ...).

Aujourd'hui c'est le choix logique pour une grosse cogip :jap:

Message cité 1 fois

---------------
On a tous un avis, le donne pas.

Publicité

Page : 1 2 3 4 5 .. 145 146 147 .. 305 306 307 308 309 310

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Discussions

Actualité

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Sujets relatifs
THE GAME -S01Q86 - MDJ : MIZA, Histoire d'amour et de comptable	Nombre de réponses par page par défaut
Jeu du Dico : POPOLL Vainqueur de la S3 - RDV sur le topic de la S4	Notification des réponses
mails d'avertissements des réponses sur hfr	[Questions sans réponses] Timidité, rejet, décès
(voiture) casi achat, besoin de réponses	[Le topic de toutes les réponses]
Je voudrais avoir vos réponses pour mes questions	APL petite question sans réponses
Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Page générée en 0.132 secondes