[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Recherche :

Dernière réponse
Sujet : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co
oh_damned	Ouh de la programmation de micro contrôleurs [:clooney41] Gros niveau de masochisme :D

Votre réponse

Nom d'utilisateur

Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !

Le ton de votre message

Votre réponse

Smilies

Liste des smilies perso
Wiki smilies
Chercher un smiley

Options

Activer votre signature
Désactiver les smilies
Activer la notification par email du sujet

Aperçu

Vous avez perdu votre mot de passe ?

Vue Rapide de la discussion

oh_damned

Ouh de la programmation de micro contrôleurs [:clooney41]

Gros niveau de masochisme :D

chrispc

Je suis sur un dashboard avec recuperation meteo agricole + netatmo weather + recuperation prod conso sur shelly 3em et suivi de la temperature mondiale sur un tornado graph.

Un autre projet pour animer une sphere de 6000 points pour voir l'ia parler pour une utilisation en voiture par exemple via une pyramide en plexi retourné + ecran et rpi.

Pour finir, un site qui rassemble 4 sites d'annonces dans l'it pour m'aider à retrouver du boulot.

Ca fonctionne bien mais on sent que c'est compliqué par moment de faire ce que je lui demande. La sphère, impossible de lui faire faire ce que je souhaite...

Avec Gemini, recuperation et affichage de la prod sur un esp 32 en python, c++. Il galère parfois mais comprend un peu mieux que sur antigravity.

Les tests QA via cypress, ils sont pas mal pour maintenir la UI et pas implémenter de bug, quelques audits de sécurité de temps en temps, un linter et ca passe.

Par contre nativement, les modèles ne font pas une belle archi et faut connaitre pour leur demander de le faire (atomic design, composants à réutiliser, ajouter des tests quand la version est validée ajouter un sonarQube, watchdog,...).

Les vibe coders c'est bien mais faut aller demander à l'IA une archi au top avant de balancer en vrai prod.

Claude a était très bon quand mon pote est passé pour dev de 0 une interface sur un esp32 et le debug en full autonomie, antigravity se perd et fait vraiment de la merde...

Mon petit retour d'exp' :o

oh_damned

dante2002 a écrit :

Non.

Ce matin je me suis fait avec antigravityun robot qui va cliquer sur l interface d admin de la Livebox à ma place (orange refuses les actions d admin par appel API).

C'est quoi le rapport avec ce qu'a dit Xatrix ? :heink:

Pour des petits automatismes du genre faire quelques clics dans une interface, le contexte nécessaire est probablement très petit et ça n'est plus un soucis depuis longtemps.

Pour les projets complexes par contre... :pt1cable:

dante2002

XaTriX a écrit :

Soyons sérieux
Ils encore les maladies des anciens modèles où ça hallucine à 90% dès qu'on monte un peu le contexte

Non.

Ce matin je me suis fait avec antigravityun robot qui va cliquer sur l interface d admin de la Livebox à ma place (orange refuses les actions d admin par appel API).

Olivie

J'espère que pour Google c'est pas encore la plus grande priorité.
Parce que depuis Gemini 2.5 l'écart n'a fait que se se creuser :o

XaTriX

J'espère secrètement que des modèles européens arrivent à suivre :cry:

oh_damned

XaTriX a écrit :

Oui je trouve que l'intégration dans les autres produits se porte bien, reste à avoir un vrai modèle :D
Mais je suis pas sûr que ça ne soit qu'une histoire de dataset. Je pense qu'Anthropic a trouvé de nombreuses parades techniques pour éviter les hallucinations et autres défauts des LLM.
On les sent beaucoup moins chez Claude/OpenAI sur les derniers modèles hdg.

De ce que j'ai pu voir c'est depuis Opus 4.6 et GPT 5.4 qu'on a atteint un sacré niveau. J'ai pas vu ça chez la concurrence mais vais-je vraiment m'abaisser à tester du chinois ? :o

Tu seras bien obligé quand Anthropic et OpenAI passeront les abos à 1000 balles par mois :o

XaTriX

hephaestos

Clairement la priorité du moment chez Deepmind c'est de rattraper Anthropic. C'est pas la priorité pour le produit, notre offre est adaptée aujourd'hui. Mais on a besoin de l'équivalent pour le dev interne sinon on va vite être dépassés. On est un peu rentrés en mode "génération de données d'entraînement", pas au point de méta mais on sent le souffle des VPs dans notre nuque quand-même.

XaTriX

Olivie a écrit :

Ils sont à fond dans l'IA pour préserver leur business publicitaire.
Ça veut dire qu'ils gèrent un paquet de requêtes et ressources vers Google pour que quand tatie Jeannine demande la recette de la tarte aux pommes, c'est Gemini qui répond en en tête des résultats de recherche.
Ils vont ajouter ça dans YouTube.
Et c'est pour ça que les quotas sont merdiques dans antigravity parce que c'est le as leur priorité.

Je pense que tu fais une mauvaise lecture mais je peux me tromper :o

bulldozer_fusion

Si ils ne changent pas, ils vont perdre plus gros

Olivie

XaTriX a écrit :

J'ai pas tout maté mais c'était pas mal orienté IA
De toute façon toute prez est orienté IA
Mais ça veut pas dire qu'en interne ils sont à fond dessus
Et vu qu'en interne ils poussent pour utiliser à fond leur truc, ils ont l'air à fond :o

XaTriX

Olivie a écrit :

Ben revois le résumé de la Google io du mois passé pour t'en rendre compte [:michel_cymerde:7]

bulldozer_fusion

hephaestos a écrit :

C'est quand même lunaire la conclusion. "Incroyable, on n'a pas fait de bond en avant depuis 4 mois".

La vérité c'est que ça va tellement vite... Le boulot abattu pour rattraper le retard depuis la sortie de ChatGPT est phénoménal. Le retard sur les modèles frontières est un vrai problème, mais Google n'est pas seulement le labo qui a le plus de moyens ; c'est aussi le seul dont le modèle est servi à 2 milliards d'utilisateurs, à travers une dizaine de produits. La friction que ça rajoute est réelle.

Ils doivent être plus agile

fabien a écrit :

bientôt il va t'engueuler si tu dis une connerie :o

les rôles s'inverse :o

Olivie

XaTriX a écrit :

Ah si je pense que c'est leur priorité :lol:

Ben revois le résumé de la Google io du mois passé pour t'en rendre compte [:michel_cymerde:7]

XaTriX

Ah si je pense que c'est leur priorité :lol:

Olivie

XaTriX a écrit :

Je comprends pas où G s'est loupé, ils étaient pas mal avec DeepMind puis se sont fait tarté la gueule par d'autres boîtes US et maintenant même les chinois se foutent de leurs gueules :o

C'est pas leur priorité.
Ils gagnent de l'argent sur la pub, pas sur des abos pour IA.
La ils cherchent à faire en sorte de ne pas perdre les gens qui font des recherches sur Google et demandent directement à ChatGPT

ogsvart_

Google ils ont un business plus large et complet, certes ils bénéficient de super infrastructures etc... mais je pense que l'inertie et les freins pour repousser les limites de l'IA sont bcp plus fortes que chez les spécialistes dédiés au sujet.

Sinon pour te répondre Xat, c'est encore en phase de construction ma nouvelle manière de bosser, et hier soir j'ai vraiment bien dérivé au niveau du pilotage des agents (jaurais du fermer ma bouche jcrois :o), l'idée est de me reposer bcp plus sur Gpt Pro pour faire le chef de projet et organiser les choses, piloter les agents et realiser des prompts aux petits oignons pour mes "cerveaux IAs" (les grosses questions réglés via des threads lourds)

Et ca a eu plusieurs effets :

Produire des prompts de folie bcp plus complet et précis dans le cadrage de la mission, en sortie, les IAs bossent bcp plus solidement, vu que le prompt spécifie tout ce qu'elles doivent voir ou faire attention avec un niveau de détail du cosmos.
Par contre c'est pas optimisé pour économiser peu de tokens, sur un gros prompt d'audit/recherche, j'ai cramé instant les 5h de quota sur Opus par exemple, sur Fable ca m'aurait fait taper le plafond instant, sur Gpt Pro j'ai du repasser en abo à 200 balles, je tape bcp trop vite le quota de celui à 100 balles

Donc, à voir pour l'opti des tokens, là j'ai surtout voulu optimiser le boulot et la qualité du job des IAs, et j'ai été vraiment tres surpris et impressionné par les retours

Sur les agents, ca a dérivé par contre, gpt pro m'a embarqué dans des énormes échanges de spécifs/fichiers de config/reglements etc... digne de la nasa pour que les agents fassent exactement ce qu'on attend d'eux, et où l'erreur/approximation est interdite, comme si des vies humaines étaient en jeu sur leur taff :pt1cable:

Bref, on est reparti d'un template plus simple, et je vais continuer d'avancer sur ce cadrage du projet et du boulot des agents, je me suis enlisé hier, j'ai pas assez cadré gpt pro master sur ce que j'attendais de lui en management d'agents, il est parti sur le niveau max d'exigence digne d'une institution haut de gamme, avec des échanges ultra lourds qui me bouffaient des tokens pour finalement pas grand chose de constructif

on va continuer, mais utiliser Gpt Pro en Master pour piloter les prompts clefs et bien définir les rôles des IAs cerveaux qui bosseront lourdement sur certaines questions, c'était mon idée clef qui me semble fort intéressant.

Autre chose : tout re-croiser / faire auditer par un gpt pro autre ou opus, et si possible Fable 'revient vite', y compris tres tot tres vite dans le projet, ca fait ressortir des choses que j'aurais pas imaginé, et ca debouche sur un boulot de cadrage synthese de bien meileure qualité (audit généré par des prompts optimisés de gpt pro Master, aussi, ca joue)

Je sens un potentiel supérieur, sans l'ombre d'un doute, par contre, c'est mega lourd en conso de ressources, et faut que je cadre mieux l'aspect management des agents.

XaTriX

Ils étaient beaucoup à la ramasse au début de la race, ils ont fait vanne avec 3 Pro mais en fait il est bof donc ça change rien, on passe par la concurrence.

hephaestos

Mais ils se sont pas plantés, ils ont six mois de retard... Dans n'importe quelle autre industrie ça ferait sourire.

XaTriX

hephaestos a écrit :

C'est quand même lunaire la conclusion. "Incroyable, on n'a pas fait de bond en avant depuis 4 mois".

Je comprends pas où G s'est loupé, ils étaient pas mal avec DeepMind puis se sont fait tarté la gueule par d'autres boîtes US et maintenant même les chinois se foutent de leurs gueules :o

fabien

bulldozer_fusion a écrit :

Citation :

GPT Bidirectional Voice Mode is being rolled out in the ChatGPT app!

The model can interrupt the user, count as you speak and it can even correct you when you make a mistake.

https://x.com/i/status/2068795102428877046

bientôt il va t'engueuler si tu dis une connerie :o

les rôles s'inverse :o

hephaestos

bulldozer_fusion a écrit :

Il va leur falloir un reset chez Google, ils étaient au top il y a 1 an et ont pris un écart comme sur une échappée de Pantani

Citation :

After the release of Fable 5 and with GPT-5.6 looming, the mood behind the scenes at Google DeepMind is increasingly one of frustration and broad discontent over the lab's perceived fall into a distant third—or even fourth—place.

DeepMind's last major model release, 3.5 Flash, was a significant jump over its predecessor; however, it was not meaningfully better in most cases than 3.1 Pro, released back in February. In real-world use, it remains several steps behind the frontier. That was four months ago, and Google's best model now sits in a lowly fifth place on the Artificial Analysis Intelligence Index—lapped by models from Anthropic, OpenAI, and now China's Zhipu AI. Other releases have proven similarly disheartening: the small video generation model Gemini Omni Flash launched to little fanfare and was easily beaten by ByteDance's Seedance 2.

Gemini 3.5 Pro, slated to launch June 30th, is "not the step change we need to be truly competitive in the race [to AGI]," per another individual at the company. The consensus seems to be that leadership at Google has all but conceded that race to Anthropic and OpenAI, and that "only a big shake-up" will propel them back to the highs of mid-to-late 2025.

But employees are not hopeful: "We no longer have a frontier model in text, image, video, voice, or even vision... if we can't release a real frontier model after over four months of work with all of these resources, what are we doing?"

https://x.com/i/status/2068000857757741251

C'est quand même lunaire la conclusion. "Incroyable, on n'a pas fait de bond en avant depuis 4 mois".

bulldozer_fusion

Citation :

GPT Bidirectional Voice Mode is being rolled out in the ChatGPT app!

The model can interrupt the user, count as you speak and it can even correct you when you make a mistake.

https://x.com/i/status/2068795102428877046

joce

XaTriX a écrit :

AppImage je me souviens même pas la dernière fois que j'ai utilisé ça
Mais oui je testerai mais, brew, npm ou un repo rpm c'est plus facile pour suivre l'évolution du truc.
T'as un auto udpate intégré ?

yep pour l'auto update ! ca arrive pour brew / rpm, je finis la possibilité d'ajouter d'ollama dans l'interface et je fais la release avec rpm & brew inclus

Feitan21

XaTriX a écrit :

Ah ouais mais on est à l'étape suivante, tu comprendras quand tu y seras :o

Perso je mise sur des modèles comme Fable qui à mon sens font économiser du temps et du fric. Même à deux fois plus cher :D
En opus 4.8xhigh je fais 4 types de review via des modèles anthropic puis codex gpt5.5xhigh. Avec Fable 5 ou ptet gpt5.6, ils sont moins teubés, font moins d'erreur, comprennent mieux ce qu'ils font et note des trucs au passage et les corrige ou t'informe.
Du coup un code-review:code-review avec Fable et bouclage avec Codex GPT 5.5xhigh pour la review.
Challenge mutuel aussi mais plus consommateur avec Opus. Fable je peux descendre à deux review au lieu de 5 :o
Me tarde son retour :love:

Du coup t'as quoi comme agents ?

XaTriX

bulldozer_fusion a écrit :

avec gemini 2.5 et 3 ils étaient proches

Soyons sérieux
Ils encore les maladies des anciens modèles où ça hallucine à 90% dès qu'on monte un peu le contexte

bulldozer_fusion

ogsvart_ a écrit :

Je suis pret, j'ai revu ma maniere de bosser avec IAs ces jours, organisation par rôles bien encadrés / mieux définis / bcp mieux piloter...

C'est de la folie en résultat, mais qu'est ce que ca consomme mes quotas de gpt pro [:sad frog:5]

Sinon google ? je les ai jamais considéré comme option sérieuse pour ma part, le top d'Open AI et le top d'Anthropic, le reste n'existe pas :o

j'ai revu aussi ma manière de bosser, je re structure tout ça avec davantage de sous agents et skills qu'auparavant

bulldozer_fusion

ogsvart_ a écrit :

avec gemini 2.5 et 3 ils étaient proches