| |||||
FORUM HardWare.fr

Intelligence Artificielle

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co| Dernière réponse | |
|---|---|
| Sujet : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co | |
| oh_damned | Ouh de la programmation de micro contrôleurs [:clooney41] Gros niveau de masochisme :D |
| Aperçu |
|---|
| Vue Rapide de la discussion |
|---|
| oh_damned | Ouh de la programmation de micro contrôleurs [:clooney41] Gros niveau de masochisme :D |
| chrispc | Je suis sur un dashboard avec recuperation meteo agricole + netatmo weather + recuperation prod conso sur shelly 3em et suivi de la temperature mondiale sur un tornado graph. Un autre projet pour animer une sphere de 6000 points pour voir l'ia parler pour une utilisation en voiture par exemple via une pyramide en plexi retourné + ecran et rpi. Pour finir, un site qui rassemble 4 sites d'annonces dans l'it pour m'aider à retrouver du boulot. Ca fonctionne bien mais on sent que c'est compliqué par moment de faire ce que je lui demande. La sphère, impossible de lui faire faire ce que je souhaite... Avec Gemini, recuperation et affichage de la prod sur un esp 32 en python, c++. Il galère parfois mais comprend un peu mieux que sur antigravity. Les tests QA via cypress, ils sont pas mal pour maintenir la UI et pas implémenter de bug, quelques audits de sécurité de temps en temps, un linter et ca passe. Par contre nativement, les modèles ne font pas une belle archi et faut connaitre pour leur demander de le faire (atomic design, composants à réutiliser, ajouter des tests quand la version est validée ajouter un sonarQube, watchdog,...). Les vibe coders c'est bien mais faut aller demander à l'IA une archi au top avant de balancer en vrai prod. Claude a était très bon quand mon pote est passé pour dev de 0 une interface sur un esp32 et le debug en full autonomie, antigravity se perd et fait vraiment de la merde... Mon petit retour d'exp' :o |
| oh_damned |
|
| dante2002 |
|
| Olivie | J'espère que pour Google c'est pas encore la plus grande priorité.
Parce que depuis Gemini 2.5 l'écart n'a fait que se se creuser :o |
| XaTriX | J'espère secrètement que des modèles européens arrivent à suivre :cry: |
| oh_damned |
|
| XaTriX | Oui je trouve que l'intégration dans les autres produits se porte bien, reste à avoir un vrai modèle :D
Mais je suis pas sûr que ça ne soit qu'une histoire de dataset. Je pense qu'Anthropic a trouvé de nombreuses parades techniques pour éviter les hallucinations et autres défauts des LLM. On les sent beaucoup moins chez Claude/OpenAI sur les derniers modèles hdg. De ce que j'ai pu voir c'est depuis Opus 4.6 et GPT 5.4 qu'on a atteint un sacré niveau. J'ai pas vu ça chez la concurrence mais vais-je vraiment m'abaisser à tester du chinois ? :o |
| hephaestos | Clairement la priorité du moment chez Deepmind c'est de rattraper Anthropic. C'est pas la priorité pour le produit, notre offre est adaptée aujourd'hui. Mais on a besoin de l'équivalent pour le dev interne sinon on va vite être dépassés. On est un peu rentrés en mode "génération de données d'entraînement", pas au point de méta mais on sent le souffle des VPs dans notre nuque quand-même. |
| XaTriX |
|
| bulldozer_fusion | Si ils ne changent pas, ils vont perdre plus gros |
| Olivie |
|
| XaTriX |
|
| bulldozer_fusion |
|
| Olivie |
|
| XaTriX | Ah si je pense que c'est leur priorité :lol: |
| Olivie |
|
| ogsvart_ | Google ils ont un business plus large et complet, certes ils bénéficient de super infrastructures etc... mais je pense que l'inertie et les freins pour repousser les limites de l'IA sont bcp plus fortes que chez les spécialistes dédiés au sujet.
Sinon pour te répondre Xat, c'est encore en phase de construction ma nouvelle manière de bosser, et hier soir j'ai vraiment bien dérivé au niveau du pilotage des agents (jaurais du fermer ma bouche jcrois :o), l'idée est de me reposer bcp plus sur Gpt Pro pour faire le chef de projet et organiser les choses, piloter les agents et realiser des prompts aux petits oignons pour mes "cerveaux IAs" (les grosses questions réglés via des threads lourds) Et ca a eu plusieurs effets : Produire des prompts de folie bcp plus complet et précis dans le cadrage de la mission, en sortie, les IAs bossent bcp plus solidement, vu que le prompt spécifie tout ce qu'elles doivent voir ou faire attention avec un niveau de détail du cosmos. Par contre c'est pas optimisé pour économiser peu de tokens, sur un gros prompt d'audit/recherche, j'ai cramé instant les 5h de quota sur Opus par exemple, sur Fable ca m'aurait fait taper le plafond instant, sur Gpt Pro j'ai du repasser en abo à 200 balles, je tape bcp trop vite le quota de celui à 100 balles Donc, à voir pour l'opti des tokens, là j'ai surtout voulu optimiser le boulot et la qualité du job des IAs, et j'ai été vraiment tres surpris et impressionné par les retours Sur les agents, ca a dérivé par contre, gpt pro m'a embarqué dans des énormes échanges de spécifs/fichiers de config/reglements etc... digne de la nasa pour que les agents fassent exactement ce qu'on attend d'eux, et où l'erreur/approximation est interdite, comme si des vies humaines étaient en jeu sur leur taff :pt1cable: Bref, on est reparti d'un template plus simple, et je vais continuer d'avancer sur ce cadrage du projet et du boulot des agents, je me suis enlisé hier, j'ai pas assez cadré gpt pro master sur ce que j'attendais de lui en management d'agents, il est parti sur le niveau max d'exigence digne d'une institution haut de gamme, avec des échanges ultra lourds qui me bouffaient des tokens pour finalement pas grand chose de constructif on va continuer, mais utiliser Gpt Pro en Master pour piloter les prompts clefs et bien définir les rôles des IAs cerveaux qui bosseront lourdement sur certaines questions, c'était mon idée clef qui me semble fort intéressant. Autre chose : tout re-croiser / faire auditer par un gpt pro autre ou opus, et si possible Fable 'revient vite', y compris tres tot tres vite dans le projet, ca fait ressortir des choses que j'aurais pas imaginé, et ca debouche sur un boulot de cadrage synthese de bien meileure qualité (audit généré par des prompts optimisés de gpt pro Master, aussi, ca joue) Je sens un potentiel supérieur, sans l'ombre d'un doute, par contre, c'est mega lourd en conso de ressources, et faut que je cadre mieux l'aspect management des agents. |
| XaTriX | Ils étaient beaucoup à la ramasse au début de la race, ils ont fait vanne avec 3 Pro mais en fait il est bof donc ça change rien, on passe par la concurrence. |
| hephaestos | Mais ils se sont pas plantés, ils ont six mois de retard... Dans n'importe quelle autre industrie ça ferait sourire. |
| XaTriX |
|
| fabien |
|
| hephaestos |
La vérité c'est que ça va tellement vite... Le boulot abattu pour rattraper le retard depuis la sortie de ChatGPT est phénoménal. Le retard sur les modèles frontières est un vrai problème, mais Google n'est pas seulement le labo qui a le plus de moyens ; c'est aussi le seul dont le modèle est servi à 2 milliards d'utilisateurs, à travers une dizaine de produits. La friction que ça rajoute est réelle. |
| bulldozer_fusion |
|
| joce |
|
| Feitan21 |
|
| XaTriX |
|
| bulldozer_fusion |
|
| bulldozer_fusion |
|


