[Topic unique] Développement via IA

Recherche :

Dernière réponse
Sujet : [Topic unique] Développement via IA
b-tzu	tout le monde parle de vider le contexte pour diminuer la conso. je suis en claude opus 1M, je ne vide le contexte que quand j'arrive dans les 90% (en general sur un meme projet, je commence rarement une nouvelle task avec un contexte pollué, je clear)et pourtant je ne ressens pas de surconsommation (pas de ca en tout cas) cest normal ?

Votre réponse

Nom d'utilisateur

Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !

Le ton de votre message

Votre réponse

Smilies

Liste des smilies perso
Wiki smilies
Chercher un smiley

Options

Activer votre signature
Désactiver les smilies
Activer la notification par email du sujet

Aperçu

Vous avez perdu votre mot de passe ?

Vue Rapide de la discussion

b-tzu

tout le monde parle de vider le contexte pour diminuer la conso. je suis en claude opus 1M, je ne vide le contexte que quand j'arrive dans les 90% (en general sur un meme projet, je commence rarement une nouvelle task avec un contexte pollué, je clear)et pourtant je ne ressens pas de surconsommation (pas de ca en tout cas)
cest normal ?

bulldozer_fusion

https://rehost.diberie.com/Picture/Get/f/525458

bulldozer_fusion

https://rehost.diberie.com/Picture/Get/f/525412
[:tiutoo:3]

Olivie

Ils sont tous en période pré-éclatement de la bulle et essaient de lever un max de sous [:michel_cymerde:7]

XaTriX

A force de répéter que le gap est closé par les chinois et qu'en réalité c'est pas du tout le cas ça ne sert plus à rien d'essayer de les croire

bulldozer_fusion

Citation :

While the US was busy banning Claude Fable, China's Zhipu AI just released its latest model that matches it for cybersecurity tasks.

The gap is closing day by day.

https://x.com/puckrin/status/2071125947512959320

Winpoks

joce a écrit :

glm-5.2 bcp en ce moment parce que plus de token Claude et Codex et c'est un bon moyen pour tester l'implem Ollama de Tamag0, mais bizarrement ajd je trouve que la pertinence de glm-5.2 s'est bcp dégradée, il enchaine les conneries... Est-ce que coté Ollama il joue sur l'effort quand on tape un peu trop sur les serveurs ?

Hermes est sous 5.2 et openclaw sous 5.1, le tout sous Ollama. J'ai de meilleures réponses avec le 5.1. Mais sans demander beaucoup.

Nr13	Normalement GLM-5.2 supporte les variants high et max.. Possible que ollama tweak de son côté du coup.

joce

XaTriX a écrit :

Après il existe un biais quand on teste un modèle sensé être bon :o
On est très satisfait au début puis on découvre la vérité :o

là non, c'est vraiment un changement de comportement où il ne suis plus ce que préconise le skill et le system prompt, alors qu'il le faisait très bien avant, et que le context n'est pas plus saturé qu'avant

joce

XaTriX a écrit :

L'hébergeur explicite à combien il règle l'effort ?

non justement ollama permet juste un boolean true / false sur le thinking (sauf pour gpt-oss)

XaTriX

Après il existe un biais quand on teste un modèle sensé être bon :o
On est très satisfait au début puis on découvre la vérité :o

XaTriX

L'hébergeur explicite à combien il règle l'effort ?

joce

bulldozer_fusion

oh_damned a écrit :

Bon alors ... Codex ou Claude Code ces temps-ci ? :D

Codex

oh_damned

Bon alors ... Codex ou Claude Code ces temps-ci ? :D

Nr13

Olivie a écrit :

Y aura surtout un problème de contexte si y a bcp de codes.
Perso j'analyserais chaque apps à part d'abord en demandant de documenter et en utilisant à chaque fois un reset du contexte.
Puis je lui ferais analyser l'ensemble de la documentation pour approfondir les liens etc...

C'est ce que fera par défaut n'importe quel agent "orchestrator"

Implosion du Sord

Olivie a écrit :

Avec Claude Code /workflow (ou ultracode), chaque repo / service serait analysé par un agent différent. 20 micro service ça passe sans soucis si se sont bien des micro-service. En plus c'est parallélisable.

Par contre, je commencerai par la doc, puis le code, pour le guider dans l'analyse. Après il faut aussi lui préciser le niveau de détails (edge cases, inclusion des error flow, ...)

Avec Copilot, a part faire service par service je vois pas trop de solution

Bagdarion

Olivie a écrit :

C'est un peu l'approche que j'ai actuellement et que je fais "dans mon coin".
J'ai le souhait de généraliser cela, donc il faudrait l'industrialiser car si je compte sur la bonne volonté de mes collègues je suis mal :o

Bagdarion

- nous n'utilisons pas claude code pour moment: github copilot (j'ai oublié de le préciser), même si ça ne change rien en pratique :jap:
- beaucoup, beaucoup de lignes à analyser. Je n'ai pas tout lister non plus, mais c'est un gros projet/système.

jL'idée est d'éviter de faire de la doc markdown et de le charger à chaque début de sessions
Je le fais déjà unitairement sur les applications sur lesquelles je passe mais on est plusieurs équipes.

Je pensais à un genre de "wiki" centralisé qui pourrait être plug / ajouté en complément des connaissances existantes du LLMs
Dans un monde idéal à chaque mise en production on aurait une mécanique qui irait mettre à jour les informations du système sur base d'analyse des sources et docs.

je schématise mais vous voyez l'idée je pense.

Olivie

Implosion du Sord

Bagdarion a écrit :

:hello,

Je me demandais si certains d’entre vous avaient déjà exploré l’usage de l’IA pour documenter ou analyser une architecture un peu complexe.

Pour situer : imaginons un ensemble de 10 à 20 micro services, plusieurs bases, des APIs un peu partout… bref, une infra classique mais pas triviale.
L’idée serait de rassembler toutes ces infos afin de pouvoir ensuite poser des questions à une IA du genre :

- montre-moi comment circule la donnée XXX
- si je touche à l’API toto, qu’est-ce que ça impacte ?

Si quelqu’un a déjà tenté ce genre de mise en place, je suis preneur de retours : outils utilisés, difficultés rencontrées, coût, etc.

:jap:

C'est du classique
Claude Code et lui demander d'analyser l'Infra à partir du code pour documenter avec des fichiers markdown tous les flux. Tu peux utiliser l'option /goal pour définir l'objectif. Ça va fumer du token par contre, et dépendre du nombre de ligne à anlayser

Bagdarion

:hello:

Je me demandais si certains d’entre vous avaient déjà exploré l’usage de l’IA pour documenter ou analyser une architecture un peu complexe.

- montre-moi comment circule la donnée XXX
- si je touche à l’API toto, qu’est-ce que ça impacte ?

Si quelqu’un a déjà tenté ce genre de mise en place, je suis preneur de retours : outils utilisés, difficultés rencontrées, coût, etc.

:jap:

XaTriX

Pareil sur 2 comptes :o

ionik

J'ai 3 réinitialisation que je ne me servirais possiblement jamais :o

bulldozer_fusion

c'est le moment de lancer vos /loop /goal avant d'aller dormir :o
https://rehost.diberie.com/Picture/Get/f/524768

jix

bulldozer_fusion a écrit :

Tout le monde utilise un worklog md pour avoir un audit détaillé?

J'ai demandé à Claude d'analyser ce que je fais pour qu'il crée des audits, aux dernières nouvelles il en avait créé 24 je crois :)

bulldozer_fusion

Tout le monde utilise un worklog md pour avoir un audit détaillé?

the_fennec

Un truc assez cool pour ceux qui utilisent IntelliJ (ou PyCharm j'imagine). En plus d'exposer leur propre IA "Junie", ils exposent aussi leur archi de plugin ACP.
Il est possible de connecter ce qu'on veut dessus en éditant un fichier de config. J'ai mis les CLI de Kiro, Cursor et Claude et ça marche nickel.

Ce qui est top, c'est que c'est pas juste un chat qui touche les mêmes fichiers que l'IDE, l'agent a accès a l'IDE. Quand il compile c'est avec le compilo de l'IDE et quand il lance des tests, c'est avec les outils de l'IDE. C'est super pratique, t'es pas obligé de luter pour trouver le terminal planqué qui a servis a lancer les tests. Pour chaque commande lancée dans le chat, tu peux cliquer dessus et voir la commande qui a été lancée. Bon seul point négatif c'est que t'es obligé de relancer TOUTES les approbations pour chaque nouveau chat
[:jeanpierrefoucault:1]

jix

bulldozer_fusion a écrit :

non pas besoin
pourquoi tu utilises pas codex? tu peux mettre un mode auto et avoir sur ton tel la demande quand tu n'es pas devant pour lui donner l'autorisation sur des élements critiques
idem avec claude code

:love:

jix	J'arrive plus à suivre, trop de topics Couscous :hello:

Sirolimus

Wispr flow ?

Moundir

petite question annexe au sujet du topic: quelle est la solution pour avoir la reconnaissance vocale avec le moins de latence possible sur windows ? (j'utilise une app perso que j'ai vibecodée avec le modèle STT de mistral)

merci

bulldozer_fusion

https://pbs.twimg.com/media/HLl2GN_ [...] ame=medium
le retour bientôt?

bulldozer_fusion

Olivie a écrit :

Pour l'histoire d'écriture ssd de Codex, c'est corrigé, ouf :o

Citation :

@thsottiaux

Codex **had** a bug. Fixed.

More feedback. Better product. Keep it coming.

Il a pas fait pété un reset :O

b-tzu

XaTriX a écrit :

Reset du SSD? :o

Plutôt un truc lié aux ssd de eee :o

XaTriX

Olivie a écrit :

Pour l'histoire d'écriture ssd de Codex, c'est corrigé, ouf :o

Citation :

@thsottiaux

Codex **had** a bug. Fixed.

More feedback. Better product. Keep it coming.

Reset du SSD? :o

the_fennec

M300A a écrit :

Oui mais continuez à dire que ça de on ne comme ça on aura un reset des limites [:sadfrog62:2]

J'ai pas de limites, je reset quand je veux :o

Spoiler :

mais ça tourne en local :D