Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2058 connectés 

 


Dernière réponse
Sujet : [Topic unique] Développement via IA
b-tzu tout le monde parle de vider le contexte pour diminuer la conso. je suis en claude opus 1M, je ne vide le contexte que quand j'arrive dans les 90% (en general sur un meme projet, je commence rarement une nouvelle task avec un contexte pollué, je clear)et pourtant je ne ressens pas de surconsommation (pas de ca en tout cas)
cest normal ?

Votre réponse
Nom d'utilisateur    Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !
Le ton de votre message                        
                       
Votre réponse


[b][i][u][strike][spoiler][fixed][cpp][url][email][img][*]   
 
   [quote]
 

Options

 
Vous avez perdu votre mot de passe ?


Vue Rapide de la discussion
b-tzu tout le monde parle de vider le contexte pour diminuer la conso. je suis en claude opus 1M, je ne vide le contexte que quand j'arrive dans les 90% (en general sur un meme projet, je commence rarement une nouvelle task avec un contexte pollué, je clear)et pourtant je ne ressens pas de surconsommation (pas de ca en tout cas)
cest normal ?
bulldozer_fusion https://rehost.diberie.com/Picture/Get/f/525458
bulldozer_fusion https://rehost.diberie.com/Picture/Get/f/525412
 [:tiutoo:3]
Olivie Ils sont tous en période pré-éclatement de la bulle et essaient de lever un max de sous  [:michel_cymerde:7]
XaTriX A force de répéter que le gap est closé par les chinois et qu'en réalité c'est pas du tout le cas ça ne sert plus à rien d'essayer de les croire
bulldozer_fusion

Citation :

While the US was busy banning Claude Fable, China's Zhipu AI just released its latest model that matches it for cybersecurity tasks.
 
The gap is closing day by day.


https://x.com/puckrin/status/2071125947512959320

Winpoks

joce a écrit :

glm-5.2 bcp en ce moment parce que plus de token Claude et Codex et c'est un bon moyen pour tester l'implem Ollama de Tamag0, mais bizarrement ajd je trouve que la pertinence de glm-5.2 s'est bcp dégradée, il enchaine les conneries... Est-ce que coté Ollama il joue sur l'effort quand on tape un peu trop sur les serveurs ?

 

Hermes est sous 5.2 et openclaw sous 5.1, le tout sous Ollama. J'ai de meilleures réponses avec le 5.1. Mais sans demander beaucoup.

Nr13 Normalement GLM-5.2 supporte les variants high et max.. Possible que ollama tweak de son côté du coup.
joce

XaTriX a écrit :

Après il existe un biais quand on teste un modèle sensé être bon :o
On est très satisfait au début puis on découvre la vérité :o


là non, c'est vraiment un changement de comportement où il ne suis plus ce que préconise le skill et le system prompt, alors qu'il le faisait très bien avant, et que le context n'est pas plus saturé qu'avant

joce

XaTriX a écrit :

L'hébergeur explicite à combien il règle l'effort ?


non justement ollama permet juste un boolean true / false sur le thinking (sauf pour gpt-oss)

XaTriX Après il existe un biais quand on teste un modèle sensé être bon :o
On est très satisfait au début puis on découvre la vérité :o
XaTriX L'hébergeur explicite à combien il règle l'effort ?
joce glm-5.2 bcp en ce moment parce que plus de token Claude et Codex et c'est un bon moyen pour tester l'implem Ollama de Tamag0, mais bizarrement ajd je trouve que la pertinence de glm-5.2 s'est bcp dégradée, il enchaine les conneries... Est-ce que coté Ollama il joue sur l'effort quand on tape un peu trop sur les serveurs ?
bulldozer_fusion

oh_damned a écrit :

Bon alors ... Codex ou Claude Code ces temps-ci ? :D


Codex

oh_damned Bon alors ... Codex ou Claude Code ces temps-ci ? :D
Nr13

Olivie a écrit :

Y aura surtout un problème de contexte si y a bcp de codes.
Perso j'analyserais chaque apps à part d'abord en demandant de documenter et en utilisant à chaque fois un reset du contexte.
Puis je lui ferais analyser l'ensemble de la documentation pour approfondir les liens etc...


 
C'est ce que fera par défaut n'importe quel agent "orchestrator"

Implosion du Sord

Olivie a écrit :

Y aura surtout un problème de contexte si y a bcp de codes.
Perso j'analyserais chaque apps à part d'abord en demandant de documenter et en utilisant à chaque fois un reset du contexte.
Puis je lui ferais analyser l'ensemble de la documentation pour approfondir les liens etc...


Avec Claude Code /workflow (ou ultracode), chaque repo / service serait analysé par un agent différent. 20 micro service ça passe sans soucis si se sont bien des micro-service. En plus c'est parallélisable.

 

Par contre, je commencerai par la doc, puis le code, pour le guider dans l'analyse. Après il faut aussi lui préciser le niveau de détails (edge cases, inclusion des error flow, ...)

 

Avec Copilot, a part faire service par service je vois pas trop de solution

Bagdarion

Olivie a écrit :

Y aura surtout un problème de contexte si y a bcp de codes.
Perso j'analyserais chaque apps à part d'abord en demandant de documenter et en utilisant à chaque fois un reset du contexte.
Puis je lui ferais analyser l'ensemble de la documentation pour approfondir les liens etc...


 
C'est un peu l'approche que j'ai actuellement et que je fais "dans mon coin".
J'ai le souhait de généraliser cela, donc il faudrait l'industrialiser car si je compte sur la bonne volonté de mes collègues je suis mal :o

Bagdarion - nous n'utilisons pas claude code pour moment: github copilot (j'ai oublié de le préciser), même si ça ne change rien en pratique :jap:
- beaucoup, beaucoup de lignes à analyser. Je n'ai pas tout lister non plus, mais c'est un gros projet/système.
 
jL'idée est d'éviter de faire de la doc markdown et de le charger à chaque début de sessions
Je le fais déjà unitairement sur les applications sur lesquelles je passe mais on est plusieurs équipes.
 
Je pensais à un genre de "wiki" centralisé qui pourrait être plug / ajouté en complément des connaissances existantes du LLMs
Dans un monde idéal à chaque mise en production on aurait une mécanique qui irait mettre à jour les informations du système sur base d'analyse des sources et docs.
 
je schématise mais vous voyez l'idée je pense.
 
Olivie Y aura surtout un problème de contexte si y a bcp de codes.
Perso j'analyserais chaque apps à part d'abord en demandant de documenter et en utilisant à chaque fois un reset du contexte.
Puis je lui ferais analyser l'ensemble de la documentation pour approfondir les liens etc...
Implosion du Sord

Bagdarion a écrit :

:hello,

 

Je me demandais si certains d’entre vous avaient déjà exploré l’usage de l’IA pour documenter ou analyser une architecture un peu complexe.

 

Pour situer : imaginons un ensemble de 10 à 20 micro services, plusieurs bases, des APIs un peu partout… bref, une infra classique mais pas triviale.
L’idée serait de rassembler toutes ces infos afin de pouvoir ensuite poser des questions à une IA du genre :

 

- montre-moi comment circule la donnée XXX
- si je touche à l’API toto, qu’est-ce que ça impacte ?

 

Si quelqu’un a déjà tenté ce genre de mise en place, je suis preneur de retours : outils utilisés, difficultés rencontrées, coût, etc.

 

:jap:


C'est du classique
Claude Code et lui demander d'analyser l'Infra à partir du code pour documenter avec des fichiers markdown tous les flux. Tu peux utiliser l'option /goal pour définir l'objectif. Ça va fumer du token par contre, et dépendre du nombre de ligne à anlayser

Bagdarion :hello:

 

Je me demandais si certains d’entre vous avaient déjà exploré l’usage de l’IA pour documenter ou analyser une architecture un peu complexe.

 

Pour situer : imaginons un ensemble de 10 à 20 micro services, plusieurs bases, des APIs un peu partout… bref, une infra classique mais pas triviale.
L’idée serait de rassembler toutes ces infos afin de pouvoir ensuite poser des questions à une IA du genre :

 

- montre-moi comment circule la donnée XXX
- si je touche à l’API toto, qu’est-ce que ça impacte ?

 

Si quelqu’un a déjà tenté ce genre de mise en place, je suis preneur de retours : outils utilisés, difficultés rencontrées, coût, etc.

 

:jap:

XaTriX Pareil sur 2 comptes :o
ionik J'ai 3 réinitialisation que je ne me servirais possiblement jamais :o
bulldozer_fusion c'est le moment de lancer vos /loop /goal avant d'aller dormir :o
https://rehost.diberie.com/Picture/Get/f/524768
jix

bulldozer_fusion a écrit :

Tout le monde utilise un worklog md pour avoir un audit détaillé?


J'ai demandé à Claude d'analyser ce que je fais pour qu'il crée des audits, aux dernières nouvelles il en avait créé 24 je crois  :)

bulldozer_fusion Tout le monde utilise un worklog md pour avoir un audit détaillé?
the_fennec Un truc assez cool pour ceux qui utilisent IntelliJ (ou PyCharm j'imagine). En plus d'exposer leur propre IA "Junie", ils exposent aussi leur archi de plugin ACP.  
Il est possible de connecter ce qu'on veut dessus en éditant un fichier de config. J'ai mis les CLI de Kiro, Cursor et Claude et ça marche nickel.
 
Ce qui est top, c'est que c'est pas juste un chat qui touche les mêmes fichiers que l'IDE, l'agent a accès a l'IDE. Quand il compile c'est avec le compilo de l'IDE et quand il lance des tests, c'est avec les outils de l'IDE. C'est super pratique, t'es pas obligé de luter pour trouver le terminal planqué qui a servis a lancer les tests. Pour chaque commande lancée dans le chat, tu peux cliquer dessus et voir la commande qui a été lancée. Bon seul point négatif c'est que t'es obligé de relancer TOUTES les approbations pour chaque nouveau chat
[:jeanpierrefoucault:1]
jix

bulldozer_fusion a écrit :


non pas besoin
pourquoi tu utilises pas codex? tu peux mettre un mode auto et avoir sur ton tel la demande quand tu n'es pas devant pour lui donner l'autorisation sur des élements critiques
idem avec claude code


 :love:

jix J'arrive plus à suivre, trop de topics

 

Couscous  :hello:

Sirolimus Wispr flow ?
Moundir petite question annexe au sujet du topic: quelle est la solution pour avoir la reconnaissance vocale avec le moins de latence possible sur windows ? (j'utilise une app perso que j'ai vibecodée avec le modèle STT de mistral)
 
merci
bulldozer_fusion https://pbs.twimg.com/media/HLl2GN_ [...] ame=medium
le retour bientôt?
bulldozer_fusion

Olivie a écrit :

Pour l'histoire d'écriture ssd de Codex, c'est corrigé, ouf :o

 
Citation :

@thsottiaux

 

Codex **had** a bug. Fixed.

 

More feedback. Better product. Keep it coming.



Il a pas fait pété un reset :O

b-tzu

XaTriX a écrit :


Reset du SSD? :o


Plutôt un truc lié aux ssd de eee  :o

XaTriX

Olivie a écrit :

Pour l'histoire d'écriture ssd de Codex, c'est corrigé, ouf :o

 
Citation :

@thsottiaux

 

Codex **had** a bug. Fixed.

 

More feedback. Better product. Keep it coming.



Reset du SSD? :o

the_fennec

M300A a écrit :

Oui mais continuez à dire que ça de on ne comme ça on aura un reset des limites  [:sadfrog62:2]


 
J'ai pas de limites, je reset quand je veux :o
 

Spoiler :

mais ça tourne en local :D


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)