[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 .. 346 347 348 .. 413 414 415 416 417 418 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

XaTriX

Reprise du message précédent :
Je viens de retester pendant une session claude un changement de login pour partir sur un quota frais à 0%.
* Check du quota: 0%
* Check du context : 226k
* Log sur l'autre compte
* Check du quota: 0%, toujours en attente d'une commande pour lancer le timer
* Je prompt : "Ping ?"
* Réponse : "Pong. 23% du contexte utilisé, on a de la marge. Quoi ensuite ?"
* Check le quota: 25% [:barthaliastoxik] 31% d'un compte Pro [:blessure]

Les screens: https://imgur.com/a/otD080K

Va falloir trouver un truc là

edit: fiou ça le refait si tu fermes la session et tu resume aussi, même si logiquement un cache devrait toujours être là mais non, aie aie aie

Message édité par XaTriX le 05-04-2026 à 00:45:37

---------------
[:dawa]

XaTriX

Challenge Claude Code et tokens [:hurle]

Copiez ce prompt pour avoir de la donnée sur votre consommation de token (in/out, cache, etc):

Citation :

Donne moi un rapport complet de ma consommation de tokens Claude Code, toutes sessions confondues. Calcule depuis les fichiers JSONL dans ~/.claude/projects/*/. Pour chaque message de type "assistant", extrais le champ message.usage (input_tokens, cache_read_input_tokens, cache_creation_input_tokens, output_tokens). Les timestamps sont en ISO 8601 (string).

Affiche :
1. **Overview** : période, nombre de sessions, requêtes API totales, moyennes par session
2. **Token Breakdown** : input total ventilé en cache hits / cache writes / non-cached avec pourcentages, output, grand total
3. **Cost Efficiency** : tokens au prix plein vs effectif (cache hits = 10% du coût), taux de cache hit, estimation des économies en %
4. **Per Session** : tableau avec date, requêtes, input, taux de cache hit, output pour chaque session
5. **Scorecard** : un tableau final compact et screenshotable avec une seule ligne de chiffres clés : sessions, API calls, cache hits, cache writes, non-cached, output, grand total, cache hit rate, savings. Ce tableau doit être facilement comparable entre utilisateurs.

Format en tableaux Markdown.

En dernier un scorecard qu'on peut partager sur HFR

---------------
[:dawa]

XaTriX

votre hit rate m'interesse particulièrement

---------------
[:dawa]

gozo le clown

Salut les goats :jap:

J'ai 50 pages a rattraper sur ce fil, c'est en cours... je voudrais m'acheter un laptop d'entree de gamme pour glissser dans les bagages en voyages pro et experimenter
- codex
- claude cowork
- assistants perso a la clawdbot

Est ce qu'un laptop Macbook Neo va suffire? Sur le papier c'est parfait... Quelqu'un en a? Je precise que j'ai deja un laptop pro et celui ci sera 100% dedie a cette experience AI. Un mac mini est tres difficile... pas envie de me trimballer un ecran externe, clavier etc. :jap:

XaTriX

Pour faire appel à des LLM/API externes oui ça suffira.
Faut pas espérer faire tourner des trucs en local par contre
Mais pour le reste c'est même peut être une bonne idée vu le prix (neuf parce que sinon un laptop à 100 boules d'occasion sera bien aussi )

---------------
[:dawa]

ionik

XaTriX a écrit :

Challenge Claude Code et tokens [:hurle]

Copiez ce prompt pour avoir de la donnée sur votre consommation de token (in/out, cache, etc):

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR

the_fennec

f3nn3cUs z3rd4

Circenses a écrit :

:hello:

Certains font-ils tourner des LLM en local ? Je n'ai pas trouvé de topic "IA home made". Pour ma part, je suis sous Linux Mint, avec une RTX 5090 ( ).

Il y a un peu moins d'un an, j'avais testé plusieurs LLM (Gemma3, Qwen, etc.), via Ollama / AnythingLLM en docker, et c'était franchement décevant.

Là, il y a Gemma4 qui vient de sortir (j'utilise Gemma4:26b, la version 31b sature la VRAM), et c'est tout juste bluffant ! J'ai comparé plusieurs réponses (avec Gemini Pro et ChatGPT Plus), et ça semble tenir la route ! Bon, le délai de réponse est quand même plus long, mais les perspectives sont franchement enthousiasmantes !

On est plutot sur le topic "technique" Dev:
https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0

Perso j'ai un llama.cpp en "cluster" rpc 4060Ti 16GB Windows + BC250 16GB Debian et je fais tourner Qwen3-coder-next avec Opencode.
Pour l'instant je suis pas convaincu par Gemma 4, très lent et pas fiable, mais il y a plein de fix en cours dans llama.cpp.

---------------
Faudra que je teste un jour :o

the_fennec

f3nn3cUs z3rd4

gozo le clown a écrit :

Ça dépends de ce que tu veux faire, il n'a que 8GB de RAM partagée donc si tu veux coder ça peut être limitant. Si c'est juste pour utilise des agents, pas de souics, openclaw devrait bien tourner.

Même llama.cpp en étant patient:
https://x.com/literallydenis/status/2031793543845409255

Llama FTW

---------------
Faudra que je teste un jour :o

XaTriX

ionik a écrit :

https://rehost.diberie.com/Picture/Get/r/503733

Pas mal

Ton taux de hit a l'air normal, j'imagine que le normal est au moins vers 98-98.5%.

More stats [:roger30:3]

---------------
[:dawa]

ionik

XaTriX a écrit :

Pas mal

Ton taux de hit a l'air normal, j'imagine que le normal est au moins vers 98-98.5%.

More stats [:roger30:3]

Tu veux quoi comme stat lol

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR

XaTriX

Non, les autres. Pas toi

---------------
[:dawa]

Olivie

SUUUUUUUUUUUUUU

Tu compares quelle donnée ?

---------------

Olivie

SUUUUUUUUUUUUUU

Bon ben la fin du x2 sur codex on le sent

---------------

XaTriX

Olivie a écrit :

Tu compares quelle donnée ?

https://i.imgur.com/T72gL1O.jpeg

Bah... Tout

---------------
[:dawa]

XaTriX

Tu changes de compte ? Ou tu restart souvent ta session ?

---------------
[:dawa]

Olivie

SUUUUUUUUUUUUUU

XaTriX a écrit :

Tu changes de compte ? Ou tu restart souvent ta session ?

j'utilise 1 compte sur le VPS via tmux et un directement sur mon portable.

---------------

Circenses

the_fennec a écrit :

:jap:

ionik

Olivie a écrit :

j'utilise 1 compte sur le VPS via tmux et un directement sur mon portable.

C'est quoi ta config pour cela ? Un truc basique avec tmux over ssh ?

---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR

Olivie

SUUUUUUUUUUUUUU

ionik a écrit :

C'est quoi ta config pour cela ? Un truc basique avec tmux over ssh ?

oui

---------------

XaTriX

Bon, reprise d'une session déjà ouverte. Compte/quote à 0%, j'ai oublié le compact avant de partir.. 34% du quota pour un context de 300k sur opus

Peut être faire un "ping" avec haiku pour envoyer le contexte à pas cher ? mais si je change de modele ça refait l'input au coût du model ?

edit: j'ai annulé le compact, j'ai fait un ping, j'ai demandé à combine de quota je suis et paf je monte à..

Message édité par XaTriX le 05-04-2026 à 20:40:37

---------------
[:dawa]

Gued1duweb

Bah c'est plutôt bon signe ce chiffre [:stephan_lapaix]

Good night incoming ! [:mechant poulet]

XaTriX

J'hésite à prendre le Siège Premium (x5) mais putain la haine si tu remplis ton quota en 1hr :lol:
Même si ça coûte 33x moins cher que l'API

Si vous connaissez des experts en optimisation de context ou des hacks genre vider les gros tool result je suis preneur.
Au final dès qu'on leur fout un pdf ou 5 pages HFR à lire ça baise tout et ton JSONL devient immense et très couteux (à la reprise, au changement de compte, au cache write ...)

---------------
[:dawa]

gozo le clown

LibreArbitre a écrit :

Ha parce que tu crois vraiment que c'est différent avec les providers américains ? Dans le fond je partage ton avis mais en ces temps de gouvernance sous le règne de Trump je commence à moins craindre la Chine que les US...

Lol attention les Chinois ont un plan multi generationnel de domination du monde
Les US s'en tiennent maintenant au soft power economique, peut etre moins pervers?

Olivie a écrit :

Y a un topik doomiste-IA-fin-du-monde
Ici c’est le topik « on va remplacer des jobs par l’IA »

Link? J'ai pas trouve :jap:

XaTriX

Bon dans le x5 y'a une autre limite pour sonnet
pas encore capté l'avantage

---------------
[:dawa]

Olivie

SUUUUUUUUUUUUUU

gozo le clown a écrit :

Link? J'ai pas trouve :jap:

https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0

---------------

JohnSmith

Executive vice president

gozo le clown a écrit :

Les US s'en tiennent maintenant au soft power economique, peut etre moins pervers?

Ah merde j'avais cru comprendre qu'ils balançaient des bombes sur les arabes pour faire du délit d'initié

extenue1

Pour de l'agentique , est ce qu'il y a un setup qui fait consensus pour l'IDE ?

J'en suis avec vs code et cline (continue.dev en backup) , je me demandais si y'a mieux ?

Cline agrege parfaitement OpenAI , Gemini , Claude , Openrouter donc ca me parait ideal

Olivie

SUUUUUUUUUUUUUU

extenue1 a écrit :

Pour de l'agentique , est ce qu'il y a un setup qui fait consensus pour l'IDE ?

J'en suis avec vs code et cline (continue.dev en backup) , je me demandais si y'a mieux ?

Cline agrege parfaitement OpenAI , Gemini , Claude , Openrouter donc ca me parait ideal

Le mieux ca semble être Claude code avec opus
Pour IDE, Cursor avec Claude semble ce qui se fait de mieux

---------------

LibreArbitre

La /root est longue

Kilo Code

---------------
Pharyo | Cinépite | Capvirage

gatsu35

Blablaté par Harko

XaTriX a écrit :

Caveman https://github.com/JuliusBrussee/ca [...] le#install

---------------
Blablaté par Harko

XaTriX

gatsu35 a écrit :

Caveman https://github.com/JuliusBrussee/ca [...] le#install

C'est bien ?

---------------
[:dawa]

bulldozer_fusion

rip Mekthoub & Marc

gatsu35 a écrit :

Caveman https://github.com/JuliusBrussee/ca [...] le#install

Le nom

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

the_fennec

f3nn3cUs z3rd4

gatsu35 a écrit :

Caveman https://github.com/JuliusBrussee/ca [...] le#install

:love:

Citation :

Caveman not dumb. Caveman efficient.

---------------
Faudra que je teste un jour :o

gus84

Old school gamer

Salut le topic,

existe il une IA qui offrirai un abonnement de type "famille" ? qu'on peut partager à 3 ou 4.
Parce que j'ai mes ados qui me les brise pour avoir la version complète de chatGPT, mais je vais pas payer un abo à tout le monde.

---------------
Gus

bulldozer_fusion

rip Mekthoub & Marc

gus84 a écrit :

non, sinon il faut prendre une version "teams" mais c'est équivalent à payer les versions individuelles à chacun

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

XaTriX

gus84 a écrit :

Bah Gemini

---------------
[:dawa]

bulldozer_fusion

rip Mekthoub & Marc

XaTriX a écrit :

Bah Gemini

ah oui c'est vrai [:prozac]

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

LibreArbitre

La /root est longue

XaTriX a écrit :

Bah Gemini

Non, ça ne fonctionne pas pour les enfants mineurs... Ma femme a bien accès à la version Pro mais pas ma fille de 13 ans...

Source : https://support.google.com/googleon [...] 5039?hl=fr

---------------
Pharyo | Cinépite | Capvirage

XaTriX

Ah! J'ai pas de ce genre de choses à la maison, déso

---------------
[:dawa]

LibreArbitre

La /root est longue

XaTriX a écrit :

Ah! J'ai pas de ce genre de choses à la maison, déso

T'as des enfants déjà majeurs à ton âge Xat' ?

---------------
Pharyo | Cinépite | Capvirage

falkon1000

Avec un seul abo Gemini payant on peut avoir plusieurs comptes ? Et ils se partagent les quota (image, Gemini CLI) ou tous s'additionnent ?

Page : 1 2 3 4 5 .. 346 347 348 .. 413 414 415 416 417 418

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Intelligence Artificielle

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Sujets relatifs
sécurité de l'IA / agentique et des Devs en roue libre
Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Page générée en 0.073 secondes