Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2801 connectés 

 


Avez-vous basculé sur ChatGPT Plus ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  346  347  348  ..  413  414  415  416  417  418
Auteur Sujet :

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

n°13867
XaTriX
Posté le 05-04-2026 à 00:25:07  profilanswer
 

Reprise du message précédent :
Je viens de retester pendant une session claude un changement de login pour partir sur un quota frais à 0%.
* Check du quota: 0%
* Check du context : 226k
* Log sur l'autre compte
* Check du quota: 0%, toujours en attente d'une commande pour lancer le timer
* Je prompt : "Ping ?"
* Réponse : "Pong. 23% du contexte utilisé, on a de la marge. Quoi ensuite ?"
* Check le quota: 25% [:barthaliastoxik] 31% d'un compte Pro [:blessure]

 

Les screens: https://imgur.com/a/otD080K

 

Va falloir trouver un truc là

 

edit: fiou ça le refait si tu fermes la session et tu resume aussi, même si logiquement un cache devrait toujours être là mais non, aie aie aie


Message édité par XaTriX le 05-04-2026 à 00:45:37

---------------
[:dawa]
n°13868
XaTriX
Posté le 05-04-2026 à 01:20:51  profilanswer
 

Challenge Claude Code et tokens [:hurle]
 
Copiez ce prompt pour avoir de la donnée sur votre consommation de token (in/out, cache, etc):

Citation :


Donne moi un rapport complet de ma consommation de tokens Claude Code, toutes sessions confondues. Calcule depuis les fichiers JSONL dans ~/.claude/projects/*/. Pour chaque message de type "assistant", extrais le champ message.usage (input_tokens, cache_read_input_tokens, cache_creation_input_tokens, output_tokens). Les timestamps sont en ISO 8601 (string).
 
Affiche :
1. **Overview** : période, nombre de sessions, requêtes API totales, moyennes par session
2. **Token Breakdown** : input total ventilé en cache hits / cache writes / non-cached avec pourcentages, output, grand total
3. **Cost Efficiency** : tokens au prix plein vs effectif (cache hits = 10% du coût), taux de cache hit, estimation des économies en %
4. **Per Session** : tableau avec date, requêtes, input, taux de cache hit, output pour chaque session
5. **Scorecard** : un tableau final compact et screenshotable avec une seule ligne de chiffres clés : sessions, API calls, cache hits, cache writes, non-cached, output, grand total, cache hit rate, savings. Ce tableau doit être facilement comparable entre utilisateurs.
 
Format en tableaux Markdown.


 
En dernier un scorecard qu'on peut partager sur HFR :o
 
https://i.imgur.com/USLZ8TD.png


---------------
[:dawa]
n°13869
XaTriX
Posté le 05-04-2026 à 01:35:47  profilanswer
 

votre hit rate m'interesse particulièrement


---------------
[:dawa]
n°13870
gozo le cl​own
Posté le 05-04-2026 à 08:55:01  profilanswer
 

Salut les goats :jap:
 
J'ai 50 pages a rattraper sur ce fil, c'est en cours... je voudrais m'acheter un laptop d'entree de gamme pour glissser dans les bagages en voyages pro et experimenter
- codex
- claude cowork
- assistants perso a la clawdbot
 
Est ce qu'un laptop Macbook Neo va suffire? Sur le papier c'est parfait... Quelqu'un en a? Je precise que j'ai deja un laptop pro et celui ci sera 100% dedie a cette experience AI. Un mac mini est tres difficile... pas envie de me trimballer un ecran externe, clavier etc. :jap:

n°13871
XaTriX
Posté le 05-04-2026 à 09:09:18  profilanswer
 

Pour faire appel à des LLM/API externes oui ça suffira.
Faut pas espérer faire tourner des trucs en local par contre :o
Mais pour le reste c'est même peut être une bonne idée vu le prix (neuf parce que sinon un laptop à 100 boules d'occasion sera bien aussi :o)


---------------
[:dawa]
n°13872
ionik
Posté le 05-04-2026 à 09:09:35  profilanswer
 

XaTriX a écrit :

Challenge Claude Code et tokens [:hurle]
 
Copiez ce prompt pour avoir de la donnée sur votre consommation de token (in/out, cache, etc):
 


https://rehost.diberie.com/Picture/Get/r/503733


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°13873
the_fennec
f3nn3cUs z3rd4
Posté le 05-04-2026 à 09:11:21  profilanswer
 

Circenses a écrit :

:hello:
 
Certains font-ils tourner des LLM en local ? Je n'ai pas trouvé de topic "IA home made". Pour ma part, je suis sous Linux Mint, avec une RTX 5090 ( :o ).
 
Il y a un peu moins d'un an, j'avais testé plusieurs LLM (Gemma3, Qwen, etc.), via Ollama / AnythingLLM en docker, et c'était franchement décevant.
 
Là, il y a Gemma4 qui vient de sortir (j'utilise Gemma4:26b, la version 31b sature la VRAM), et c'est tout juste bluffant ! J'ai comparé plusieurs réponses (avec Gemini Pro et ChatGPT Plus), et ça semble tenir la route ! Bon, le délai de réponse est quand même plus long, mais les perspectives sont franchement enthousiasmantes !


 
On est plutot sur le topic "technique" Dev:
https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
 
Perso j'ai un llama.cpp en "cluster" rpc 4060Ti 16GB Windows + BC250 16GB Debian et je fais tourner Qwen3-coder-next avec Opencode.
Pour l'instant je suis pas convaincu par Gemma 4, très lent et pas fiable, mais il y a plein de fix en cours dans llama.cpp.


---------------
Faudra que je teste un jour :o
n°13874
the_fennec
f3nn3cUs z3rd4
Posté le 05-04-2026 à 09:22:43  profilanswer
 

gozo le clown a écrit :

Salut les goats :jap:
 
J'ai 50 pages a rattraper sur ce fil, c'est en cours... je voudrais m'acheter un laptop d'entree de gamme pour glissser dans les bagages en voyages pro et experimenter
- codex
- claude cowork
- assistants perso a la clawdbot
 
Est ce qu'un laptop Macbook Neo va suffire? Sur le papier c'est parfait... Quelqu'un en a? Je precise que j'ai deja un laptop pro et celui ci sera 100% dedie a cette experience AI. Un mac mini est tres difficile... pas envie de me trimballer un ecran externe, clavier etc. :jap:


 
Ça dépends de ce que tu veux faire, il n'a que 8GB de RAM partagée donc si tu veux coder ça peut être limitant. Si c'est juste pour utilise des agents, pas de souics, openclaw devrait bien tourner.
 
Même llama.cpp en étant patient:
https://x.com/literallydenis/status/2031793543845409255
 
Llama FTW :o


---------------
Faudra que je teste un jour :o
n°13875
XaTriX
Posté le 05-04-2026 à 10:17:22  profilanswer
 


Pas mal :D

 

Ton taux de hit a l'air normal, j'imagine que le normal est au moins vers 98-98.5%.

 

More stats  [:roger30:3]


---------------
[:dawa]
n°13876
ionik
Posté le 05-04-2026 à 10:32:14  profilanswer
 

XaTriX a écrit :


Pas mal :D

 

Ton taux de hit a l'air normal, j'imagine que le normal est au moins vers 98-98.5%.

 

More stats  [:roger30:3]


Tu veux quoi comme stat lol  :O


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°13877
XaTriX
Posté le 05-04-2026 à 10:36:20  profilanswer
 

Non, les autres. Pas toi :d


---------------
[:dawa]
n°13878
Olivie
SUUUUUUUUUUUUUU
Posté le 05-04-2026 à 10:38:57  profilanswer
 

Tu compares quelle donnée ?
 
https://i.imgur.com/T72gL1O.jpeg


---------------

n°13879
Olivie
SUUUUUUUUUUUUUU
Posté le 05-04-2026 à 11:09:10  profilanswer
 

Bon ben la fin du x2 sur codex on le sent :(


---------------

n°13880
XaTriX
Posté le 05-04-2026 à 11:11:33  profilanswer
 


Bah... Tout :o


---------------
[:dawa]
n°13881
XaTriX
Posté le 05-04-2026 à 11:13:16  profilanswer
 

Tu changes de compte ? Ou tu restart souvent ta session ?


---------------
[:dawa]
n°13882
Olivie
SUUUUUUUUUUUUUU
Posté le 05-04-2026 à 11:18:59  profilanswer
 

XaTriX a écrit :

Tu changes de compte ? Ou tu restart souvent ta session ?


j'utilise 1 compte sur le VPS via tmux et un directement sur mon portable.


---------------

n°13883
Circenses
Posté le 05-04-2026 à 19:02:57  profilanswer
 

the_fennec a écrit :


 
On est plutot sur le topic "technique" Dev:
https://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
 
Perso j'ai un llama.cpp en "cluster" rpc 4060Ti 16GB Windows + BC250 16GB Debian et je fais tourner Qwen3-coder-next avec Opencode.
Pour l'instant je suis pas convaincu par Gemma 4, très lent et pas fiable, mais il y a plein de fix en cours dans llama.cpp.


:jap:

n°13884
ionik
Posté le 05-04-2026 à 20:00:58  profilanswer
 

Olivie a écrit :


j'utilise 1 compte sur le VPS via tmux et un directement sur mon portable.


C'est quoi ta config pour cela ? Un truc basique avec tmux over ssh ?


---------------
Recette cookeo | Recette de cuisine | Extension chrome HFR
n°13885
Olivie
SUUUUUUUUUUUUUU
Posté le 05-04-2026 à 20:18:24  profilanswer
 

ionik a écrit :


C'est quoi ta config pour cela ? Un truc basique avec tmux over ssh ?


oui :o


---------------

n°13886
XaTriX
Posté le 05-04-2026 à 20:37:01  profilanswer
 

Bon, reprise d'une session déjà ouverte. Compte/quote à 0%, j'ai oublié le compact avant de partir.. 34% du quota pour un context de 300k sur opus :(

 

Peut être faire un "ping" avec haiku pour envoyer le contexte à pas cher ? mais si je change de modele ça refait l'input au coût du model ?

 

edit: j'ai annulé le compact, j'ai fait un ping, j'ai demandé à combine de quota je suis et paf je monte à..
https://i.imgur.com/FnJJftH.png


Message édité par XaTriX le 05-04-2026 à 20:40:37

---------------
[:dawa]
n°13887
Gued1duweb
Posté le 05-04-2026 à 20:48:18  profilanswer
 

Bah c'est plutôt bon signe ce chiffre  [:stephan_lapaix]

 

Good night incoming !  [:mechant poulet]

n°13888
XaTriX
Posté le 05-04-2026 à 21:06:54  profilanswer
 

:D
 
J'hésite à prendre le Siège Premium (x5) mais putain la haine si tu remplis ton quota en 1hr :lol:
Même si ça coûte 33x moins cher que l'API :o
 
Si vous connaissez des experts en optimisation de context ou des hacks genre vider les gros tool result je suis preneur.
Au final dès qu'on leur fout un pdf ou 5 pages HFR à lire ça baise tout et ton JSONL devient immense et très couteux (à la reprise, au changement de compte, au cache write ...)


---------------
[:dawa]
n°13889
gozo le cl​own
Posté le 05-04-2026 à 21:52:16  profilanswer
 

LibreArbitre a écrit :


Ha parce que tu crois vraiment que c'est différent avec les providers américains ? Dans le fond je partage ton avis mais en ces temps de gouvernance sous le règne de Trump je commence à moins craindre la Chine que les US...


 
Lol attention les Chinois ont un plan multi generationnel de domination du monde  
Les US s'en tiennent maintenant au soft power economique, peut etre moins pervers?
 

Olivie a écrit :


Y a un topik doomiste-IA-fin-du-monde
Ici c’est le topik « on va remplacer des jobs par l’IA » :o


 
Link? J'ai pas trouve :jap:

n°13890
XaTriX
Posté le 06-04-2026 à 01:07:06  profilanswer
 

Bon dans le x5 y'a une autre limite pour sonnet :o
pas encore capté l'avantage :o
 
https://i.imgur.com/lnhVRl1.png


---------------
[:dawa]
n°13891
Olivie
SUUUUUUUUUUUUUU
Posté le 06-04-2026 à 09:36:13  profilanswer
 
n°13892
JohnSmith
Executive vice president
Posté le 06-04-2026 à 10:29:58  profilanswer
 

gozo le clown a écrit :


Les US s'en tiennent maintenant au soft power economique, peut etre moins pervers?


 
Ah merde j'avais cru comprendre qu'ils balançaient des bombes sur les arabes pour faire du délit d'initié  :o  

n°13893
extenue1
Posté le 06-04-2026 à 11:21:10  profilanswer
 

Pour de l'agentique , est ce qu'il y a un setup qui fait consensus pour l'IDE ?

 

J'en suis avec vs code et cline (continue.dev en backup) , je me demandais si y'a mieux ?

 

Cline agrege parfaitement OpenAI , Gemini , Claude , Openrouter donc ca me parait ideal

n°13894
Olivie
SUUUUUUUUUUUUUU
Posté le 06-04-2026 à 11:56:24  profilanswer
 

extenue1 a écrit :

Pour de l'agentique , est ce qu'il y a un setup qui fait consensus pour l'IDE ?
 
J'en suis avec vs code et cline (continue.dev en backup) , je me demandais si y'a mieux ?
 
Cline agrege parfaitement OpenAI , Gemini , Claude , Openrouter donc ca me parait ideal


Le mieux ca semble être Claude code avec opus :o
Pour IDE, Cursor avec Claude semble ce qui se fait de mieux


---------------

n°13895
LibreArbit​re
La /root est longue
Posté le 06-04-2026 à 12:34:02  profilanswer
 

Kilo Code ;)


---------------
Pharyo | Cinépite | Capvirage
n°13896
gatsu35
Blablaté par Harko
Posté le 06-04-2026 à 16:36:39  profilanswer
 

XaTriX a écrit :

:D
 
J'hésite à prendre le Siège Premium (x5) mais putain la haine si tu remplis ton quota en 1hr :lol:
Même si ça coûte 33x moins cher que l'API :o
 
Si vous connaissez des experts en optimisation de context ou des hacks genre vider les gros tool result je suis preneur.
Au final dès qu'on leur fout un pdf ou 5 pages HFR à lire ça baise tout et ton JSONL devient immense et très couteux (à la reprise, au changement de compte, au cache write ...)


Caveman https://github.com/JuliusBrussee/ca [...] le#install


---------------
Blablaté par Harko
n°13897
XaTriX
Posté le 06-04-2026 à 16:53:43  profilanswer
 
n°13898
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 06-04-2026 à 16:58:39  profilanswer
 
n°13899
the_fennec
f3nn3cUs z3rd4
Posté le 06-04-2026 à 17:14:31  profilanswer
 


 :love:  
 

Citation :

Caveman not dumb. Caveman efficient.


---------------
Faudra que je teste un jour :o
n°13900
gus84
Old school gamer
Posté le 06-04-2026 à 19:01:43  profilanswer
 

Salut le topic,  
 
existe il une IA qui offrirai un abonnement de type "famille" ? qu'on peut partager à 3 ou 4.
Parce que j'ai mes ados qui me les brise pour avoir la version complète de chatGPT, mais je vais pas payer un abo à tout le monde. :o


---------------
Gus
n°13901
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 06-04-2026 à 19:02:43  profilanswer
 

gus84 a écrit :

Salut le topic,  
 
existe il une IA qui offrirai un abonnement de type "famille" ? qu'on peut partager à 3 ou 4.
Parce que j'ai mes ados qui me les brise pour avoir la version complète de chatGPT, mais je vais pas payer un abo à tout le monde. :o


non, sinon il faut prendre une version "teams" mais c'est équivalent à payer les versions individuelles à chacun


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°13902
XaTriX
Posté le 06-04-2026 à 19:42:09  profilanswer
 

gus84 a écrit :

Salut le topic,  
 
existe il une IA qui offrirai un abonnement de type "famille" ? qu'on peut partager à 3 ou 4.
Parce que j'ai mes ados qui me les brise pour avoir la version complète de chatGPT, mais je vais pas payer un abo à tout le monde. :o


Bah Gemini


---------------
[:dawa]
n°13903
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 06-04-2026 à 19:52:20  profilanswer
 


ah oui c'est vrai [:prozac]


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°13904
LibreArbit​re
La /root est longue
Posté le 06-04-2026 à 20:18:28  profilanswer
 


Non, ça ne fonctionne pas pour les enfants mineurs... Ma femme a bien accès à la version Pro mais pas ma fille de 13 ans...
 
Source : https://support.google.com/googleon [...] 5039?hl=fr


---------------
Pharyo | Cinépite | Capvirage
n°13905
XaTriX
Posté le 06-04-2026 à 20:19:40  profilanswer
 

Ah! J'ai pas de ce genre de choses à la maison, déso :o


---------------
[:dawa]
n°13906
LibreArbit​re
La /root est longue
Posté le 06-04-2026 à 20:24:32  profilanswer
 

XaTriX a écrit :

Ah! J'ai pas de ce genre de choses à la maison, déso :o


T'as des enfants déjà majeurs à ton âge Xat' ?


---------------
Pharyo | Cinépite | Capvirage
n°13907
falkon1000
Posté le 06-04-2026 à 21:42:09  profilanswer
 

Avec un seul abo Gemini payant on peut avoir plusieurs comptes ? Et ils se partagent les quota (image, Gemini CLI) ou tous s'additionnent ?

 Page :   1  2  3  4  5  ..  346  347  348  ..  413  414  415  416  417  418

Aller à :
Ajouter une réponse
 

Sujets relatifs
sécurité de l'IA / agentique et des Devs en roue libre 
Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)