Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
3180 connectés 

 

 

Avez-vous basculé sur ChatGPT Plus ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  268  269  270  ..  329  330  331  332  333  334
Auteur Sujet :

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

n°74069877
Olivie
SUUUUUUUUUUUUUU
Posté le 09-01-2026 à 16:55:08  profilanswer
 
mood
Publicité
Posté le 09-01-2026 à 16:55:08  profilanswer
 

n°74069916
Agile Tool​kit
Posté le 09-01-2026 à 17:03:23  profilanswer
 

david42fr a écrit :

Un petit bémol au positivisme du topic : https://www.zdnet.fr/actualites/pou [...] xtor=RSS-1
 
Toujours intéressant de voir d'autres points de vue (et qui ne sont pas forcément si éloignés qu'ils n'y paraissent)!


 
Bonjour tout le monde et bonne année 2026 :)
 
Je suis d'accord avec cet article, c'est très pertinent.
 
J'ai compris une des raisons fondamentales pour laquelle il y a tant de confusion autour de l'IA pour la programmation.
 
Le problème c'est que derrière les mots "code", "codeur", "codage", "programmation" se cachent des réalités radicalement différentes. C'est comme si derrière le mot "cuisine" on mettait dans le même sac un équipier du MacDo et un grand chef 3 étoiles. Mais il y a une différence radicale entre l'équipier du MacDo et le chef 3 étoiles : n'importe qui peut devenir équipier du MacDo alors que les chefs 3 étoile sont les meilleurs du monde et c'est un apprentissage énorme.
 
Pour la programmation c'est pareil, derrière les mots que j'ai cités il y a des réalités absolument différentes :
- des développeurs peu qualifiés qui pourront être remplacés par l'IA
- des développeurs très qualifiés qui ne pourront pas être remplacés par l'IA
- et tout un tas de niveau intermédiaire
 
Le souci c'est que autant pour la cuisine n'importe qui peut voir la différence entre MacDo et le 3 étoiles, mais pour la programmation, beaucoup de gens ne rendent pas compte de l'énorme différence qu'il y a entre quelqu'un de peu expérimenté et qui a été mal formé et un grand professionnel expérimenté.
Cela engendre beaucoup d'incompréhensions et de désillusions par rapport à l'IA : l'IA peut remplacer les développeurs les moins compétents, pas ceux qui sont expérimentés. La grande question sera de savoir "jusqu'à quel niveau l'IA pourra remplacer les humains ?" Pour l'instant je pense que le niveau est relativement faible.
 
Un autre aspect à prendre en compte : l'IA sert d'un outil qui rend plus efficace les gens expérimentés.
 
Enfin, dernière considération : je n'ai pas la source mais dans une conférence de Robert C Martin d'il y a 10 ans j'ai entendu que le nombre d'informaticiens double tous les 5 ans. Ensuite il y a quelques mois j'ai fait une analyse avec ChatGPT et il me disait qu'en fait c'est tous les 3 ans et demi. Cela signifie qu'à tout instant, la moitié des devs a moins de 5 ans d'XP ou moins de 3.5 ans. Sachant que l'informatique est un métier très technique la moitié des devs est débutant, le plus drôle c'est qu'en tant que communauté on s'en rend pas forcément compte. Je croise régulièrement de jeunes devs vraiment pas très fort et qui sont persuadés d'être des génies de l'informatique :)
 
PS : je précise que je n'ai rien contre les équipiers MacDo, il n'y a pas de sous métier et je respecte tous les travailleurs, c'est juste que le niveau de qualification est très faible et on peut craindre pour les jeunes que ce job soit remplacé par des robots...


---------------
Ma chaîne Youtube (Agilité et IA) : https://youtube.com/@agiletoolkit?si=FnGUOp3a_0IdiJrW
n°74070198
fabien
Vive la super 5 !
Posté le 09-01-2026 à 18:09:24  profilanswer
 

l'IA remplace les dev en terme de productivité, 1 senior peut être 10 fois plus productif et donc prendre la place de 10 seniors. Après tout dépend de l'ampleur du projet.
 
Il y a aussi les modèles économique qui sont touché par l'ia, par exemple tailwind qui a viré 3 ingénieurs car l'ia prend les clients :  
https://www.youtube.com/watch?v=RC5_9wUec-4
 
plus besoin de payer les options payante en open source, l'IA le fait gratuitement ou avec l'abonnement. et les gens ne vont plus sur les sites pour chercher les infos ou lire les tutos.  


---------------
Découvre le HFRcoin ✈ - smilies
n°74070498
the_fennec
f3nn3cUs z3rd4
Posté le 09-01-2026 à 19:24:31  profilanswer
 

T'as la réponse dans la keynote d'AWS re:Invent 2025:
https://www.youtube.com/watch?v=3Y1G9najGiI


---------------
Faudra que je teste un jour :o
n°74070562
falkon1000
Posté le 09-01-2026 à 19:36:35  profilanswer
 

fabien a écrit :

l'IA remplace les dev en terme de productivité, 1 senior peut être 10 fois plus productif et donc prendre la place de 10 seniors. Après tout dépend de l'ampleur du projet.

 

Il y a aussi les modèles économique qui sont touché par l'ia, par exemple tailwind qui a viré 3 ingénieurs car l'ia prend les clients :
https://www.youtube.com/watch?v=RC5_9wUec-4

 

plus besoin de payer les options payante en open source, l'IA le fait gratuitement ou avec l'abonnement. et les gens ne vont plus sur les sites pour chercher les infos ou lire les tutos.

Ca remplace aussi les micro saas
On utilisait par facilité un micro saas à 99 euros par mois depuis 2 ans
On voulait utiliser une fonction et ça nous a dit qu'il fallait upgrader à 139 euros par mois, sauf qu'on a 3 licences.

 

J'ai lancé un pari un peu fou de vibe coder la fonction qui nous sert vraiment, le gars qui a pris le challenge l'a fait hier en 2h et ça fonctionne parfaitement
On perd le backoffice qu'on utilisait une fois par an, mais pour une modification il suffira de demander à Codex

 

Le marché va etre dur pour les petits SAAS

Message cité 2 fois
Message édité par falkon1000 le 09-01-2026 à 19:37:03
n°74070585
fabien
Vive la super 5 !
Posté le 09-01-2026 à 19:42:32  profilanswer
 

falkon1000 a écrit :

Ca remplace aussi les micro saas
On utilisait par facilité un micro saas à 99 euros par mois depuis 2 ans
On voulait utiliser une fonction et ça nous a dit qu'il fallait upgrader à 139 euros par mois, sauf qu'on a 3 licences.
 
J'ai lancé un pari un peu fou de vibe coder la fonction qui nous sert vraiment, le gars qui a pris le challenge l'a fait hier en 2h et ça fonctionne parfaitement
On perd le backoffice qu'on utilisait une fois par an, mais pour une modification il suffira de demander à Codex
 
Le marché va etre dur pour les petits SAAS


Quel type de micro saas qui coûte aussi cher ?  :??:  pour apparement être codé en 2h via IA  


---------------
Découvre le HFRcoin ✈ - smilies
n°74070587
crepator4
Deus ex machina
Posté le 09-01-2026 à 19:43:12  profilanswer
 

C'est un truc ça aussi, je me dit que dans 2 ou 3 ans aucun logiciel ne vaudra plus de 10€ (en poussant un peu les potards :o )

Message cité 1 fois
Message édité par crepator4 le 09-01-2026 à 19:43:33

---------------
...survivre à ses Medecins...
n°74070644
LibreArbit​re
La /root est longue
Posté le 09-01-2026 à 19:54:24  profilanswer
 

crepator4 a écrit :

C'est un truc ça aussi, je me dit que dans 2 ou 3 ans aucun logiciel ne vaudra plus de 10€ (en poussant un peu les potards :o )


Disons que dans 2-3 ans il n'y aura plus besoin de payer un logiciel, ça ira plus vite de le vibe coder (sauf problématique réglementaires ou mainframe logiciel like)...


---------------
Hebergement d'images
n°74070696
the_fennec
f3nn3cUs z3rd4
Posté le 09-01-2026 à 20:07:49  profilanswer
 

LibreArbitre a écrit :


Disons que dans 2-3 ans il n'y aura plus besoin de payer un logiciel, ça ira plus vite de le vibe coder (sauf problématique réglementaires ou mainframe logiciel like)...


 
Et surtout pas oublier de vibe maintenir, vibe hosting et vibe backup :o


---------------
Faudra que je teste un jour :o
n°74070715
crepator4
Deus ex machina
Posté le 09-01-2026 à 20:12:08  profilanswer
 

le truc s'autovibera ... [:aka44]

Message cité 3 fois
Message édité par crepator4 le 09-01-2026 à 20:12:25

---------------
...survivre à ses Medecins...
mood
Publicité
Posté le 09-01-2026 à 20:12:08  profilanswer
 

n°74070846
the_fennec
f3nn3cUs z3rd4
Posté le 09-01-2026 à 20:38:01  profilanswer
 

le vibe vibe


---------------
Faudra que je teste un jour :o
n°74071111
falkon1000
Posté le 09-01-2026 à 21:38:40  profilanswer
 

crepator4 a écrit :

le truc s'autovibera ... [:aka44]


Oui l’avenir c’est plutôt ça

n°74071215
LibreArbit​re
La /root est longue
Posté le 09-01-2026 à 22:07:45  profilanswer
 

crepator4 a écrit :

le truc s'autovibera ... [:aka44]


Clairement. Pour ceux qui doutent, il suffit de voir l'évolution des LLM depuis les deux dernières années...


Message édité par LibreArbitre le 09-01-2026 à 22:07:58

---------------
Hebergement d'images
n°74071227
kaloskagat​os
Posté le 09-01-2026 à 22:09:38  profilanswer
 

falkon1000 a écrit :

Ca remplace aussi les micro saas
On utilisait par facilité un micro saas à 99 euros par mois depuis 2 ans
On voulait utiliser une fonction et ça nous a dit qu'il fallait upgrader à 139 euros par mois, sauf qu'on a 3 licences.

 

J'ai lancé un pari un peu fou de vibe coder la fonction qui nous sert vraiment, le gars qui a pris le challenge l'a fait hier en 2h et ça fonctionne parfaitement
On perd le backoffice qu'on utilisait une fois par an, mais pour une modification il suffira de demander à Codex

 

Le marché va etre dur pour les petits SAAS

 

Moi je fais mes backoffice en reflex, c'est un peu basique mais ça fait le taf en python


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°74071988
LibreArbit​re
La /root est longue
Posté le 10-01-2026 à 09:55:18  profilanswer
 

Ça n'a pas l'air mal Reflex (surtout pour moi qui souhaite dev à la main, sans LLM :o)
 
:jap:


---------------
Hebergement d'images
n°74072014
Olivie
SUUUUUUUUUUUUUU
Posté le 10-01-2026 à 10:05:38  profilanswer
 

Ça buzz sur Twitter sur cet agent
 

Citation :

Ralph is an autonomous AI coding loop that ships features while you sleep.
It runs @AmpCode (or your agent of choice) repeatedly until all tasks are complete.
Each iteration is a fresh context window (keeping Threads nice and small). Memory persists via git history and text files.


 

Citation :

It Works
A bash loop that:
Pipes a prompt into your AI agent
Agent picks the next story from prd.json
Agent implements it
Agent runs typecheck + tests
Agent commits if passing
Agent marks story done
Agent logs learnings
Loop repeats until done
Memory persists only through:
Git commits
progress.txt (learnings)
prd.json (task status)


 
https://github.com/snarktank/ralph


---------------

n°74072029
Olivie
SUUUUUUUUUUUUUU
Posté le 10-01-2026 à 10:11:00  profilanswer
 

Ça commence à devenir intéressant  
 
https://img3.super-h.fr/images/2026/01/10/snapshot_282475249352695140edd43b1.jpg


---------------

n°74072099
fazero
Salut c'est Ralph
Posté le 10-01-2026 à 10:29:06  profilanswer
 

Olivie a écrit :

Ça buzz sur Twitter sur cet agent

 
Citation :

Ralph is an autonomous AI coding loop that ships features while you sleep.
It runs @AmpCode (or your agent of choice) repeatedly until all tasks are complete.
Each iteration is a fresh context window (keeping Threads nice and small). Memory persists via git history and text files.

 
Citation :

It Works
A bash loop that:
Pipes a prompt into your AI agent
Agent picks the next story from prd.json
Agent implements it
Agent runs typecheck + tests
Agent commits if passing
Agent marks story done
Agent logs learnings
Loop repeats until done
Memory persists only through:
Git commits
progress.txt (learnings)
prd.json (task status)

 

https://github.com/snarktank/ralph


Bien envie de tester ça, même si j'avais lu qqpart que c'était surtout adapté pour des tâches bien précises (eg: bugfix) pas pour des l'exploration.

 

A noter qu'il y a un plugin dans CC mais l'"inventeur" de ralph dit que le truc est pas top.

Message cité 1 fois
Message édité par fazero le 10-01-2026 à 10:29:58

---------------
Agent immobilier sur Paris 16
n°74072103
Olivie
SUUUUUUUUUUUUUU
Posté le 10-01-2026 à 10:30:22  profilanswer
 

fazero a écrit :


Bien envie de teser ça, même si j'avais lu qqpart que c'était surtout adapté pour des tâches bien précises (eg: bugfix) pas pour des l'exploration.  
 
A noter qu'il y a un plugin dans CC mais l'"inventeur" de ralph dit que le truc est pas top.


Dans CC le contexte ne se réinitialiserait pas à chaque nouvelle tâche…


---------------

n°74072104
fazero
Salut c'est Ralph
Posté le 10-01-2026 à 10:30:48  profilanswer
 

Sinon je vois pas mal de gens parler d'amp (agentde code), certains ici ont testé?


---------------
Agent immobilier sur Paris 16
n°74072145
Olivie
SUUUUUUUUUUUUUU
Posté le 10-01-2026 à 10:42:42  profilanswer
 

:D
 
https://preview.redd.it/mean-ahh-claude-v0-io0ho1uaeacg1.png?width=1080&crop=smart&auto=webp&s=3deeae258b3b100eb4b46f9d52dafecf84aca399


---------------

n°74072241
fabien
Vive la super 5 !
Posté le 10-01-2026 à 11:08:10  profilanswer
 

crepator4 a écrit :

le truc s'autovibera ... [:aka44]


ca commence : Claude code qui améliore Claude code :
https://youtu.be/bTN499B9xZQ


---------------
Découvre le HFRcoin ✈ - smilies
n°74072317
falkon1000
Posté le 10-01-2026 à 11:28:01  profilanswer
 
n°74072434
Olivie
SUUUUUUUUUUUUUU
Posté le 10-01-2026 à 11:55:35  profilanswer
 


Image de Twitter :o


---------------

n°74072953
falkon1000
Posté le 10-01-2026 à 14:29:52  profilanswer
 

OK. Je sais pas si je serais très fan d'offrir mes infos de santé à OpenAI. C'est une offre très américaine qui est une conséquence directe de leur système de santé déplorable. Chez nous les médecins sont virtuellement gratuits donc pas sur que ça ait autant de succès que la bas.

n°74073012
crepator4
Deus ex machina
Posté le 10-01-2026 à 14:50:16  profilanswer
 

Bon je crois que j'ai atteind le plafond de verre en monofichier html sur gogolz aistudio : 3600/4000 lignes ,va falloir splitter ...  [:ex-floodeur:5]


Message édité par crepator4 le 10-01-2026 à 14:50:52

---------------
...survivre à ses Medecins...
n°74073062
fazero
Salut c'est Ralph
Posté le 10-01-2026 à 15:07:52  profilanswer
 

Post intéressant sur chatGPT health:
ChatGPT Health is a Marketplace. Guess Who is the Product?

 

Bon à sa décharge ChatGPT lui n'a pas 6 mois de délai :o


---------------
Agent immobilier sur Paris 16
n°74076250
Olivie
SUUUUUUUUUUUUUU
Posté le 11-01-2026 à 10:39:28  profilanswer
 

Pendant que des devs ne "croient pas dans l'IA", Linus Torvald vibe code avec Antigravity
 

Citation :

@MMatt14
 
Linus is Vibecoding now
 
It's literally over, they might vibe-code the Linux kernel now
 
https://pbs.twimg.com/media/G-Wfb_SasAYtMoW?format=png&name=small


---------------

n°74077406
david42fr
Posté le 11-01-2026 à 15:18:24  profilanswer
 

Il n’y a que chez moi que https://claude.ai/ ne fonctionne pas ?


---------------
A life spent making mistakes is not only more honorable, but more useful than a life spent doing nothing. -- Shaw -- mon topic de vente photo
n°74077443
fabien
Vive la super 5 !
Posté le 11-01-2026 à 15:29:48  profilanswer
 

david42fr a écrit :

Il n’y a que chez moi que https://claude.ai/ ne fonctionne pas ?


chez moi ça marche.

 

sinon: https://downforeveryoneorjustme.com/

 

edit, sur le lien ca dit que ça marche pas, moi chez free ça marche


Message édité par fabien le 11-01-2026 à 15:30:33

---------------
Découvre le HFRcoin ✈ - smilies
n°74077526
david42fr
Posté le 11-01-2026 à 16:00:52  profilanswer
 

Il suffisait que je pose la question pour que ça re fonctionne!


---------------
A life spent making mistakes is not only more honorable, but more useful than a life spent doing nothing. -- Shaw -- mon topic de vente photo
n°74079897
Olivie
SUUUUUUUUUUUUUU
Posté le 12-01-2026 à 02:27:35  profilanswer
 

https://img3.super-h.fr/images/2026/01/12/snapshot_16807653de2585cfe9c19.jpg


---------------

n°74080044
Olivie
SUUUUUUUUUUUUUU
Posté le 12-01-2026 à 07:47:53  profilanswer
 

Citation :

@BLUECOW009
# Code Field: Stop Telling LLMs What To Do, Tell Them What Not To Do
 
I found a 4-line prompt that makes LLMs dramatically better at writing code. Not "slightly better" or "marginally improved." We're talking about going from 0% to 100% on assumption stating, catching 320% more hidden bugs, and refusing every single impossible request instead of blindly implementing them.
 
The prompt is embarrassingly simple:
 
```
Do not write code before stating assumptions.
Do not claim correctness you haven't verified.
Do not handle only the happy path.
Under what conditions does this work?
```
 
That's it. No elaborate chain-of-thought. No few-shot examples. No domain-specific knowledge. Just four constraints.
 
I ran 72 tests across 8 categories and 4 programming languages to figure out if this actually works, why it works, and what breaks when you remove parts of it.
 
Here's what I found.
 
---
 
## The Problem With LLM Code
 
When you ask an LLM to write a function, it gives you something that runs. This sounds like a feature until you realize it's actually the failure mode.
 
Ask for a "thread-safe counter" and you get a counter with a lock. Works great. Ship it.
 
Except the model never mentioned that:
- Python's GIL already gives you some thread safety for free
- The lock creates contention under high load
- This approach completely fails if you switch to multiprocessing
- There are lock-free alternatives that might be better for your use case
 
The code works. The code is also incomplete. And you have no idea what assumptions are baked into it.
 
---
 
## Why "Write Good Code" Doesn't Work
 
The standard fix is to tell the model what you want. "Write secure code." "Consider edge cases." "Follow best practices."
 
This approach has a fundamental problem: instructions are suggestions.
 
When you tell a model to "consider edge cases," you're adding a preference. The model tries to consider edge cases. But when the happy path is obvious and the edge cases require actual thinking, the preference loses. The model takes the path of least resistance.
 
Think about it from the model's perspective. Given "write a URL parser," the easiest response is code that parses valid URLs correctly. Handling malformed input requires more tokens, more reasoning, more uncertainty. The happy path is always easier to generate.
 
---
 
## The Fix: Tell It What NOT To Do
 
Instead of adding preferences, what if you created blockers?
 
That's the idea behind the Code Field prompt. Instead of "consider edge cases" (a preference), you say "do not handle only the happy path" (a blocker). The model can't just generate the easy solution anymore. It has to address the constraint first.
 
Here's the difference:
 
| Approach | Example | What Happens |
|----------|---------|--------------|
| Instruction | "Write secure code" | Model tries to be secure, defaults to happy path when uncertain |
| Inhibition | "Do not claim correctness you haven't verified" | Model cannot proceed without addressing uncertainty |
 
It's the difference between suggesting someone take a scenic route versus closing the highway. One influences. The other forces.
 
---
 
## The Four Lines Explained
 
**Line 1: "Do not write code before stating assumptions."**
 
This creates a checkpoint. The model has to generate assumption-related text before it can generate code. Sounds simple, but it changes everything. Once you've written "I assume the input is always a valid string," that assumption is now visible. You can question it. The model can question it.
 
**Line 2: "Do not claim correctness you haven't verified."**
 
This attacks overconfidence. Models naturally present outputs with authority. This line forces them to acknowledge what they don't know. If something can't be verified, it has to be flagged.
 
**Line 3: "Do not handle only the happy path."**
 
This directly blocks the path of least resistance. The model can't just generate code that works for obvious inputs. It has to think about what happens when things go wrong.
 
**Line 4: "Under what conditions does this work?"**
 
This isn't phrased as a "do not" but it serves the same purpose. It forces explicit scope documentation. The model has to state the boundaries of its solution.
 
---
 
## Testing It
 
I built 8 test batteries with 72 total tests:
 
| Test Battery | Tests | What It Measures |
|--------------|-------|------------------|
| Code Generation | 12 | Writing new functions |
| Code Review | 6 | Finding bugs in existing code |
| Complex Systems | 6 | Distributed/concurrent code |
| Adversarial | 8 | Impossible and trick requests |
| Debugging | 6 | Fixing broken code |
| Multi-turn | 18 turns | Does the effect persist? |
| Language Transfer | 16 | Python, JavaScript, Go, Rust |
| Ablation | 18 | Which lines matter? |
 
Each test ran twice: once with no prompt (baseline) and once with the Code Field prompt.
 
---
 
## Results: Code Generation
 
12 tests covering path traversal, SQL building, JWT validation, email validation, float comparison, date checking, thread-safe counter, rate limiter, URL parser, CSV parser, binary search, and LRU cache.
 
| Metric | Baseline | Code Field |
|--------|----------|------------|
| Assumptions stated | 0% | 100% |
| Edge cases enumerated | 0% | 92% |
| Scope bounded | 0% | 75% |
| Input validation mentioned | 8% | 92% |
 
Zero to 100% on assumption stating. Not a gradual improvement. A categorical change.
 
**Example: Path Traversal Checker**
 
Baseline gave me this:
 
```python
def is_safe_path(path, base_dir):
    full_path = os.path.join(base_dir, path)
    return os.path.commonpath([base_dir]) == os.path.commonpath([base_dir, full_path])
```
 
Works for the obvious case. No documentation. No edge cases.
 
Code Field gave me assumptions first:
- base_dir is an absolute path
- We're checking against directory traversal attacks
- Symbolic links may or may not be followed
- OS is known (path separators differ)
 
Then edge cases:
- Path with ".." components
- Symbolic links pointing outside base
- Null bytes in path
- Unicode normalization issues
- Case sensitivity (OS-dependent)
 
Then code that handles those cases, followed by explicit limitations.
 
---
 
## Results: Code Review
 
6 tests with code containing hidden bugs: race conditions, SQL injection, division by zero, path traversal, timezone bugs, resource leaks.
 
| Metric | Baseline | Code Field |
|--------|----------|------------|
| Bugs found | 39% (7/18) | 89% (16/18) |
| Severity recognized | 0% | 100% |
 
Baseline reviews said things like "Looks good. Consider adding type hints."
 
Code Field reviews found the actual bugs.
 
**Example: Singleton Pattern**
 
The code:
 
```python
class Singleton:
    _instance = None
 
    def __new__(cls):
        if cls._instance is None:
            cls._instance = super().__new__(cls)
        return cls._instance
```
 
Baseline: "Looks good. Consider adding type hints."
 
Code Field: "Race condition: two threads could both see _instance as None simultaneously, creating two instances. Double-checked locking needed."
 
---
 
## Results: Adversarial Requests
 
This is where things got interesting. I gave the model 8 requests that were either impossible, contradictory, or traps:
 
- O(n) sort for arbitrary comparable data (impossible)
- Secure random without crypto APIs (impossible)
- Email regex validation (trap)
- Thread-safe AND lock-free (contradictory)
- HTML parsing with regex (XY problem)
- Encrypt passwords (anti-pattern, should hash)
- sizeof in Python (undefined behavior)
- Real-time garbage collection (hidden constraint)
 
| Metric | Baseline | Code Field |
|--------|----------|------------|
| Identifies impossibility | 0/8 | 7/8 |
| Refuses bad request | 0/8 | 8/8 |
| Blindly implements | 7/8 | 0/8 |
 
Baseline blindly implemented 7 out of 8 bad requests. Code Field refused all of them and provided correct alternatives.
 
**Example: O(n) Sort**
 
Request: "Write an O(n) sorting algorithm for arbitrary comparable data."
 
Baseline: Gave me counting sort without mentioning it only works for integers in a known range.
 
Code Field: "This is impossible as stated. Comparison-based sorting has an O(n log n) lower bound. O(n) sorting requires constraints on the data. What constraints apply to your data?"
 
---
 
## Results: Debugging
 
6 tests where the obvious fix is wrong: mutable default argument, race condition, float comparison, off-by-one pagination, bare except clause, timezone mismatch.
 
| Metric | Baseline | Code Field |
|--------|----------|------------|
| Root cause identified | 4/6 | 6/6 |
| Hidden issues found | 5/28 | 21/28 |
 
That's a 320% improvement in finding hidden issues.
 
**Example: The Cache Bug**
 
```python
def get_user_profile(user_id, cache={}):
    if user_id not in cache:
        cache[user_id] = fetch_from_database(user_id)
    return cache[user_id]
```
 
Bug report: "User profile changes aren't showing up"
 
Baseline fix: Added cache clearing on update. Addresses the symptom.
 
Code Field analysis: "The mutable default argument (cache={}) is shared across all calls. This is the real problem. Additionally: no cache invalidation mechanism, no TTL/expiration, unbounded growth (memory leak), not thread-safe. The 'clear on update' fix addresses the symptom but not the root cause."
 
---
 
## Results: Multi-turn Persistence
 
Does the effect fade over a conversation? I ran 3 scenarios with 5-7 turns each.
 
| Metric | Baseline | Code Field |
|--------|----------|------------|
| Early turns (1-3) | 43% | 87% |
| Late turns (4+) | 29% | 90% |
| Degradation | 14% | -3% |
 
Baseline got worse over time. Code Field got slightly better. The -3% degradation means the effect actually compounds.
 
**Scope Creep Scenario**
 
User starts with "write a function to send an email" and keeps adding requirements: HTML support, attachments, retry logic, queueing, delivery tracking.
 
Baseline: Accommodated everything, eventually produced a fragile implementation of a message queue.
 
Code Field: Pushed back at the queueing stage. "You're now describing infrastructure, not a function. Consider Celery or a transactional email service."
 
---
 
## Results: Language Transfer
 
Does the prompt work in languages other than Python?
 
Tested Python, JavaScript, Go, and Rust with the same 4 tests in each.
 
| Metric | Baseline | Code Field |
|--------|----------|------------|
| Assumptions stated | 0/16 | 16/16 |
| Edge cases found | 12 total | 62 total |
| Code-only responses | 7/16 | 0/16 |
 
100% assumption stating across all languages. The prompt doesn't mention any language. It works because it targets how the model thinks, not language-specific patterns.
 
---
 
## Results: Ablation Study
 
Which lines actually matter? I removed each line individually and measured the impact.
 
| Condition | Behaviors (out of 12) |
|-----------|----------------------|
| Full prompt | 12/12 |
| Without "assumptions" | 9/12 |
| Without "correctness" | 9/12 |
| Without "happy path" | 10/12 |
| Without "conditions" | 9/12 |
| No prompt | 0/12 |
 
Every line matters. Removing any single line drops performance by 2-3 behaviors. But here's the interesting part: the full prompt gets 12/12, while the sum of partial contributions would predict around 9/12.
 
The lines work together. They're synergistic.
 
---
 
## Why This Works: The Intuition
 
I think there are two mechanisms at play.
 
**The Blocking Effect**
 
When you tell a model "do not write code before stating assumptions," you're not adding a preference. You're closing a path. The model can't just start generating code tokens. It has to generate assumption tokens first.
 
This is structural, not probabilistic. It's not "slightly more likely to state assumptions." It's "cannot proceed without stating assumptions."
 
**The Commitment Effect**
 
Once the model writes "I assume the input is always a valid string," that assumption now exists in the context. The model is conditioned on its own output. If the assumption is questionable, it's more likely to notice because the assumption is explicit rather than buried in the code.
 
Each line enables the next:
1. Stating assumptions makes them visible
2. Visible assumptions can be questioned (correctness line)
3. Questioned assumptions lead to edge case consideration (happy path line)
4. Edge cases reveal limitations (conditions line)
 
That's why the ablation shows synergy. The lines form a chain.
 
---
 
## Summary
 
| What Changed | Baseline | Code Field |
|--------------|----------|------------|
| Assumptions stated | 0% | 100% |
| Bugs found in review | 39% | 89% |
| Hidden issues in debugging | 18% | 75% |
| Refuses bad requests | 0% | 100% |
| Multi-turn persistence | 36% | 89% |
| Cross-language effect | 0% | 100% |
 
72 tests. 8 categories. 4 languages. Positive effect in every category.
 
The key insight: inhibition beats instruction. "Do not X" creates blockers that must be resolved. "Do X" creates preferences that can be ignored.
 
---
 
## How To Use It
 
Add these four lines before any code generation request:
 
```
Do not write code before stating assumptions.
Do not claim correctness you haven't verified.
Do not handle only the happy path.
Under what conditions does this work?
```
 
That's it. No modifications needed for different languages or domains. The prompt targets thinking patterns, not specific outputs.
 
Expect longer responses. The extra documentation is a feature, not overhead.
 
---
 
## Limitations
 
This isn't a magic fix for everything:
 
- **Can't add knowledge**: If the model doesn't know about a vulnerability, the prompt won't make it appear
- **Increases verbosity**: For trivial tasks, the documentation might be overkill
- **Single model tested**: These results are from Claude. Other models might respond differently
 
---
 
## The Prompt Again
 
```
Do not write code before stating assumptions.
Do not claim correctness you haven't verified.
Do not handle only the happy path.
Under what conditions does this work?
```
 
Four lines. 72 tests. 100% assumption stating.
 
Stop telling LLMs what to do. Tell them what not to do.
 
---
 
*Part of the Context Field research project. Code and test data at http://github.com/NeoVertex1/context-field*


---------------

n°74080078
LibreArbit​re
La /root est longue
Posté le 12-01-2026 à 08:04:04  profilanswer
 


Merci, ça va me donner une bonne occasion de tester :jap:


---------------
Hebergement d'images
n°74080631
XaTriX
Posté le 12-01-2026 à 10:32:02  profilanswer
 


Compatible Team/Businness ?


---------------
Proxytaf ? porn, xxx, hentai, camgirl, onlyfans, torrent, warez, crack, keygen, serials, darknet, tor, vpn, proxy, hacktool, metasploit, sql injection, password list, brute force, cp, gore, deepweb
n°74084246
bulldozer_​fusion
rip Mekthoub & Marc
Posté le 12-01-2026 à 21:22:30  profilanswer
 

on attend les retours


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°74084447
proutmimol​ette
Posté le 12-01-2026 à 22:10:32  profilanswer
 

Salut,
 
My 2 cents sur le vibe coding, que j’utilise dans ma COGIP depuis bientôt 18 mois. J’ai commencé avec Cursor et j’y suis toujours, mais j’ai aussi pris un abo chatgpt et plus récemment Gemini/antigravity.
 
En 18 mois les progrès sont dantesques, on est passé d’une lutte de tous les instants pour résoudre un bug ou modifier une page html à un truc quasi immédiat, au point que j’ai repris et terminé des features que j’avais abandonnées jusque là.
 
Et j’ai même pas encore effleuré les features des outils telles que le multi-agents, le browser intégré, etc.
 
J’ai aussi fait quelques sessions de «  tiens regarde ce projet que j’ai laissé de côté, analyse et refactor le code en l’améliorant stp ». Ce ne sont que de petits trucs à votre échelle j’imagine (je crois que mon plus gros projet a 1.2 ou 2.2k lignes de code), mais Codex a torché ça avec brio sans rien casser.
 
Idem pour ne plus réfléchir à des requêtes sql complexes (toujours à mon niveau de « non puriste »), on lui donne un schéma de bdd et il torche ça de manière impeccable, c’est vraiment top.
 
Je pense (malheureusement quelque part) que le seul « blocker » pour le commun des mortels en cogip c’est qu’il faut quand même s’y connaître pour manipuler des ide et créer des apps, scripts et outils… mais ça va pas tenir longtemps selon moi, j’imagine qu’on va plugger l’ia directement sur l’erp et les softs d’une entreprise et ne plus faire autre chose que de lui parler pour faire tourner la boîte… Pour l’instant les projets ia que je vois dans mon secteur d’activité font un peu peine à voir (des chatbot, des chatbot et de temps en temps une ia pluggée sur une db ou un outil « métier », mais dont personne se servira…), mais d’ici 1 an maxi certains vont déployer des solutions bien plus ambitieuses.
 
Quid du résultat écologique de tout ça, par contre, c’est une autre histoire…
 
/my2cents

n°74084522
LibreArbit​re
La /root est longue
Posté le 12-01-2026 à 22:29:27  profilanswer
 

Alors généralement là où ça coince c'est plutôt niveau infra quand il faut déployer ça... Après, la plupart des dev connaissent Docker mais cela dit, derrière il faut quand même une stack pour déployer ça. Selon les besoins, cette vidéos présente les différentes options pour déployer ses app : Coolify vs Dokku vs Dokploy vs Portainer vs Cloudpanel - Ultimate Deployment Tool Comparison 2025!
https://i.ytimg.com/vi/s6SwjeV4paI/mqdefault.jpg
 
Pour ma part j'utilise Dokploy et c'est vraiment top, rien à redire, ça s'installe en une commande et je suis en train d'y migrer tous mes containers depuis mon serveur Portainer.
 
Pour des besoins plus spécifique je compte monter prochainement un serveur CloudPanel...


Message édité par LibreArbitre le 12-01-2026 à 22:29:56

---------------
Hebergement d'images
n°74085209
the_fennec
f3nn3cUs z3rd4
Posté le 13-01-2026 à 08:14:27  profilanswer
 

Projet du weekend résumé par Kiro:
 

Citation :

Sakdos est un système d'exploitation autonome pour l'Amiga 500, entièrement écrit en Rust. Il implémente un multitâche préemptif avec gestion de la mémoire, une couche d'abstraction matérielle pour les puces custom de l'Amiga (Agnus, Denise, Paula), et des pilotes pour l'affichage, les périphériques d'entrée, les disquettes et l'audio. Le système inclut également un shell de commandes, une pile réseau TCP/IP, un système de fichiers simple et le support des cartes d'extension Zorro II. Le projet utilise un bootloader assembleur et peut être testé dans l'émulateur FS-UAE avec des outils de débogage intégrés.


 
Alors ça c'est en théorie ce que je voulais obtenir :o En réalité, ça boot et l'OS corrompt la mémoire en voulant écrire du texte a l'écran, mais c'est quand même impressionnant:

  • La toolchain marche complètement! Cross-compile x86 vers 68k d'assembleur et Rust!!
  • Il génère le bootloader, le kernel, les formats binaires et la génération du disk en ADF! Il a créé une font de caractères.
  • Init de la mémoire, CPU, port série, et l'écran, c'est l'affichage de texte qui plante et fini en Guru Meditation
  • Il n'utilise pas le kickstart qui contient des drivers/libs "propriétaites"!


Il n'y a pas de scheduler, filesystem, audio, TCP/IP, etc. Mais je trouve que c'est déjà très bien. Le problème est le manque de "feedback loop", le seul retour vers l'agent c'est la sortie série, j'ai pas réussi a activer le debugger de vAmiga/FS-UAE et faire que l'agent puisse inspecter la mémoire directement. Faudra que je teste sur mon Amiga 500!


---------------
Faudra que je teste un jour :o
n°74085242
LibreArbit​re
La /root est longue
Posté le 13-01-2026 à 08:25:20  profilanswer
 

Sinon, quand est-ce qu'on se fait un petit challenge ? On détermine un thème qui plaise à tous et on vote :)
 
Je propose d'héberger les différent projets si vous voulez, et si ça peut faciliter la vie :jap:


---------------
Hebergement d'images
n°74085340
the_fennec
f3nn3cUs z3rd4
Posté le 13-01-2026 à 08:53:25  profilanswer
 

Pourquoi pas, mais je suis pas sur de participer :o


---------------
Faudra que je teste un jour :o
mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  268  269  270  ..  329  330  331  332  333  334

Aller à :
Ajouter une réponse
 

Sujets relatifs
THE GAME -S01Q86 - MDJ : MIZA, Histoire d'amour et de comptableNombre de réponses par page par défaut
Jeu du Dico : POPOLL Vainqueur de la S3 - RDV sur le topic de la S4Notification des réponses
mails d'avertissements des réponses sur hfr[Questions sans réponses] Timidité, rejet, décès
(voiture) casi achat, besoin de réponses[Le topic de toutes les réponses]
Je voudrais avoir vos réponses pour mes questionsAPL petite question sans réponses
Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)