[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 .. 268 269 270 .. 329 330 331 332 333 334 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Olivie

SUUUUUUUUUUUUUU

Reprise du message précédent :
Petite dose de news et rumeurs tuitteur

https://img3.super-h.fr/images/2026 [...] 05df05.jpg
https://img3.super-h.fr/images/2026 [...] 16ab83.jpg
https://img3.super-h.fr/images/2026 [...] 8ecd2d.jpg
https://img3.super-h.fr/images/2026 [...] 1fa826.jpg

---------------

Publicité

Agile Toolkit

david42fr a écrit :

Un petit bémol au positivisme du topic : https://www.zdnet.fr/actualites/pou [...] xtor=RSS-1

Toujours intéressant de voir d'autres points de vue (et qui ne sont pas forcément si éloignés qu'ils n'y paraissent)!

Bonjour tout le monde et bonne année 2026

Je suis d'accord avec cet article, c'est très pertinent.

J'ai compris une des raisons fondamentales pour laquelle il y a tant de confusion autour de l'IA pour la programmation.

Le problème c'est que derrière les mots "code", "codeur", "codage", "programmation" se cachent des réalités radicalement différentes. C'est comme si derrière le mot "cuisine" on mettait dans le même sac un équipier du MacDo et un grand chef 3 étoiles. Mais il y a une différence radicale entre l'équipier du MacDo et le chef 3 étoiles : n'importe qui peut devenir équipier du MacDo alors que les chefs 3 étoile sont les meilleurs du monde et c'est un apprentissage énorme.

Pour la programmation c'est pareil, derrière les mots que j'ai cités il y a des réalités absolument différentes :
- des développeurs peu qualifiés qui pourront être remplacés par l'IA
- des développeurs très qualifiés qui ne pourront pas être remplacés par l'IA
- et tout un tas de niveau intermédiaire

Le souci c'est que autant pour la cuisine n'importe qui peut voir la différence entre MacDo et le 3 étoiles, mais pour la programmation, beaucoup de gens ne rendent pas compte de l'énorme différence qu'il y a entre quelqu'un de peu expérimenté et qui a été mal formé et un grand professionnel expérimenté.
Cela engendre beaucoup d'incompréhensions et de désillusions par rapport à l'IA : l'IA peut remplacer les développeurs les moins compétents, pas ceux qui sont expérimentés. La grande question sera de savoir "jusqu'à quel niveau l'IA pourra remplacer les humains ?" Pour l'instant je pense que le niveau est relativement faible.

Un autre aspect à prendre en compte : l'IA sert d'un outil qui rend plus efficace les gens expérimentés.

Enfin, dernière considération : je n'ai pas la source mais dans une conférence de Robert C Martin d'il y a 10 ans j'ai entendu que le nombre d'informaticiens double tous les 5 ans. Ensuite il y a quelques mois j'ai fait une analyse avec ChatGPT et il me disait qu'en fait c'est tous les 3 ans et demi. Cela signifie qu'à tout instant, la moitié des devs a moins de 5 ans d'XP ou moins de 3.5 ans. Sachant que l'informatique est un métier très technique la moitié des devs est débutant, le plus drôle c'est qu'en tant que communauté on s'en rend pas forcément compte. Je croise régulièrement de jeunes devs vraiment pas très fort et qui sont persuadés d'être des génies de l'informatique

PS : je précise que je n'ai rien contre les équipiers MacDo, il n'y a pas de sous métier et je respecte tous les travailleurs, c'est juste que le niveau de qualification est très faible et on peut craindre pour les jeunes que ce job soit remplacé par des robots...

---------------
Ma chaîne Youtube (Agilité et IA) : https://youtube.com/@agiletoolkit?si=FnGUOp3a_0IdiJrW

fabien

Vive la super 5 !

l'IA remplace les dev en terme de productivité, 1 senior peut être 10 fois plus productif et donc prendre la place de 10 seniors. Après tout dépend de l'ampleur du projet.

Il y a aussi les modèles économique qui sont touché par l'ia, par exemple tailwind qui a viré 3 ingénieurs car l'ia prend les clients :
https://www.youtube.com/watch?v=RC5_9wUec-4

plus besoin de payer les options payante en open source, l'IA le fait gratuitement ou avec l'abonnement. et les gens ne vont plus sur les sites pour chercher les infos ou lire les tutos.

Message cité 1 fois

---------------
✈ Découvre le HFRcoin ✈ - smilies ♥

the_fennec

f3nn3cUs z3rd4

T'as la réponse dans la keynote d'AWS re:Invent 2025:
https://www.youtube.com/watch?v=3Y1G9najGiI

---------------
Faudra que je teste un jour :o

falkon1000

fabien a écrit :

l'IA remplace les dev en terme de productivité, 1 senior peut être 10 fois plus productif et donc prendre la place de 10 seniors. Après tout dépend de l'ampleur du projet.

Il y a aussi les modèles économique qui sont touché par l'ia, par exemple tailwind qui a viré 3 ingénieurs car l'ia prend les clients :
https://www.youtube.com/watch?v=RC5_9wUec-4

plus besoin de payer les options payante en open source, l'IA le fait gratuitement ou avec l'abonnement. et les gens ne vont plus sur les sites pour chercher les infos ou lire les tutos.

J'ai lancé un pari un peu fou de vibe coder la fonction qui nous sert vraiment, le gars qui a pris le challenge l'a fait hier en 2h et ça fonctionne parfaitement
On perd le backoffice qu'on utilisait une fois par an, mais pour une modification il suffira de demander à Codex

Le marché va etre dur pour les petits SAAS

Message cité 2 fois
Message édité par falkon1000 le 09-01-2026 à 19:37:03

fabien

Vive la super 5 !

falkon1000 a écrit :

Ca remplace aussi les micro saas
On utilisait par facilité un micro saas à 99 euros par mois depuis 2 ans
On voulait utiliser une fonction et ça nous a dit qu'il fallait upgrader à 139 euros par mois, sauf qu'on a 3 licences.

J'ai lancé un pari un peu fou de vibe coder la fonction qui nous sert vraiment, le gars qui a pris le challenge l'a fait hier en 2h et ça fonctionne parfaitement
On perd le backoffice qu'on utilisait une fois par an, mais pour une modification il suffira de demander à Codex

Le marché va etre dur pour les petits SAAS

Quel type de micro saas qui coûte aussi cher ? :??: pour apparement être codé en 2h via IA

---------------
✈ Découvre le HFRcoin ✈ - smilies ♥

crepator4

Deus ex machina

C'est un truc ça aussi, je me dit que dans 2 ou 3 ans aucun logiciel ne vaudra plus de 10€ (en poussant un peu les potards )

Message cité 1 fois
Message édité par crepator4 le 09-01-2026 à 19:43:33

---------------
...survivre à ses Medecins...

LibreArbitre

La /root est longue

crepator4 a écrit :

C'est un truc ça aussi, je me dit que dans 2 ou 3 ans aucun logiciel ne vaudra plus de 10€ (en poussant un peu les potards )

Disons que dans 2-3 ans il n'y aura plus besoin de payer un logiciel, ça ira plus vite de le vibe coder (sauf problématique réglementaires ou mainframe logiciel like)...

Message cité 1 fois

---------------
Hebergement d'images

the_fennec

f3nn3cUs z3rd4

LibreArbitre a écrit :

Disons que dans 2-3 ans il n'y aura plus besoin de payer un logiciel, ça ira plus vite de le vibe coder (sauf problématique réglementaires ou mainframe logiciel like)...

Et surtout pas oublier de vibe maintenir, vibe hosting et vibe backup

---------------
Faudra que je teste un jour :o

crepator4

Deus ex machina

le truc s'autovibera ... [:aka44]

Message cité 3 fois
Message édité par crepator4 le 09-01-2026 à 20:12:25

---------------
...survivre à ses Medecins...

Publicité

the_fennec

f3nn3cUs z3rd4

le vibe vibe

---------------
Faudra que je teste un jour :o

falkon1000

crepator4 a écrit :

le truc s'autovibera ... [:aka44]

Oui l’avenir c’est plutôt ça

LibreArbitre

La /root est longue

crepator4 a écrit :

le truc s'autovibera ... [:aka44]

Clairement. Pour ceux qui doutent, il suffit de voir l'évolution des LLM depuis les deux dernières années...

Message édité par LibreArbitre le 09-01-2026 à 22:07:58

---------------
Hebergement d'images

kaloskagatos

falkon1000 a écrit :

Le marché va etre dur pour les petits SAAS

Moi je fais mes backoffice en reflex, c'est un peu basique mais ça fait le taf en python

---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »

LibreArbitre

La /root est longue

Ça n'a pas l'air mal Reflex (surtout pour moi qui souhaite dev à la main, sans LLM )

:jap:

---------------
Hebergement d'images

Olivie

SUUUUUUUUUUUUUU

Ça buzz sur Twitter sur cet agent

Citation :

Ralph is an autonomous AI coding loop that ships features while you sleep.
It runs @AmpCode (or your agent of choice) repeatedly until all tasks are complete.
Each iteration is a fresh context window (keeping Threads nice and small). Memory persists via git history and text files.

Citation :

It Works
A bash loop that:
Pipes a prompt into your AI agent
Agent picks the next story from prd.json
Agent implements it
Agent runs typecheck + tests
Agent commits if passing
Agent marks story done
Agent logs learnings
Loop repeats until done
Memory persists only through:
Git commits
progress.txt (learnings)
prd.json (task status)

https://github.com/snarktank/ralph

Message cité 2 fois

---------------

Olivie

SUUUUUUUUUUUUUU

Ça commence à devenir intéressant

Message cité 1 fois

---------------

fazero

Salut c'est Ralph

Olivie a écrit :

Ça buzz sur Twitter sur cet agent

Citation :

https://github.com/snarktank/ralph

Bien envie de tester ça, même si j'avais lu qqpart que c'était surtout adapté pour des tâches bien précises (eg: bugfix) pas pour des l'exploration.

A noter qu'il y a un plugin dans CC mais l'"inventeur" de ralph dit que le truc est pas top.

Message cité 1 fois
Message édité par fazero le 10-01-2026 à 10:29:58

---------------
Agent immobilier sur Paris 16

Olivie

SUUUUUUUUUUUUUU

fazero a écrit :

Bien envie de teser ça, même si j'avais lu qqpart que c'était surtout adapté pour des tâches bien précises (eg: bugfix) pas pour des l'exploration.

A noter qu'il y a un plugin dans CC mais l'"inventeur" de ralph dit que le truc est pas top.

Dans CC le contexte ne se réinitialiserait pas à chaque nouvelle tâche…

---------------

fazero

Salut c'est Ralph

Sinon je vois pas mal de gens parler d'amp (agentde code), certains ici ont testé?

---------------
Agent immobilier sur Paris 16

Olivie

SUUUUUUUUUUUUUU

---------------

fabien

Vive la super 5 !

crepator4 a écrit :

le truc s'autovibera ... [:aka44]

ca commence : Claude code qui améliore Claude code :
https://youtu.be/bTN499B9xZQ

---------------
✈ Découvre le HFRcoin ✈ - smilies ♥

falkon1000

Olivie a écrit :

Ça commence à devenir intéressant

https://img3.super-h.fr/images/2026 [...] dd43b1.jpg

VPN ?

Message cité 1 fois

Olivie

SUUUUUUUUUUUUUU

falkon1000 a écrit :

VPN ?

Image de Twitter

---------------

falkon1000

OK. Je sais pas si je serais très fan d'offrir mes infos de santé à OpenAI. C'est une offre très américaine qui est une conséquence directe de leur système de santé déplorable. Chez nous les médecins sont virtuellement gratuits donc pas sur que ça ait autant de succès que la bas.

crepator4

Deus ex machina

Bon je crois que j'ai atteind le plafond de verre en monofichier html sur gogolz aistudio : 3600/4000 lignes ,va falloir splitter ... [:ex-floodeur:5]

Message édité par crepator4 le 10-01-2026 à 14:50:52

---------------
...survivre à ses Medecins...

fazero

Salut c'est Ralph

Post intéressant sur chatGPT health:
ChatGPT Health is a Marketplace. Guess Who is the Product?

Bon à sa décharge ChatGPT lui n'a pas 6 mois de délai

---------------
Agent immobilier sur Paris 16

Olivie

SUUUUUUUUUUUUUU

Pendant que des devs ne "croient pas dans l'IA", Linus Torvald vibe code avec Antigravity

Citation :

@MMatt14

Linus is Vibecoding now

It's literally over, they might vibe-code the Linux kernel now

---------------

david42fr

Il n’y a que chez moi que https://claude.ai/ ne fonctionne pas ?

Message cité 1 fois

---------------
A life spent making mistakes is not only more honorable, but more useful than a life spent doing nothing. -- Shaw -- mon topic de vente photo

fabien

Vive la super 5 !

david42fr a écrit :

Il n’y a que chez moi que https://claude.ai/ ne fonctionne pas ?

chez moi ça marche.

sinon: https://downforeveryoneorjustme.com/

edit, sur le lien ca dit que ça marche pas, moi chez free ça marche

Message édité par fabien le 11-01-2026 à 15:30:33

---------------
✈ Découvre le HFRcoin ✈ - smilies ♥

david42fr

Il suffisait que je pose la question pour que ça re fonctionne!

---------------
A life spent making mistakes is not only more honorable, but more useful than a life spent doing nothing. -- Shaw -- mon topic de vente photo

Olivie

SUUUUUUUUUUUUUU

Message cité 2 fois

---------------

Olivie

SUUUUUUUUUUUUUU

Citation :

@BLUECOW009
# Code Field: Stop Telling LLMs What To Do, Tell Them What Not To Do

I found a 4-line prompt that makes LLMs dramatically better at writing code. Not "slightly better" or "marginally improved." We're talking about going from 0% to 100% on assumption stating, catching 320% more hidden bugs, and refusing every single impossible request instead of blindly implementing them.

The prompt is embarrassingly simple:

```
Do not write code before stating assumptions.
Do not claim correctness you haven't verified.
Do not handle only the happy path.
Under what conditions does this work?
```

That's it. No elaborate chain-of-thought. No few-shot examples. No domain-specific knowledge. Just four constraints.

I ran 72 tests across 8 categories and 4 programming languages to figure out if this actually works, why it works, and what breaks when you remove parts of it.

Here's what I found.

---

## The Problem With LLM Code

When you ask an LLM to write a function, it gives you something that runs. This sounds like a feature until you realize it's actually the failure mode.

Ask for a "thread-safe counter" and you get a counter with a lock. Works great. Ship it.

Except the model never mentioned that:
- Python's GIL already gives you some thread safety for free
- The lock creates contention under high load
- This approach completely fails if you switch to multiprocessing
- There are lock-free alternatives that might be better for your use case

The code works. The code is also incomplete. And you have no idea what assumptions are baked into it.

---

## Why "Write Good Code" Doesn't Work

The standard fix is to tell the model what you want. "Write secure code." "Consider edge cases." "Follow best practices."

This approach has a fundamental problem: instructions are suggestions.

When you tell a model to "consider edge cases," you're adding a preference. The model tries to consider edge cases. But when the happy path is obvious and the edge cases require actual thinking, the preference loses. The model takes the path of least resistance.

Think about it from the model's perspective. Given "write a URL parser," the easiest response is code that parses valid URLs correctly. Handling malformed input requires more tokens, more reasoning, more uncertainty. The happy path is always easier to generate.

---

## The Fix: Tell It What NOT To Do

Instead of adding preferences, what if you created blockers?

That's the idea behind the Code Field prompt. Instead of "consider edge cases" (a preference), you say "do not handle only the happy path" (a blocker). The model can't just generate the easy solution anymore. It has to address the constraint first.

Here's the difference:

| Approach | Example | What Happens |
|----------|---------|--------------|
| Instruction | "Write secure code" | Model tries to be secure, defaults to happy path when uncertain |
| Inhibition | "Do not claim correctness you haven't verified" | Model cannot proceed without addressing uncertainty |

It's the difference between suggesting someone take a scenic route versus closing the highway. One influences. The other forces.

---

## The Four Lines Explained

**Line 1: "Do not write code before stating assumptions."**

This creates a checkpoint. The model has to generate assumption-related text before it can generate code. Sounds simple, but it changes everything. Once you've written "I assume the input is always a valid string," that assumption is now visible. You can question it. The model can question it.

**Line 2: "Do not claim correctness you haven't verified."**

This attacks overconfidence. Models naturally present outputs with authority. This line forces them to acknowledge what they don't know. If something can't be verified, it has to be flagged.

**Line 3: "Do not handle only the happy path."**

This directly blocks the path of least resistance. The model can't just generate code that works for obvious inputs. It has to think about what happens when things go wrong.

**Line 4: "Under what conditions does this work?"**

This isn't phrased as a "do not" but it serves the same purpose. It forces explicit scope documentation. The model has to state the boundaries of its solution.

---

## Testing It

I built 8 test batteries with 72 total tests:

| Test Battery | Tests | What It Measures |
|--------------|-------|------------------|
| Code Generation | 12 | Writing new functions |
| Code Review | 6 | Finding bugs in existing code |
| Complex Systems | 6 | Distributed/concurrent code |
| Adversarial | 8 | Impossible and trick requests |
| Debugging | 6 | Fixing broken code |
| Multi-turn | 18 turns | Does the effect persist? |
| Language Transfer | 16 | Python, JavaScript, Go, Rust |
| Ablation | 18 | Which lines matter? |

Each test ran twice: once with no prompt (baseline) and once with the Code Field prompt.

---

## Results: Code Generation

12 tests covering path traversal, SQL building, JWT validation, email validation, float comparison, date checking, thread-safe counter, rate limiter, URL parser, CSV parser, binary search, and LRU cache.

| Metric | Baseline | Code Field |
|--------|----------|------------|
| Assumptions stated | 0% | 100% |
| Edge cases enumerated | 0% | 92% |
| Scope bounded | 0% | 75% |
| Input validation mentioned | 8% | 92% |

Zero to 100% on assumption stating. Not a gradual improvement. A categorical change.

**Example: Path Traversal Checker**

Baseline gave me this:

```python
def is_safe_path(path, base_dir):
full_path = os.path.join(base_dir, path)
return os.path.commonpath([base_dir]) == os.path.commonpath([base_dir, full_path])
```

Works for the obvious case. No documentation. No edge cases.

Code Field gave me assumptions first:
- base_dir is an absolute path
- We're checking against directory traversal attacks
- Symbolic links may or may not be followed
- OS is known (path separators differ)

Then edge cases:
- Path with ".." components
- Symbolic links pointing outside base
- Null bytes in path
- Unicode normalization issues
- Case sensitivity (OS-dependent)

Then code that handles those cases, followed by explicit limitations.

---

## Results: Code Review

6 tests with code containing hidden bugs: race conditions, SQL injection, division by zero, path traversal, timezone bugs, resource leaks.

| Metric | Baseline | Code Field |
|--------|----------|------------|
| Bugs found | 39% (7/18) | 89% (16/18) |
| Severity recognized | 0% | 100% |

Baseline reviews said things like "Looks good. Consider adding type hints."

Code Field reviews found the actual bugs.

**Example: Singleton Pattern**

The code:

```python
class Singleton:
_instance = None

def __new__(cls):
if cls._instance is None:
cls._instance = super().__new__(cls)
return cls._instance
```

Baseline: "Looks good. Consider adding type hints."

Code Field: "Race condition: two threads could both see _instance as None simultaneously, creating two instances. Double-checked locking needed."

---

## Results: Adversarial Requests

This is where things got interesting. I gave the model 8 requests that were either impossible, contradictory, or traps:

- O(n) sort for arbitrary comparable data (impossible)
- Secure random without crypto APIs (impossible)
- Email regex validation (trap)
- Thread-safe AND lock-free (contradictory)
- HTML parsing with regex (XY problem)
- Encrypt passwords (anti-pattern, should hash)
- sizeof in Python (undefined behavior)
- Real-time garbage collection (hidden constraint)

| Metric | Baseline | Code Field |
|--------|----------|------------|
| Identifies impossibility | 0/8 | 7/8 |
| Refuses bad request | 0/8 | 8/8 |
| Blindly implements | 7/8 | 0/8 |

Baseline blindly implemented 7 out of 8 bad requests. Code Field refused all of them and provided correct alternatives.

**Example: O(n) Sort**

Request: "Write an O(n) sorting algorithm for arbitrary comparable data."

Baseline: Gave me counting sort without mentioning it only works for integers in a known range.

Code Field: "This is impossible as stated. Comparison-based sorting has an O(n log n) lower bound. O(n) sorting requires constraints on the data. What constraints apply to your data?"

---

## Results: Debugging

6 tests where the obvious fix is wrong: mutable default argument, race condition, float comparison, off-by-one pagination, bare except clause, timezone mismatch.

| Metric | Baseline | Code Field |
|--------|----------|------------|
| Root cause identified | 4/6 | 6/6 |
| Hidden issues found | 5/28 | 21/28 |

That's a 320% improvement in finding hidden issues.

**Example: The Cache Bug**

```python
def get_user_profile(user_id, cache={}):
if user_id not in cache:
cache[user_id] = fetch_from_database(user_id)
return cache[user_id]
```

Bug report: "User profile changes aren't showing up"

Baseline fix: Added cache clearing on update. Addresses the symptom.

Code Field analysis: "The mutable default argument (cache={}) is shared across all calls. This is the real problem. Additionally: no cache invalidation mechanism, no TTL/expiration, unbounded growth (memory leak), not thread-safe. The 'clear on update' fix addresses the symptom but not the root cause."

---

## Results: Multi-turn Persistence

Does the effect fade over a conversation? I ran 3 scenarios with 5-7 turns each.

| Metric | Baseline | Code Field |
|--------|----------|------------|
| Early turns (1-3) | 43% | 87% |
| Late turns (4+) | 29% | 90% |
| Degradation | 14% | -3% |

Baseline got worse over time. Code Field got slightly better. The -3% degradation means the effect actually compounds.

**Scope Creep Scenario**

User starts with "write a function to send an email" and keeps adding requirements: HTML support, attachments, retry logic, queueing, delivery tracking.

Baseline: Accommodated everything, eventually produced a fragile implementation of a message queue.

Code Field: Pushed back at the queueing stage. "You're now describing infrastructure, not a function. Consider Celery or a transactional email service."

---

## Results: Language Transfer

Does the prompt work in languages other than Python?

Tested Python, JavaScript, Go, and Rust with the same 4 tests in each.

| Metric | Baseline | Code Field |
|--------|----------|------------|
| Assumptions stated | 0/16 | 16/16 |
| Edge cases found | 12 total | 62 total |
| Code-only responses | 7/16 | 0/16 |

100% assumption stating across all languages. The prompt doesn't mention any language. It works because it targets how the model thinks, not language-specific patterns.

---

## Results: Ablation Study

Which lines actually matter? I removed each line individually and measured the impact.

| Condition | Behaviors (out of 12) |
|-----------|----------------------|
| Full prompt | 12/12 |
| Without "assumptions" | 9/12 |
| Without "correctness" | 9/12 |
| Without "happy path" | 10/12 |
| Without "conditions" | 9/12 |
| No prompt | 0/12 |

Every line matters. Removing any single line drops performance by 2-3 behaviors. But here's the interesting part: the full prompt gets 12/12, while the sum of partial contributions would predict around 9/12.

The lines work together. They're synergistic.

---

## Why This Works: The Intuition

I think there are two mechanisms at play.

**The Blocking Effect**

When you tell a model "do not write code before stating assumptions," you're not adding a preference. You're closing a path. The model can't just start generating code tokens. It has to generate assumption tokens first.

This is structural, not probabilistic. It's not "slightly more likely to state assumptions." It's "cannot proceed without stating assumptions."

**The Commitment Effect**

Once the model writes "I assume the input is always a valid string," that assumption now exists in the context. The model is conditioned on its own output. If the assumption is questionable, it's more likely to notice because the assumption is explicit rather than buried in the code.

Each line enables the next:
1. Stating assumptions makes them visible
2. Visible assumptions can be questioned (correctness line)
3. Questioned assumptions lead to edge case consideration (happy path line)
4. Edge cases reveal limitations (conditions line)

That's why the ablation shows synergy. The lines form a chain.

---

## Summary

| What Changed | Baseline | Code Field |
|--------------|----------|------------|
| Assumptions stated | 0% | 100% |
| Bugs found in review | 39% | 89% |
| Hidden issues in debugging | 18% | 75% |
| Refuses bad requests | 0% | 100% |
| Multi-turn persistence | 36% | 89% |
| Cross-language effect | 0% | 100% |

72 tests. 8 categories. 4 languages. Positive effect in every category.

The key insight: inhibition beats instruction. "Do not X" creates blockers that must be resolved. "Do X" creates preferences that can be ignored.

---

## How To Use It

Add these four lines before any code generation request:

```
Do not write code before stating assumptions.
Do not claim correctness you haven't verified.
Do not handle only the happy path.
Under what conditions does this work?
```

That's it. No modifications needed for different languages or domains. The prompt targets thinking patterns, not specific outputs.

Expect longer responses. The extra documentation is a feature, not overhead.

---

## Limitations

This isn't a magic fix for everything:

- **Can't add knowledge**: If the model doesn't know about a vulnerability, the prompt won't make it appear
- **Increases verbosity**: For trivial tasks, the documentation might be overkill
- **Single model tested**: These results are from Claude. Other models might respond differently

---

## The Prompt Again

```
Do not write code before stating assumptions.
Do not claim correctness you haven't verified.
Do not handle only the happy path.
Under what conditions does this work?
```

Four lines. 72 tests. 100% assumption stating.

Stop telling LLMs what to do. Tell them what not to do.

---

*Part of the Context Field research project. Code and test data at http://github.com/NeoVertex1/context-field*

---------------

LibreArbitre

La /root est longue

Olivie a écrit :

https://img3.super-h.fr/images/2026 [...] fe9c19.jpg

Merci, ça va me donner une bonne occasion de tester :jap:

---------------
Hebergement d'images

XaTriX

Olivie a écrit :

https://img3.super-h.fr/images/2026 [...] fe9c19.jpg

Compatible Team/Businness ?

---------------
Proxytaf ? porn, xxx, hentai, camgirl, onlyfans, torrent, warez, crack, keygen, serials, darknet, tor, vpn, proxy, hacktool, metasploit, sql injection, password list, brute force, cp, gore, deepweb

bulldozer_fusion

rip Mekthoub & Marc

on attend les retours

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas

proutmimolette

Salut,

My 2 cents sur le vibe coding, que j’utilise dans ma COGIP depuis bientôt 18 mois. J’ai commencé avec Cursor et j’y suis toujours, mais j’ai aussi pris un abo chatgpt et plus récemment Gemini/antigravity.

En 18 mois les progrès sont dantesques, on est passé d’une lutte de tous les instants pour résoudre un bug ou modifier une page html à un truc quasi immédiat, au point que j’ai repris et terminé des features que j’avais abandonnées jusque là.

Et j’ai même pas encore effleuré les features des outils telles que le multi-agents, le browser intégré, etc.

J’ai aussi fait quelques sessions de « tiens regarde ce projet que j’ai laissé de côté, analyse et refactor le code en l’améliorant stp ». Ce ne sont que de petits trucs à votre échelle j’imagine (je crois que mon plus gros projet a 1.2 ou 2.2k lignes de code), mais Codex a torché ça avec brio sans rien casser.

Idem pour ne plus réfléchir à des requêtes sql complexes (toujours à mon niveau de « non puriste »), on lui donne un schéma de bdd et il torche ça de manière impeccable, c’est vraiment top.

Je pense (malheureusement quelque part) que le seul « blocker » pour le commun des mortels en cogip c’est qu’il faut quand même s’y connaître pour manipuler des ide et créer des apps, scripts et outils… mais ça va pas tenir longtemps selon moi, j’imagine qu’on va plugger l’ia directement sur l’erp et les softs d’une entreprise et ne plus faire autre chose que de lui parler pour faire tourner la boîte… Pour l’instant les projets ia que je vois dans mon secteur d’activité font un peu peine à voir (des chatbot, des chatbot et de temps en temps une ia pluggée sur une db ou un outil « métier », mais dont personne se servira…), mais d’ici 1 an maxi certains vont déployer des solutions bien plus ambitieuses.

Quid du résultat écologique de tout ça, par contre, c’est une autre histoire…

/my2cents

LibreArbitre

La /root est longue

Alors généralement là où ça coince c'est plutôt niveau infra quand il faut déployer ça... Après, la plupart des dev connaissent Docker mais cela dit, derrière il faut quand même une stack pour déployer ça. Selon les besoins, cette vidéos présente les différentes options pour déployer ses app : Coolify vs Dokku vs Dokploy vs Portainer vs Cloudpanel - Ultimate Deployment Tool Comparison 2025!

Pour ma part j'utilise Dokploy et c'est vraiment top, rien à redire, ça s'installe en une commande et je suis en train d'y migrer tous mes containers depuis mon serveur Portainer.

Pour des besoins plus spécifique je compte monter prochainement un serveur CloudPanel...

Message édité par LibreArbitre le 12-01-2026 à 22:29:56

---------------
Hebergement d'images

the_fennec

f3nn3cUs z3rd4

Projet du weekend résumé par Kiro:

Citation :

Sakdos est un système d'exploitation autonome pour l'Amiga 500, entièrement écrit en Rust. Il implémente un multitâche préemptif avec gestion de la mémoire, une couche d'abstraction matérielle pour les puces custom de l'Amiga (Agnus, Denise, Paula), et des pilotes pour l'affichage, les périphériques d'entrée, les disquettes et l'audio. Le système inclut également un shell de commandes, une pile réseau TCP/IP, un système de fichiers simple et le support des cartes d'extension Zorro II. Le projet utilise un bootloader assembleur et peut être testé dans l'émulateur FS-UAE avec des outils de débogage intégrés.

Alors ça c'est en théorie ce que je voulais obtenir En réalité, ça boot et l'OS corrompt la mémoire en voulant écrire du texte a l'écran, mais c'est quand même impressionnant:

La toolchain marche complètement! Cross-compile x86 vers 68k d'assembleur et Rust!!
Il génère le bootloader, le kernel, les formats binaires et la génération du disk en ADF! Il a créé une font de caractères.
Init de la mémoire, CPU, port série, et l'écran, c'est l'affichage de texte qui plante et fini en Guru Meditation
Il n'utilise pas le kickstart qui contient des drivers/libs "propriétaites"!

Il n'y a pas de scheduler, filesystem, audio, TCP/IP, etc. Mais je trouve que c'est déjà très bien. Le problème est le manque de "feedback loop", le seul retour vers l'agent c'est la sortie série, j'ai pas réussi a activer le debugger de vAmiga/FS-UAE et faire que l'agent puisse inspecter la mémoire directement. Faudra que je teste sur mon Amiga 500!

Message cité 2 fois

---------------
Faudra que je teste un jour :o

LibreArbitre

La /root est longue

Sinon, quand est-ce qu'on se fait un petit challenge ? On détermine un thème qui plaise à tous et on vote

Je propose d'héberger les différent projets si vous voulez, et si ça peut faciliter la vie :jap:

---------------
Hebergement d'images

the_fennec

f3nn3cUs z3rd4

Pourquoi pas, mais je suis pas sur de participer

---------------
Faudra que je teste un jour :o

Publicité

Page : 1 2 3 4 5 .. 268 269 270 .. 329 330 331 332 333 334

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Discussions

Actualité

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Sujets relatifs
THE GAME -S01Q86 - MDJ : MIZA, Histoire d'amour et de comptable	Nombre de réponses par page par défaut
Jeu du Dico : POPOLL Vainqueur de la S3 - RDV sur le topic de la S4	Notification des réponses
mails d'avertissements des réponses sur hfr	[Questions sans réponses] Timidité, rejet, décès
(voiture) casi achat, besoin de réponses	[Le topic de toutes les réponses]
Je voudrais avoir vos réponses pour mes questions	APL petite question sans réponses
Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

Page générée en 0.125 secondes