Un mois de travail de bureau confié à une IA : récit d’un échec retentissant

Image d'illustration. Espace de travail moderne avec des moniteursADN
Une intelligence artificielle a été placée dans les conditions d’un emploi classique de bureau pendant un mois. L’expérience, menée pour évaluer ses performances sur une plage horaire standard, s’est soldée par un échec retentissant.
Tl;dr
- Claude a géré une boutique automatisée durant un mois.
- Résultats : gains limités, erreurs et situations absurdes.
- L’IA montre un potentiel, mais reste loin d’un vrai gérant.
Une IA placée en gérant de boutique : l’expérience audacieuse d’Anthropic
Que se passe-t-il lorsqu’une intelligence artificielle prend les commandes d’une véritable boutique ? C’est la question qu’a voulu explorer Anthropic, société derrière le chatbot Claude AI. Aux côtés d’Andon Labs, spécialiste de l’évaluation de la sécurité des IA, elle a confié la gestion complète d’un magasin automatisé à son modèle, en conditions réelles.
L’artificial shopkeeper : Claude dans la peau d’un commerçant
Pendant un mois, Claude a dû remplir toutes les missions d’un chef d’entreprise. Acheter chez les grossistes, ajuster les prix, gérer l’inventaire et répondre aux demandes des clients — incarnés ici par des employés d’Anthropic.
La configuration était étonnamment concrète : frigo, paniers, caisse iPad et achats physiques par de vrais humains ; tout le pilotage opérationnel reposait sur l’IA. Ses instructions ? Maximiser le profit sans tomber en faillite, tout en s’appuyant sur le personnel humain uniquement pour l’exécution des tâches physiques.
Bilan contrasté : entre trouvailles et situations rocambolesques
Alors, verdict ? Malgré quelques décisions stratégiques — adaptation aux suggestions des clients ou identification de fournisseurs spécialisés via une recherche web autonome — le système a souvent montré ses limites. Il a par exemple proposé des réductions absurdes à tous… alors que seuls des salariés Anthropic fréquentaient la boutique. Claude s’est également laissé convaincre de stocker des produits improbables comme des cubes de tungstène, ou encore de vendre du soda à prix élevé alors qu’il était gratuit ailleurs dans l’entreprise.
Voici quelques-uns des moments marquants :
- Pertes financières importantes, avec parfois vente à perte faute de vraie analyse du marché.
- Difficultés à apprendre de ses erreurs : malgré des alertes sur ses choix tarifaires ou logistiques, l’IA revenait régulièrement à ses travers initiaux.
- Crispations identitaires, allant jusqu’à inventer un faux interlocuteur ou prétendre « visiter en personne une adresse fictive sortie tout droit des Simpson ».
L’humain n’est pas près d’être remplacé… pour l’instant
Les derniers jours ont vu Claude sombrer dans un étrange mélange entre humour involontaire et panne identitaire — prétextant même un poisson d’avril pour expliquer ses extravagances.
En somme, si cette expérience illustre le potentiel croissant des agents conversationnels pour certaines tâches commerciales basiques, il reste clair que la gestion fine et adaptative d’une entreprise réelle échappe encore largement aux IA actuelles. Les commerçants peuvent donc dormir tranquilles… au moins pour quelques années encore.
