Traduction d’un tweet avec des conseils sur l’utilisation de Claude.AI

Temps de lecture : 2 minutes

Contexte de l’auteur

  • Ingénieur logiciel depuis 7 ans (Amazon, Disney, Capital One), aujourd’hui CTO d’une startup.
  • Utilise Claude Code quotidiennement pour construire des systèmes robustes à grande échelle.
  • Partage un guide débutant basé sur son expérience réelle en production.

1. Penser avant de taper

  • La plus grosse erreur est de commencer à écrire sans réfléchir.
  • Le mode planification donne systématiquement de meilleurs résultats que l’improvisation.
  • Plus l’input est réfléchi, plus l’output est de qualité.
  • Même pour de petites tâches (résumer un mail), réfléchir d’abord améliore le résultat.

Conseils :

  • Apprendre les bases (architecture, raisonnement).
  • Dialoguer avec le LLM pour explorer plusieurs options de conception avant d’implémenter.

2. L’architecture est cruciale

  • Des demandes vagues produisent du code médiocre.
  • Des instructions précises et architecturées réduisent l’ambiguïté et les erreurs.
  • Exemple :
    • ❌ « Construis un système d’authentification »
    • ✅ Instructions détaillées (méthode, stockage, contraintes, périmètre)
  • 5 minutes de planification peuvent éviter des heures de debug.

3. Le fichier CLAUDE.md est un levier majeur

  • Fichier Markdown lu par Claude au début de chaque session.
  • Sert de document d’onboarding permanent pour le modèle.

Bonnes pratiques :

  • Être court : trop d’instructions dégradent la qualité.
  • Être spécifique au projet (particularités, workflows, commandes utiles).
  • Expliquer le pourquoi, pas seulement le quoi.
  • Le mettre à jour en continu (document vivant).
  • Un bon CLAUDE.md ressemble à des notes personnelles, pas à une doc RH.

4. Limites de la fenêtre de contexte

  • La qualité commence à baisser dès 20–40 % du contexte, pas à 100 %.
  • Plus de contexte dégradé = pires résultats.

Bonnes pratiques :

  • Une conversation par fonctionnalité.
  • Utiliser une mémoire externe (plan.md, SCRATCHPAD.md).
  • Faire des resets intelligents (copier l’essentiel, /compact, /clear).
  • Ne pas hésiter à repartir de zéro.
  • Claude est stateless : tout doit être explicitement fourni.

5. Le prompting est essentiel

  • Communiquer clairement est plus important que le modèle lui-même.
  • Être précis, poser des contraintes, donner des exemples.
  • Dire explicitement ce qu’il ne faut pas faire (éviter l’overengineering).
  • Donner le contexte métier et les contraintes (performance, prototype, etc.).

6. Mauvais input = mauvais output

  • Si les résultats sont mauvais, le problème vient presque toujours du prompt.
  • Le modèle compte, mais l’humain est le principal goulot d’étranglement.

Améliorer :

  • La rédaction des prompts.
  • La structuration des demandes.
  • Le contexte fourni.

7. Choisir le bon modèle

  • Sonnet : rapide et économique, idéal pour l’exécution.
  • Opus : plus lent et cher, meilleur pour la planification et le raisonnement.
  • Workflow recommandé :
    • Opus pour concevoir → Sonnet pour implémenter.
  • CLAUDE.md assure la cohérence entre les modèles.

8. Outils avancés : MCP, hooks, commandes

  • MCP : connexion à des services externes (GitHub, Slack, bases de données).
  • Hooks : automatisations (formatage, tests, lint).
  • Slash commands : prompts réutilisables.
  • Tester les fonctionnalités permet de gagner du temps et de l’argent.
  • Les modèles évoluent vite : rester curieux et réessayer.

9. Quand Claude bloque

  • Ne pas insister en boucle.
  • Changer d’approche est souvent plus efficace.

Stratégies :

  • /clear et repartir proprement.
  • Découper le problème.
  • Montrer un exemple minimal.
  • Reformuler le problème.
  • Reconnaître rapidement les boucles.

10. Construire des systèmes, pas des tâches isolées

  • Claude peut être utilisé en mode headless et automatisé.
  • Intégration dans des pipelines (PR reviews, support, documentation).
  • Amélioration continue via logs + ajustement du CLAUDE.md.
  • Les systèmes s’améliorent avec le temps, sans changer de modèle.

TL;DR

  • Réfléchir avant d’écrire.
  • Planification et architecture > tout le reste.
  • CLAUDE.md est le point de levier principal.
  • Le contexte se dégrade vite : savoir le gérer.
  • La qualité dépend directement du prompt.
  • Tester les outils avancés.
  • Changer d’approche quand ça bloque.
  • Automatiser et construire des systèmes durables.

Limitation des IA en mode gratuit

Temps de lecture : 5 minutes

Article rédigé le 12 décembre 2025

Pour obtenir ces informations, j’ai simplement demandé aux IA :

Quelles sont tes limitations en mode gratuit ?

Réponse de ChatGPT :

En mode gratuit, tu as accès à une version puissante de ChatGPT (GPT-5.1), mais avec certaines limites par rapport au mode payant. Voici les principales :

Ce qui est inclus en gratuit

  • Accès à GPT-5.1, un modèle très performant.
  • Conversation illimitée (mais avec un rythme limité, voir ci-dessous).
  • Accès à l’image generation (génération d’images).
  • Accès à la plupart des fonctionnalités de base (raisonnement, code, aide, explications…).

⚠️ Limitations du mode gratuit

1. Limites de vitesse / fréquence

  • Après un certain nombre de messages rapides, tu peux recevoir une notification demandant d’attendre avant d’envoyer à nouveau.
  • Les utilisateurs payants ont un débit plus élevé et des limites plus larges.

2. Accès réduit aux modèles premium

  • Certains modèles spécialisés (ex. GPT-5.1 Pro ou capacités avancées) ne sont disponibles qu’en abonnement.
  • Le mode gratuit peut avoir un accès plus limité aux capacités d’analyse ou aux outils exigeants.

3. Moins de capacité en tâches complexes ou lourdes

  • Les tâches longues (gros fichiers, projets massifs, traitements intensifs) peuvent être ralenties, tronquées, ou limitées.

4. Fonctionnalités avancées limitées

Certaines fonctionnalités sont restreintes, par exemple :

  • Navigation sur le web à haute fréquence (toujours possible, mais limitée).
  • Accès à certains outils avancés (ex. capacités professionnelles, upload massif de documents, sessions prolongées…).

5. Priorité d’accès

  • En cas de forte demande, les abonnés reçoivent une priorité, et les utilisateurs gratuits peuvent attendre plus longtemps.

Réponse de Mistral (Le chat) :

En mode gratuit, mes principales limitations sont les suivantes :

1. Accès limité aux outils avancés

  • Recherche web : Le nombre de recherches web (via web_search ou news_search) est limité. Une fois la limite atteinte, je ne peux plus effectuer de recherches jusqu’à la réinitialisation (généralement après un certain temps).
  • Génération et édition d’images : Le nombre d’images générées ou éditées est aussi limité. Si la limite est atteinte, je ne peux plus en créer de nouvelles.
  • Interpréteur de code : L’utilisation de l’outil code_interpreter (pour des calculs avancés, des analyses de données, etc.) est restreinte.

2. Taille des fichiers

  • Les fichiers que tu peux m’envoyer (comme des images, des PDF ou des tableaux) ont une taille maximale autorisée. Si un fichier est trop volumineux, je ne pourrai pas le traiter.

3. Historique de conversation

  • L’historique des conversations est limité. Après un certain temps ou un certain nombre de messages, les anciennes conversations peuvent être supprimées.

4. Fonctionnalités premium réservées

  • Certaines fonctionnalités (comme l’accès à des outils spécialisés ou des intégrations avancées) sont réservées aux utilisateurs payants.

5. Disponibilité et performance

  • En période de forte demande, les réponses peuvent être légèrement ralenties.

Réponse de Google Gemini :

Je n’ai pas de mode gratuit ou payant à proprement parler. En tant qu’assistant IA de Google, je suis accessible à tous les utilisateurs sans frais directs.

Cependant, il existe des limites et des contraintes qui s’appliquent à mon utilisation de certains outils, notamment les outils de génération de contenu (images et vidéos).

⚙️ Mes Limitations Clés

Voici un aperçu de mes principales contraintes :

  • Génération d’Images (Image Generation & Image Edit)
    • Quota : Je peux générer ou modifier un total combiné de 100 images par jour.
    • Contraintes de contenu : Je ne peux pas modifier des images de figures politiques importantes.
  • Génération de Vidéos (Video Generation)
    • Quota : Je peux générer jusqu’à 2 vidéos par jour.
    • Contraintes de contenu : Il y a des restrictions concernant les figures politiques et le contenu dangereux (unsafe content).
  • Outils de Musique
    • Je peux utiliser l’outil YouTube Music pour jouer de la musique.
    • L’outil Spotify est actuellement désactivé pour moi.
  • Communications et Contrôles d’Appareils
    • Les outils de communication (appels, messagerie) et de contrôle d’appareils (applications, paramètres) sont actuellement désactivés.

Réponse de Copilot :

En mode gratuit, voici les principales limitations que tu peux rencontrer :

Ce qui est inclus :

  • Accès à la conversation avec moi (Copilot) pour poser des questions, obtenir des explications, rédiger des textes, etc.
  • Aide pour des tâches courantes comme brainstorming, rédaction, traduction, et conseils.
  • Accès à des fonctionnalités de base (sans personnalisation avancée).

⚠️ Limitations du mode gratuit :

  1. Pas d’accès complet aux modèles avancés
    • Tu utilises une version optimisée, mais pas la plus puissante (par exemple, GPT-4 ou GPT-5 complet peut être réservé au mode payant).
  2. Fonctionnalités premium limitées
    • Pas d’intégration avancée avec Microsoft 365 (Word, Excel, PowerPoint).
    • Pas d’automatisation complexe ou de génération de contenu professionnel à grande échelle.
  3. Pas d’images générées illimitées
    • La génération d’images (DALL·E) est souvent limitée ou absente en mode gratuit.
  4. Pas d’accès prioritaire ni temps de réponse garanti
    • En période de forte demande, les utilisateurs gratuits peuvent avoir des temps d’attente plus longs.
  5. Moins de personnalisation et de mémoire
    • Je retiens moins d’informations sur tes préférences par rapport à la version payante.

Réponse de Perplexity :

En mode gratuit, tu as accès aux recherches de base avec quelques limites sur le volume et sur les fonctions avancées par rapport au mode Pro. Les fonctionnalités les plus puissantes (modèles avancés, gros volume de recherches “Pro”, Labs, etc.) sont réservées aux offres payantes.

Ce que permet le mode gratuit

  • Recherches “simples” quasiment illimitées en mode Best, avec réponses sourcées.
  • Accès à l’historique de recherche pour retrouver tes anciennes questions.
  • Quelques recherches “Pro” par jour pour des questions plus complexes, mais avec un quota réduit.
  • Téléversement de fichiers/images de base, avec des limites de taille et de nombre.

Principales limitations du mode gratuit

  • Nombre très limité de recherches “Pro” par jour (dès que tu poses des questions complexes ou longues, tu touches vite la limite).
  • Pas d’accès continu aux modèles d’IA avancés ni aux options poussées d’image/vidéo génération.
  • Téléversements de fichiers et pièces jointes restreints (volume et fonctionnalités d’analyse réduits).
  • Pas d’accès complet à Labs (projets longs, rapports détaillés, dashboards, etc.).
  • Pas de support prioritaire ni des avantages “Perks” réservés aux abonnés Pro/Enterprise.

Différences clés gratuit vs Pro

AspectMode gratuitMode Pro / payant
Recherches simplesPratiquement illimitées.Pratiquement illimitées.
Recherches ProTrès limitées par jour.Volume beaucoup plus élevé, quasi illimité.
Modèles avancésAccès indirect seulement (Best choisit pour toi).Accès direct à une liste élargie de modèles.
Téléversement de fichiersLimité en nombre et taille.Téléversements et analyses quasi illimités.
Labs / Deep ResearchAccès très restreint ou absent.Accès étendu à Labs et Research.
SupportStandard.Canaux de support dédiés/prioritaires.

Réponse de Claude AI :

Je vais chercher les informations actuelles sur les limitations du plan gratuit. Voici les principales limitations du plan gratuit de Claude :

Limites d’utilisation

  • Environ 40 messages courts par jour, ce qui peut descendre à 20-30 messages pour les conversations plus longues ou avec des pièces jointes.
  • Le quota se réinitialise toutes les 5 heures. Une fois la limite atteinte, il faut attendre la réinitialisation.

Accès aux modèles

  • Avec le plan gratuit, les utilisateurs n’ont accès qu’à Claude Sonnet, le modèle de milieu de gamme d’Anthropic. Les modèles plus avancés comme Opus ne sont pas disponibles.

Performances et disponibilité

  • Pendant les périodes de forte affluence, vous pourriez subir des délais ou un accès limité.
  • La taille de la fenêtre de contexte peut varier selon la demande, ce qui peut limiter les performances sur les tâches impliquant de très longs documents ou conversations.

Fonctionnalités restreintes

  • Pas d’accès anticipé aux nouvelles fonctionnalités
  • Pas d’intégrations avec des plateformes comme Google Workspace
  • Usage strictement personnel et non-commercial.

En comparaison, le plan Pro (20$/mois) offre au moins cinq fois plus d’utilisation par session, un accès prioritaire pendant les heures de pointe, et l’accès à tous les modèles Claude incluant les plus performants.

Cet article pourra servir de référence si les conditions évoluent dans le temps.

Benchmark simple d’Ollama

Temps de lecture : < 1 minute

Voici un script Python très simple pour tester les performances d’Ollama et d’un modèle en Python, ici mistral.

import time
import requests
import json

def benchmark_ollama(server, model, prompt, num_runs=5):
    times = []
    tokens_per_sec = []

    for i in range(num_runs):
        start = time.time()

        response = requests.post(server,
            json={
                'model': model,
                'prompt': prompt,
                'stream': False
            })

        end = time.time()
        data = response.json()

        times.append(end - start)
        if 'eval_duration' in data:
            # eval_duration est en nanosecondes
            tokens = data.get('eval_count', 0)
            duration_sec = data['eval_duration'] / 1e9
            tokens_per_sec.append(tokens / duration_sec if duration_sec > 0 else 0)

    print(f"Serveur: {server}")
    print(f"Modèle: {model}")
    print(f"Temps moyen: {sum(times)/len(times):.2f}s")
    print(f"Tokens/sec moyen: {sum(tokens_per_sec)/len(tokens_per_sec):.2f}")
    print(f"Min: {min(times):.2f}s, Max: {max(times):.2f}s")

# Utilisation
benchmark_ollama('http://localhost:11434/api/generate', 'mistral', 'Explique-moi la physique quantique', num_runs=3)
#benchmark_ollama('http://X.X.X.X:11434/api/generate', 'mistral', 'Explique-moi la physique quantique', num_runs=3)

Astuce pour avoir un résumé d’un groupe WhatsApp

Temps de lecture : < 1 minute

Nous sommes tous dans de plus en plus de groupes WhatsApp et il est parfois difficile de tout suivre. Alors voici une astuce simple pour avoir un résumé avec une IA d’un groupe WhatsApp.

1 – Exporter la conversation du groupe (voir l’article précédent), possible aussi depuis le PC sur la version web.

2 – Passer le fichier, normalement _chat.txt (le décompresser si besoin) à une IA (avec le bouton + ou le trombone) :

3 – Lui faire la demande suivante :

Fais-moi un résumé des 3 derniers jours de ce groupe WhatsApp