IA – Le blog de Brihx

Traduction d’un tweet avec des conseils sur l’utilisation de Claude.AI

Temps de lecture : 2 minutes

Contexte de l’auteur

Ingénieur logiciel depuis 7 ans (Amazon, Disney, Capital One), aujourd’hui CTO d’une startup.
Utilise Claude Code quotidiennement pour construire des systèmes robustes à grande échelle.
Partage un guide débutant basé sur son expérience réelle en production.

1. Penser avant de taper

La plus grosse erreur est de commencer à écrire sans réfléchir.
Le mode planification donne systématiquement de meilleurs résultats que l’improvisation.
Plus l’input est réfléchi, plus l’output est de qualité.
Même pour de petites tâches (résumer un mail), réfléchir d’abord améliore le résultat.

Conseils :

Apprendre les bases (architecture, raisonnement).
Dialoguer avec le LLM pour explorer plusieurs options de conception avant d’implémenter.

2. L’architecture est cruciale

Des demandes vagues produisent du code médiocre.
Des instructions précises et architecturées réduisent l’ambiguïté et les erreurs.
Exemple :
- ❌ « Construis un système d’authentification »
- ✅ Instructions détaillées (méthode, stockage, contraintes, périmètre)
5 minutes de planification peuvent éviter des heures de debug.

3. Le fichier `CLAUDE.md` est un levier majeur

Fichier Markdown lu par Claude au début de chaque session.
Sert de document d’onboarding permanent pour le modèle.

Bonnes pratiques :

Être court : trop d’instructions dégradent la qualité.
Être spécifique au projet (particularités, workflows, commandes utiles).
Expliquer le pourquoi, pas seulement le quoi.
Le mettre à jour en continu (document vivant).
Un bon CLAUDE.md ressemble à des notes personnelles, pas à une doc RH.

4. Limites de la fenêtre de contexte

La qualité commence à baisser dès 20–40 % du contexte, pas à 100 %.
Plus de contexte dégradé = pires résultats.

Bonnes pratiques :

Une conversation par fonctionnalité.
Utiliser une mémoire externe (plan.md, SCRATCHPAD.md).
Faire des resets intelligents (copier l’essentiel, /compact, /clear).
Ne pas hésiter à repartir de zéro.
Claude est stateless : tout doit être explicitement fourni.

5. Le prompting est essentiel

Communiquer clairement est plus important que le modèle lui-même.
Être précis, poser des contraintes, donner des exemples.
Dire explicitement ce qu’il ne faut pas faire (éviter l’overengineering).
Donner le contexte métier et les contraintes (performance, prototype, etc.).

6. Mauvais input = mauvais output

Si les résultats sont mauvais, le problème vient presque toujours du prompt.
Le modèle compte, mais l’humain est le principal goulot d’étranglement.

Améliorer :

La rédaction des prompts.
La structuration des demandes.
Le contexte fourni.

7. Choisir le bon modèle

Sonnet : rapide et économique, idéal pour l’exécution.
Opus : plus lent et cher, meilleur pour la planification et le raisonnement.
Workflow recommandé :
- Opus pour concevoir → Sonnet pour implémenter.
CLAUDE.md assure la cohérence entre les modèles.

8. Outils avancés : MCP, hooks, commandes

MCP : connexion à des services externes (GitHub, Slack, bases de données).
Hooks : automatisations (formatage, tests, lint).
Slash commands : prompts réutilisables.
Tester les fonctionnalités permet de gagner du temps et de l’argent.
Les modèles évoluent vite : rester curieux et réessayer.

9. Quand Claude bloque

Ne pas insister en boucle.
Changer d’approche est souvent plus efficace.

Stratégies :

/clear et repartir proprement.
Découper le problème.
Montrer un exemple minimal.
Reformuler le problème.
Reconnaître rapidement les boucles.

10. Construire des systèmes, pas des tâches isolées

Claude peut être utilisé en mode headless et automatisé.
Intégration dans des pipelines (PR reviews, support, documentation).
Amélioration continue via logs + ajustement du CLAUDE.md.
Les systèmes s’améliorent avec le temps, sans changer de modèle.

TL;DR

Réfléchir avant d’écrire.
Planification et architecture > tout le reste.
CLAUDE.md est le point de levier principal.
Le contexte se dégrade vite : savoir le gérer.
La qualité dépend directement du prompt.
Tester les outils avancés.
Changer d’approche quand ça bloque.
Automatiser et construire des systèmes durables.

Limitation des IA en mode gratuit

Temps de lecture : 5 minutes

Article rédigé le 12 décembre 2025

Pour obtenir ces informations, j’ai simplement demandé aux IA :

Quelles sont tes limitations en mode gratuit ?

Réponse de ChatGPT :

En mode gratuit, tu as accès à une version puissante de ChatGPT (GPT-5.1), mais avec certaines limites par rapport au mode payant. Voici les principales :

✅ Ce qui est inclus en gratuit

Accès à GPT-5.1, un modèle très performant.

Conversation illimitée (mais avec un rythme limité, voir ci-dessous).

Accès à l’image generation (génération d’images).

Accès à la plupart des fonctionnalités de base (raisonnement, code, aide, explications…).

⚠️ Limitations du mode gratuit

1. Limites de vitesse / fréquence

Après un certain nombre de messages rapides, tu peux recevoir une notification demandant d’attendre avant d’envoyer à nouveau.

Les utilisateurs payants ont un débit plus élevé et des limites plus larges.

2. Accès réduit aux modèles premium

Certains modèles spécialisés (ex. GPT-5.1 Pro ou capacités avancées) ne sont disponibles qu’en abonnement.

Le mode gratuit peut avoir un accès plus limité aux capacités d’analyse ou aux outils exigeants.

3. Moins de capacité en tâches complexes ou lourdes

Les tâches longues (gros fichiers, projets massifs, traitements intensifs) peuvent être ralenties, tronquées, ou limitées.

4. Fonctionnalités avancées limitées

Certaines fonctionnalités sont restreintes, par exemple :

Navigation sur le web à haute fréquence (toujours possible, mais limitée).

Accès à certains outils avancés (ex. capacités professionnelles, upload massif de documents, sessions prolongées…).

5. Priorité d’accès

En cas de forte demande, les abonnés reçoivent une priorité, et les utilisateurs gratuits peuvent attendre plus longtemps.

Réponse de Mistral (Le chat) :

En mode gratuit, mes principales limitations sont les suivantes :

1. Accès limité aux outils avancés

Recherche web : Le nombre de recherches web (via web_search ou news_search) est limité. Une fois la limite atteinte, je ne peux plus effectuer de recherches jusqu’à la réinitialisation (généralement après un certain temps).

Génération et édition d’images : Le nombre d’images générées ou éditées est aussi limité. Si la limite est atteinte, je ne peux plus en créer de nouvelles.

Interpréteur de code : L’utilisation de l’outil code_interpreter (pour des calculs avancés, des analyses de données, etc.) est restreinte.

2. Taille des fichiers

Les fichiers que tu peux m’envoyer (comme des images, des PDF ou des tableaux) ont une taille maximale autorisée. Si un fichier est trop volumineux, je ne pourrai pas le traiter.

3. Historique de conversation

L’historique des conversations est limité. Après un certain temps ou un certain nombre de messages, les anciennes conversations peuvent être supprimées.

4. Fonctionnalités premium réservées

Certaines fonctionnalités (comme l’accès à des outils spécialisés ou des intégrations avancées) sont réservées aux utilisateurs payants.

5. Disponibilité et performance

En période de forte demande, les réponses peuvent être légèrement ralenties.

Réponse de Google Gemini :

Je n’ai pas de mode gratuit ou payant à proprement parler. En tant qu’assistant IA de Google, je suis accessible à tous les utilisateurs sans frais directs.

Cependant, il existe des limites et des contraintes qui s’appliquent à mon utilisation de certains outils, notamment les outils de génération de contenu (images et vidéos).

⚙️ Mes Limitations Clés

Voici un aperçu de mes principales contraintes :

Génération d’Images (Image Generation & Image Edit)

Quota : Je peux générer ou modifier un total combiné de 100 images par jour.

Contraintes de contenu : Je ne peux pas modifier des images de figures politiques importantes.

Génération de Vidéos (Video Generation)

Quota : Je peux générer jusqu’à 2 vidéos par jour.

Contraintes de contenu : Il y a des restrictions concernant les figures politiques et le contenu dangereux (unsafe content).

Outils de Musique

Je peux utiliser l’outil YouTube Music pour jouer de la musique.

L’outil Spotify est actuellement désactivé pour moi.

Communications et Contrôles d’Appareils

Les outils de communication (appels, messagerie) et de contrôle d’appareils (applications, paramètres) sont actuellement désactivés.

Réponse de Copilot :

En mode gratuit, voici les principales limitations que tu peux rencontrer :

✅ Ce qui est inclus :

Accès à la conversation avec moi (Copilot) pour poser des questions, obtenir des explications, rédiger des textes, etc.

Aide pour des tâches courantes comme brainstorming, rédaction, traduction, et conseils.

Accès à des fonctionnalités de base (sans personnalisation avancée).

⚠️ Limitations du mode gratuit :

Pas d’accès complet aux modèles avancés

Tu utilises une version optimisée, mais pas la plus puissante (par exemple, GPT-4 ou GPT-5 complet peut être réservé au mode payant).

Fonctionnalités premium limitées

Pas d’intégration avancée avec Microsoft 365 (Word, Excel, PowerPoint).

Pas d’automatisation complexe ou de génération de contenu professionnel à grande échelle.

Pas d’images générées illimitées

La génération d’images (DALL·E) est souvent limitée ou absente en mode gratuit.

Pas d’accès prioritaire ni temps de réponse garanti

En période de forte demande, les utilisateurs gratuits peuvent avoir des temps d’attente plus longs.

Moins de personnalisation et de mémoire

Je retiens moins d’informations sur tes préférences par rapport à la version payante.

Réponse de Perplexity :

En mode gratuit, tu as accès aux recherches de base avec quelques limites sur le volume et sur les fonctions avancées par rapport au mode Pro. Les fonctionnalités les plus puissantes (modèles avancés, gros volume de recherches “Pro”, Labs, etc.) sont réservées aux offres payantes.

Ce que permet le mode gratuit

Recherches “simples” quasiment illimitées en mode Best, avec réponses sourcées.

Accès à l’historique de recherche pour retrouver tes anciennes questions.

Quelques recherches “Pro” par jour pour des questions plus complexes, mais avec un quota réduit.

Téléversement de fichiers/images de base, avec des limites de taille et de nombre.

Principales limitations du mode gratuit

Nombre très limité de recherches “Pro” par jour (dès que tu poses des questions complexes ou longues, tu touches vite la limite).

Pas d’accès continu aux modèles d’IA avancés ni aux options poussées d’image/vidéo génération.

Téléversements de fichiers et pièces jointes restreints (volume et fonctionnalités d’analyse réduits).

Pas d’accès complet à Labs (projets longs, rapports détaillés, dashboards, etc.).

Pas de support prioritaire ni des avantages “Perks” réservés aux abonnés Pro/Enterprise.

Différences clés gratuit vs Pro

Aspect Mode gratuit Mode Pro / payant
Recherches simples Pratiquement illimitées. Pratiquement illimitées.
Recherches Pro Très limitées par jour. Volume beaucoup plus élevé, quasi illimité.
Modèles avancés Accès indirect seulement (Best choisit pour toi). Accès direct à une liste élargie de modèles.
Téléversement de fichiers Limité en nombre et taille. Téléversements et analyses quasi illimités.
Labs / Deep Research Accès très restreint ou absent. Accès étendu à Labs et Research.
Support Standard. Canaux de support dédiés/prioritaires.

Aspect	Mode gratuit	Mode Pro / payant
Recherches simples	Pratiquement illimitées.	Pratiquement illimitées.
Recherches Pro	Très limitées par jour.	Volume beaucoup plus élevé, quasi illimité.
Modèles avancés	Accès indirect seulement (Best choisit pour toi).	Accès direct à une liste élargie de modèles.
Téléversement de fichiers	Limité en nombre et taille.	Téléversements et analyses quasi illimités.
Labs / Deep Research	Accès très restreint ou absent.	Accès étendu à Labs et Research.
Support	Standard.	Canaux de support dédiés/prioritaires.

Réponse de Claude AI :

Je vais chercher les informations actuelles sur les limitations du plan gratuit. Voici les principales limitations du plan gratuit de Claude :

Limites d’utilisation

Environ 40 messages courts par jour, ce qui peut descendre à 20-30 messages pour les conversations plus longues ou avec des pièces jointes.

Le quota se réinitialise toutes les 5 heures. Une fois la limite atteinte, il faut attendre la réinitialisation.

Accès aux modèles

Avec le plan gratuit, les utilisateurs n’ont accès qu’à Claude Sonnet, le modèle de milieu de gamme d’Anthropic. Les modèles plus avancés comme Opus ne sont pas disponibles.

Performances et disponibilité

Pendant les périodes de forte affluence, vous pourriez subir des délais ou un accès limité.

La taille de la fenêtre de contexte peut varier selon la demande, ce qui peut limiter les performances sur les tâches impliquant de très longs documents ou conversations.

Fonctionnalités restreintes

Pas d’accès anticipé aux nouvelles fonctionnalités

Pas d’intégrations avec des plateformes comme Google Workspace

Usage strictement personnel et non-commercial.

En comparaison, le plan Pro (20$/mois) offre au moins cinq fois plus d’utilisation par session, un accès prioritaire pendant les heures de pointe, et l’accès à tous les modèles Claude incluant les plus performants.

Cet article pourra servir de référence si les conditions évoluent dans le temps.

Benchmark simple d’Ollama

Temps de lecture : < 1 minute

Voici un script Python très simple pour tester les performances d’Ollama et d’un modèle en Python, ici mistral.

import time
import requests
import json

def benchmark_ollama(server, model, prompt, num_runs=5):
    times = []
    tokens_per_sec = []

    for i in range(num_runs):
        start = time.time()

        response = requests.post(server,
            json={
                'model': model,
                'prompt': prompt,
                'stream': False
            })

        end = time.time()
        data = response.json()

        times.append(end - start)
        if 'eval_duration' in data:
            # eval_duration est en nanosecondes
            tokens = data.get('eval_count', 0)
            duration_sec = data['eval_duration'] / 1e9
            tokens_per_sec.append(tokens / duration_sec if duration_sec > 0 else 0)

    print(f"Serveur: {server}")
    print(f"Modèle: {model}")
    print(f"Temps moyen: {sum(times)/len(times):.2f}s")
    print(f"Tokens/sec moyen: {sum(tokens_per_sec)/len(tokens_per_sec):.2f}")
    print(f"Min: {min(times):.2f}s, Max: {max(times):.2f}s")

# Utilisation
benchmark_ollama('http://localhost:11434/api/generate', 'mistral', 'Explique-moi la physique quantique', num_runs=3)
#benchmark_ollama('http://X.X.X.X:11434/api/generate', 'mistral', 'Explique-moi la physique quantique', num_runs=3)

Astuce pour avoir un résumé d’un groupe WhatsApp

Temps de lecture : < 1 minute

Nous sommes tous dans de plus en plus de groupes WhatsApp et il est parfois difficile de tout suivre. Alors voici une astuce simple pour avoir un résumé avec une IA d’un groupe WhatsApp.

1 – Exporter la conversation du groupe (voir l’article précédent), possible aussi depuis le PC sur la version web.

2 – Passer le fichier, normalement _chat.txt (le décompresser si besoin) à une IA (avec le bouton + ou le trombone) :

3 – Lui faire la demande suivante :

Fais-moi un résumé des 3 derniers jours de ce groupe WhatsApp

Étiquette : IA

Traduction d’un tweet avec des conseils sur l’utilisation de Claude.AI

Contexte de l’auteur

1. Penser avant de taper

2. L’architecture est cruciale

3. Le fichier `CLAUDE.md` est un levier majeur

4. Limites de la fenêtre de contexte

5. Le prompting est essentiel

6. Mauvais input = mauvais output

7. Choisir le bon modèle

8. Outils avancés : MCP, hooks, commandes

9. Quand Claude bloque

10. Construire des systèmes, pas des tâches isolées

TL;DR

Limitation des IA en mode gratuit

✅ Ce qui est inclus en gratuit

⚠️ Limitations du mode gratuit

1. Limites de vitesse / fréquence

2. Accès réduit aux modèles premium

3. Moins de capacité en tâches complexes ou lourdes

4. Fonctionnalités avancées limitées

5. Priorité d’accès

1. Accès limité aux outils avancés

2. Taille des fichiers

3. Historique de conversation

4. Fonctionnalités premium réservées

5. Disponibilité et performance

⚙️ Mes Limitations Clés

✅ Ce qui est inclus :

⚠️ Limitations du mode gratuit :

Ce que permet le mode gratuit

Principales limitations du mode gratuit

Différences clés gratuit vs Pro

Benchmark simple d’Ollama

Astuce pour avoir un résumé d’un groupe WhatsApp

Contexte de l’auteur

1. Penser avant de taper

2. L’architecture est cruciale

3. Le fichier CLAUDE.md est un levier majeur

4. Limites de la fenêtre de contexte

5. Le prompting est essentiel

6. Mauvais input = mauvais output

7. Choisir le bon modèle

8. Outils avancés : MCP, hooks, commandes

9. Quand Claude bloque

10. Construire des systèmes, pas des tâches isolées

TL;DR

✅ Ce qui est inclus en gratuit

⚠️ Limitations du mode gratuit

1. Limites de vitesse / fréquence

2. Accès réduit aux modèles premium

3. Moins de capacité en tâches complexes ou lourdes

4. Fonctionnalités avancées limitées

5. Priorité d’accès

1. Accès limité aux outils avancés

2. Taille des fichiers

3. Historique de conversation

4. Fonctionnalités premium réservées

5. Disponibilité et performance

⚙️ Mes Limitations Clés

✅ Ce qui est inclus :

⚠️ Limitations du mode gratuit :

Ce que permet le mode gratuit

Principales limitations du mode gratuit

Différences clés gratuit vs Pro

3. Le fichier `CLAUDE.md` est un levier majeur