Stratégie de traçabilité des sources — BP APEX¶
Document méthodologique décrivant comment les chiffres du Business Plan sont sourcés, vérifiés et traçables.
Problème¶
Le rapport brut (analyse-marche-pricing.md) contient des dizaines de chiffres — TAM, SAM, pricing, coûts, benchmarks — mais la section "Sources" en fin de document est une liste brute de liens. On ne sait pas :
- Quel chiffre est justifié par quelle source
- Quel raisonnement relie la source au chiffre (calcul, extrapolation, hypothèse)
- Quels chiffres sont sourcés et lesquels sont des estimations internes
Un investisseur qui lit "TAM hors-US = 1,2 Md$" doit pouvoir remonter à la preuve en un clic.
Solution : marqueurs de référence + document de traçabilité¶
Principe¶
Chaque chiffre clé du rapport brut est annoté d'un marqueur de référence [^ref:XX]. Un document séparé (sources-tracabilite.md) détaille chaque référence avec :
- Le chiffre concerné
- La source (lien, document, benchmark)
- Le raisonnement qui relie la source au chiffre
- Le niveau de confiance (Élevé / Moyen / Faible)
Exemple dans le rapport brut¶
Le TAM hors-US est estimé à **1,2 Md$ en 2028** [^ref:04], avec une croissance
de **38% CAGR** [^ref:05] tirée par l'adoption des serveurs CXL-capables.
Exemple dans le document de traçabilité¶
### Ref 04 — TAM hors-US : 1,2 Md$ en 2028
**Chiffre** : 1,2 Md$ (TAM logiciel de tiering mémoire CXL, hors Amérique du Nord)
**Source principale** : Yole Group, "CXL Memory Market Report 2025"
(https://www.yolegroup.com/product/report/cxl-memory-market-report-2025/)
**Raisonnement** : Yole estime le marché mondial du CXL memory à 3,1 Md$
en 2028 (hardware + software). La part software représente ~35% selon leur
segmentation, soit ~1,09 Md$. En ajustant pour l'inflation des prix logiciels
(+5-8%/an sur les outils d'infrastructure), on arrive à ~1,15-1,2 Md$.
Le marché US représentant ~52% du marché mondial (concentration hyperscalers),
le hors-US est estimé à ~48%, soit **~1,2 Md$ × 48/52 ≈ 1,1 Md$**.
Arrondi à 1,2 Md$ pour inclure les revenus services/support.
**Niveau de confiance** : Moyen — le rapport Yole est fiable sur le hardware,
mais la segmentation software est une estimation de l'agent.
Flux de travail¶
Phase 1 Agent business → Rapport brut (contenu + marqueurs [^ref:XX])
Phase 1.5 Agent sources → sources-tracabilite.md (recherche + rédaction)
Phase 2 Agents MkDocs → 3 documents de présentation (propagent les refs)
Phase 3 Prompts Excel → Mise à jour du classeur
Phase 1 — Rapport brut¶
L'agent business produit ou met à jour le rapport brut. Pour chaque chiffre clé, il insère un marqueur [^ref:XX] en fin de phrase.
Règles :
- Les marqueurs sont incrémentaux ([^ref:01], [^ref:02], etc.)
- Chaque marqueur est unique — un même chiffre réutilisé à plusieurs endroits pointe vers la même ref
- Les chiffres issus de calculs internes au modèle (ex: MRR = serveurs × prix) n'ont pas besoin de ref — seuls les inputs du modèle sont sourcés
- Si l'agent business ne connaît pas la source exacte, il insère quand même le marqueur avec une note [source à compléter]
Phase 1.5 — Document de traçabilité¶
Un agent dédié (business ou général) relit le rapport brut et produit sources-tracabilite.md. Pour chaque marqueur [^ref:XX] :
- Identifie le chiffre et son contexte
- Recherche la source sur le web (rapports sectoriels, benchmarks SaaS, données publiques)
- Rédige le raisonnement complet qui relie la source au chiffre
- Attribue un niveau de confiance
Fallback — transcripts de l'agent business : si une source ou une donnée semble introuvable par recherche web, l'agent sources peut consulter le transcript JSONL de l'agent business qui a produit le rapport brut. Ces transcripts sont stockés dans ~/.claude/projects/{project}/{sessionId}/subagents/agent-{agentId}.jsonl et contiennent les recherches web, les raisonnements et les sources consultées par l'agent business lors de la rédaction.
Pour identifier le bon fichier JSONL, le coordinateur (conversation principale) :
1. Note les fichiers existants dans subagents/ avant de lancer l'agent business (phase 1)
2. Après complétion, identifie le nouveau fichier par diff
3. Passe le chemin exact dans le prompt de l'agent sources
L'agent sources utilise Grep pour chercher des termes ciblés dans le JSONL (noms de sources, URLs, chiffres spécifiques) plutôt que de le lire en entier. C'est un filet de sécurité, pas le flux principal.
Cette phase peut tourner en parallèle de la phase 2 car elle ne modifie pas les mêmes fichiers.
Phase 2 — Documents MkDocs¶
Les agents MkDocs (général, pas business) synchronisent les 3 documents de présentation avec le rapport brut. Pour chaque chiffre sourcé repris dans une présentation :
- Marqueur inline : ajouter
[^ref:XX]à côté du chiffre - Définition footnote : ajouter en bas du fichier un bloc
<!-- Références -->avec les définitions
Format des définitions de footnotes :
<!-- Références -->
[^ref:04]: Nutanix FY2024, ~45% S&M/revenu (SEC filing). [Détail →](sources-tracabilite.md#ref-04--nutanix-fy2024--45-du-revenu-en-sm)
[^ref:07]: Ratio DRAM/CXL : ~8 USD/Go vs ~3 USD/Go. [Détail →](sources-tracabilite.md#ref-07--ratio-cout-dramcxl)
Chaque définition contient :
- Un résumé en une ligne (source + chiffre)
- Un lien [Détail →] vers la section correspondante dans sources-tracabilite.md
Seules les refs effectivement utilisées dans le fichier reçoivent une définition. Les ancres cibles sont générées par MkDocs depuis les titres h3 de sources-tracabilite.md (format : lowercase, tirets, pas de caractères spéciaux).
Prérequis MkDocs : l'extension footnotes doit être activée dans mkdocs.yml :
markdown_extensions:
- footnotes
Instructions précises pour l'agent Phase 2 : le prompt doit demander explicitement de :
- Lire sources-tracabilite.md pour avoir la liste complète des 41 refs avec les chiffres associés
- Parcourir chaque ligne de chaque fichier MkDocs et vérifier si un chiffre sourcé y apparaît
- Annoter tous les chiffres sourcés, pas seulement ceux qui sont des reprises textuelles évidentes — un chiffre arrondi ou reformulé doit aussi recevoir sa ref
- Lister dans son rapport de sortie les refs non propagées et la raison (le chiffre n'apparaît pas dans le fichier)
Phase 3 — Excel¶
Pas de changement. Les prompts Excel n'ont pas besoin de références.
Rendu des footnotes¶
Les marqueurs [^ref:XX] dans le texte sont rendus par MkDocs comme des numéros cliquables en exposant. Les définitions en bas de page apparaissent comme des notes de bas de page avec le lien vers le détail dans sources-tracabilite.md.
Exemple de rendu :
Le TAM hors-US est estimé à 1,2 Md$¹ avec une croissance de 38% CAGR².
Structure du document de traçabilité¶
# Sources et traçabilité — BP APEX
> Chaque référence [^ref:XX] du rapport brut est détaillée ici.
## Marché (TAM / SAM / SOM)
### Ref 01 — [Titre court]
**Chiffre** : ...
**Source** : ... (lien)
**Raisonnement** : ...
**Confiance** : Élevé / Moyen / Faible
### Ref 02 — [Titre court]
...
## Pricing
### Ref 10 — [Titre court]
...
## Coûts
### Ref 20 — [Titre court]
...
## Benchmarks SaaS
### Ref 30 — [Titre court]
...
Les références sont regroupées par thème pour faciliter la lecture, et numérotées dans l'ordre d'apparition dans le rapport brut.
Niveaux de confiance¶
| Niveau | Signification | Exemples |
|---|---|---|
| Élevé | Donnée issue d'une source publique vérifiable, peu d'interprétation | Rapport Gartner/IDC, données financières publiques, stats gouvernementales |
| Moyen | Source fiable mais avec extrapolation ou hypothèse intermédiaire | Benchmark SaaS appliqué à notre segment, estimation de part de marché |
| Faible | Estimation interne, analogie avec un marché adjacent, intuition fondateur | Taux d'adoption CXL en France, nombre de prospects qualifiés |
Quoi sourcer, quoi ne pas sourcer¶
À sourcer (inputs du modèle)¶
- Taille de marché (TAM, SAM) et taux de croissance
- Nombre de prospects / taille du marché adressable
- Benchmarks de pricing (comparaison concurrence)
- Taux de churn, expansion, NRR (benchmarks SaaS)
- Coûts unitaires (salaires, infrastructure, juridique)
- Cycles de vente et taux de conversion (benchmarks B2B)
Pas besoin de sourcer (outputs calculés)¶
- MRR, ARR (= serveurs × prix, calcul interne)
- Marge (= revenus − coûts, calcul interne)
- CAC (= budget S&M / flux clients, calcul interne)
- LTV (= ARPU / churn, formule standard)
- Stock clients (= cumul flux − churn, modèle Excel)
- Breakeven (= intersection revenus/coûts, modèle Excel)
Maintenance¶
Quand un chiffre du rapport brut change :
- Si c'est un input sourcé : mettre à jour la ref correspondante dans
sources-tracabilite.md - Si c'est un output calculé : rien à faire côté sources
- Si c'est un nouvel input : créer une nouvelle ref
[^ref:XX+1]
Le document de traçabilité est versionné avec le rapport brut. Toute modification du rapport qui touche un chiffre sourcé doit être reflétée dans les deux fichiers.