La formation transmet des compétences. Le conseil aide à prendre les bonnes décisions sur votre contexte spécifique.
J'interviens en complément ou en alternative à la formation, quand vos équipes ont besoin d'un regard externe expert sur leur architecture data, leurs choix techniques ou leurs pratiques d'analyse. Mon expérience de chercheur sur des projets à très grande échelle — analyse complète du graphe social de Twitter (505 millions de comptes), étude de la propagation d'information sur les réseaux sociaux, monitoring de millions d'utilisateurs sur des protocoles pair-à-pair, traitement de l'intégralité du graphe de transactions Bitcoin (16,5 milliards de liens entre 1,5 milliard d'adresses) — nourrit directement ce travail de conseil.
Types d'interventions
Audit ponctuel
Une analyse en profondeur d'un sujet précis, sur 1 à 3 jours, suivie d'un rapport écrit avec recommandations concrètes et hiérarchisées. Format adapté quand vous avez une question claire : « notre pipeline est trop lent, où sont les goulots ? », « on atteint une limite mémoire, que faire ? », « faut-il migrer de Pandas à Polars ? », « comment industrialiser ce notebook ? ».
Accompagnement régulier
Une présence ponctuelle mais régulière sur plusieurs mois — quelques jours ou demi-journées étalés dans le temps. Format adapté quand vos équipes veulent un référent technique externe sur lequel s'appuyer pour les décisions structurantes, les revues de code critiques, ou les choix d'architecture au fil de l'évolution du projet.
Sujets sur lesquels j'interviens
- Performance et passage à l'échelle — analyse de bottlenecks, migration Pandas vers Polars, parallélisation avec Numba ou multiprocessing, optimisation mémoire sur gros volumes, choix entre traitement batch et streaming.
- Qualité et bonnes pratiques — code review de pipelines de données, architecture de notebooks vers scripts industrialisables, gestion des dépendances, reproductibilité scientifique.
- Choix technologiques — comparaison de stacks data (Pandas, Polars, DuckDB, Dask, Spark), choix de formats de stockage (CSV, Parquet, formats colonnaires), arbitrage entre solutions managées et auto-hébergées.
- Sens de l'analyse — au-delà du code, accompagnement sur la formulation des bonnes questions à poser à un dataset, l'identification des biais, la construction de protocoles d'analyse qui tiennent la route scientifiquement.
Cadre d'intervention
Mon objectif est d'analyser les problèmes que rencontrent mes clients et de proposer des améliorations sur la base de mes compétences en data engineering et calcul performant en Python.
Les modalités, le périmètre et le tarif sont définis au cas par cas en fonction du besoin. Tout engagement fait l'objet d'un contrat écrit.
Discuter d'un besoin de conseil
Décrivez-moi votre contexte et la question que vous vous posez. Je vous rappelle pour en parler, et si la mission a du sens, je vous fais une proposition adaptée.