Aller au contenu

Tests de parsing CSV

Billet: Ajout de tests unitaires pour la robustesse du parsing CSV
Type : Amélioration / Qualité
Composant concerné : code_source_simule/pipeline.py, tests/test_pipeline.py


1. Contexte

La fonction read_and_clean_csv est critique pour garantir que les données entrantes sont correctes. Elle est utilisée par la pipeline ETL pour normaliser les fichiers CSV et déclencher l'enrichissement des prix.

2. Objectif

Renforcer la suite de tests unitaires afin de s'assurer que la fonction reste robuste face aux entrées dégradées, sans modifier son comportement actuel.

3. Ajouts réalisés

  • Ajout de tests unitaires couvrant :
  • un CSV sans la colonne Ticker (doit retourner un DataFrame vide)
  • des valeurs Price invalides (N/A, format 1 234.56) qui doivent être normalisées en float
  • l'absence de la colonne Marketstack_Currency (doit être ajoutée et remplie avec USD)
  • le filtrage automatique des lignes Cash et des lignes sans ticker

4. Résultat

La suite pytest passe désormais avec succès, et ces nouveaux scénarios renforcent la couverture de la fonction de nettoyage CSV.