Parcours / EXPÉRIENCE

Data Scientist.Salariat

Période
Juil 2018 - Mai 2019
Entreprise
RINTIO ↗

Développé des produits analytiques et data science pour Duniya, le MVP smart farming de Rintio pour les agriculteurs béninois.

  • Conçu et déployé une architecture big data (data lake Hadoop, cluster Apache Spark, ElasticSearch) traitant plus de 100 Go de données agricoles en features ML pour le produit.
  • Construit des pipelines de bout en bout traitant les données agricoles (météo, cultures, sols, rendements) et développé des modèles de prévision de rendement par régression (R² supérieur à 80 % sur maïs et haricots) alimentant les décisions de sourcing, cycles et pricing.
  • Livré un rapport BI consolidé (Kibana, Apache Superset) couvrant plusieurs KPIs et domaines pour la direction.
  • Livré une mission de formation data & IA exécutive à la direction de Société Générale Maroc, couvrant des cas d’usage bancaires et des labs pratiques.
[•] PROJETS & CAS D'USAGE 4 ENTRÉES
01

Plateforme big data pour l'agriculture de précision

Problème / Besoin
Les signaux agricoles bruts (météo, cultures, sols, rendements) arrivaient dans des formats hétérogènes sans couche unifiée de stockage et de calcul, bloquant la transformation en fonctionnalités produit.
Solution
Conçu et déployé une architecture big data combinant un data lake Hadoop, un cluster Apache Spark et ElasticSearch. Ingéré plus de 100 Go de données agricoles depuis plusieurs sources (données marché scrapées, feuilles de calcul, PDF, images) couvrant informations sur les cultures, engrais, production de rendement, pluviométrie et climat. Construit des pipelines d’ingestion et de transformation de bout en bout transformant les données brutes en features ML pour l’app smart-farming.
Outils

Hadoop·Apache Spark·ElasticSearch·Python

02

Modèles de prévision de rendement agricole

Problème / Besoin
La stratégie business sur les cycles de plantation, le sourcing et le pricing se faisait sans vue quantitative des rendements attendus, entraînant des décisions réactives coûteuses.
Solution
Développé des modèles statistiques de prévision de rendement agricole utilisant des algorithmes de régression, alimentés par les pipelines de données agricoles, principalement pour le maïs avec des modèles complémentaires pour les haricots. Atteint un R² supérieur à 80 % la plupart du temps. Traduit les prévisions en couche prédictive pour la planification business : décisions de sourcing, cycles, et pricing.
Outils

Python·scikit-learn·Apache Spark

03

Reporting BI consolidé

Problème / Besoin
La direction avait besoin de visibilité sur les insights analytiques, mais les sorties brutes étaient inaccessibles aux lecteurs non techniques.
Solution
Livré un rapport BI consolidé (Kibana, Apache Superset) couvrant plusieurs KPIs et domaines pour la direction.
Outils

Kibana·Apache Superset

04

Formation data & IA pour la direction Société Générale Maroc

Problème / Besoin
La direction de Société Générale Maroc avait besoin d’une exposition structurée aux applications data et IA dans la banque pour orienter ses priorités stratégiques.
Solution
Conçu le contenu de formation et développé les cas d’usage de lab adaptés aux applications data et IA bancaires, livrés à la direction de Société Générale Maroc dans le cadre d’une mission de formation unique.
Outils

Conception de contenu de formation·Développement de cas d'usage lab·Python

← Parcours