
RAG Pro Builder : Agentic Retrieval Augmented Generation
Pipeline RAG de production pour traiter des documents complexes (PDF financiers, juridiques, techniques) avec recherche hybride, reranking Cohere et LLM local. Architecture modulaire : LlamaParse pour l'extraction, Qdrant pour le stockage vectoriel, Parent-Document Chunking pour la précision, et orchestration agentique via LangGraph. Benchmark validé sur des documents réels avec 100% de factualité.
Technologies:
Python
LlamaIndex
LangGraph
Qdrant
Cohere Rerank
Ollama (Llama 3)
LlamaParse
Recherche Hybride
RAG

FlowSight : Système de Perception de Trafic Urbain
Pipeline complet de vision par ordinateur pour le comptage et la classification du trafic urbain en temps réel. Phase 1 : entraînement YOLOv11 sur VisDrone (85% d'objets <32px), avec analyse exploratoire et optimisation haute résolution (1024px+). Phase 2 : déploiement avec tracking BoT-SORT, détection de franchissement par analyse vectorielle, et tableau de bord temps réel. mAP 0.87 sur véhicules.
Technologies:
Python
PyTorch
YOLOv11
BoT-SORT
Computer Vision
Object Detection
Object Tracking
Filtre de Kalman
VisDrone Dataset

Agent 2048 en Reinforcement Learning
Ce projet explore l'apprentissage par renforcement appliqué au jeu 2048, en combinant une approche théorique rigoureuse et des expérimentations à grande échelle. Plusieurs agents développés : Value Iteration, Expectimax et TD Learning avec N-Tuple Networks. Optimisation (Numba, bitboards) pour 5x la vitesse et 85% de taux de victoire. Démonstrateur interactif inclus.

PoseCoach : Moteur d'analyse biomécanique temps réel
Ce projet est une solution de 'Computer Vision' optimisée pour l'Edge Computing. Il utilise TensorFlow Lite et MoveNet pour détecter les points clés du corps humain en moins de 10ms. L'algorithme calcule des vecteurs géométriques pour valider la forme des exercices et fournir un feedback visuel instantané via OpenCV. L'architecture est pensée pour la performance : tout le traitement se fait localement, éliminant la latence du Cloud.
Technologies:
Python
TensorFlow Lite
MoveNet
OpenCV
NumPy
Edge Computing
Pose Estimation
Biomécanique
Raspberry Pi / Jetson

EmoSense : Pipeline de Deep Learning Multi-Label (SOTA)
Détection d'émotions fines dans des textes courts (Tweets, dialogues) avec gestion du déséquilibre de classes. Architecture ModernBERT couplée à une Asymmetric Loss pour le hard negative mining, et seuillage dynamique (Dynamic Thresholding) pour maximiser la précision en inférence. Solution robuste et reproductible pour traiter les ambiguïtés émotionnelles avec précision.
Technologies:
Python
PyTorch
Hugging Face
ModernBERT
Asymmetric Loss
NLP
Multi-Label Classification
Pandas
Dynamic Thresholding

TopicMap : Moteur d'Exploration Sémantique (IA)
Solution d'IA pour structurer automatiquement des milliers de retours clients ou tickets support en topics cohérents, sans intervention humaine. Détection de tendances émergentes et signaux faibles. Dashboard Streamlit interactif pour l'exploration graphique. Cas d'usage : Voix du Client (VoC), détection d'incidents, veille concurrentielle.
Technologies:
Python
Topic Modeling
NLP
Streamlit
Clustering
Text Mining
Data Visualization
Pandas

ScoreXplain : IA de Crédit Scoring Transparente & Éthique
Solution de scoring crédit 'White-box' conçue pour l'auditabilité dans les secteurs régulés. Intégration de SHAP pour expliquer chaque décision en langage clair. Module d'audit et mitigation des biais (âge, genre) via Fairlearn pour la conformité IA Act. Optimisation basée sur le coût réel des erreurs (FP vs FN).
Technologies:
Python
SHAP
Fairlearn
XGBoost
Explainable AI (XAI)
Credit Scoring
Bias Mitigation
Scikit-learn
Pandas