depuis la création du compte
Confiez votre projet à Killian
Faites appel à l'expertise de Killian pour faire avancer votre projet, ou découvrez d'autres freelances pour trouver celui qui correspondra parfaitement à vos besoins.
Bonjour, je suis Killian, ingénieur spécialisé en IA générative.
Je construis pour vous des applications IA qui fonctionnent vraiment en production : pas des démos sympas qui meurent au premier vrai usage, mais du code propre, déployé, maintenable.
MON PROFIL
5+ ans d'expérience en Machine Learning et IA, dont 3 ans en lead technique sur des projets LLM en production. Certifié Google Cloud Professional ML Engineer.
LE PROBLÈME QUE JE RÉSOUS
Vous avez une idée d'application IA, un POC bricolé avec ChatGPT, ou un projet qui patine ? Je vous aide à le transformer en outil fiable, connecté à vos données, utilisable par vos équipes au quotidien.
CE QUE JE DÉVELOPPE
• Chatbots intelligents sur vos documents et bases internes (RAG)
• Agents IA qui exécutent des tâches multi-étapes
• APIs LLM intégrables à vos applications
• Applications GenAI complètes, du front au déploiement
• Audits et cadrages techniques
STACK
Python, LangChain, FastAPI, Streamlit, Kubernetes, GCP. Tous les principaux modèles LLM (OpenAI, Claude, Mistral, Gemini, open-source).
COMMENT JE TRAVAILLE
Facturation au forfait avec périmètre clair, livraison par jalons, communication directe et régulière. Télétravail.
Un projet à dégrossir, même mal défini ? Écrivez-moi, on en discute. Premier échange gratuit.
Pilotage technique et delivery d'une équipe sur plusieurs projets GenAI en parallèle : agents IA, automatisations métier, systèmes RAG.
Périmètre : cadrage des cas d'usage avec les métiers, arbitrages d'architecture (LLMOps, on-premise vs cloud), pilotage du delivery et gestion budgétaire.
Lead technique d'une équipe pluridisciplinaire (développeurs ML, data engineers).
Développement d'un pipeline de préprocessing et d'ingestion documentaire pour un système RAG, basé sur Temporal pour l'orchestration des workflows asynchrones.
Stack : Python, Temporal, LangChain, vector database, FastAPI.
Capable de traiter des volumes documentaires importants tout en garantissant la résilience et la reprise sur erreur des traitements.
Conception et déploiement d'une plateforme d'inférence pour modèles LLM open-source (type Mixtral) sur Kubernetes / GCP, avec orchestration ArgoCD. Objectif : mutualiser l'utilisation des GPU entre plusieurs équipes pour réduire significativement les coûts.
Stack : Kubernetes, GCP, vLLM, ArgoCD, Python, FastAPI.
Résultat : plateforme utilisée par plusieurs équipes internes, économies substantielles sur les coûts d'infrastructure GPU.
Ingénieur généraliste (électronique, mécatronique et informatique)