SENIOR MACHINE LEARNING ENGINEER RAG (H/F)
Contexte
Dans un contexte d’accélération forte des usages autour de l’IA générative, nos clients grands comptes et industriels de la région marseillaise et PACA structurent et industrialisent des architectures RAG (Retrieval-Augmented Generation) à l’échelle.
L’objectif n’est plus le simple POC, mais la mise en production sécurisée, scalable et performante d’assistants IA métiers, intégrés aux systèmes existants (on-premise et cloud).
Dans ce cadre, Wolsome Provence recherche un(e) Senior Machine Learning Engineer RAG pour intervenir sur des projets à très forte valeur ajoutée, au cœur des équipes Data, IT et Innovation.
VOS MISSIONS
Architecture & RAG avancé
- Prendre en responsabilité des architectures RAG complexes et industrialisées.
- Concevoir des pipelines complets : ingestion, chunking, embeddings, indexation, retrieval, reranking et prompting avancé.
- Déployer des assistants IA spécialisés, interrogeables via des APIs standardisées.
Industrialisation & Production
- Transformer des modèles IA/GenAI en services robustes, sécurisés et scalables.
- Mettre en œuvre des architectures orientées “factory” pour accélérer le time-to-market.
- Concevoir et maintenir des APIs (FastAPI) et services ML exposables à grande échelle.
Performance, Scalabilité & LLMOps
- Optimiser les performances d’inférence (latence, throughput, GPU, coûts).
- Implémenter des mécanismes de monitoring, observabilité, qualité et dérive des modèles.
- Appliquer les bonnes pratiques MLOps / CI-CD / LLMOps en environnement contraint.
Collaboration & Gouvernance
- Travailler en étroite collaboration avec les équipes métiers, Data et IT.
- Participer à la définition des standards techniques IA et MLOps.
- Être force de proposition sur les choix d’architecture et d’outillage.
VOTRE PROFIL
Formation & Expérience
- Bac+5 (école d’ingénieur, université ou équivalent).
- Minimum 5 ans d’expérience en Machine Learning Engineering, Software Engineering ou Data.
- Expérience significative sur des projets RAG / GenAI en production.
Compétences techniques clés
- Python (expert) – PyTorch / TensorFlow.
- Frameworks RAG : LangChain, LlamaIndex.
- Bases vectorielles et moteurs de recherche : FAISS, Pinecone, Qdrant, Weaviate, OpenSearch, Elasticsearch.
- APIs & services ML : FastAPI.
- Conteneurisation & orchestration : Docker, Kubernetes, OpenShift / OpenShift AI.
- MLOps / CI-CD : MLflow, GitLab CI, Argo, Kubeflow, Elyra.
- Optimisation & serving : vLLM, Triton Inference Server, OpenVINO.
- Environnements On-Premise et Cloud (AWS, GCP, Azure).
Savoir-être
- Forte autonomie et capacité à auditer et améliorer des architectures existantes.
- Rigueur d’ingénierie et culture production.
- Capacité à vulgariser et interagir avec des équipes métiers.
- Sens du service, exigence qualité et esprit collectif.
POURQUOI REJOINDRE WOLSOME PROVENCE
- Des projets IA concrets, industrialisés et à impact réel.
- Une expertise Data & IA reconnue localement (Aix / Marseille / PACA).
- Une structure à taille humaine, agile, réactive et exigeante techniquement.
- Un environnement bienveillant, favorisant l’autonomie et la montée en compétences.
À PROPOS DE WOLSOME
Wolsome est une société de conseil multi-spécialiste créée en 2020, intervenant dans des secteurs variés : Banque, Finance, Assurance, Industrie, Cybersécurité, Énergie.
Sa filiale Wolsome Provence accompagne des clients régionaux et nationaux sur leurs projets Data, IA et transformation digitale, avec une forte exigence de proximité, de qualité et d’impact opérationnel.
Dans le cadre de sa politique Diversité & Inclusion, tous nos postes sont ouverts aux personnes en situation de handicap.
Wolsome s’engage à garantir l’égalité des chances.