AI Engineer / Ingénieur Intelligence Artificielle Senior (Voix & LLM)
Société : Vocads Lieu : Paris (Île-de-France)
Présentation de l'entreprise
At Vocads, we are reshaping customer interaction with our no-code AI voice agents. Our technology automates inbound and outbound calls, boosts team productivity, and delivers a smooth, 24/7 customer experience.
We’re a fast-growing startup, accelerated by Station F and Microsoft GenAI studio, and already trusted by ambitious companies.
Descriptif du poste
Société : Vocads Catégorie : Offre emploi CDI Activité : Informatique Filiere : Assurance Metier : Intégrateur d'applications / Paramétreur ERP Lieu : Paris (Île-de-France) Durée : Indéterminée
Mission
Chez Vocads, nous révolutionnons l’interaction client grâce à nos agents vocaux IA no-code. Notre technologie automatise les appels entrants et sortants, améliore la productivité des équipes et offre une expérience client fluide 24/7.
Nous sommes une startup en forte croissance, accélérée par Station F et Microsoft GenAI Studio, déjà adoptée par des entreprises ambitieuses et actuellement en expansion aux États-Unis.
Développement et fine-tuning de modèles LLM
Fine-tuning de modèles de langage (OpenAI, Anthropic, Meta) pour des interactions vocales naturelles et contextuelles.
Conception de pipelines NLP adaptés aux dialogues en temps réel et aux contraintes de production.
Personnalisation des modèles pour des cas d’usage spécifiques, en optimisant précision, cohérence et performance.
Assurer une veille technologique pour rester à jour avec les dernières avancées en intelligence artificielle.
Advanced prompting & génération de contenu IA en temps réel
Création et optimisation de prompts pour des réponses précises et adaptées.
Mise en place de stratégies de prompt chaining et few-shot learning lorsque nécessaire.
Développement Python, APIs & déploiement
Création et maintenance de scripts, notebooks et API pour l’intégration des modèles dans nos applications vocales.
Utilisation d’outils Python modernes tels que Pydantic pour la validation et la structuration des données, et Instructor pour le fine-tuning et l’optimisation des embeddings.
Optimiser les algorithmes et les modèles pour améliorer la précision et l'efficacité des solutions.
Déploiement des modèles et pipelines en production, en garantissant performance, scalabilité et fiabilité.
Collaboration avec les équipes de développement pour intégrer les modèles AI dans les produits et services existants.
Collaboration avec les équipes backend et DevOps pour assurer le monitoring, la maintenance et l’optimisation continue des modèles.
Optimisation des performances et latence
Analyse et amélioration des temps de réponse des modèles et pipelines IA pour les interactions vocales.
Profilage et tuning des modèles pour un fonctionnement fluide en temps réel sur LiveKit, Twilio et autres plateformes vocales.
Intégration de fonctionnalités et sources externes
Conception de pipelines permettant aux agents vocaux d’utiliser différentes fonctionnalités ou sources de données : bases de données vectorielles, recherche sur le web, envoi de SMS, intégration d’APIs tierces, etc.
Développement de solutions modulaires et scalables pour enrichir les réponses du modèle en fonction du contexte et des besoins métier.
Gestion de la cohérence, de la latence et de la sécurité lors de l’accès à des données externes ou d’actions déclenchées par l’IA.
Machine Learning & NLP temps réel
Entraînement, déploiement et optimisation de modèles ML et NLP pour des systèmes à faible latence.
Suivi des performances des modèles et amélioration continue des pipelines en production.
Profil recherché
Diplôme en informatique, mathématiques appliquées, IA ou domaine équivalent.
Minimum 5 ans d’expérience en IA, ML ou NLP, avec expérience significative en production et déploiement de modèles.
Expertise en Python et bibliothèques ML/NLP (PyTorch, TensorFlow, HuggingFace, LangChain…), ainsi qu’outils modernes (Pydantic, Instructor).
Expérience dans le fine-tuning de LLM et Prompt Engineering.
Connaissance des pipelines pour intégrer des fonctionnalités externes (RAG, APIs, outils tiers, web scraping, SMS…).
Expérience avec des systèmes temps réel ou interactifs (latence critique, optimisation de performance).
Capacité à concevoir, déployer et maintenir des modèles en production.
Autonomie, rigueur et goût pour les défis techniques complexes.
Atouts supplémentaires :
Expérience avec plateformes vocales (LiveKit, Twilio, WebRTC).
Expérience avec MLOps, CI/CD pour pipelines ML.
Familiarité avec les frameworks de déploiement (FastAPI, BentoML, TorchServe…).
Connaissance des environnements cloud (GCP).CLIQUER ICI POUR POSTULER