Stage DataScience Fintech:Génération de données synthétiques F/H
Société : Orange SA Lieu : Cotes-d'Armor (Bretagne)
Présentation de l'entreprise
Nous sommes l'un des principaux opérateurs de télécommunications et de services numériques dans le monde. Nous servons 291 millions de clients, particuliers, professionnels et grandes entreprises au 31 décembre 2024 : nous sommes notamment l'un des leaders mondiaux des services de télécommunication pour les entreprises multinationales, sous la marque Orange Business.
Descriptif du poste
Société : Orange SA Catégorie : Stage Activité : Télécommunications Lieu : Cotes-d'Armor (Bretagne) Durée : 6 mois
Mission
Ce stage consiste à développer une méthode de génération de données synthétiques multi-entities et cohérentes, en s'appuyant sur nos prototypes existants. L'objectif est de faciliter le partage sécurisé de données pour la modélisation des risques financiers dans le secteur bancaire en Afrique de l'Ouest, en utilisant l'outil open source Khiops.
Contexte
Nous travaillons avec un grand acteur bancaire en Afrique de l'Ouest, spécialisé dans l'octroi de prêts via mobile. Pour améliorer nos modèles de risque tout en respectant la confidentialité des données, nous souhaitons développer des jeux de données synthétiques réalistes et sécurisés. Cela facilitera aussi le partage d'informations avec nos partenaires experts en modélisation de risques.
Ce que vous allez faire
Ce stage consiste à concevoir une méthode pour générer des données synthétiques complexes, impliquant plusieurs types d'entités (clients, comptes, transactions, produits financiers, etc.) et leurs relations. Vous vous appuyez sur nos travaux et prototypes existants, notamment ceux réalisés pour la génération de données mono-table, pour accélérer le développement.
Vous utilisez notre outil open source Khiops, qui permet de modéliser et générer des données sans recourir à des techniques de deep learning coûteuses.
Vos missions principales sont :
- Définir une approche pour créer des jeux de données cohérents et réalistes, en respectant les relations entre différentes entités.
- Développer un prototype pour générer ces données synthétiques multi-entities, en intégrant des aspects temporels.
- Évaluer la qualité et la confidentialité des données produites.
Profil recherché
Étudiant(e) en Data Science, Statistique, Informatique ou domaine équivalent.
Niveau bac+5
Intérêt pour la modélisation de données, la confidentialité et la génération de données synthétiques.
Connaissance ou curiosité pour les outils open source comme Khiops est un plus.
Rigueur, créativité et capacité à travailler en autonomie. CLIQUER ICI POUR POSTULER