Sopra Steria et Octopize – Mimethik Data lancent une collaboration afin d’expérimenter la solution d’anonymisation de données Avatar. Le projet mené avec Sopra Steria implique la mise à disposition de jeux de données personnelles. Octopize – Mimethik Data accompagne la réalisation de l’expérimentation grâce à son expertise d’anonymisation des données, tout en appuyant l’obtention de la preuve des résultats. Cette expérimentation permettra notamment de tester en conditions réelles la solution d’anonymisation Avatar, de nourrir la montée en compétences des équipes de Sopra Steria sur les sujets d’anonymisation et de sécurité des données, tout en démontrant la conservation des performances du modèle.
Une collaboration pour protéger les données personnelles
En plus d’apporter une protection supplémentaire sur les données personnelles, le projet rend possible l’entraînement de modèles de machine learning sur la base de jeux de données anonymisés. Pour Sopra Steria, la génération de données synthétiques représentatives des données sources sera créatrice de valeur. Les données anonymes
générées par Octopize conservent la structure et la qualité du jeu de données initial. Ainsi, confidentialité et utilité du jeu de données sont démontrées par les métriques mises en place par la start-up Octopize. La collaboration avec Sopra Steria ambitionne donc de maintenir les performances des modèles de prédiction, dans le respect de la confidentialité des individus.
Avatar pour révolutionner la gestion des données
Le respect de la confidentialité ainsi que la reproductibilité des résultats sont des enjeux majeurs du traitement des données personnelles. Aujourd’hui, pseudonymisation,
anonymisation, diverses techniques de renforcement de la sécurité des données sont des mesures largement évoquées pour révolutionner la gestion des données.
Ce projet permettra d’appronfondir une nouvelle approche pour garantir le respect de la confidentialité des données : les données synthétiques avatars. Générées de manière à ne présenter aucun risque pour les individus – puisqu’elles ne sont associées à aucune personne réelle – tout en maintenant la qualité et la valeur informative des données originales sur des aspects essentiels, ces données synthétiques permettent de multiplier les usages.
Estimations des erreurs, formations, appréhension de jeux de données complexes, ou encore réalisation d’études avec des résultats statistiquement pertinents : les données de synthèse constituent une vraie opportunité pour accélérer le développement de projets et améliorer la connaissance du marché par la valorisation des données.