Watch full webinar here: https://buff.ly/48x0LqY
Pour le salon Big Data Paris qui s'est tenu les 28 et 29 septembre 2021, Christophe Leclerc, Directeur Data Science du Groupe Orano est revenu sur le déploiement de la solution Denodo sur son site de la Hague. Avec notre ingénieure avant-vente Emily Sergent, C. Leclerc a abordé les points-clés suivants :
- Qu’est-ce que la virtualisation des données et pourquoi la solution Denodo ?
- Le positionnement Denodo vs Data Lake
- Les cas d’usage actuels au sein de l’usine de la Hague
Le tout est suivi d'une démonstration technique.
3. Agenda
1. Qu’est-ce que la virtualisation des données et
pourquoi la solution Denodo ?
2. Les cas d’usage actuels au sein de l’usine de la Hague
3. Présentation et démo technique live
4. Questions/réponses
4. Qu’est-ce que la virtualisation des
données et pourquoi la solution
Denodo ?
5. La Data Virtualisation
vers une DATA
collaborative
Christophe Leclerc
Expertise leader (data management, process control)
Orano La Hague Reprocessing plant
DT-E-DS : Technical Direction - Expertise - Data Science
Mail: christophe.leclerc1@orano.group
6. ▪ 2 usines de retraitement des combustibles nucléaires usés
▪ 30 ans d’activité industrielle
6
Orano La Hague
Quelques chiffres
▪ 24 ateliers de production
▪ 500 000 équipements majeurs
▪ > 1 000 automates industriels
▪ > 400 applications informatiques
▪ > 2 000 000 tags industriels
Non recyclable:
4% Produits de fission
Recyclable:
95% Uranium
1% Plutonium
Réception
piscines
Cisaillage
Dissolution
Compactag
e
Séparation
U/Pu/PF
Vitrificatio
n
Purificatio
n
Uranium
Purificatio
n
Plutonium
Nitrate
d’uranyl
e
Plutoniu
m
PuO2
Produits
de
fission
Parties
métalliq
ues
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Revaloriser les matières nucléaires
7. Les applications ne suffisent jamais
▪ Dans les formulaires / rapports prédéfinis
▪ Besoins en extraction manuelle permanents
Aux limites des silos
▪ Besoins en consolidations complexes
▪ A cause de clés hétérogènes…
Le partage sémantique
▪ Connaissance de l’existence
▪ De leur signification (et équivalences)
7
De l’usage avancé de la data ?
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Par obligation, nous
avons une culture de la
conservation des
données. Sait-on les
valoriser en proportion
pour autant ?
AVOIR ?
POUVOIR ?
SAVOIR ?
A la reconquête de nos données
Pour nos usages et par nous mêmes
En version démocratisée & sécurisée
Sommes nous « big data » compliant ?
8. 8
Démocratiser les accès (ambitions)
+ +
A
B
a
c
e
A
e
c
B
B
E
f
A
B
E B
C
F
?
(what)
get
(where)
ok
(cleaning)
AI…
analysis
more
(addings)
? get ok AI…
analysis
more
(addings)
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Associations
Capitalisation
Esperanto
Résilience
Un cahier des
charges…
9. 9
Démocratiser les accès (comment)
Rendre accessibles toutes nos données
Quelles que soient leur origine et leur nature
En conjuguant tous les périmètres métiers
Pour des usages variés (sujets, fonctions)
Sans révolutionner le SI actuel (coûts, délais)
123
ABC
a4x
Producteurs
Consommateurs
Maintenance
Logistique
Expertise
Utilités
Procédé
Laboratoires
La Data Virtualisation nous offre
la réponse technologique
(solution choisie : Denodo)
Sa mise en œuvre doit être accompagnée par une
organisation et des méthodes (= gouvernance)
Médiation
de
données
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Un scénario à court terme
10. 10
Démocratiser les accès (modalités)
Voie protégée pour connecter
nos sources de données
Base ou fichier
Médiation
Requêtage
(+extraction)
Cartographie Mise à disposition
Excel Reporting
(PowerBI, Tableau…)
Data Science
(Knime, python…)
Application
Base ou fichier Base ou fichier Base ou fichier
Possibilité de connecter les outils
adaptés à nos besoins (DS, DA…)
D’une organisation informatique
imposée et subie
(en partie fixée par les progiciels)
A une structuration
métier décidée
(liée à nos « intangibles »)
Rapports
KPIs
Calculs Modèles
Corrélations
Performances
Fonctions
ERP EAM PLM
Excel Legacy
MES LIMS
Cadences
Analyses
Stocks Bâtiments
Opérations
Produits
Rondes
Sources
Objets
Usages
Graphiques
Habilitations
Programmes Actes
Listings
Contrôles
Plannings
Règles
KPI
Personnes
Naming
GDPR
Workflow
Un middleware « data »
avec une gouvernance
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Une architecture à déployer et déployée
11. T2 2019 : appels à candidature, la Data Virtualisation répond à la « médiation de données » demandée face à du spécifique, de
l’ETL, du Data Lake, du full cloud
T3 2019 : POC grandeur nature sur 9 bases en production dans un bac à sable fonctionnel, verdict positif, lancement du projet
T1 2020 : études de sécurité, schémas d’architecture, scénarios d’usage, validations
T3/T4 2020 : infrastructures mises en place, écosystème gréé (Citrix, Git, workflow, badges/certificats, disques sécurisés, driver
ODBC sécurisé), conformité OPI2 (niveau 2 de protection de l’information Orano)
T1 2021 : connexions des principales sources de données (LDAP, SAP, 75 bases SQL (Oracle, SQL Server, Postgresql, MySql), 50
sources API, 20 du type fichiers)
T2 2021 : mise en place des 1ères formations et use cases (16 bases virtuelles, plus de 25 000 vues de base, 500 vues
intermédiaires, 200 vues publiées à ce jour, 120 profils de sécurité, 4 applications clientes dont 1 externe)
T3 2021 : l’heure de la gouvernance
11
Planning & situation actuelle
Infrastructures
Accès aux
données
Hommes &
femmes
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Un état des lieux et son historique
12. 12
Collecte de données automatisée
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Tous les chiffres sont factices
• Passage du réseau industriel au réseau bureautique
• Assemblage de données laboratoires et données procédé
• Exécution par un simple bouton
• Restitution des résultats dans un format usuel (Excel)
SQL API
Illustration
13. 13
Extension du SI Data
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Comment rendre accessibles des
données Excel « à audience limitée »,
transmises plusieurs fois par an à
d’autres entités tout en conservant la
maîtrise de cette gestion
« Sanctuarisation / visibilité »
Mise en relation de ces données avec le
suivi laboratoire facilitée, un accès
unique et direct, plus de manipulations
Excel complexes
Périmètre étendu & public
Illustration
14. 14
Introspection & gouvernance
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Grâce à l’introspection DENODO et aux
conventions adoptées en interne
Suivi de l’avancement
Identification des faiblesses sécurité
Identification des faiblesses qualité
Un support à la gouvernance
Contrôle des orphelins
15. 15
Une aventure en construction
Des illustrations qui se multiplient
Avec l’adhésion de tous les métiers : opérations, maintenance, laboratoires, environnement, dosimétrie, supply chain…
Des difficultés minimes
Une phase d’installation un peu « complexe », un écosystème complet à maîtriser, une formation à « construire »
Montée en puissance dans l’organisation
Perception des rôles (data steward, data owner…), collaborations inter BUs, nominations en cours
Des liens qui se tissent
Vers le Data Catalog groupe via exports, avec des outils de gestion de données plus puissants qu’un simple tableur
Merci de votre attention
Orano Cycle La Hague - C.Leclerc - Vers une Data collaborative
via la Data Virtualisation - Salon Big Data Paris 2021
Des perspectives
17. 17
CONNECTER, COMBINER & CONSOMMER
Ventes
RH
COMEX
Marketing Apps/API
Data Science
AI/ML
Data Virtualization : Une plateforme de données moderne
Connecter
✔ Accès en temps réel à des sources de données variées
✔ Tirer parti de la puissance des technologies existantes
✔ Maîtriser la complexité des formats de stockage et des protocoles
d’accès
Combiner
✔ Construire des vues qui ciblent les besoins et cas d’usage métier
✔ Accès à la demande à travers un optimiseur de requêtes
✔ Gouvernance et sécurité appliquées de manière transparente
Consommer
✔ Accès SQL : JDBC, ODBC et ADO.NET
✔ Data Services : SOAP, REST, OData, GraphQL
✔ Libre service et exploration : Data catalog intégré
18. 18
Plateforme de virtualisation de données Denodo
Vues
de base
Vues
standardisées
Vues métiers
Sécurité, couche sémantique et optimiseur de
requêtes
Sources
de données
Consommateurs
Ventes
RH
COMEX
Marketing Apps/API
Data Science
AI/ML
19. 19
Les cas d’usage de la Data Virtualization
DU STOCKAGE & MANAGEMENT, À LA CONSOMMATION, EN PASSANT PAR LA GOUVERNANCE ET LA
SÉCURITÉ
DÉCISION
NEL
(Multi-outil
)
VUES 360
(Clients,
KYC…)
BI AGILE
(SELF-SERVICE)
DATA
SCIENCE
(ML & AI)
APPS
(MOBILE & WEB)
FUSIONS &
ACQUISITIONS
DATA
MARKETPLACE
RÉGLEMENTATIONS
(IFRS17, GRC)
GOUVERNANCE
& SÉCURITÉ
APIFICATION
(& SQLIFICATION)
COUCHE DONNÉE
UNIFIÉE
AGILITÉ
& SIMPLICITÉ
ACCÈS
TEMPS-R
ÉEL
ABSTRACTION
DONNÉES
ZÉRO
RÉPLICATION
DATA
CATALOG
PERFORMANCES
OPTIMISÉES
LOGICAL DATA
WAREHOUSE/LAKE
BIG DATA
FABRIC
HYBRID
DATA FABRIC
DATA
INTEGRATION
DATA
MIGRATION
REFACTORING &
REPLATFORMING
CONSOMMATION DE LA
DONNÉE
STOCKAGE & INFRASTRUCTURE DE LA
DONNÉE
GOVERNANCE, MODÉLISATION ET ACCÈS
Sales
HR
Executive
Marketing Apps/API
Data Science
AI/ML
API
20. 20
Scénario de la démo
Quel est l'impact d'une nouvelle
campagne de marketing ?
▪ Les données historiques sur les ventes
dans un Cluster Hadoop pour un
stockage à moindre coût
▪ Les campagnes de marketing gérées
dans un application cloud externe
▪ Les données client stockées dans un
entrepôt de données Oracle
JOIN
GROUP BY
JOIN
Ventes Marketing Client
API
Data Catalog
Visualisation
(2.8M enr.) (100K enr.)
(300 enr.)
21. 21
En conclusion
• Fiabilité des données
▪ Diminuer la réplication et augmenter la pertinence
• Flexibilité pour les utilisateurs métiers
▪ Accéder à toutes les données de l'entreprise en libre-service avec les outils de
leur choix
• Flexibilité pour l’IT
▪ Assurer la modernisation des applications et la migration vers le cloud sans
interruption de service
• Contrôle et gouvernance pour la gestion des données
▪ Renforcer la sécurité, réduire les risques et assurer la conformité
La virtualisation des données peut vous aider à tirer parti des points forts des diverses
technologies de sources de données tout en garantissant :
22. 22
“Product strategy focused on logical and distributed
architectures: Denodo enables its customers to connect
distributed data through business-friendly semantic models
that decouple data from its location and physical schemas. It
reflects a longtime focus and strength in data virtualization that
enables agile data integration and delivery.”
2021 Gartner Magic Quadrant for Data Integration Tools
Gartner : Denodo nommé Leader et “Customers’ choice”
Denodo est l'un des deux fournisseurs
à recevoir le “Customers’ choice” pour
2021, parmi les 17 fournisseurs inclus
dans ce rapport, avec une note globale
moyenne de 4,6 sur 5,0 au 31
décembre 2020, sur la base de 56 avis
reçus.
62% < 3 mois 91% < 6 mois
Projets Denodo : - Gartner Peer Insights, Data Integration
2018
Read the full report on our web site.
23. Clients
• 900+ actifs
• F500, G2000 & Start-ups
Santé financière
• $4B+ Fond privé (HGGC).
• 60+% croissance annuelle; Zéro dette;
Rentable.
Présence Denodo
• Palo Alto (USA) & A Coruña (Espagne)
• Présence mondiale
Leadership
• A l’origine et « Pure Player » de la data
virtualization depuis 1999
• Reconnaissance des analystes et du marché
en tant que leader (Forrester, Gartner,
Clients depuis 6+ ans)
• Nombreux prix
Denodo Technologies
Leader & Pionnier de la Data Virtualization
Technologie
Industrie
Service financier
Assurance
Santé
Secteur public
Télécommunication
Distribution
Pharma / Bio-Tech
Energie
24. Denodo Technologies
Leader & Pionnier de la Data Virtualization
Technology Partners
System Integrators & Solution Consultants
Clients
• 900+ actifs
• F500, G2000 & Start-ups
Santé financière
• $4B+ Fond privé (HGGC).
• 60+% croissance annuelle; Zéro dette;
Rentable.
Présence Denodo
• Palo Alto (USA) & A Coruña (Espagne)
• Présence mondiale
Leadership
• A l’origine et « Pure Player » de la data
virtualization depuis 1999
• Reconnaissance des analystes et du marché
en tant que leader (Forrester, Gartner,
Clients depuis 6+ ans)
• Nombreux prix
25. 25
Pour aller plus loin
Commencer à connecter vos propres sources de données avec la plateforme Denodo !
Denodo Express
• Version gratuite et allégée
pour
une installation partout
• Téléchargeable ici
Evaluation
collaborative
Contactez-nous !
Denodo Standard
Free Trial
• 30 jours d’évaluation
offerts
• Accessible ici sur le
fournisseur