Partager :

Les Instants Infeeny : Azure Data Lake

Les Instants Infeeny : Azure Data Lake

Echange Infeeny autour de notre offre Azure Data Lake où comment piloter son entreprise autrement et innover grâce au Cloud Microsoft Azure

Découvrez notre offre Azure Data Lake ici.

Transcription de l’interview vidéo
Les Instants Infeeny : Azure Data Lake

Guillaume Rochette, Directeur Général Infeeny & Frédéric Brossard, Directeur adjoint de la Practice Data Experience Infeeny

Guillaume : Bonjour Frédéric

Frédéric : Bonjour Guillaume

Guillaume : Frédéric tu es consultant senior dans la Practice Data Experience chez Infeeny

Frédéric : Exactement

Guillaume : Et on va parler aujourd’hui de toute l’offre Data Lake sous Azure

Frédéric : Ouais

Guillaume : Aujourd’hui nos clients sont confrontés à une explosion des données. Quels sont selon toi les bénéfices de l’offre Azure Data Lake ?

Frédéric : Alors déjà on va parler d’Azure en termes de capacité, d’élasticité puisque généralement on va orienter nos clients sur une plateforme de cloud public de par son élasticité et sa capacité du coup à répondre à des volumes changeants et à des capacités de traitement et d’analyse de façon croissante ou décroissante et là-dessus Azure va nous permettre de répondre à ces différentes problématiques là. Après on constate aussi au niveau de la data que l’on a une explosion en fait des volumes et du type de données qu’on va être amené à manipuler autour de la data et là-dessus il nous faut deux types, de grandes catégories de services. On va dire déjà une première catégorie de services d’entreposer et de stocker la donnée. Là-dessus on va se baser sur un service qui s’appelle Azure Data Lake Store et après derrière de pouvoir exploiter et donc d’analyser cette donnée avec différents services Azure et là-dessus on va avoir une pléthore de choix avec de l’HDInsight en utilisant du Spark, de l’Azure Data Lake Analytics et après derrière pouvoir exploiter cette donnée là soit dans un entrepôt de données comme l’Azure SQL Data Warehouse de façon à pouvoir ressortir de la DataViz avec du Power BI ou autre et de redescendre après derrière les données dans des applicatifs métiers ou autres.

Guillaume : D’accord. Quid de la sécurité qui est un élément important chez nos clients surtout quand on parle de leurs données un peu métier…

Frédéric : Alors la sécurité et la gouvernance c’est toujours un aspect très fort au niveau de la data. Là-dessus au niveau du stockage de la donnée en fait Azure Data Lake Store il faut vraiment le voir comme un stockage distribué sur lequel derrière on va pouvoir organiser la donnée dans différents dossiers et sous-dossiers et donc attribuer l’accès en lecture, écriture et exécution à certains types d’utilisateurs, à certains utilisateurs, groupes utilisateurs ou autres. Donc on va pouvoir en fait adapter cette sécurité d’accès en fonction des différents groupes de sécurité qu’on va vouloir mettre en œuvre. Et après derrière sur les différents services analytiques idem on va pouvoir attribuer à ses différents services analytiques le droit d’exécution à telle ou telle personne.

Guillaume : Aujourd’hui sur les offres, le catalogue d’offres comment finalement l’avez-vous articulé ? Qu’est-ce que vous proposez finalement à nos clients ?

Frédéric : Alors au niveau de nos clients on propose différentes phases au niveau du montage de l’offre et du passage sur une vision Data Lake sur Azure. On va avoir une première offre de conseil et d’audit sur lequel on va accompagner soit sur un audit de l’existant donc voir un petit peu ce qui a été monté sur Azure ou sur un Cloud tierce concurrent comme de l’Amazon ou autre. Donc voir un petit peu ce qui a été monté, les conseiller vers une optimisation en fait de leur architecture et de leur infrastructure pour les orienter vers de nouveaux usages et les conseiller aussi sur une nouvelle vision de la data parce que généralement nos clients on une forte culture en fait de l’analyse descriptive donc traditionnellement et une analyse BI classique et on cherche à les orienter vers des usages un peu plus modernes et un peu plus avancés comme de l’analyse prédictive de façon à mettre du Machine Learning et de l’analyse prescriptive. Prévoir ce qui peut se passer et prévoir qu’elles seront les meilleures actions à envisager pour les meilleurs résultats possibles et donc essayer de valoriser au mieux la data.

Guillaume : Donc on les conseille, on construit avec eux et comment finalement on les accompagne dans le temps sur des plateformes qui vivent ?

Frédéric : Une fois qu’on a fait cet audit et ce conseil et qu’on a pu designer en fait une première architecture on va pouvoir les accompagner sur la réalisation du projet donc la mise en œuvre de la première partie c’est-à-dire l’infrastructure sur Azure, la sécurisation et la gouvernance qui va bien avec. Et ensuite après derrière toute la réalisation projet donc ça va être la mise en place de factory qui permettent d’injecter la donnée directement dans le Data Lake, la mise en place des flux de préparation, de nettoyage de la donnée, des algorithmes de Machine Learning donc des modèles prédictifs, l’exposition en fait de ces données et on va pouvoir les accompagner sur toute la réalisation du projet ou sur une partie pour compléter leurs équipes projet déjà en place. Et une fois que le projet a été mis en production on va pouvoir via notre équipe de TMA les accompagner en poste projet pour tout ce qui est du coup maintenance évolutive et corrective sur le projet une fois livré.

Guillaume : D’accord. Donc ce sont des métiers qui sont extrêmement près finalement du métier de nos clients, peut-être le plus proches du métier de nos clients dans l’IT. Est-ce que tu peux nous raconter tes deux dernières expériences pour illustrer un petit peu ses métiers de la data ?

Frédéric : On va pouvoir illustrer mes deux dernières expériences avec une approche un petit peu BI classique traditionnelle sur laquelle on a orienté notre client sur la mise en place d’un Data Lake. Pourquoi ? Déjà pour deux raisons, la mise en place d’une culture de la donnée au sein de l’entreprise donc « désiloter » la donnée et la rendre plus accessible à plus de gens en fait dans l’entreprise et après derrière pouvoir proposer en fait une architecture complètement sans serveur donc ce que va nous permettre en fait Azure c’est d’avoir des services entièrement managés par Microsoft donc sans coûts d’exploitation matériels, logiciels et donc entièrement déportés côté Microsoft et on va se recentrer uniquement sur le projet et use case du métier. Donc là-dessus on est plutôt sur, dans cet exemple-là, la mise en place d’une plateforme en fait d’analyse de pilotage financier, des portefeuilles projets et on s’est attaché à collecter en fait l’ensemble des informations de l’entreprise, les mettre à disposition de sur le Data Lake, les transformer, les modéliser pour les mettre en place dans un Data Warehouse de façon à diffuser plus largement en fait la data chez notre client et que les utilisateurs métiers puissent in fine produire eux-mêmes leur reporting à l’aide de Power BI.

Guillaume : Comment vous avez rendu finalement ces équipes métiers qui ne sont pas forcément IT un peu autonomes ?

Frédéric : Donc pour les rendre plus autonomes sur cette partie BI Self-Service en fait on les a accompagné avec plusieurs slots de formation pour qu’ils montent en compétence en fait sur le projet Power BI de façon à les rendre autonomes sur la production de reporting donc la modélisation, la mise en place d’indicateurs et une fois ces modèles définis la publication sur le service Power BI et la diffusion à l’ensemble des collaborateurs souhaités.

Guillaume : D’accord.

Frédéric : Un autre cas mais là plutôt orienté sur du Machine Learning. Donc on a revu complètement l’architecture qui avait été mise en œuvre chez un client dans le cadre d’une analyse prédictive en fait des ventes tout ça pour mieux prédire en fait le comportement d’achat des clients et anticiper au mieux les changements d’activité donc de produits achetés et autre et diminuer du coup le coût de stock qu’on va pouvoir avoir et les flux entre les différents entrepôts. Donc là on a revu complètement l’architecture Azure qui avait été mise en place de façon à pouvoir l’industrialiser de bout en bout et de provisionner à la volée en fait les différents services Azure uniquement au besoin. Et donc du coup de diminuer le coût de consommation Azure et de provisionner à chaque fois chaque brique en fonction de son usage lors du besoin du traitement de la data.

Guillaume : Vous venez vraiment finalement impacter le business model de nos clients et dans l’optimisation…

Frédéric : Dans l’optimisation, la rentabilité et juste utiliser à chaque fois le service Azure pour ce qu’il est fait et quand on en a besoin.

Guillaume : Ok

Frédéric : De pouvoir le faire évoluer en conséquence. Soit augmenter sa consommation parce qu’on a besoin, pendant un temps bien précis, de plus de puissance de calcul pour diminuer les temps de traitement et réduire ou détruire complètement le service si on n’en a plus besoin une fois que la donnée à été traitée.

Guillaume : Ok. Quels sont les points différenciant finalement des équipes Infeeny ?

Frédéric : Alors les équipes Infeeny en fait, nos équipes sont… on est une BU en fait qui est constituée d’une trentaine de collaborateurs, la plupart certifiés mais tous spécialisés autour de la data mais de la data Microsoft. On n’est pas généraliste, on ne dit pas qu’on sait tout gérer par contre ce qu’on sait faire et ce qu’on sait faire de bien c’est gérer des projets data sur les technologies Microsoft. Sur cette trentaine de collaborateurs là on distingue en plus deux MVPs donc des gens qui sont reconnus pour leur investissement au sein de la communauté Microsoft et on a quatre P-Sellers qui sont capables d’assister en fait les équipes de Microsoft en tant qu’avant-vente technique sur ces projets data et notamment sur ces projets Data Lake sur Azure.

Guillaume : Entendu. Pour conclure ce qu’on peut estimer c’est que finalement votre passage dans une entreprise vient modifier finalement sont fonctionnement, sa capacité d’autoanalyse et c’est aussi finalement le départ de nouveaux projets ou de nouveaux usages non ?

Frédéric : Oui c’est le départ de nouveaux projets, de nouvelles perspectives parce que c’est ce qui va aussi pousser en fait les utilisateurs de la donnée à se poser de nouvelles questions et de se dire ben comment on va valoriser au mieux la data et comment je vais pouvoir aller plus loin. C’est vrai qu’il y a encore certaines années on se disait que le Machine Learning c’était pas pour nous, que c’était de la science-fiction et autre c’est vrai que maintenant, plus on aborde ces notions-là plus les usagers, les différents métiers se disent mais oui comment on n’y a pas pensé plus tôt et comment je vais pouvoir valoriser au mieux mes process et ma data.

Guillaume : C’est le berceau de l’intelligence artificielle ?

Frédéric : C’est le berceau, c’est vraiment la naissance de l’intelligence artificielle qu’on est en train de faire naitre.

Guillaume : Très bien. Merci beaucoup Frédéric pour ces explications

Frédéric : Merci à toi.

Guillaume : Merci.

Découvrez notre offre Azure Data Lake ici

Comment démarrer ?

+ de 300 personnes à votre disposition, n'hésitez pas, contactez-nous !
Parlons ensemble de votre objectif et des outils et solutions qui peuvent vous permettre d'y répondre et construisons ensemble vos projets d'analyses de vos données