Data Science : tout ce qu'il faut savoir pour commencer votre projet

damien.carlhian@solution-bi.com 22 juin 2022

Par Emma DAMITIO,

Directrice IA - Data Scientist // Solution BI Canada

 

1 - Qu’est-ce que la data science ?

La data science est une discipline qui combine des méthodes scientifiques et la programmation informatique dans un seul but : augmenter les connaissances et amener de la valeur ajoutée. Cela peut se faire grâce à la mine d’or que les entreprises possèdent – leurs données. Il existe un tas de données de différents types dans une entreprise, elles peuvent être structurées ou non, interne ou externe. Les ventes par produit, les salaires des employés ou les coûts d'occupation sont des exemples de données.

La science de donnée utilise différentes méthodes ( voir la figure ci-dessous)

 

Pour créer de la valeur ajoutée ou de la valeur business, il faut interpréter et exploiter à leurs pleins potentiels les données et c’est là que rentre un jeu le data scientiste.

Il n’y a pas de définition unanime de la Data Science, chaque cas, projet ou pratique nous amènent dans des utilisations, des techniques et des besoins d’outils différents. Réduire la data science à une définition est toujours compliquée et risquée.

Ce qui est certain c’est qu’une des premières étapes lorsqu’on parle de data science est la vulgarisation. On n’en simplifie pas pour autant l’explication – on rend juste plus audible pour les non-initiés les grands principes de la data science. La démocratisation de cette discipline va permettre aux entreprises d’avoir des avantages concurrentiels, d’optimiser des processus et / ou d’améliorer des produits ou services.

Pour faire simple, la data science ne se traduit pas au travers d’outils mais grâce à des bonnes pratiques et de la simplicité. C'est par là que tout commence pour en arriver au cœur de notre métier : Créer de la valeur business grâce à la donnée pour une prise de décision optimale.

 

2 – Pour qui est la data science ?

Si on généralise l’état actuel des choses, il y a 3 niveaux d’entreprises par rapport à leurs maturités et leurs utilisations de la donnée :

Les « avancés »

Une ligne directrice Data-Driven est établie, les besoins sont connus et les projets avancent pour créer de plus en plus de valeurs.

Les objectifs : définir les bons uses cases pour que la valeur créée soit vraiment utile aux différents métiers.

Les défis : uniformiser le niveau d’utilisation et de compréhension de la donnée dans toute la sphère de l’entreprise.

 

Les « demandeurs »

Il y a une connaissance du domaine et ce que ça peut apporter à l’entreprise mais les termes et les méthodes sont flous, vagues et trop souvent, dans l’imaginaire, destiné aux plus gros

Les objectifs : définir les premiers projets qui vont être des cas assez simples et qui vont amener de la valeur ajoutée rapidement pour prouver les avantages à la direction.

Les défis : ne pas brûler des étapes. Il faut construire les projets par itération pour ne pas perdre le but : développer un outil ou une solution qui va avoir une vraie valeur business

 

Les « retardataires »

Ceux qui ne mettent pas la donnée au centre de leurs priorités

Les objectifs : mobiliser les parties prenantes pour montrer l’enjeu majeur de centraliser la donnée et de vérifier la qualité afin d’exploiter cette mine d’or.

Les défis : ne pas aller trop vite et être patient car c’est un projet de longue haleine – une infrastructure adéquate, une analyse des données sont les premières étapes de ce grand projet. Pour imager la pratique : « Il faut commencer par construire des fondations solides de la maison avant de vouloir poser le toit »

 

Des exemples d’utilisation accessibles à toutes les entreprises ayant de la donnée entreposée et de bonne qualité :

 

3 – Quel est le processus de la data science ?

Il y a différentes étapes et il ne faut en minimiser aucune. Tout cela doit s’accompagner de beaucoup de pédagogie pour assurer la compréhension essentielle des contributeurs et utilisateurs afin que la solution soit utile et utilisable.

 

La compréhension des enjeux métiers :

Quantifier la qualité des données, identifier les processus et l’utilisation de la donnée par les métiers et définir les meilleurs « use cases » pour amener de la valeur BUSINESS. Une fois le projet bien défini avec les besoins, les solutions et la restitution. On peut lancer la mise en œuvre.

 

La mise en oeuvre :

En 4 grandes étapes, le projet avance vers l’objectif.

Le travailler par itération assure ici une première livraison dans un délai raisonnable, ce qui permet de vérifier que la chaine « end-to-end » est valide et que la livraison correspond aux attentes. Par la suite, la solution est améliorée pour augmenter la performance.

1. Analyse exploratoire des données : 50 % du travail pour la mise en œuvre - comprendre la donnée - la nettoyer pour la rendre la plus pertinente - la transformer - construire le dataset de travail - analyser les corrélations - etc.

2. Choisir & entraîner les modèles : 20 % du travail - faire le meilleur choix technique selon l’itération - trouver le meilleur équilibre pour l’utilisateur

3. Valider les modèles : 5 % du travail - présentation et vulgarisation pour que le plus grand nombre d’utilisateurs se l’approprie

4. Mettre en production : 25 % du travail - s’assurer de la bonne restitution et du maintien de la mise à disposition pour les utilisateurs – déploiement du processus de MLOps pour assurer la pérennité de la solution

 

 

Lire également  

Intelligence artificielle : où en est-on vraiment ? 

5 conseils pour s'engager sur la voie de l'IA

Lexique Data : on vous aide à y voir plus clair !

Partagez cet article

Nos Actus

informatique décisionnelle analyse de données Business Intelligence Actualité Business Intelligence force de vente digital native consultant
30 juin 2017
Quel plan de carrière pour un consultant BI ?

Peur de l’immobilisme ? Bonne nouvelle, si vous êtes consultant BI, vous avez fait le choix d’une carrière pleine de rebondissements.

informatique décisionnelle microstrategy analyse de données Business Intelligence Actualité Business Intelligence consultant
28 avril 2017
Suis-je prêt pour un projet BI

Envie de vous laisser tenter par un projet BI ? Ça tombe bien, 2017 sera l’année de la data. Mais êtes-vous prêt à relever le challenge ?

data driven
7 septembre 2021
Lexique Data : on vous aide à y voir plus clair !

Vous trouvez qu’il est parfois difficile de s’y retrouver dans le jargon de la data ? Vous n’êtes pas seul.e ! La data science et l’analytique...