Les systémes ETL

Lisez cet article pour en savoir plus sur les systèmes ETL (Extract, Transform, Load)

Par: Manfouo steve

I- Principes

Pour continuer dans la série de publications propres au monde du décisionnel, nous allons parler des ETL (extract transform load).
L'approche décisionnelle comme nous l'avons présenter dans l'article intitulé (Système d'Informations Décisionnels), est basée sur le principe qu'un ensemble de données disparates issues des bases de productions chacune liée à un métier intègrent le processus de décision de l'entreprise. L'idée étant de construire un magasin de données (Datawarehouse) assez général sur lequel les experts du domaine pourront avoir toutes les informations voulues.
Ainsi donc, pour l'alimenter cet entrepôt, on utilise une gamme ou multitude d'outils connus sous le nom de ETL (" Extract, Transform, Load "). Comme son nom l'indique, ces outils permettent d'extraire des données à partir de différentes sources, d'y effectuer des transformations (formatage, fusion, filtrages, etc.), et de les charger dans une nouvelle base cible connue sous le nom d'entrepôt ou datawarehouse.
Entre autre, un ETL permet :

- d'éviter la réalisation des traitements récurrents
- d'effectuer le mapping (correspondance entre attributs) des données issues de différentes sources de données homogènes

II- Outils ETL


On distingue une liste assez importante d'outils realisant les fonctions ETL.

" Pentaho bussiness suite
" Ascential DataStage (qui a acheté Mercator Inside Integrator)
" BusinessObjects Data Integrator
" Cognos DecisionStream ( Data Manager)
" ETI (Evolutionary Technologies International)
" Talend open studio
" IBM DB2 Data Warehouse Manager
" Informatica (PowerCenter et SuperGlue)
" Microsoft SQL Server DTS
" Oracle Warehouse Builder


III- L'ETL Vs l'ELT

Ces deux notations, bien que similaires du point de vue des termes qui les composent à savoir (extraction, transformation et chargement (Load)) sont en fait deux modes complètement différents de fonctionnement.
On parlera d'ETL lorsque chaque serveur distinct se voit installé un moteur ou engine. C'est ce dernier qui réalise toute l'activité de l'ETL à savoir les transformations et filtrages sur les données qu'il a extraites des sources. Une fois cela réalisé, il les charge dans une cible qui lui à été indiqué (notons bien que les données chargées sont préalablement traitées et filtrées par le moteur ETL).
On parlera d'ELT dans la mesure où un code sql est généré et ce dernier est natif à chaque moteur de base de données impliqué dans le processus source et cible.Ici, les fonctionnalités propres à chaque base de données sont exploitées pour effectuer et optimiser la réalisation des transformations sur les données qui lui sont fournies par le moteur ELT. Cela implique un certain nombre de préréquis à savoir les requêtes de transformation doivent respecter la syntaxe spécifique au SGBD en question. (Notons que ici le moteur extrait et charge (load) mais laisse le soin au SGBD cible d'effectuer les transformations).
Il est cependant possible de coupler les deux approches pour tirer partie des deux avantages.


IV- catégories d'ETL

Actuellement trois catégories d'outils ETL existent

a- Engine-based : les transformations sont exécutées sur un serveur ETL, disposant en général d'un référentiel. Ce genre de d'outil dispose d'un moteur de transformation ;
b- Database-embedded : les transformations sont intégrées dans la BD ;
c- Code-generators : les transformations sont conçues et un code est généré. Ce code est déployabe indépendamment de la base de données.

V- Avantages des suites ETL

Nous ne citerons ici que quelques uns:

- Production automatique par le référentiel de l'ETL des rapports de mise en correspondance de données et d'analyse des dépendances
- Très bonne performance des outils ETL surtout lorsqu'il s'agit de masses importantes de données.
- Gestion le cas échéant des scénarios d'équilibre de charge entre serveurs par les ETL
- Développement simple, moins coûteux etc...

VI- Conclusion

Cet article présente le principe ETL dans l'architecture du décisionnel. L'on présente à quel niveau le moteur ETL intervient et la portée de son action en occurrence selon le type d'ETL. Enfin les avantages et la comparaison ETL/ELT permettent aux futurs utilisateurs de cette technologie de bien s'en tirer déjà dans le choix mais aussi dans l'architecture à mettre sur pied.

A propos de l'auteur:
Manfouo .S - consultant en informatique yaoundé-CMR

Fourni par ArticlesEnLigne : Annuaire d'articles gratuits - Contenu libre

Articles Régionaux
- Les systémes ETL Ain
- Les systémes ETL Aisne
- Les systémes ETL Allier
- Les systémes ETL Alpes-de-Haute-Provence
- Les systémes ETL Alpes-Maritimes
- Les systémes ETL Ardèche
- Les systémes ETL Ardennes
- Les systémes ETL Ariège
- Les systémes ETL Aube
- Les systémes ETL Aude
- Les systémes ETL Aveyron
- Les systémes ETL Bas-Rhin
- Les systémes ETL Bouches-du-Rhône
- Les systémes ETL Calvados
- Les systémes ETL Cantal
- Les systémes ETL Charente
- Les systémes ETL Charente-Maritime
- Les systémes ETL Cher
- Les systémes ETL Corrèze
- Les systémes ETL Corse-du-Sud
- Les systémes ETL Côte-d'Or
- Les systémes ETL Côtes-d'Armor
- Les systémes ETL Creuse
- Les systémes ETL Deux-Sèvres
- Les systémes ETL Dordogne
- Les systémes ETL Doubs
- Les systémes ETL Drôme
- Les systémes ETL Essone
- Les systémes ETL Eure
- Les systémes ETL Eure-et-Loir
- Les systémes ETL Finistère
- Les systémes ETL Gard
- Les systémes ETL Gers
- Les systémes ETL Gironde
- Les systémes ETL Haute-Corse
- Les systémes ETL Haute-Garonne
- Les systémes ETL Haute-Loire
- Les systémes ETL Haute-Marne
- Les systémes ETL Hautes-Alpes
- Les systémes ETL Haute-Saône
- Les systémes ETL Haute-Savoie
- Les systémes ETL Hautes-Pyrénées
- Les systémes ETL Haute-Vienne
- Les systémes ETL Haut-Rhin
- Les systémes ETL Hauts-de-Seine
- Les systémes ETL Hérault
- Les systémes ETL Ille-et-Vilaine
- Les systémes ETL Indre
- Les systémes ETL Indre-et-Loire
- Les systémes ETL Isère
- Les systémes ETL Jura
- Les systémes ETL Landes
- Les systémes ETL Loire
- Les systémes ETL Loire-Atlantique
- Les systémes ETL Loiret
- Les systémes ETL Loir-et-Cher
- Les systémes ETL Lot
- Les systémes ETL Lot-et-Garonne
- Les systémes ETL Lozère
- Les systémes ETL Maine-et-Loire
- Les systémes ETL Manche
- Les systémes ETL Marne
- Les systémes ETL Mayenne
- Les systémes ETL Meurthe-et-Moselle
- Les systémes ETL Meuse
- Les systémes ETL Morbihan
- Les systémes ETL Moselle
- Les systémes ETL Nièvre
- Les systémes ETL Nord
- Les systémes ETL Oise
- Les systémes ETL Orne
- Les systémes ETL Paris
- Les systémes ETL Pas-de-Calais
- Les systémes ETL Puy-de-Dôme
- Les systémes ETL Pyrénées-Atlantiques
- Les systémes ETL Pyrénées-Orientales
- Les systémes ETL Rhône
- Les systémes ETL Saône-et-Loire
- Les systémes ETL Sarthe
- Les systémes ETL Savoie
- Les systémes ETL Seine-et-Marne
- Les systémes ETL Seine-Maritime
- Les systémes ETL Seine-Saint-Denis
- Les systémes ETL Somme
- Les systémes ETL Tarn
- Les systémes ETL Tarn-et-Garonne
- Les systémes ETL Territoire de Belfort
- Les systémes ETL Val-de-Marne
- Les systémes ETL Val-d'Oise
- Les systémes ETL Var
- Les systémes ETL Vaucluse
- Les systémes ETL Vendée
- Les systémes ETL Vienne
- Les systémes ETL Vosges
- Les systémes ETL Yonne
- Les systémes ETL Yvelines
Voir Aussi
- Systèmes d'information décisionnels
Lisez cet article pour tout savoir sur les systèmes d'information décisionnels ou Business Intelligence (BI).
- Installer Linux