Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
Hervé Couturier EVP, SAP Technology Development
Hervé Biausser Directeur de l’Ecole Centrale Paris
Bernard Liautaud Fondateur de Business Objects
Questions à: Hervé Couturier Hervé Biausser
Bernard Liautaud
CHAIRE SAP BUSINESSOBJECTS DE BUSINESS INTELLIGENCE
Marie-Aude AUFAURE
Enjeux scientifiques de la Business Intelligence
Sommaire
ü Quelques évolutions de la société de l’information et leur impact sur la Business Intelligence
ü Quelques questions posées au monde de la recherche
ü Zoom sur la représentation unifiée des données structurées et non structurées
Business Intelligence : de la donnée à la décision
Séman&que
Per&nence Crédibilité
Stratégie
Moyens d’ac&on
Exécu&on
connaissance décision
ac&on
données
informa&on
Facteurs de Changement
ü La nature de l’information
Facteurs de Changement
ü La manière d’interagir ensemble et avec l’information
Évolutions nécessaires pour la BI
ü Transformer toutes les données en information
ü Favoriser la simplicité d’utilisation ü Faciliter la collaboration ü S’intégrer avec les processus métier
Quelques problématiques à explorer
ü Comment rendre l’interaction avec l’information plus simple et plus efficace ?
ü Comment proposer une représentation
sémantique unifiée des données structurées et non structurées?
Interaction avec l’information
ü Mettre l’Utilisateur au centre ü Comprendre ses intentions ü Profil, modèle utilisateur, modèle situationnel
ü Visualisation décisionnelle ü Flexible et dynamique ü Visualisation de grandes masses de données
ü Simplifier les interfaces ü Questions/Réponses à la Google ou Wolfram Alpha
ü Recommandation et aspects collaboratifs ü Qualité de la recommandation ü Intégration des réseaux sociaux
Quelques problématiques à explorer
ü Comment rendre l’interaction avec l’information plus simple et plus efficace ?
ü Comment proposer une représentation
sémantique unifiée des données structurées et non structurées?
Extraction – Structuration en graphe
Couche Sémantique
Couche Requêtes
Représentation sémantique unifiée
ü Couche sémantique : ontologies ü Modèle de connaissances ü Description en intension et extension
ü Concepts, relations, instances, axiomes
ü Définies de manière plus ou moins formelle
ü Construction manuelle des ontologies de domaine : processus long et coûteux ü Automatiser la construction ü Méthodologies d’apprentissage existantes pour
chaque type de sources de données
ü Exemple : apprentissage collaboratif
Apprentissage collaboratif d’ontologies ü Requêtes posées par 2 utilisateurs
ü « What are the languages used for OLAP Analysis? » ü « What is MDX? »
ü Extraction d’un graphe de requête
ü Création d’un module dans l’ontologie Business ü Requêtes soumises au moteur de recherche
ü « OLAP languages », « OLAP + Analysis », « OLAP languages + Business »
ü Analyse des documents sélectionnés
? language is
OLAP Analysis used for
www.themegallery.com
Apprentissage collaboratif d’ontologies
Online analytical processing, or OLAP (pronounced /ˈoʊlæp/), is an approach to quickly answer multi-dimensional analytical queries.[1] OLAP is part of the broader category of business intelligence, which also encompasses relational reporting and data mining.[2] The typical applications of OLAP are in business reporting for sales, marketing, management reporting, business process management (BPM), budgeting and forecasting, financial reporting and similar areas. The term OLAP was created as a slight modification of the traditional database term OLTP (Online Transaction Processing).[3] Databases configured for OLAP use a multidimensional data model, allowing for complex analytical and ad-hoc queries with a rapid execution time. They borrow aspects of navigational databases and hierarchical databases that are faster than relational databases.[4] The output of an OLAP query is typically displayed in a matrix (or pivot) format. The dimensions form the rows and columns of the matrix; the measures form the values.
OLAP Online analytical
processing is
multi-dimensional analytical query
answer
Relational reporting
Data mining
Part-of Part-of
OLAP application
Business reporting
marketing MDX
OLAP database Analysis
language Microsoft
OLAP database querying
Used for
Used for
Developed by is
Apprentissage collaboratif d’ontologies
What is MDX ? Results
M D X ( M u l t i - D i m e n s i o n a l Expressions) is a language developed by Microsoft for the querying and analysis of multi-dimensional OLAP (On-Line Analytical Processing) databases.
recommandations
OLAP URL + MDX URL
Apprentissage collaboratif d’ontologies
MDX
OLAP database Analysis
language Microsoft
OLAP database querying
Used for
Used for
Developed by is
Représentation sémantique : axes importants
ü Mise en correspondance d’ontologies ü Résolution d’incohérences lors de
l’enrichissement d’ontologies ü Passage à l’échelle pour la construction
automatisée ü Qualité des ontologies ü Requêtes complexes sur les ontologies
Extraction – Structuration en graphe
Couche Sémantique
Couche Requêtes
Structurer le non structuré
ü Clustering numérique ü Regroupement d’objets dans des classes ü Basé sur des mesures de distance
ü Clustering conceptuel
ü Basé sur un langage de description ü Regroupe les objets en concepts selon leurs
propriétés communes ü Conserve la sémantique des données
Treillis de Galois
O\A Nalc non alcoolisée
Cha chaude
Alc alcoolisée
Caf avec caféine
Gaz gazeuse
Tv Thé vert ü ü Kf Café ü ü ü E Eau gazeuse
ü
ü
V Vin ü B Bière ü ü Co Coca ü ü ü Chp Champagne
ü ü
Contexte = triplet (O, A, I) tel que : • O : ensemble fini d’exemples • A : ensemble fini d’attributs • I : relation binaire entre O et A, (I ⊆ O x A)
{Tv,Kf,E,V,B,Co,Chp}
∅
{V, B, Chp} {Alc}
{E, B, Co, Chp} {Gaz}
{Tv, Kf, E, Co} {Nalc}
{Tv, Kf} {Nalc, Cha}
{E, Co} {Nalc, Gaz}
{Kf, Co} {Nalc, Caf}
{B, Chp} {Alc, Gaz}
{Kf} {Nalc, Cha, Caf}
{Co} {Nalc, Caf, Gaz}
∅ {Nalc, Cha, Alc, Caf, Gaz}
Exemple de Treillis de Galois
Correspondance de Galois : Soient Oi ⊆ O et Ai ⊆ A, on définit f et g : • f: P(O)→ P(A) f(Oi) = {a ∈ A / (o,a) ∈ I, ∀ o ∈ Oi} intension • g: P(A)→ P(O) g(Ai) = {o ∈ O / (o,a) ∈ I, ∀ a ∈ Ai} extension (f,g) = correspondance de Galois entre P(O) et P(A) Exemple: • O1 = {Tv, Kf) ⇒ f (O1) = {Nalc, Cha} • A1 = {Nalc, Cha} ⇒ g (A1) = {Tv, Kf} (Oi, Ai) est un concept (fermé) ssi
• Oi est l’extension de Ai et • Ai est l’intension de Oi
c-à-d: Oi = g(Ai) et Ai = f(Oi)
Structurer le non structuré : axes importants
ü Complexité des treillis ü Nombre élevé de concepts ü Coût des algorithmes de construction ü Interprétation
ü Mesures de similarité (aide à la navigation) ü Mesures conceptuelles (filtrage et caractérisation du treillis) ü Visualisation
ü Mise en correspondance avec la couche sémantique
ü Extraction de relations
Extraction – Structuration en graphe
Couche Sémantique
Couche Requêtes
Harmoniser la représentation des données
ü Problématique : représenter les relations entre objets ü Exemple : réseau de chercheurs extrait à partir de
bases de données et enrichi avec des données provenant du web
ü Offrir une représentation unique pour des données de
plus en plus volumineuses et hétérogènes ü Graphes : une représentation naturelle
ü Adaptée aussi bien au structuré qu’au non structuré ü Manipulation facile
ü Mise à jour des données sans modification de la structure
ü Algorithmes dédiés aux graphes : plus court chemin, sous-graphe, etc.
Exemple : extraction d’un réseau social
29
Firm1 Firm2
Firm1 Firm2
Employer(Enum, Name, LastName, DNO#) Project(Pname, Pnum, Dnum#) Departement(Dname, DNO, Location) Works_On(Enum#,Pname#)
TBEmployee(EmID, EMName, EMLastName, DNO#) tbProject(Pname, Pnum, Dnum#) TBLDepartement(Dname, DNO, Location) tbProject_Employee(Enum#,Pname#)
Extraction Schéma
Works_ON
tbProject_Employee
Transformation en Hypernoeuds
Transformation des données Construction du
Réseau Social
Harmoniser la représentation : axes importants
ü Mise en correspondance avec la couche sémantique
ü Volumétrie
ü Passage à l’échelle des algorithmes ü Visualisation
ü Requêtes et agrégation de graphes
Synthèse
Extraction – Structuration en graphe
Couche Sémantique
Couche Requêtes
Questions à: Marie-Aude Aufaure