Smart data

Notre formation vous propose d’illustrer les différentes problématiques du Big Data ainsi que les solutions de traitement et d’analyse de données, afin que vous soyez pleinement capable de profiter de la valeur ajoutée que représentent ces masses de données.

Contexte

Les Big data ( ou données massives ) désignent un ensemble de données dont le volume et la complexité sont tels que les capacités des technologies classiques d’exploitation, de stockage, de traitement et de transport à un coût raisonnable et selon un délai acceptable sont dépassées. Tous les acteurs sont concernés , le web, les entreprises ou encore les organismes publics.

Les géants du net comme Google, Facebook, LinkedIn, Amazon ou eBay, sont depuis longtemps les piliers de l’activité Big data. Il est donc devenu urgent d’imaginer de nouvelles structures, de nouvelles technologies, des nouveaux algorithmes afin de proposer des solutions efficaces en termes de capture de la données, de stockage, de moteur de recherche, d’analyse et de visualisation.

Plan

Introduction

  • Définition de big data
  • Les problématiques de big data
  • Les défis et les enjeux technologiques, économiques et environnementaux?
  • Les 4V
  • Améliorer les performances en exploitant les solutions big data
  • Les nouvelles compétences métier

Analyse de données

  • Récupération des données: privées et publiques
  • Les contraintes de la CNIL
  • Type de données
  • Les techniques d’analyse de données non structurées (scrawler et scraper)
  • Les frameworks utiles pour récupérer les données
  • Prédiction ou description ?
  • Visualisation des connaissances et retour à la donnée

Architecture

  • L’écosystème big data: stocker traiter et analyser
  • Les limites des solutions traditionnelles
  • Les solutions et les panoramas de technologies
  • Choisir la bonne solution adaptée à mon besoin
  • Architecture hadoop

Stockage

  • SQL, NoSQL, NewSQL
  • Atomicité, Cohérence, Isolation et Durabilité « ACID »
  • Théorème de CAP
  • Les 4 catégories NoSQL : clé-valeur, clé-document, colonne et graphe
  • Techniques de modélisation NoSQL
  • TP : Redis ou MongoDB

Traitement et calcul

  • Programmation parallèle : algorithmes, logiciels et matériels
  • Pattern Map-reduce
  • TP :
    • Installation Hadoop standlone
    • Mettre en place une application de wordCount

Analyse décisionnelle

  • Etat de l'art
  • Classification supervisée ou non supervisée pour la prédiction ou la description
  • Cycle de fouille de données
  • Etude de cas

Sessions


Smart Data on 22/04/2014

Smart Data on 24/06/2014

Pratiques


Durée : 2 jours

1850 euros HT

contact

>