Go to Top

Dossier Big Data (3/3) – Pourquoi NoSQL ?

Dossier Big Data

Né pour satisfaire aux demandes de plus en plus flagrantes de traitements lourds de données issues de sites Web tels que ceux d’Amazon, Facebook ou Linkedin, NoSQL est un langage d’interrogation de bases de données taillé pour le « Big Data ». Mais pourquoi NoSQL ?

SQL est l’acronyme de Structured Query Language. Il est connu depuis longtemps de tous les acteurs de l’informatique qui ont eu à rechercher rapidement des informations dans de grosses bases de données relationnelles (SGBD). Dans les années 90, certains commerciaux dans des compagnies de logistique n’avaient ni souris ni écran graphique, ni interface utilisateur pour rechercher certaines informations stockées sur des serveurs souvent distants et reliés par des lignes spécialisées : ils entraient au clavier des commandes SQL et étaient capables de répondre à leur client sur la disponibilité de tel ou tel camion ou train en quelques secondes. SQL est aujourd’hui largement utilisé, car étant un des dispositifs d’organisation et d’interrogation de bases de données le plus structuré et le plus rapide ; il se décline sous différentes appellations qui montrent qu’il y a des adaptations diverses comme c’est notamment le cas de MySQL d’Oracle qui est le plus gros concurrent de SQL de Microsoft.

NoSQL est l’acronyme qui a été trouvé depuis 2009 pour s’attaquer au phénomène Big Data. Pour certains il signifie « non SQL », pour d’autres, « Not only SQL »,  ce qui sous-entend que le langage n’est pas « que » du SQL. La principale problématique qui a conduit à inventer NoSQL a été de solutionner le fait qu’une même base de données sur un site Web, pouvait être utilisée en même temps dans le monde entier par des millions d’utilisateurs ; la problématique  typique d’un Amazon… Ce que l’on cherche donc à réaliser avec NoSQL, c’est à réduire la complexité du langage de requêtes, à simplifier l’architecture de la base de données, et à trouver un moyen de stocker la base sur un maximum d’ordinateurs peu couteux en fonction des besoins. Ainsi, une base NoSQL est une base de données distribuée pour répartir la charge de calcul et de données dynamiquement, non relationnelle, préférant la gestion d’une table gigantesque à celle de nombreuses tables interdépendantes.

Sur Hadoop, dont on a déjà parlé pour le Big Data, il existe Hbase qui est un dispositif de Base de données NoSQL ; il en existe d’autres comme Cassandra, Accumulo, BigTable de Google et une bonne dizaine d’autres qui ne fonctionnent pas forcément dans l’environnement Hadoop. NoSQL est résolument conçu pour résoudre une problématique Big Data.

Retrouvez tous les articles de notre Dossier Big Data

One Response to "Dossier Big Data (3/3) – Pourquoi NoSQL ?"

  • Des algorithmes et de l’analyse prédictive | ELECTRIC NEWS | Digital Publishing for Electric Brain
    19 décembre 2014 - 11:18 Reply

    […] Algorithmes devins : les smartphones, bientôt nos « deuxièmes cerveaux » ? Tranquilien data.sncf.com Wiki : open data Wiki : big data data.gov.fr datascience.net Open Data Paris Analyse prédictive : Le data scientist doit travailler en équipe Big Data sur lemondeinformatique.fr L’analyse prédictive permet d’augmenter le taux de conversion en ligne de 30% L’effet Big Data Modélisations prédictives on track.fr […]

Laisser un commentaire