Cassandra 101 est un workshop permettant de découvrir la base de données NoSQL Cassandra et son écosystème, étape par étape.
cassandra-101 par Chris WOODROW, Sébastien PRUNIER, Benjamin CAVY et Guillaume SOLDERA est distribué sous les termes de la licence Creative Commons - Attribution - NonCommercial - ShareAlike.
Cassandra est une base de données NoSQL orientée colonnes, déversée dans l'Open Source en 2008. Cassandra est une des bases les plus scalables actuellement disponibles sur le marché. C'est par ailleurs une des seules bases qui peut être installée sur une infrastructure multi-datacenters (i.e. connexions WAN). Cassandra propose des performances d'écriture très élevées et est hautement disponible. Un exemple souvent cité est celui d'Apple qui dispose d'un cluster de 75 000 noeuds.
En terme de CAP, Cassandra privilégie la disponibilité à la cohérence en cas de partitionnement. De fait, Cassandra propose de la cohérence à terme (Eventual Consistency). Néanmoins, l'utilisateur peut choisir de privilégier la cohérence au dépend de la disponibilité. Cette option est paramétrable pour chaque requête.
Ce workshop est basé sur la version 3.11.3 de Cassandra.
Quelques cas d'utilisation pour lesquels les bases de données orientées colonnes, et en particulier Cassandra, sont adaptées :
- Time-series (notamment objets connectés)
- Référentiels, Catalogues
- Messaging
- Analyse des utilisateurs (traffic web, réseaux sociaux, recommandations)
- Étape 0 - Installation
- Étape 1 - Prise en main
- Site officiel : http://cassandra.apache.org/
- Le site de Datastax : http://www.datastax.com/
- La documentation officielle : http://cassandra.apache.org/doc/latest/