<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Ze Technology &#187; MongoDB</title>
	<atom:link href="http://www.ze-technology.com/category/mongodb/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.ze-technology.com</link>
	<description>Ze Blog qui parle de Ze Technology. Univers du libre, programmation, société, business...</description>
	<lastBuildDate>Sat, 17 Dec 2011 08:35:59 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3</generator>
		<item>
		<title>Retour d&#8217;expérience sur MongoDB partie 1 : présentation</title>
		<link>http://www.ze-technology.com/2010/07/23/retour-dexperience-sur-mongodb/</link>
		<comments>http://www.ze-technology.com/2010/07/23/retour-dexperience-sur-mongodb/#comments</comments>
		<pubDate>Fri, 23 Jul 2010 20:19:55 +0000</pubDate>
		<dc:creator>Adrien Mogenet</dc:creator>
				<category><![CDATA[MongoDB]]></category>
		<category><![CDATA[Non classé]]></category>

		<guid isPermaLink="false">http://www.ze-technology.com/?p=691</guid>
		<description><![CDATA[Retour d&#8217;expérience sur MongoDB Cela fait maintenant quelques temps que je donne plus de nouvelles, plus un signe de technologie, de recherche. Et pourtant, de la recherche, il y en a eu ! Après avoir passé une longue période à essayer les différents outils de QA dédiés au web, j&#8217;ai passé ces derniers mois à [...]]]></description>
			<content:encoded><![CDATA[<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Retour d&#8217;expérience sur MongoDB</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Cela fait maintenant quelques temps que je donne plus de nouvelles,</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">plus un signe de technologie, de recherche. Et pourtant, de la</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">recherche, il y en a eu !</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Après avoir passé une longue période à essayer les différents outils</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">de QA dédiés au web, j&#8217;ai passé ces derniers mois à essayer &#8211; et</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">exploiter &#8211; les NoSQL. La littérature est déjà bien large sur le sujet</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">dans ses généralités. Cassandra, HBase, Voldemort, Redis&#8230; tout y</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">passe, du plus ancien dépôt clé/valeur au plus évolué système orienté</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">graphe ou document. Je vais parler ici finalement de MongoDB, que j&#8217;ai</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">pu torturer en long, en large et en travers, et qui appartient</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">justement à la catégorie des NoSQL orienté document.</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Un NoSQL, pourquoi ?</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Certainement pas par effet de mode. Une prise de décision basée sur ce</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">critère ne serait que folie. Par besoin ? Il va être temps de définir</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">ces besoins. Car on assiste à bon nombre de projets qui tendent à</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">délaisser ces bons vieux SGBDR au profit de leurs consins</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">non-relationnels. Or, la plupart de ces projets ont &#8211; selon moi -</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">surtout un problème de conception et non d&#8217;outils. Si ces projets</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">reprochent à MySQL une certaine lenteur, ils feraient bien mieux</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">d&#8217;apprendre à tirer profit d&#8217;une configuration optimale, et d&#8217;une</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">conception sérieuse du modèle de données, avec une stratégie</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">d&#8217;indexation adaptée. On ne le dira jamais assez : des bases comme</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">MySQL, PostgreSQL ou autre ont perduré pendant des années. La</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">réplication est fonctionelle. Le partitionnement est possible. Les</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">plus gros l&#8217;ont utilisé et continuent à l&#8217;utiliser. Twitter avoue même</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">rester sur MySQL après avoir essayé timidement de mettre en place</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Cassandra. Non, pour moi, une des raison qui peut pousser à envisager</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">une solution NoSQL est ailleurs. La grosse plus value de ces solutions</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">reste toujours leur très bonne disposition à &laquo;&nbsp;scaler&nbsp;&raquo;. Autrement dit,</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">si on souhaite absorber un déluge de données croissant, on y trouvera</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">un allié puissant pour rapidement doubler, quadrupler la puissance de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">stockage, sans se lancer dans une trop lourde configuration du</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">partitionnement et/ou de la réplication.</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Orienté document, pourquoi ?</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Comme d&#8217;habitude, nuançons ce point de vue par un autre apport, mais</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">celui-ci est propre au modèle de stockage choisi. On en dénombre 4 :</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">- dépôts clé/valeur (Voldemort, Redis&#8230;)</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">- orientés colonne (Cassandra, HBase&#8230;)</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">- orientés documents (CouchDB, MongoDB&#8230;)</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">- orientés graphes (Neo4J&#8230;)</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Chaque modèle répond à des problématiques et stratégies de stockage</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">différentes. MongoDB stocke des &laquo;&nbsp;documents&nbsp;&raquo;. Un document est un</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">ensemble de paires clé/valeurs, ici décrites au format BSon. Ce format</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">est largement comparable au JSon, modulo quelques types additionnels.</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">{</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">blog: http://www.zt.com,</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">authors: [adrien, robot],</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">comments:</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">[</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;"><span style="white-space: pre;"> </span>{ author: robert, age: 42 },</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;"><span style="white-space: pre;"> </span>{ author: johanna, age: 25 }</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">]</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">}</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Volà donc typiquement ce qui peut être stocké dans une collection (=</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">table) MongoDB. Ce stockage est dit &laquo;&nbsp;schemaless&nbsp;&raquo;, traduire par &laquo;&nbsp;sans</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">schéma&nbsp;&raquo;. Les documents ne correspondent à aucune définition formelle</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">qui aurait été préalablement définie. Ainsi, on pourrait très bien</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">rajouter un autre document &laquo;&nbsp;blog&nbsp;&raquo; similaire à l&#8217;exemple, mais sans</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">champs &laquo;&nbsp;authors&nbsp;&raquo; et avec une colonne &laquo;&nbsp;keywords&nbsp;&raquo;. le NewYorkTimes tire</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">partie de ce modèle avec MongoDB en permettant à ses contributeurs</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">d&#8217;ajouter des méta-données à la volée pour chaque photo soumise. En</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">effet, on ne retrouve pas forcément les même méta-données entre une</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">photo de lieu et celle d&#8217;une star. Certes, la chose reste largement</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">faisable avec les outils actuels. Le modèle document est juste</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">extrémement adapté à ce type de stockage, sans s&#8217;occuper d&#8217;un modèle</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">relationnel et ses multiples contraintes. Je sais, je viens de donner</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">un argument qui pourrait remettre en cause le premier : certains NoSQL</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">ont un rôle qui dépasse de loin celui d&#8217;un entrepôt extensible et redondé.</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">MongoDB, pourquoi ?</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Voyons maintenant le cas particulier de MongoDB. C&#8217;est un NoSQL</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">orienté documents, qui se qualifie par l&#8217;acronyme &laquo;&nbsp;CP&nbsp;&raquo; du théorème de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">CAP.</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">1) Langage de requêtage intuitif</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Tout naturellement, lorsqu&#8217;on essaye un système de stockage, nos</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">premiers essais se tournent vers l&#8217;insertion et la récupération de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">données. Pour l&#8217;insertion, nous venons de voir qu&#8217;elle s&#8217;effectuait au</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">format BSon. Concretement, après avoir lancé le shell MongoDB, la</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">commande suivante effectuerait une insertion dans une collection</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">&laquo;&nbsp;test&nbsp;&raquo; :</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">db.test.insert({&laquo;&nbsp;name&nbsp;&raquo;: &laquo;&nbsp;Adrien&nbsp;&raquo;});</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Et pour requêter nos collections, cela s&#8217;effectue également tout</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">naturellement au format BSon ! MongoDB fournit un certain nombre</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">d&#8217;opérateurs classiques : &gt;, &lt;, =, &gt;=, IN, NOT IN, etc. Quelques</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">exemples :</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;"># Tous les utilisateurs &laquo;&nbsp;toto&nbsp;&raquo;</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">db.test.find({&laquo;&nbsp;name&nbsp;&raquo;: &laquo;&nbsp;toto&nbsp;&raquo;});</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;"># Les 3 premiers &laquo;&nbsp;Adrien&nbsp;&raquo;, ayant plus de 23 ans, triés</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">db.test.find({&laquo;&nbsp;name&nbsp;&raquo;: &laquo;&nbsp;Adrien&nbsp;&raquo;, &laquo;&nbsp;age&nbsp;&raquo;: {$gt: 23}}.sort({&laquo;&nbsp;age&nbsp;&raquo;: -1}).limit(3);</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">C&#8217;est en général le premier point qui ressort de MongoDB par rapport à</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">la plupart de ses rivaux. Son système de requêtage séduisant permet</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">une prise en main extrémement rapide.</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">2) Auto-sharding</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Venons en maintenant à ce qui fait normalement tout l&#8217;attrait des</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">NoSQL : leur forte extensibilité et leur mécanisme de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">réplication. MongoDB offre des possibilités de sharding</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">(partitionnement) afin de distribuer les données au sein de plusieurs</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">&laquo;&nbsp;shards&nbsp;&raquo; (bloc venant constituer le cluster, et ne possédant qu&#8217;une</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">partie des données). L&#8217;auto-sharding reste aujourd&#8217;hui (version 1.5.3)</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">en version beta, mais il est possible tout de même de spécifier ses</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">propres pattern de sharding. Par exemple, on peut décider que le</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">champs &laquo;&nbsp;name&nbsp;&raquo; de nos exemple deviendra une clé de sharding. Il est</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">possible, à l&#8217;instar des indexes, de spécifier des clés composées de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">plusieurs champs. MongoDB calculera un hash de ces clés pour</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">déterminer sur quel shard envoyer tel ou tel document. La</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">configuration du cluster et toutes ses méta-données sont stockées au</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">sein de &laquo;&nbsp;serveurs de configuration&nbsp;&raquo;. En production, trois serveurs de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">ce type sont normalement configurés. Si un de ces serveurs tombe en</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">rade, le système continue de fonctionner normalement. Si deux de ces 3</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">serveurs montrent un dysfonctionnement, le dernier serveur de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">configuration devient accessible en lecture seulement. Ceci n&#8217;empêche</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">pas le cluster complet de fonctionner, mais empêche toute modification</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">de la configuration, et tout déplacement de &laquo;&nbsp;chunks&nbsp;&raquo; (position des</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">blocs de données, qui est elle aussi stockée dans ces serveurs de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">configuration).</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">3) Replica pair, replica sets</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Chaque shard peut actuellement être redondé par ce qu&#8217;on appelle un système de</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">&laquo;&nbsp;replica pair&nbsp;&raquo; : le shard est constitué d&#8217;un master et d&#8217;un slave. À</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">tout moment, si le master tombe en panne, le slave prend le relai. Les</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">données peuvent être répliquées instantanément ou avec une certaines</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">latence dans le cas d&#8217;un système dit &laquo;&nbsp;finalement consistant&nbsp;&raquo;. Cette</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">paire est bien limitée actuellement en matière de fail-over et</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">laissera place aux &laquo;&nbsp;replica sets&nbsp;&raquo; avec MongoDB 1.6, qui laissera la</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">possibilité de plus de 2 serveurs de sauvegarde. Dans cette nouvelle</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">situation, en cas de panne du master, l&#8217;élection du slave qui</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">deviendra master se fera par la résolution d&#8217;un consensus basé sur la</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">disponibilité de chaque noeud, le nombre de serveurs vus par chacun, etc&#8230;</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Conclusion</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">On attend les replica sets, l&#8217;autosharding fonctionnel</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Liens à insérer :</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">- &laquo;&nbsp;twitter avoue&nbsp;&raquo;</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">- &laquo;&nbsp;théoreme de CAP&nbsp;&raquo;</div>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Article sur XOP</div>
<p>Cela fait maintenant quelques temps que je donne plus de nouvelles, plus un signe de technologie, de recherche. Et pourtant, de la recherche, il y en a eu ! Après avoir passé une longue période à essayer les différents outils de QA dédiés au web, j&#8217;ai passé ces derniers mois à essayer &#8211; et exploiter &#8211; les NoSQL. La littérature est déjà bien large sur le sujet dans ses généralités. Cassandra, HBase, Voldemort, Redis&#8230; tout y passe, du plus ancien dépôt clé/valeur au plus évolué système orienté graphe ou document. Je vais parler ici finalement de MongoDB, que j&#8217;ai pu torturer en long, en large et en travers, et qui appartient justement à la catégorie des NoSQL orienté document.</p>
<h3>Un NoSQL, pourquoi ?</h3>
<p>Certainement pas par effet de mode. Une prise de décision basée sur ce critère ne serait que folie. Par besoin ? Il va être temps de définir ces besoins. Car on assiste à bon nombre de projets qui tendent à délaisser ces bons vieux SGBDR au profit de leurs cousins non-relationnels. Or, la plupart de ces projets ont &#8211; selon moi - surtout un problème de conception et non d&#8217;outils. Si ces projets reprochent à MySQL une certaine lenteur, ils feraient bien mieux d&#8217;apprendre à tirer profit d&#8217;une configuration optimale, et d&#8217;une conception sérieuse du modèle de données, avec une stratégie d&#8217;indexation adaptée. On ne le dira jamais assez : des bases comme MySQL, PostgreSQL ou autre ont perduré pendant des années. La réplication est fonctionelle. Le partitionnement est possible. Les plus gros l&#8217;ont utilisé et continuent à l&#8217;utiliser. Twitter <a href="http://engineering.twitter.com/2010/07/cassandra-at-twitter-today.html">avoue même rester sur MySQL</a> après avoir essayé timidement de mettre en place Cassandra. Non, pour moi, une des raison qui peut pousser à envisager une solution NoSQL est ailleurs. La grosse plus value de ces solutions reste toujours leur très bonne disposition à &laquo;&nbsp;scaler&nbsp;&raquo;. Autrement dit, si on souhaite absorber un déluge de données croissant, on y trouvera un allié puissant pour rapidement doubler, quadrupler la puissance de stockage, sans se lancer dans une trop lourde configuration du partitionnement et/ou de la réplication.</p>
<h3>Orienté document, pourquoi ?</h3>
<p>Comme d&#8217;habitude, nuançons ce point de vue par un autre apport, mais celui-ci est propre au modèle de stockage choisi. On en dénombre 4 :</p>
<ul>
<li>dépôts clé/valeur (Voldemort, Redis&#8230;)</li>
<li>orientés colonne (Cassandra, HBase&#8230;)</li>
<li>orientés documents (CouchDB, MongoDB&#8230;)</li>
<li>orientés graphes (Neo4J&#8230;)</li>
</ul>
<p>Chaque modèle répond à des problématiques et stratégies de stockage différentes. MongoDB stocke des &laquo;&nbsp;documents&nbsp;&raquo;. Un document est un ensemble de paires clé/valeurs, ici décrites au format BSon. Ce format est largement comparable au JSon, modulo quelques types additionnels.</p>
<p><code>{<br />
blog: http://www.zt.com,<br />
authors: [adrien, robot],<br />
comments:<br />
[<br />
<span style="white-space: pre;"> </span>{ author: robert, age: 42 },<br />
<span style="white-space: pre;"> </span>{ author: johanna, age: 25 }<br />
]<br />
}<br />
</code></p>
<p>Voolà donc typiquement ce qui peut être stocké dans une collection (= table) MongoDB. Ce stockage est dit &laquo;&nbsp;schemaless&nbsp;&raquo;, traduire par &laquo;&nbsp;sans schéma&nbsp;&raquo;. Les documents ne correspondent à aucune définition formelle qui aurait été préalablement définie. Ainsi, on pourrait très bien rajouter un autre document &laquo;&nbsp;blog&nbsp;&raquo; similaire à l&#8217;exemple, mais sans champs &laquo;&nbsp;authors&nbsp;&raquo; et avec une colonne &laquo;&nbsp;keywords&nbsp;&raquo;. le NewYorkTimes tire partie de ce modèle avec MongoDB en permettant à ses contributeurs d&#8217;ajouter des méta-données à la volée pour chaque photo soumise. En effet, on ne retrouve pas forcément les même méta-données entre une photo de lieu et celle d&#8217;une star. Certes, la chose reste largement faisable avec les outils actuels. Le modèle document est juste extrémement adapté à ce type de stockage, sans s&#8217;occuper d&#8217;un modèle relationnel et ses multiples contraintes. Je sais, je viens de donner un argument qui pourrait remettre en cause le premier : certains NoSQL ont un rôle qui dépasse de loin celui d&#8217;un entrepôt extensible et redondé.</p>
<h3>MongoDB, pourquoi ?</h3>
<p>Voyons maintenant le cas particulier de MongoDB. C&#8217;est un NoSQL orienté documents, qui se qualifie par l&#8217;acronyme &laquo;&nbsp;CP&nbsp;&raquo; du <a href="http://en.wikipedia.org/wiki/CAP_theorem">théorème de CAP</a>.</p>
<h4>1) Langage de requêtage intuitif</h4>
<p>Tout naturellement, lorsqu&#8217;on essaye un système de stockage, nos premiers essais se tournent vers l&#8217;insertion et la récupération de données. Pour l&#8217;insertion, nous venons de voir qu&#8217;elle s&#8217;effectuait au format BSon. Concretement, après avoir lancé le shell MongoDB, la commande suivante effectuerait une insertion dans une collection &nbsp;&raquo;test&nbsp;&raquo; :</p>
<p><span style="font-family: Consolas, Monaco, 'Courier New', Courier, monospace; line-height: 18px; font-size: 12px; white-space: pre;">db.test.insert({&laquo;&nbsp;name&nbsp;&raquo;: &laquo;&nbsp;Adrien&nbsp;&raquo;});</span></p>
<p>Et pour requêter nos collections, cela s&#8217;effectue également tout naturellement au format BSon ! MongoDB fournit un certain nombre d&#8217;opérateurs classiques : &gt;, &lt;, =, &gt;=, IN, NOT IN, etc. Quelques exemples :</p>
<pre><code># Tous les utilisateurs "toto"
db.test.find({"name": "toto"});
</code></pre>
<p><code># Les 3 premiers "Adrien", ayant plus de 23 ans, triés<br />
db.test.find({"name": "Adrien", "age": {$gt: 23}}.sort({"age": -1}).limit(3);</code></p>
<p>C&#8217;est en général le premier point qui ressort de MongoDB par rapport à la plupart de ses rivaux. Son système de requêtage séduisant permet une prise en main extrémement rapide.</p>
<h4>2) Auto-sharding</h4>
<p>Venons en maintenant à ce qui fait normalement tout l&#8217;attrait des NoSQL : leur forte extensibilité et leur mécanisme de réplication. MongoDB offre des possibilités de sharding (partitionnement) afin de distribuer les données au sein de plusieurs &nbsp;&raquo;shards&nbsp;&raquo; (bloc venant constituer le cluster, et ne possédant qu&#8217;une partie des données). L&#8217;auto-sharding reste aujourd&#8217;hui (version 1.5.3) en version beta, mais il est possible tout de même de spécifier ses propres pattern de sharding. Par exemple, on peut décider que le champs &laquo;&nbsp;name&nbsp;&raquo; de nos exemple deviendra une clé de sharding. Il est possible, à l&#8217;instar des indexes, de spécifier des clés composées de plusieurs champs. MongoDB calculera un hash de ces clés pour déterminer sur quel shard envoyer tel ou tel document. La configuration du cluster et toutes ses méta-données sont stockées au sein de &laquo;&nbsp;serveurs de configuration&nbsp;&raquo;. En production, trois serveurs de ce type sont normalement configurés. Si un de ces serveurs tombe en rade, le système continue de fonctionner normalement. Si deux de ces 3 serveurs montrent un dysfonctionnement, le dernier serveur de configuration devient accessible en lecture seulement. Ceci n&#8217;empêche pas le cluster complet de fonctionner, mais empêche toute modification de la configuration, et tout déplacement de &laquo;&nbsp;chunks&nbsp;&raquo; (position des blocs de données, qui est elle aussi stockée dans ces serveurs de configuration).</p>
<h4>3) Replica pair, replica sets</h4>
<p>Chaque shard peut actuellement être redondé par ce qu&#8217;on appelle un système de &nbsp;&raquo;replica pair&nbsp;&raquo; : le shard est constitué d&#8217;un master et d&#8217;un slave. À tout moment, si le master tombe en panne, le slave prend le relai. Les données peuvent être répliquées instantanément ou avec une certaines latence dans le cas d&#8217;un système dit &laquo;&nbsp;finalement consistant&nbsp;&raquo;. Cette paire est bien limitée actuellement en matière de fail-over et laissera place aux &laquo;&nbsp;replica sets&nbsp;&raquo; avec MongoDB 1.6, qui laissera la possibilité de plus de 2 serveurs de sauvegarde. Dans cette nouvelle situation, en cas de panne du master, l&#8217;élection du slave qui deviendra master se fera par la résolution d&#8217;un consensus basé sur la disponibilité de chaque noeud, le nombre de serveurs vus par chacun, etc&#8230;</p>
<h4>4) Map/Reduce</h4>
<p>L&#8217;algorithme Map/Reduce a le vent en poupe depuis les papiers Google et l&#8217;implémentation Hadoop. Et devinez quoi ? MongoDB, à l&#8217;instar de CouchDB, offre des possibilités d&#8217;interrogation en Map/Reduce. Dans un environnement &laquo;&nbsp;shardé&nbsp;&raquo;, les requêtes sont en effet ciblées ou globales (parallèles ou séquentielles). Pour effecter un certain nombre de calculs efficacement, MongoDB permet l&#8217;écriture de fonctions map() et  reduce() &#8211; et finalize() &#8211; en javascript. Les résultats peuvent être stockées dans des collections temporaires pour conserver un cache des résultats.</p>
<h4>5) Autres fonctionnalités</h4>
<p>En fait, il y a trop de choses à raconter sur MongoDB. Je vais faire un bon petit lot de petits articles pour détailler chaque point, mais pour ce soir, il faudra se contenter d&#8217;une découverte rapide :</p>
<ul>
<li>Un moteur d&#8217;indexation géographique, que Foursquare utilise à outrance</li>
<li>Une indexation en background</li>
<li>Des capped-collections, collections de tailles fixes auto-gérées pour ne conserver que les X derniers éléments insérés (fonctionnement par TTL prévu pour les futures versions)</li>
<li>Profiling des requêtes</li>
<li>Interface REST</li>
</ul>
<h3>Conclusion</h3>
<p>MongoDB est la solution qui actuellement suscite le plus ma curiosité, et surtout mon intérêt, tant pour ses performances que pour sa conception et ses fonctionnalités. Son plus gros défaut actuel est sa grande jeunesse. Gageons qu&#8217;une fois l&#8217;auto-sharding et les replica-sets 100% fonctionnels, 10 Gen Confluence arrivera à mettre en place une architecture composée de 1000 shards, son objectif actuel.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.ze-technology.com/2010/07/23/retour-dexperience-sur-mongodb/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
	</channel>
</rss>

