L’architecture interne du site Wikipedia

Wikipedia et Wikimedia sont parmi les sites les plus consultés au monde, mais comment fonctionnent ces sites. Et bien tout est dans le document de Domas Mituzas. Cet article traite la mise en place des logiciels suivants : Linux, PowerDNS, LVS, Squid, lighttpd, Apache, PHP5, Lucene, Mono, Memcached.

wikipedia

Il explique également comment ils utilisent les ressources de leur CDN, comment ils optimisent les caches, comment se fait le profiling du code PHP, la gestion des bases de données.

Wikipedia architecture

Une autre partie concerne la répartition entre les différents datacenter, et comment sur chaque datacenter LVS et Squid se partage la charge.

datacenter repartition squid lvs

 

Bref c’est une mine d’or pour tous les sites de contenu qui se posent des questions sur la mise en place d’une architecture technique solide leur permettant de tenir des très fortes charges.

Tout est ici Wikipedia: Site internals

Sur le même thème :

4 Responses to “L’architecture interne du site Wikipedia”

  1. [...] quoi refroidir les ardeurs des adeptes d’un moteur web libre. Car ici contrairement à l’architecture Wikipedia, c’est le nombre de serveur qui compte. Même si les différents applicatifs (crawl, parse, [...]

  2. [...] même sujet si la couche applicative vous intéresse vous pouvez consulter cette page à propos de l’architecture interne wikipedia, c’est assez proche mais le PDF donne plus de détails sur les structures interne, et moins [...]

  3. [...] L’architecture interne sur site Wikipedia [...]

Leave a Reply