L’architecture interne du site Wikipedia
Wikipedia et Wikimedia sont parmi les sites les plus consultés au monde, mais comment fonctionnent ces sites. Et bien tout est dans le document de Domas Mituzas. Cet article traite la mise en place des logiciels suivants : Linux, PowerDNS, LVS, Squid, lighttpd, Apache, PHP5, Lucene, Mono, Memcached.
Il explique également comment ils utilisent les ressources de leur CDN, comment ils optimisent les caches, comment se fait le profiling du code PHP, la gestion des bases de données.
Une autre partie concerne la répartition entre les différents datacenter, et comment sur chaque datacenter LVS et Squid se partage la charge.
Bref c’est une mine d’or pour tous les sites de contenu qui se posent des questions sur la mise en place d’une architecture technique solide leur permettant de tenir des très fortes charges.
Tout est ici Wikipedia: Site internals



Abonnement RSS
[...] La suite et quelques schéma ici [...]
[...] quoi refroidir les ardeurs des adeptes d’un moteur web libre. Car ici contrairement à l’architecture Wikipedia, c’est le nombre de serveur qui compte. Même si les différents applicatifs (crawl, parse, [...]
[...] même sujet si la couche applicative vous intéresse vous pouvez consulter cette page à propos de l’architecture interne wikipedia, c’est assez proche mais le PDF donne plus de détails sur les structures interne, et moins [...]
[...] L’architecture interne sur site Wikipedia [...]