Les promesses de la haute disponibilité dans le Cloud

October 26, 2009

haute disponibiliteAprès avoir défini la Haute Disponibilité et décrit comment elle pouvait être mesurée, je vous propose de conclure cette première série d’articles avec le site Cloud  Consulting par un petit tour d’horizon des promesses des fournisseurs de Cloud Computing.

Et comme pour les articles précédent, si vous avez des remarques questions n’hésitez à visiter le site cloudconsulting.fr ou à laisser vos questions dans les commentaires.

Lire la suite »


Mesure de la disponibilité d’un service

September 28, 2009

problème baie datacenterUn nouveau post (voir ce précédent billet) de la société Cloud Consultingpartenaire des IT souhaitant étudier leur migration vers le Cloud Computing qui nous propose cette fois d’étudier la mesure de la disponibilité d’un service. Même si en général il est préférable de comptabiliser les temps d’interruption, pour calculer le taux de disponibilité…Voici donc un article sur la discontinuitié d’un service et les méthodes permettant de la mesurer.

Lire la suite »


Inondation : Un datacenter dans l’eau…

September 16, 2009

datacenter-innodationUn post rapide pour vous rappeller qu’il est très important de ne pas laisser toutes vos ressources dans le même centre. Votre hébergeur vous garantira toujours qu’il est le meilleur, mais le seul moyen réellement éfficace pour protéger ses données c’est de les répliquer sur des centres distants.

Et idéalement de maniere continue et automatique.

Lire la suite »


Panne électrique chez Equinix : Black out pour Dailymotion, LeParisien, Claranet et d’autres…

July 2, 2009

outageMalgré les procédures de sécurité les pannes de courant existent dans les datacenter. Le centre Telecity de Courbevoie avait été victime de plusieurs incidents il y à quelques années. Aujourd’hui c’est Equinix qui a coupé le courant dans plus de 6000 mètres carrés de son centre de Saint-Denis (suite à une erreur de manipulation).

Comme d’habitude ce type d’incident provoque la mise off line de plusieurs milliers de serveurs, dans la liste des sites impactés ont peut déjà citer :

SkyBlog, Pixmania  , Dailymotion, LeParisien, Claranet, Gandi, et bien d’autres…

Lire la suite »


Site web piraté pour cause de virtualisation

June 11, 2009

hypervmLors d’un échange de commentaires récent sur un article à propos des nouveaux serveurs DELL, la question de l’utilité des petits serveurs était mis en cause par rapport à l’avantage des serveurs plus importants, virtualités en N petits serveurs.

Le piratage, ou le manque de puissance à cause de la mauvaise gestion des ressources par ses voisins virtuels est souvent l’argument justifiant la conservation d’un serveur physique indépendant.

Lire la suite »


Nouvel incident chez Media Temple

May 5, 2009

media-templeDe nouveau un problème chez l’hébergeur Américain Media Temple, avec une interruption de service pour les clients hébergés sur l’offre Grid Hosting. Dommage car pour le moment cet hébergeur innovant était plutôt fiable.

Une nouvelle fois c’est le système de stockage qui est en cause, et du coup c’est tout un cluster qui est tombé (le Cluster.02 pour ceux qui sont concernés). Lire la suite »


Prévention et gestion d’une panne électrique chez OVH

April 29, 2009

ovhJe le répète assez souvent, mais en voici de nouveau une preuve. La gestion et l’hébergement des serveurs s’industrialise de plus en plus. Que ce soit en construisant des systèmes de type Clouds ou en proposant de l’hébergement de serveur ‘brut’, la location de ressources informatique ne devient viable et économiquement rentable qu’à partir d’une certaine taille critique.

Lire la suite »


Incident majeur chez Media Temple, 3000 clients impactés

March 4, 2009

media-templePlus de 100 000$, c’est ce que Media Temple (Los Angeles) devra rembourser à ses clients dans le cadre du dédommagement pour les 38 heures d’interruption de service ! C’est l’inconvénient des architectures hautement distribuées, elles sont très robustes, scalables, les incidents sont gommés par la taille des clusters mais en cas de défaillance matérielle importante, c’est majeur et c’est très grave !

Lire la suite »


Les incidents majeurs de l’internet en 2008

January 11, 2009

pingdom Pour commencer 2009 je vous propose un retour rapide sur 2008. En effet l’amélioration des services se fait souvent par la correction des précédentes erreurs.

A ce titre Pingdom a rassemblé dix incidents importants intervenus sur Internet en 2008. Ils y ont inclus les problèmes et pannes sur les sites Web mais aussi les interruptions de réseaux à grande échelle. Certains ont déjà été mentionné sur ce blog, d’autres vous ont peut-être affecté car d’une manière générale ce type d’incident tend à impacter de plus en plus de monde.

Par ailleurs, il ne s’agit ici que des gros incidents américains, en France nous avons aussi nos sites indisponibles : SNCF, Bouygues, Cogent (incident dans son système de climatisation), OVH (du liquide de refroidissement dans les serveurs) et j’en passe…

Voici un petit aperçu de cette liste, et je vous invite bien sur à consulter la source si vous souhaitez plus d’informations :

- Explosion et incendie dans le datacenter de The Planet Lire la suite »


Des problèmes de charge chez LinkedIn ?

October 10, 2008

La fréquentation de ce site ne cesse de progresser mais malheureusement ses périodes d’indisponibilité aussi. Pourtant LinkedIn dispose d’une bonne architecture technique et en général son ‘uptime‘ est dans la moyenne, mais depuis début septembre les problèmes s’accumulent.

Comparativement au début de l’année ( 4H d’interruption sur les deux premiers mois de 2008) les dernières semaines sont en fort recul. En effet sur septembre le site était hors ligne pendant 9 heures, dont 5 heures pleines lors de la coupure de courant du 6 septembre. Lire la suite »