giovedì 10 marzo 2011

fault in datacenter



Lunedì 7 marzo si è verificato un incidente in uno dei tre datacenter che ospitano le infrastrutture NewMediaLabs.
Precisamente, nel datacenter KPN DC1 durante delle operazioni di manutenzione straordinaria agli UPS si è verificato un calo di tensione di 20 ms.
Ciò ha causato il riavvio di 6 server (su 65), ed un guasto su uno switch.
Il nostro personale è intervenuto immediatamente, e nell'arco di un'ora sono stati riattivati i server e ripristinata la connettività.
Altre operazioni di verifica, manutenzione e ripristino servizi sono poi proseguite nell'arco di tutta la notte.

La sospensione di connettività ha coinvolto alcuni server di hosting shared e diversi server dedicati in housing e colocation.
Il riavvio forzoso ha invece coinvolto un solo nostro server di hosting shared, alcuni storage di backup ed altri server dedicati in housing e colocation.

Riportiamo in fondo il comunicato ufficiale di KPN al riguardo.

Si tratta di incidenti che, per quanto si operi con strutture ridondate ed allo stato dell'arte, possono sempre succedere. L'importante è saperli gestire con tempestività, efficienza e flessibilità.
Uno dei server riavviati in quest'occasione aveva un uptime di quasi due anni, ed è ridiventato pienamente operativo poco più di un'ora dopo l'incidente. Un'ora di interruzione di servizio su due anni ci sembra un risultato lusinghiero e di rilevo.
Al personale che si è impegnato in tale occasione nel ripristino dei servizi vanno non solo la nostra gratitudine, ma anche i nostri complimenti per le capacità dimostrate nell'affrontare il problema, per la professionalità e la disponibilità.

Ecco alcune informazioni aggiuntive riguardo il malfunzionamento UPS avvenuto in Sala 1, lunedì 7 marzo.

Gli UPS in sala 1 interessati dal malfunzionamento operano in configurazione “in parallelo”, se uno dei due ha un problema, viene automaticamente escluso e tutto il carico passato all’altro UPS. Ogni singolo UPS è dimensionato in modo da reggere l’intero carico.

Intorno alle ore 15:00 gli UPS funzionavano correttamente ma generavano una segnalazione di possibile malfunzionamento. I tecnici del produttore degli UPS sono prontamente arrivati sul luogo e hanno valutato di dover intervenire urgentemente. Abbiamo avvisato i clienti dell’intervento di manutenzione straordinaria.

Alle 16:00 i tecnici del produttore hanno commutato il carico dei due UPS su un singolo UPS, che ha retto per l’intera durata delle operazioni.

Tuttavia la commutazione ha comportato un imprevisto calo di tensione di pochi millisecondi che ha impattato una parte delle apparecchiature a valle, fra cui: alcuni server di nostri clienti, alcuni server nostri e i router di core, che sono ripartiti dopo qualche minuto.

Questo calo di tensione, seppur breve, NON sarebbe dovuto avvenire, perciò abbiamo convocato per domani il fornitore degli UPS per identificare le cause ed i correttivi. Forniremo maggiori dettagli appena possibile.

I lavori sull’UPS sono proseguiti sino alle 01:00 di martedì. Sino a quel momento tutto il carico è stato retto dall’UPS rimanente.

Ci scusiamo per il disagio arrecato dal calo di tensione, soprattutto con i clienti che hanno dovuto ripristinare dati e applicazioni sulle proprie macchine.

martedì 8 marzo 2011

Nuove modalità gestione domini .it


Nel corso della prossima settimana, salvo imprevisti, finalmente il Registro Italiano provvederà a convertire al "sistema sincrono" tutti i domini .it registrati attraverso Rubalo.it

Questo comporterà diversi vantaggi nella gestione dei domini, ma necessariamente anche qualche cambio nelle procedure.

Ad esempio, per il cambio registrante non saranno più necessari documenti da inviare via fax: sarà possibile effettuare l'operazione on line.
Come pure per i trasferimenti da e verso altro Registrar, non sarà più necessaria la LAR, ma si potrà effettuare l'operazione on-line comunicando un codice di autorizzazione (cosiddetto "Authinfo")

Con l'operazione di conversione al sistema sincrono:
  • il TAG di registrazione EMMEWEB-MNT verrà convertito in NML-REG
  • a tutti i titolari dei domini ("registrant") verrà automaticamente comunicato per email il codice authinfo del proprio dominio
    Nota: questo non prelude ad alcun trasferimento o ad altre operazioni sul dominio, diverse dalla conversione al sistema sincrono. E' solo una misura obbligatoria e richiesta dal Registro Italiano.
    Nel caso si gestiscano domini .it per conto di altri, è consigliabile preavvertire i relativi Registrant di questo fatto, in quanto il vedersi recapitare una mail "ufficiale" contenente il codice Authinfo può generare spiacevoli equivoci.
    Inoltre, il codice authinfo va conservato e protetto gelosamente, in quanto è la "chiave" che permetterà tutte le operazioni di gestione e modifica del dominio.
Con il passaggio al sistema sincrono potremo finalmente introdurre anche il nuovo pannello di controllo utente, già noto agli utenti di DomainRegister.it (la nostra piattaforma commerciale di sola registrazione domini, senza servizi di hosting).

Tale nuovo pannello permetterà di eseguire direttamente, in tempo reale ed in piena autonomia una serie di operazioni che oggi possono esser effettuate solo nell'arco di alcune ore ed aprendo un ticket all'assistenza.

Tra le altre novità, attraverso il nuovo pannello sarà possibile:
  • impostare i propri server DNS autoritativi;
  • settare tutti i record DNS del proprio dominio sui nostri server DNS;
  • correggere e modificare i dati di contatto;
Ovviamente nella versione per gli utenti di Rubalo.it il pannello sarà completato da tutte le funzioni necessarie alla gestione dei servizi di hosting ed email associati ad un dominio.