- Martes, 11 Octubre 2011
Debido al espectacular aumento de los costes energéticos y a la creciente incertidumbre sobre la disponibilidad de energía a nivel mundial, todos los niveles de dirección de las empresas se concentran, ahora más que nunca, en administrar y ahorrar energía.
Este principio adquiere una importancia clave en los centros de datos de las corporaciones, que pueden consumir el 25 por ciento de la energía total de cualquier organización informática con niveles de actividad típicos (estimación de Raritan basada en el informe “Report to Congress on Server and Data Center Energy Efficiency Public Law 109-431” de la Agencia de Protección Medioambiental de EE. UU.). Dada la creciente confianza depositada en los sistemas informáticos para servir aplicaciones críticas y el surgimiento tanto de la tecnología blade como de la virtualización, la densidad de servidores está aumentando notablemente.
Como consecuencia de este aumento, los centros de datos generan cada vez más calor y los sistemas de aire acondicionado (HVAC) tienen que trabajar más para mantenerlos refrigerados. Esto, a su vez, aumenta los gastos energéticos y se está convirtiendo en una causa de preocupación creciente para los departamentos informáticos, ya que el coste asociado podría llegar a superar cualquier presupuesto - y aprovecha las Directrices de TI Ecológica que se están lanzando desde notables organizaciones en los centros ecológicos de TI.
Existe la necesidad clara de supervisar el consumo energético y las temperaturas de los centros de datos, así como de ajustar los niveles de calefacción, refrigeración y ventilación para minimizar el consumo sin perjudicar los tiempos de disponibilidad de los sistemas informáticos. ¿Pero cuál es el primer paso que deben dar las corporaciones con visión de futuro? ¿Qué instrumentos hay disponibles para obtener los datos necesarios para diseñar un centro de datos más eficiente y ecológico?
Este libro blanco, el primero de una serie, repasa algunos de los problemas de administración de energía más espinosos y proporciona algunas respuestas. El lector aprenderá estas tres cosas:
- Sus lagunas de conocimiento en lo que pensaba que sabía sobre la medición de energía.
- Qué tipo de instrumentos de medida se necesitan para calcular la eficiencia energética de un centro de datos.
- Cómo establecer unos criterios que pongan su centro de datos en concordancia con Green Grid y faciliten su compromiso con un entorno de TI más respetuoso con el medioambiente.
El desafío
Cuando la administración de energía no era un asunto de máxima prioridad, los responsables informáticos predecían el consumo eléctrico total de sus centros de datos mediante cálculos sencillos basados en las especificaciones nominales de los equipos.
Sin embargo, de acuerdo con el documento de HP titulado “HP Power & Cooling”, del 31 de agosto de 2006, el consumo eléctrico medio de un centro de datos ha aumentado de 2,1 kilovatios por rack en 1992 a 14 kWh por rack en 2006. La mera multiplicación del número de servidores por sus consumos nominales no se corresponde con las estadísticas de consumo reales. La encuesta que DatacenterDynamics realizó con ocasión de su conferencia Spring 2007 demostró que el consumo eléctrico medio de todos los encuestados de EE. UU. era de 5,5 kWh por rack, con un promedio de picos de consumo de 11,6 kWh por rack.
Por otra parte, muchos analistas industriales, como Gartner (“25ª Conferencia Anual sobre Centros de Datos”, diciembre de 2006), llevan ya más de un año prediciendo notables insuficiencias en el suministro energético. Aunque algunas empresas disponen de la flexibilidad necesaria para trasladar sus centros de datos a lugares en los que el suministro eléctrico sea más fiable y barato, no todas pueden, lo que significa que las diferencias, que quedan sin resolver, podrían obligar a los administradores de TI e instalaciones a tomar complicadas decisiones para mantener unas aplicaciones y sacrificar otras, de modo que puedan mantener el negocio en funcionamiento durante los picos de demanda.
Con la creciente atención que se viene prestando a las cuestiones relacionadas con la energía y la aparición de herramientas capaces de realizar mediciones exactas, los administradores informáticos y responsables de instalaciones ya no tienen que confiar ciegamente en los consumos nominales indicados en las placas de características de sus unidades ni realizar sus cálculos basándose en asunciones aceptadas por la industria. Aunque hasta ahora se aceptaban valores aproximados, la crisis energética que parece avecinarse obliga a trabajar con valores precisos.
Sólo midiendo los consumos individualizados de sus servidores, los responsables pueden determinar exactamente el consumo real de sus equipos y obtener cifras que permitan planificar las medidas de ahorro energético.
Con los datos obtenidos de la supervisión individualizada de servidores en tiempo real, los administradores pueden gestionar más eficazmente y sentirse más seguros a la hora de elegir qué equipos deben desconectar, ya que pueden:
- Identificar recursos de procesamiento inactivos.
- Identificar recursos de procesamiento de bajo rendimiento (que consumen mucha energía a cambio de una potencia de cálculo reducida).
- Apoyar la planificación de capacidades a la hora de diseñar infraestructuras para todos los equipos de refrigeración y de protección y distribución de alimentación.
Capacidades nominales y datos asumidos
Los fabricantes de servidores indican el consumo eléctrico de cada servidor en la placa de características. Sin embargo, los administradores de centros de datos saben que este dato siempre indica el máximo consumo posible y que el consumo eléctrico típico del servidor nunca alcanza el valor nominal expresado en la placa de características. Una manera fácil de aumentar la densidad de servidores es restar del consumo nominal un determinado porcentaje, que dependerá de la carga de trabajo impuesta al servidor.
PTS denomina este valor reducido “consumo nominal de diseño” del equipo. Generalmente, equivale a un 50 a 75 por ciento del consumo nominal indicado en la placa de características, y se utiliza para dimensionar todos los sistemas de refrigeración y de protección y distribución de la alimentación del centro de datos. Dado que frecuentemente este porcentaje sigue siendo mayor que el real, en la actualidad se utilizan dispositivos PDU inteligentes para obtener datos mucho más precisos.
Por ejemplo, midiendo el consumo eléctrico de servidores individuales mediante equipos PDU inteligentes, el estudio de equipos informáticos de Raritan por parte de PTS determinó que su consumo habitual se situaba entre el 20 y el 85 por ciento de su consumo teórico (nominal), con un promedio aproximado del 31 por ciento, es decir, muy inferior al consumo nominal de los equipos.
Consumo eléctrico de equipos informáticos frente a consumo eléctrico total de las instalaciones
Otra medición importante consiste en contrastar el consumo de los equipos informáticos frente al consumo total de la instalación. APC-MGE calcula que el 30 por ciento del consumo eléctrico total de un centro de datos corresponde a los servidores y a los demás equipos informáticos, mientras que el resto de consumidores (refrigeración, ventilación, distribución de la alimentación, iluminación) suman el 70 por ciento restante. Según EYP Mission Critical Facilities, una división de HP, ambas magnitudes se reparten por igual, es decir, 50 por ciento frente a 50 por ciento. Sin embargo, un análisis preliminar realizado por PTS y Raritan demostró que el 71 por ciento del consumo correspondía a cargas de trabajo informático crítico, pero sólo un 29 por ciento a los sistemas auxiliares. El elevado porcentaje de energía destinado a tareas informáticas críticas indica que PTS y Raritan gestionan la energía en sus centros de datos de forma más eficiente que el promedio de la industria. También deja entrever una oportunidad para mejorar el rendimiento… más potencia de cálculo con menos energía.
Estos datos ilustran la importancia de obtener mediciones exactas en los centros de datos, en lugar de confiar en los “promedios oficiales de la industria”.
Sistemas de medición
¿Cómo puede usted realizar estas mediciones de forma eficiente y exacta? A continuación se explican algunas de las piezas del rompecabezas que deben tenerse en cuenta:
Supervisores de circuitos derivados y medición de cargas de dispositivos individuales
Los supervisores de circuitos secundarios son dispositivos eléctricos que miden la carga actual en todos los circuitos de un panel eléctrico y alertan a los operadores cuando la carga se aproxima al límite nominal del disyuntor. Esta prevención es especialmente importante, por ejemplo, en centros de datos, donde puede ocurrir que se enchufen servidores adicionales a un circuito que ya se encuentre a próximo su capacidad máxima. Los supervisores de circuitos secundarios miden continuamente la corriente presente en todos los circuitos y garantizan que alguien sea avisado antes de que un disyuntor alcance su capacidad nominal, o peor aún, que se dispare.
Recopiladores de datos ambientales en centros de datos
Los recopiladores de datos ambientales están específicamente diseñados para recopilar los datos ambientales y de suministro eléctrico de centros de datos. También pueden consolidar la información recogida y analizarla para ayudar a tomar decisiones informadas sobre el consumo eléctrico, tanto de equipos informáticos como de instalaciones.
Dispositivos PDU inteligentes
Los dispositivos PDU inteligentes permiten al personal informático supervisar el consumo eléctrico de cualquier servidor, unidad de almacenaje u otro dispositivo informático, lo cual resulta muy útil para identificar los equipos infrautilizados e identificar aquéllos que se aproximen a sus niveles de utilización máximos normales, o incluso los superen. También ofrecen funciones de supervisión y control del consumo eléctrico del centro de datos a nivel de instalación.
Los dispositivos PDU inteligentes se puede controlar remotamente a través de un navegador web o de una interfaz de línea de comandos (CLI). Pueden medir el flujo eléctrico tanto a nivel de PDU como a nivel de cada toma de corriente individual, permiten establecer alarmas con umbrales definidos por el usuario, proporcionan seguridad en forma de contraseñas, autenticación, autorización y cifrado; e incorporan amplias funciones de administración ambiental. Algunos modelos también son altamente adaptables, incorporan las últimas técnicas basadas en estándares de la industria, como SNMP TRAPs/SETs/GETs, IPMI, SMASH CLP y pueden integrarse sin problemas en infraestructuras corporativas existentes, como servidores LDAP, Active Directory®, RADIUS y NFS.
No obstante, estas herramientas no pueden desarrollar su potencial máximo si el modelo se basa meramente en un entorno estático. En el mundo real, los centros de datos son dinámicos. El grado de utilización de los servidores cambia con el tiempo, y con él varían también el consumo eléctrico y la generación y disipación del calor. Esto, a su vez, requiere una refrigeración apropiada para determinados racks o grupos de computadoras.
Por lo tanto, el paso siguiente consiste en determinar el grado de eficacia del aprovechamiento energético del centro de datos.
La organización Green Grid: Cálculo del valor PUE
La organización Green Grid define la eficacia de utilización de la energía (“PUE”, acrónimo del término inglés “Power Usage Effectiveness”) con esta fórmula:
PUE = Consumo de toda la instalación/Consumo de los equipos informáticos
En esta ecuación, “Consumo de toda la instalación” es la energía necesaria para mantener en funcionamiento todo el centro de datos, es decir, servidores, equipos informáticos, iluminación, refrigeración, ventilación, etc. “Consumo de los equipos informáticos” representa la energía consumida sólo por los servidores y los equipos informáticos.
El valor PUE puede variar de 1,0 a infinito. Un valor PUE cercano a 1,0 indicaría una eficacia del 100 por ciento (es decir, toda la energía eléctrica sería consumida sólo por equipos informáticos). Actualmente, no existen estudios amplios que demuestren la distribución real del valor PUE en centros de datos. Algún trabajo preliminar realizado por PTS parece indicar que muchos centros de datos pueden tener una PUE de 3,0 o mayor, pero con un diseño adecuado podría alcanzarse un valor PUE de 1,6.
Herramientas para calcular la PUE
A la hora de calcular el valor PUE de su centro de datos, es necesario medir con exactitud el consumo eléctrico real para poder establecer una línea de base de cálculo que le permita cuantificar las mejoras obtenidas. Para hacerlo posible, Raritan y PTS diseñaron e implementaron la siguiente estrategia de medición.
Se instaló un dispositivo de captura de datos Veris H8820 para medir el amperaje del circuito secundario de cada carga y calcular la energía que alimentaba las unidades de aire acondicionado (CRAC), la iluminación, los sistemas de alimentación ininterrumpida (SAI o, en inglés, “UPS”) y de otros consumidores no informáticos del centro de datos. Se seleccionó esta unidad porque era fácil de instalar y suministraba los datos que se precisaban.
Se desplegaron monitores ambientales Geist Racsense con sondas de temperatura en las cubiertas y pisos de cada rack (en las partes frontal y posterior), así como en la entrada y salida de alimentación de cada unidad CRAC.
También se instaló una sonda de humedad para medir la humedad ambiental dentro de la sala. Los dispositivos Racsense permitieron capturar de forma muy sencilla y eficiente datos sobre la instalación y el cableado.
En cada rack se colocaron dos unidades de distribución de alimentación inteligentes Dominion® PX. Esto permitió recopilar datos sobre el consumo activo de las cargas informáticas críticas de forma individualizada por cada dispositivo. Estos datos sobre cargas informáticas críticas proporcionaron la precisión de datos necesaria para medir la PUE y elaborar propuestas de mejora.
Los resultados
Consumo nominal frente al consumo real
El histograma de la Figura 1 muestra la distribución de frecuencias del consumo real expresado como porcentaje del consumo nominal (capacidad), elaborado a partir de lecturas efectuadas en el centro de datos de Raritan entre el 21 y el 26 de febrero de 2008. El valor nominal expresado en la placa de características indica el consumo máximo que un dispositivo puede alcanzar en un momento dado bajo cualquier carga de trabajo y en cualquier clase de condición ambiental dentro del centro de datos.
Las reglas actuales de diseño de centros de datos utilizan los valores nominales para elaborar la planificación de capacidades. Puesto que el valor nominal indicado en la placa de características representa el valor máximo alcanzable, utilizar este método para dimensionar los sistemas de alimentación de centros de datos resulta ineficiente porque se basa en cifras superiores al consumo real. La reducción del valor nominal en un porcentaje fijo mitiga en parte el problema, pero el gráfico que aparece debajo demuestra que el abanico de aspectos relacionados con el consumo real de la parte operativa es tan amplio que dificulta notablemente la elección de un factor de reducción que proporcione un equilibrio adecuado entre eficiencia de consumo y garantía de funcionamiento fiable. En otras palabras, lo que pensábamos que estábamos consiguiendo mediante una estrategia de “disminución de los valores” ha resultado ser un mito, pues estábamos sacrificando conocimiento “real” por un conocimiento “aproximado”, y así también sacrificábamos nuestra capacidad para convertirnos en una empresa más ecológica.
Por ejemplo, durante la medición del consumo medio real se halló que 29 dispositivos de la sala de servidores de Raritan consumen entre un 21% y un 40% de esta capacidad, mientras que 15 consumen un porcentaje mayor y 15 consumen un porcentaje de capacidad menor. La medición del consumo máximo demostró que 27 dispositivos de nuestra sala de servidores consumen entre un 21% y un 40% de esta capacidad, mientras que 23 consumen un porcentaje de capacidad mayor y 9 consumen un porcentaje de capacidad menor.
La conclusión principal es que la capacidad real (el consumo real) tiene un rango potencial muy amplio. Por lo tanto, la mera reducción aritmética de los consumos nominales tiene dos posibles consecuencias: o pone en peligro la fiabilidad o no aprovecha todo el potencial de aumento de eficiencia. Un diseño basado en consumos reducidos aritméticamente podría ser el primer paso, pero la medición del consumo real de un dispositivo durante el funcionamiento diario proporciona la información adicional necesaria para trabajar de forma más eficiente y para garantizar un funcionamiento fiable.
Cálculo del valor PUE de Raritan
Como muestra el gráfico de la Figura 2, aproximadamente el 71 por ciento del consumo eléctrico medio total corresponde a equipos informáticos críticos de Raritan (sólo los servidores ya consumen el 49.4 por ciento), mientras que el 29 por ciento
restante corresponde a servicios auxiliares, como refrigeración e iluminación.
Para calcular la PUE de Raritan mediante la fórmula anterior:
Consumo total = Infraestructura auxiliar (5,625 kW) + Carga crítica (13,68 kW) = 19,3 kW
Consumo total de equipos informáticos = Carga crítica (13,68 kW)
PUE de Raritan = Consumo total / Consumo total de equipos informáticos= 19,3 kW/13,7 kW= 1,4
Conclusiones
El aumento de los costes energéticos y la reducción de las fuentes de suministro fueron las principales motivaciones para realizar este análisis. Durante un periodo de cinco meses, Raritan y PTS definieron y ejecutaron un plan para equipar la sala de servidores de Raritan y medir el consumo eléctrico tanto a nivel de dispositivos informáticos como a nivel de circuitos secundarios para cargas no informáticas. Gracias a este estudio, Raritan descubrió lo siguiente:
- Tras asumir inicialmente que su sala de servidores tendría un valor PUE poco llamativo, Raritan descubrió que en realidad tenía el respetable valor PUE de 1,4, siendo el consumo medio de todos sus equipos informáticos de 10,5 kW (servidores y almacenaje combinado)
- Esto significa que, si tomamos el conocimiento real, y no “aproximado”, Raritan puede darle un enfoque inteligente a la gestión y al suministro de su centro de datos:
• Raritan no necesita añadir servidores para aumentar la potencia de cálculo.
• Raritan puede pasar a ser un centro de datos más ecológico.
- 44 dispositivos registraron un consumo eléctrico medio real equivalente al de un servidor inactivo. Esto indicaba claramente que podría ahorrarse energía consolidando esos servidores casi inactivos. Asumiendo una consolidación típica de 10 a 1, potencialmente podrían ponerse fuera de servicio 40 dispositivos.
• Raritan puede evitar el deterioro de sus servicios vitales implementando una administración más eficiente de las cargas de trabajo.
- Dos dispositivos estaban consumiendo entre el 80 y el 100 por ciento de su consumo nominal. Si Raritan hubiese aplicado el promedio aritmético de la industria y reducido entre un 60 y un 80 por ciento este valor, el rendimiento de los servidores podría haberse visto afectado negativamente.
- Se investigaron esos mismos dos dispositivos para asegurarse de que no creaban puntos problemáticos (“hot spots”) y de que su consumo no era cercano al límite de su capacidad, lo cual habría planteado un problema potencial.
- Raritan puede reducir sus costes operativos sin perjuicio de su capacidad de procesamiento vital.
• La utilización de dispositivos PDU inteligentes en rack indicó a Raritan el consumo eléctrico real a nivel de dispositivos informáticos individuales, proporcionando los datos necesarios para planificar los pasos siguientes en el camino hacia una reducción del consumo energético, una mayor eficiencia y en consecuencia un mayor respeto
por el medio ambiente
Las mediciones también aportaron una serie de ventajas imprevistas, más allá del mero suministro de los datos necesarios para elaborar el cálculo del valor PUE. Por ejemplo, una caída repentina del consumo eléctrico permitió al personal informático descubrir que el disyuntor de una de sus unidades CRAC se había disparado. Esto permitió efectuar una reparación preventiva, antes de que el calor del verano pudiese presentar un problema para la refrigeración. Un sensor de temperatura colocado en la parte alta de un rack los avisó de que uno de los ventiladores del rack había fallado.
Puesto que los patrones comparativos de la industria (“benchmarks”) están basados en una amplia variedad de promedios y cada centro de datos tiene sus propias características únicas que lo diferencian de dichos promedios, este estudio de Raritan y PTS vino a reforzar el principio de la organización Green Grid:
“Para mejorar el rendimiento energético de los centros de datos, primero es necesario medir el consumo del centro de datos en su conjunto y de cada uno de los subsistemas que lo componen.”
¿Cuál es el paso siguiente?
En el libro blanco siguiente examinaremos la utilización y las ventajas de la dinámica de fluidos computacional (“Computational Fluid Dynamics” o CFD) para ayudarle a mejorar la eficiencia energética de su centro de datos.
También compararemos nuestros resultados obtenidos aplicando mediciones reales frente a datos de consumos nominales mediante CFD.
Autor:
Greg More, Product Manager en Raritan.