¿Qué significa DCI?

Sep 15, 2025|

En el panorama digital contemporáneo, los centros de datos se han convertido en la columna vertebral de la infraestructura de computación en la nube, procesando volúmenes masivos de datos mientras consumen cantidades sustanciales de energía.

La pregunta "¿Qué significa DCI" con frecuencia "surge con frecuencia en las discusiones sobre las arquitecturas modernas de los centros de datos, donde DCI significa Interconnect de centros de datos, la tecnología que conecta múltiples centros de datos para permitir el intercambio de recursos y la distribución de la carga de trabajo.

Energía - Programación eficiente ha surgido como un desafío crítico, que requiere enfoques sofisticados para equilibrar los requisitos de rendimiento con la optimización del consumo de energía. La metodología de programación de la red del centro de datos (DENS) representa un avance significativo en la abordación de estos desafíos a través de modelos jerárquicos y estrategias de asignación de recursos inteligentes.

Conceptos clave en las redes de centros de datos

Interconexión del centro de datos (DCI)

Tecnología que conecta múltiples centros de datos para permitir el intercambio de recursos, la distribución de la carga de trabajo y la recuperación de desastres en las instalaciones geográficamente dispersas.

Congestión de la red

Ocurre cuando el tráfico de red excede la capacidad, a menudo causado por limitaciones del amortiguador en la infraestructura de Ethernet y los desajustes de ancho de banda entre los enlaces.

Metodología DENS

Un enfoque jerárquico para la programación del centro de datos que optimiza la eficiencia energética al tiempo que mantiene el rendimiento a través de la asignación inteligente de recursos.

Congestión de la red en entornos de centros de datos

El desafío de la infraestructura basada en Ethernet -

Los centros de datos modernos adoptan la filosofía de utilizar los medios Ethernet para llevar varios tipos de tráfico, incluidas las comunicaciones LAN, SAN e IPC. Si bien la tecnología Ethernet ofrece madurez, facilidad de implementación y una gestión relativamente simple, presenta desafíos significativos en términos de limitaciones de rendimiento del hardware, particularmente en la capacidad del búfer.

Los tamaños típicos de búfer Ethernet funcionan en el nivel de magnitud de 100 kb, mientras que los enrutadores de Internet generalmente cuentan con tamaños de búfer de una magnitud de 100 MB. Esta diferencia sustancial de 1000X en la capacidad de búfer, combinada con patrones de tráfico de ancho de banda -} altos, constituye la causa principal de la congestión de la red en entornos de centros de datos.

Comparación de capacidad de búfer

Switches Ethernet 100 KB

Routers de Internet 100 MB

La diferencia 1000X en la capacidad del búfer crea desafíos significativos para manejar patrones de tráfico de ancho de banda altos -} en centros de datos.

Manifestación de congestión en los interruptores del centro de datos

La manifestación de la congestión en los interruptores del centro de datos puede ocurrir en múltiples direcciones. En la dirección del enlace descendente, la congestión surge cuando la capacidad agregada de los enlaces de entrada excede la capacidad de los enlaces de salida. Para las direcciones de enlace ascendente, el desajuste de ancho de banda se determina principalmente por la relación de convergencia de ancho de banda, con una congestión que ocurre cuando el ancho de banda agregado de todos los puertos del servidor supera la capacidad total del enlace ascendente del interruptor.

Estos puntos de congestión, a menudo denominados puntos críticos, pueden afectar severamente la capacidad de la red del centro de datos para transmitir datos de manera eficiente, reduciendo potencialmente el rendimiento en hasta un 70% en casos extremos.

Congestión del enlace descendente

Ocurre cuando el tráfico entrante total excede la capacidad de salida de un puerto de conmutador, creando cuellos de botella en los datos de los datos de niveles de red más altos a más bajos.

Congestión del enlace ascendente

Sucede cuando el tráfico agregado del servidor excede la capacidad del enlace ascendente, típicamente determinada por la relación de convergencia de ancho de banda del diseño de red.

IEEE 802.1qau estándares y gestión de congestión

Cómo funciona 802.1qau

Los interruptores sobrecargados detectan la congestión y generan señales de notificación

Las señales de congestión se propagan a los dispositivos de envío

Los remitentes aceleran sus tasas de transmisión para reducir la congestión

La utilización de la red se mantiene a niveles altos (hasta el 95%)

La pérdida de paquetes se minimiza a través del control de la tasa proactiva

El Grupo de Tareas de puente del centro de datos (IEEE 802.1) ha desarrollado soluciones de control de congestión de Layer 2, específicamente la especificación IEEE 802.1qau. Este estándar introduce bucles de retroalimentación para la notificación de congestión entre los interruptores del centro de datos, lo que permite a los interruptores sobrecargados para utilizar las señales de notificación de congestión para acelerar los remitentes de carga -}.

Si bien esta técnica previene efectivamente la pérdida de paquetes debido a la congestión y mantiene altas tasas de utilización de la red de hasta el 95%, no resuelve fundamentalmente el problema subyacente.

"Un enfoque más eficiente implica el despliegue estratégico de datos - tareas intensivas para evitar compartir rutas de comunicación comunes. Por ejemplo, para aprovechar completamente las características de aislamiento espacial de tres - arquitecturas de nivel, datos -} Las tareas intensivas deben distribuirse proporción a través de los serveres de comunicación de acuerdo con sus requisitos de comunicación de comunicación". ".". "

Estas datos - tareas intensivas, similares a las aplicaciones de intercambio de video -}, generan transmisiones de bits constantes para los usuarios finales mientras se comunican simultáneamente con otros trabajos que se ejecutan dentro del centro de datos. Sin embargo, este método de implementación distribuido proporcionalmente contradice los objetivos de programación eficientes de energía -}, cuyo objetivo es utilizar conjuntos mínimos de servidores y conjuntos de recursos de comunicación para manejar todas las cargas de trabajo.

El marco de la metodología de DENS

Enfoque de modelado jerárquico

La metodología DENS representa un cambio de paradigma de los enfoques tradicionales que modelan los centros de datos como grupos homogéneos de recursos informáticos del servidor. En cambio, Dens propone un modelo jerárquico consistente con las topologías del centro de datos convencional.

Para los tres - centros de datos de nivel, la métrica Dens M se define como una combinación ponderada del servidor - función de nivel F_S, rack - función de nivel F_R y Módulo -} Función de nivel F_M:

M = × f_s + × f_r + × f_m

Donde, y representar coeficientes de ponderación que determinan cómo los componentes correspondientes (servidores, bastidores, módulos) influyen en las métricas de evaluación.

Coeficientes de ponderación

(Servidor - peso de nivel) típicamente 0.7

Favores seleccionando Servidores de carga -} dentro de bastidores ligeramente cargados

(Rack - peso de nivel) típicamente 0.2

Prioriza los bastidores informáticos con bajas cargas de red

(Módulo - peso de nivel) típicamente 0.1

Favores seleccionando módulos ligeramente cargados, crucial para la consolidación de tareas

Weighting Coefficients

Potencial de carga y comunicación del servidor

La combinación de carga del servidor L_S (L) y su potencial de comunicación Q_S (Q) forma la base principal para la selección del servidor. Esta relación se expresa a través de:

f_s(l,q) = L_s(l) × (Q_s(q)^φ)/δ_t

L_s(l)

Depende de la carga del servidor L, calculada utilizando una función sigmoidal especializada

Q_s(q)

Define la carga en los enlaces ascendentes del bastidor analizando las condiciones de congestión en la cola de salida del interruptor Q

δ_t

Ancho de banda sobre - factor de aprovisionamiento en la parte superior - de - rack (tor) conmutadores

Coeficiente que define la relación entre L_S (L) y Q_S (Q) en la métrica

Definición y optimización del factor de carga

El factor de carga DENS se define como la suma de dos funciones sigmoidales para abordar el desafío de que los servidores inactivos consumen aproximadamente el 67% de su consumo de energía máxima:

L_s(l) = 1/(1 + e^(-10(l - 0.5))) - 1/(1 + e^(-2(l - (1 - ε/2))))

El primer componente define la forma sigmoidea primaria, mientras que el segundo sirve como una función de penalización diseñada para converger los valores máximos de carga del servidor. El parámetro ε define el rango y la pendiente de la porción en declive de la curva.

Curva de optimización de carga del servidor

Server Load Optimization Curve

Este enfoque sofisticado asegura que los servidores funcionen dentro de los rangos de carga óptimos, típicamente entre el 70% y el 85% de la utilización, equilibrando la eficiencia energética con las preocupaciones de confiabilidad del hardware.

Gestión de la cola y métricas de congestión

Análisis de ocupación de la cola

Todos los servidores dentro de un bastidor comparten un interruptor TOR para la comunicación de enlace ascendente. A las tasas de gigabit, determinar la proporción exacta de la comunicación del enlace ascendente ocupada por servidores o flujos individuales se vuelve computacionalmente intensivo. Para abordar este desafío, la metodología DENS incorpora un componente relacionado con la ocupación de la cola de salida del interruptor Q (q), que varía con el ancho de banda sobre - factor de aprovisionamiento δ.

La tasa de ocupación Q es independiente del tamaño de la cola absoluta, pero varía con el tamaño total de la cola Q_max, que va desde [0,1], donde 0 y 1 corresponden a estados de cola vacíos y completos respectivamente. Al introducir el componente de ocupación de la cola, la métrica DENS puede responder a los cambios de congestión dentro de los bastidores o módulos en lugar de las variaciones de la velocidad de transmisión.

Implementación de distribución de Weibull

La función Q (Q) utiliza una función de distribución acumulada de Weibull inversa:

Q (q)=e^(- (3q/q_max)^2)

Esta formulación favorece la selección de colas vacías mientras penaliza las colas muy cargadas. Cuando los niveles de congestión siguen siendo bajos, el ancho de banda sobre - factor de aprovisionamiento δ en las ecuaciones es mejor admite la simetría entre la capacidad de ancho de banda de enlace ascendente y del enlace descendente.

Ocupación de cola vs. rendimiento

A medida que aumenta la congestión y se desbordan los amortiguadores, el desajuste de ancho de banda se vuelve imperdible, lo que puede conducir a la degradación del rendimiento de hasta el 40% en las rutas afectadas

Métricos de rendimiento y resultados de optimización

Función de selección en forma de campana -

La función F_S (L, Q) crea una superficie en forma de campana - en relación con la carga del servidor L y la carga de la cola q. Esta función selecciona preferentemente servidores por encima de los niveles de carga promedio ubicados en bastidores con congestión mínima o nula. Los estudios empíricos demuestran que este enfoque puede lograr un ahorro de energía de 25 - 35% en comparación con la programación tradicional de round-robin mientras mantiene el rendimiento dentro del 5% de los niveles óptimos.

Ahorro de energía

25-35%

En comparación con los algoritmos de programación de Robin Round -

Actuación

95%+

Mantiene el rendimiento dentro del 5% de los niveles óptimos

Utilización

70-85%

Eficiencia y confiabilidad de equilibrio de rango de utilización de servidor óptimo

Análisis de impacto jerárquico

Los factores de impacto para bastidores y módulos se expresan como:

Factor de nivel rack -

f_r (l, q)=l_r (l) × (q_m (q)^φ)/Δ_m=(q_m (q)^φ)/Δ_m × (1/n) σ (i =1 a n) l_s (l)

Donde l_r (l) representa la carga del bastidor ya que la suma normalizada de todas las cargas del servidor dentro del rack, N es el número de servidores por rack, Q_M (Q) es proporcional a la carga de tráfico en los interruptores de ingreso del módulo, y Δ_m es el ancho de banda sobre -} factor de aprovisionamiento en los interruptores de módulos.

Módulo - Factor de nivel

f_m (l)=l_m (l)=(1/k) σ (j =0 a k) l_r (l)

Donde l_m (l) representa la carga del módulo como la suma normalizada de todas las cargas de rack dentro del módulo, y k es el número de bastidores por módulo. El factor de nivel del módulo - incluye solo un componente relacionado de carga - a medida que todos los módulos se conectan a los mismos interruptores de núcleo.

Consideraciones de implementación práctica

Comercio de eficiencia energética - offs

Al examinar qué significa DCI para la programación eficiente de energía -, queda claro que las implementaciones de DCI deben equilibrar cuidadosamente la optimización local dentro de los centros de datos individuales contra la optimización global en las instalaciones interconectadas.

La metodología DENS demuestra que los programadores eficientes de energía - deben consolidar los trabajos del centro de datos dentro del conjunto de servidores más pequeño posible, logrando relaciones de consolidación de 3: 1 o más en escenarios típicos.

Sin embargo, la operación continua en las cargas máximas puede reducir la confiabilidad del hardware en un 15-20% e impactar los tiempos de finalización del trabajo hasta en un 30%.

Energy Efficiency Trade-Offs

Comercio clave - offs

Una mayor consolidación reduce el consumo de energía

El equilibrio de carga óptimo mejora la eficiencia de la red

Sobre - La consolidación aumenta el riesgo de falla (15-20% de reducción de confiabilidad)

Las cargas máximas pueden afectar los tiempos de finalización del trabajo hasta en un 30%

Multi - equilibrio de carga de ruta

El módulo - Factor de nivel F_M incluye solo un componente relacionado con la carga - L, ya que todos los módulos se conectan a los mismos interruptores centrales y obtienen un ancho de banda idéntico a través de ECMP (igual -} Costo multi -} ruta de enrutamiento). Este diseño asegura que la distribución del tráfico permanezca equilibrada en las rutas disponibles, con mejoras medidas en el rendimiento de 40 - 50% en comparación con los enfoques de enrutamiento de una sola vía.

Beneficios de enrutamiento de ECMP

Distribuye el tráfico en múltiples rutas de costos -

Mejora el rendimiento por 40 - 50% vs. enrutamiento de una sola vía

Mejora la tolerancia a fallas a través de la redundancia del camino

Funciona sin problemas con el modelo jerárquico de Dens

Estrategias de optimización avanzada

Ajuste de peso dinámico

Investigaciones recientes han explorado el ajuste dinámico de los coeficientes de ponderación, y basado en características de carga de trabajo de tiempo - real.

Compute - cargas de trabajo intensivas =0.8, + =0.2

Comunicación - intensiva =0.4, =0.3, =0.3

Servicios de personalización de productos

"La integración de las fuentes de energía renovables con algoritmos de programación basados en DENS - ha demostrado un potencial notable para reducir las huellas de carbono en los centros de datos de hiperescala".

Reducción de hasta el 45% en el consumo de energía de la red

Fuente: Zhang et al. (2024), transacciones IEEE en computación sostenible

Servicio de muestra gratuito

La incorporación de algoritmos de aprendizaje automático para predecir los patrones de tráfico y optimizar los parámetros de DENS ha mostrado resultados prometedores.

85% de precisión en la predicción de congestión

Horizonte de predicción de 5 minutos

10-15% de ahorro de energía adicional

Validación y resultados experimentales

Entorno de simulación

Las extensas simulaciones utilizando simuladores de eventos discretos han validado la metodología DENS en varias configuraciones de centros de datos. Los escenarios de prueba incluyeron centros de datos que van desde 1,000 a 100,000 servidores, con patrones de tráfico variables que incluyen servicios web (80% de lectura, 20% de escritura), procesamiento por lotes (lectura/escritura equilibrada) y aplicaciones de transmisión (95% de escritura, 5% de lectura).

Escala de servidor

1,000 a 100,000 servidores

Patrones de tráfico

Servicios web, procesamiento por lotes, transmisión

Tipo de simulación

Simuladores de eventos discretos

Métricas de rendimiento

Indicadores clave de rendimiento

Eficiencia energética

28-42% de reducción de energía en comparación con los programadores de referencia

Utilización de la red

Mantenido 85 - 92% Utilización de la red sin pérdida de paquetes inducido por congestión

Tiempo de finalización del trabajo

Tiempos de finalización promedio de trabajo mejorados en un 15-25%

Utilización del servidor

Alcanzó rangos de utilización óptimos del servidor del 72-83%

Latencia de cola

Latencia de cola promedio reducida en un 35-45%

Comparación de rendimiento

← Artículo anterior: Lo que permite que los dispositivos digitales interconecten y transmitan datos

Siguiente artículo: Conectividad del centro de datos →

Envíeconsulta