Brevemente sobre PCI y las diferencias con PCIe y AGP. ¿Cómo funciona el bus PCI Express?

Al cambiar solo una tarjeta de video, asegúrese de tener en cuenta que es posible que los nuevos modelos simplemente no se ajusten a su placa base, ya que no solo hay varios tipos diferentes de ranuras de expansión, sino también varias versiones diferentes de las mismas (tanto para AGP como para PCI Express). . Si no está seguro de sus conocimientos sobre este tema, lea atentamente la sección.

Como señalamos anteriormente, la tarjeta de video se inserta en una ranura de expansión especial en la placa base de la computadora y, a través de esta ranura, el chip de video intercambia información con el procesador central del sistema. Las placas base suelen tener ranuras de expansión de uno o dos tipos diferentes, que se diferencian en el ancho de banda, la configuración de energía y otras características, y no todas son adecuadas para instalar tarjetas de video. Es importante conocer los conectores disponibles en el sistema y comprar sólo la tarjeta de video que coincida con ellos. Los diferentes conectores de expansión son física y lógicamente incompatibles y una tarjeta de video diseñada para un tipo no encajará en otro y no funcionará.

Afortunadamente, en el último tiempo, no solo se han hundido en el olvido las ranuras de expansión ISA y VESA Local Bus (que son de interés solo para futuros arqueólogos) y las tarjetas de video correspondientes, sino que también las tarjetas de video para ranuras PCI prácticamente han desaparecido, y todas Los modelos AGP están irremediablemente obsoletos. Y todas las GPU modernas utilizan un solo tipo de interfaz: PCI Express. Anteriormente, el estándar AGP se usaba ampliamente; estas interfaces difieren significativamente entre sí, incluido el rendimiento, las capacidades proporcionadas para alimentar la tarjeta de video y otras características menos importantes.

Sólo una pequeña parte de las placas base modernas no tienen ranuras PCI Express, y si su sistema es tan antiguo que utiliza una tarjeta de video AGP, no podrá actualizarlo; deberá cambiar todo el sistema. Echemos un vistazo más de cerca a estas interfaces; estas son las ranuras que debes buscar en tus placas base. Ver fotos y comparar.

AGP (Puerto de gráficos acelerados o Puerto de gráficos avanzados) es una interfaz de alta velocidad basada en la especificación PCI, pero creada específicamente para conectar tarjetas de video y placas base. El bus AGP, aunque es más adecuado para adaptadores de video que PCI (¡no Express!), proporciona una conexión directa entre el procesador central y el chip de video, así como algunas otras características que aumentan el rendimiento en algunos casos, por ejemplo, GART. la capacidad de leer texturas directamente desde la RAM, sin copiarlas a la memoria de video; velocidades de reloj más altas, protocolos de transferencia de datos simplificados, etc., pero este tipo de ranura está irremediablemente desactualizado y hace mucho tiempo que no se lanzan nuevos productos con él.

Pero aún así, por razones de orden, mencionemos este tipo. Las especificaciones AGP aparecieron en 1997, cuando Intel lanzó la primera versión de la especificación, que incluía dos velocidades: 1x y 2x. En la segunda versión (2.0) apareció AGP 4x, y en 3.0 - 8x. Consideremos todas las opciones con más detalle:
AGP 1x es un enlace de 32 bits que funciona a 66 MHz, con un rendimiento de 266 MB/s, que es el doble del ancho de banda PCI (133 MB/s, 33 MHz y 32 bits).
AGP 2x es un canal de 32 bits que funciona con el doble de ancho de banda de 533 MB/s a la misma frecuencia de 66 MHz debido a la transferencia de datos en dos frentes, similar a la memoria DDR (sólo en la dirección “a la tarjeta de video”).
AGP 4x es el mismo canal de 32 bits que funciona a 66 MHz, pero como resultado de ajustes adicionales, se logró una frecuencia "efectiva" cuádruple de 266 MHz, con un rendimiento máximo de más de 1 GB/s.
AGP 8x: los cambios adicionales en esta modificación permitieron obtener un rendimiento de hasta 2,1 GB/s.

Las tarjetas de video con interfaz AGP y las ranuras correspondientes en las placas base son compatibles dentro de ciertos límites. Las tarjetas de vídeo con capacidad de 1,5 V no funcionan en ranuras de 3,3 V y viceversa. Sin embargo, también existen conectores universales que admiten ambos tipos de placas. Las tarjetas de video diseñadas para una ranura AGP obsoleta moral y físicamente no se han considerado durante mucho tiempo, por lo que para conocer los sistemas AGP antiguos, sería mejor leer el artículo:

PCI Express (PCIe o PCI-E, que no debe confundirse con PCI-X), anteriormente conocida como Arapahoe o 3GIO, se diferencia de PCI y AGP en que es una interfaz serie en lugar de paralela, lo que permite menos pines y mayor ancho de banda. PCIe es sólo un ejemplo del paso de buses paralelos a seriales; otros ejemplos de este movimiento son HyperTransport, Serial ATA, USB y FireWire. Una ventaja importante de PCI Express es que le permite apilar varios carriles individuales en un canal para aumentar el rendimiento. El diseño en serie multicanal aumenta la flexibilidad, a los dispositivos lentos se les pueden asignar menos líneas con una pequeña cantidad de contactos y a los dispositivos rápidos se les puede asignar más.

La interfaz PCIe 1.0 transfiere datos a una velocidad de 250 MB/s por carril, que es casi el doble de la capacidad de las ranuras PCI convencionales. El número máximo de carriles admitidos por las ranuras PCI Express 1.0 es 32, lo que proporciona un rendimiento de hasta 8 GB/s. Una ranura PCIe con ocho carriles de trabajo es aproximadamente comparable en este parámetro a la versión AGP más rápida: 8x. Lo que es aún más impresionante si se tiene en cuenta la capacidad de transmitir simultáneamente en ambas direcciones a altas velocidades. Las ranuras PCI Express x1 más comunes proporcionan ancho de banda de un solo carril (250 MB/s) en cada dirección, mientras que PCI Express x16, que se utiliza para tarjetas de vídeo y combina 16 carriles, proporciona hasta 4 GB/s de ancho de banda en cada dirección.

Aunque la conexión entre dos dispositivos PCIe a veces se compone de varios carriles, todos los dispositivos admiten un solo carril como mínimo, pero opcionalmente pueden manejar más. Físicamente, las tarjetas de expansión PCIe encajan y funcionan normalmente en cualquier ranura con un número igual o mayor de carriles, por lo que una tarjeta PCI Express x1 funcionará sin problemas en ranuras x4 y x16. Además, una ranura físicamente más grande puede funcionar con un número lógicamente menor de líneas (por ejemplo, parece un conector x16 normal, pero solo se enrutan 8 líneas). En cualquiera de las opciones anteriores, el propio PCIe seleccionará el modo más alto posible y funcionará con normalidad.

La mayoría de las veces, los conectores x16 se utilizan para adaptadores de video, pero también hay placas con conectores x1. Y la mayoría de las placas base con dos ranuras PCI Express x16 funcionan en modo x8 para crear sistemas SLI y CrossFire. Físicamente, otras opciones de ranuras, como x4, no se utilizan para tarjetas de video. Permítanme recordarles que todo esto se aplica solo al nivel físico; también hay placas base con conectores físicos PCI-E x16, pero en realidad con 8, 4 o incluso 1 canal. Y cualquier tarjeta de video diseñada para 16 canales funcionará en dichas ranuras, pero con menor rendimiento. Por cierto, la foto de arriba muestra las ranuras x16, x4 y x1 y, a modo de comparación, también queda PCI (abajo).

Aunque la diferencia en juegos no es tan grande. Aquí, por ejemplo, hay una revisión de dos placas base en nuestro sitio web, que examina la diferencia en la velocidad de los juegos 3D en dos placas base, un par de tarjetas de video de prueba en las que funcionan en modos de 8 canales y 1 canal, respectivamente:

La comparativa que nos interesa está al final del artículo, presta atención a las dos últimas tablas. Como puede ver, la diferencia en la configuración media es muy pequeña, pero en los modos pesados ​​​​comienza a aumentar y se nota una gran diferencia en el caso de una tarjeta de video menos potente. Por favor toma nota.

PCI Express se diferencia no solo en el rendimiento, sino también en las nuevas capacidades de consumo de energía. Esta necesidad surgió porque la ranura AGP 8x (versión 3.0) solo puede transferir no más de 40 vatios en total, lo que ya faltaba en las tarjetas de video de esa época diseñadas para AGP, que se instalaban con uno o dos alimentadores estándar de cuatro pines. conectores. La ranura PCI Express puede transportar hasta 75 W, con 75 W adicionales disponibles a través del conector de alimentación estándar de seis pines (consulte la última sección de esta parte). Recientemente, han aparecido tarjetas de video con dos de estos conectores, lo que en total da hasta 225 W.

Posteriormente, el grupo PCI-SIG, que desarrolla estándares relevantes, presentó las principales especificaciones de PCI Express 2.0. La segunda versión de PCIe duplicó el ancho de banda estándar, de 2,5 Gbps a 5 Gbps, de modo que el conector x16 puede transferir datos a velocidades de hasta 8 GB/s en cada dirección. Al mismo tiempo, PCIe 2.0 es compatible con PCIe 1.1; las tarjetas de expansión antiguas suelen funcionar bien en las placas base nuevas.

La especificación PCIe 2.0 admite velocidades de transferencia de 2,5 Gbps y 5 Gbps para garantizar la compatibilidad con las soluciones PCIe 1.0 y 1.1 existentes. La compatibilidad con versiones anteriores de PCI Express 2.0 permite utilizar soluciones heredadas de 2,5 Gb/s en ranuras de 5,0 Gb/s, que luego simplemente funcionarán a una velocidad más baja. Y los dispositivos diseñados según las especificaciones de la versión 2.0 pueden admitir velocidades de 2,5 Gbps y/o 5 Gbps.

Aunque la principal innovación en PCI Express 2.0 es la velocidad duplicada a 5 Gbps, este no es el único cambio, hay otras modificaciones para aumentar la flexibilidad, nuevos mecanismos para el control programático de las velocidades de conexión, etc. Lo que más nos interesa son los cambios relacionados con con la fuente de alimentación de los dispositivos, ya que los requisitos de energía de las tarjetas de video aumentan constantemente. PCI-SIG ha desarrollado una nueva especificación para adaptarse al creciente consumo de energía de las tarjetas gráficas; amplía las capacidades actuales de suministro de energía a 225/300 W por tarjeta de video. Para admitir esta especificación, se utiliza un nuevo conector de alimentación de 2x4 pines, diseñado para proporcionar energía a tarjetas gráficas de alta gama.

Las tarjetas de video y placas base con soporte para PCI Express 2.0 aparecieron en gran venta ya en 2007, y ahora no se pueden encontrar otras en el mercado. Los dos principales fabricantes de chips de vídeo, AMD y NVIDIA, han lanzado nuevas líneas de GPU y tarjetas de vídeo basadas en ellas, que admiten el mayor ancho de banda de la segunda versión de PCI Express y aprovechan las nuevas capacidades de energía eléctrica para las tarjetas de expansión. Todos ellos son compatibles con placas base que tienen ranuras PCI Express 1.x, aunque en algunos casos raros hay incompatibilidad, por lo que hay que tener cuidado.

En realidad, la aparición de la tercera versión de PCIe fue un acontecimiento obvio. En noviembre de 2010 finalmente se aprobaron las especificaciones para la tercera versión de PCI Express. Aunque esta interfaz tiene una velocidad de transferencia de 8 Gt/s en lugar de los 5 Gt/s de la versión 2.0, su rendimiento ha vuelto a aumentar exactamente el doble en comparación con el estándar PCI Express 2.0. Para hacer esto, utilizaron un esquema de codificación diferente para los datos enviados a través del bus, pero se mantuvo la compatibilidad con versiones anteriores de PCI Express. Los primeros productos de la versión PCI Express 3.0 se presentaron en el verano de 2011 y los dispositivos reales apenas han comenzado a aparecer en el mercado.

Entre los fabricantes de placas base estalló toda una guerra por el derecho a ser los primeros en presentar un producto compatible con PCI Express 3.0 (principalmente basado en el chipset Intel Z68), y varias empresas presentaron los comunicados de prensa correspondientes a la vez. Aunque en el momento de actualizar la guía simplemente no había tarjetas de video con dicho soporte, por lo que simplemente no es interesante. Cuando se necesite compatibilidad con PCIe 3.0, aparecerán placas completamente diferentes. Lo más probable es que esto no suceda antes de 2012.

Por cierto, podemos suponer que PCI Express 4.0 se introducirá en los próximos años y que la nueva versión duplicará nuevamente el ancho de banda demandado en ese momento. Pero esto no sucederá pronto y todavía no estamos interesados.

PCI Externo Externo

En 2007, PCI-SIG, que estandariza formalmente las soluciones PCI Express, anunció la adopción de la especificación PCI Express External Cabling 1.0, que describe el estándar de transferencia de datos a través de la interfaz externa PCI Express 1.1. Esta versión permite la transferencia de datos a una velocidad de 2,5 Gbps y la próxima debería aumentar el rendimiento a 5 Gbps. El estándar incluye cuatro conectores externos: PCI Express x1, x4, x8 y x16. Los conectores más antiguos están equipados con una lengüeta especial que facilita la conexión.

La versión externa de la interfaz PCI Express se puede utilizar no solo para conectar tarjetas de video externas, sino también para unidades externas y otras tarjetas de expansión. La longitud máxima de cable recomendada es de 10 metros, pero se puede aumentar conectando los cables a través de un repetidor.

En teoría, esto podría hacer la vida más fácil a los amantes de las computadoras portátiles, cuando usan un núcleo de video incorporado de bajo consumo cuando funcionan con baterías y una potente tarjeta de video externa cuando se conectan a un monitor de escritorio. Actualizar dichas tarjetas de video es mucho más fácil; no es necesario abrir la carcasa de la PC. Los fabricantes pueden fabricar sistemas de refrigeración completamente nuevos que no estén limitados por las características de las tarjetas de expansión, y debería haber menos problemas con la fuente de alimentación; lo más probable es que se utilicen fuentes de alimentación externas, diseñadas específicamente para una tarjeta de video específica; en una caja externa con una tarjeta de video, usando un sistema de enfriamiento. Puede facilitar el montaje de sistemas en varias tarjetas de vídeo (SLI/CrossFire) y, dado el constante crecimiento de la popularidad de las soluciones móviles, este tipo de PCI Express externo debería haber ganado cierta popularidad.

Debieron haberlo hecho, pero no ganaron. A partir del otoño de 2011, prácticamente no había opciones externas para tarjetas de video en el mercado. Su gama está limitada por modelos de chips de vídeo obsoletos y una estrecha selección de portátiles compatibles. Desafortunadamente, el negocio de las tarjetas de video externas no avanzó más y poco a poco se extinguió. Ya ni siquiera escuchamos declaraciones publicitarias ganadoras de los fabricantes de portátiles... Quizás la potencia de las tarjetas de video móviles modernas simplemente se haya vuelto suficiente incluso para aplicaciones 3D exigentes, incluidos muchos juegos.

Quedan esperanzas para el desarrollo de soluciones externas en la prometedora interfaz para conectar dispositivos periféricos Thunderbolt, anteriormente conocida como Light Peak. Fue desarrollado por Intel Corporation basándose en la tecnología DisplayPort y Apple ya lanzó las primeras soluciones. Thunderbolt combina las capacidades de DisplayPort y PCI Express y le permite conectar dispositivos externos. Sin embargo, hasta el momento simplemente no existen, aunque ya existen cables:

En este artículo no abordamos las interfaces obsoletas; la gran mayoría de las tarjetas de video modernas están diseñadas para la interfaz PCI Express 2.0, por lo que al elegir una tarjeta de video, sugerimos considerarla solo como referencia; Las nuevas placas utilizan la interfaz PCI Express 2.0, que combina la velocidad de 16 líneas PCI Express, lo que proporciona un rendimiento de hasta 8 GB/s en cada dirección, varias veces más que la misma característica del mejor AGP. Además, PCI Express funciona a velocidades similares en cada dirección, a diferencia de AGP.

Por otro lado, los productos compatibles con PCI-E 3.0 aún no han aparecido, por lo que tampoco tiene mucho sentido considerarlos. Si estamos hablando de actualizar una vieja o comprar una placa nueva o cambiar simultáneamente el sistema y las placas de video, entonces solo necesita comprar placas con la interfaz PCI Express 2.0, que será suficiente y más común durante varios años, especialmente ya que los productos de diferentes versiones de PCI Express son compatibles entre sí.

Me han hecho esta pregunta más de una vez, así que ahora intentaré responderla de la manera más clara y breve posible. Para ello, daré imágenes de las ranuras de expansión PCI Express y PCI de la placa base para una comprensión más clara. Por supuesto, indicaré las principales diferencias en las características, es decir. Muy pronto descubrirás qué son estas interfaces y cómo son.

Entonces, primero, respondamos brevemente la pregunta: ¿qué es exactamente PCI Express y PCI?

¿Qué es PCI Express y PCI?

PCI Es un bus de entrada/salida paralelo de computadora para conectar dispositivos periféricos a la placa base de la computadora. PCI se utiliza para conectar: ​​tarjetas de video, tarjetas de sonido, tarjetas de red, sintonizadores de TV y otros dispositivos. La interfaz PCI está desactualizada, por lo que probablemente no podrá encontrar, por ejemplo, una tarjeta de video moderna que se conecte a través de PCI.

PCI Express(PCIe o PCI-E) es un bus de entrada/salida serie de computadora para conectar dispositivos periféricos a la placa base de una computadora. Aquellos. esto ya utiliza una conexión serie bidireccional, que puede tener varias líneas (x1, x2, x4, x8, x12, x16 y x32). Cuantas más líneas haya, mayor será el ancho de banda del bus PCI-E. La interfaz PCI Express se utiliza para conectar dispositivos como tarjetas de video, tarjetas de sonido, tarjetas de red, unidades SSD y otros.

Existen varias versiones de la interfaz PCI-E: 1.0, 2.0 y 3.0 (La versión 4.0 se lanzará pronto.). Esta interfaz generalmente se designa, por ejemplo, así PCI-E 3.0 x16, lo que significa versión PCI Express 3.0 con 16 carriles.

Si hablamos de si, por ejemplo, una tarjeta de video que tenga una interfaz PCI-E 3.0 funcionará en una placa base que solo admita PCI-E 2.0 o 1.0, los desarrolladores dicen que todo funcionará, solo por supuesto, tenga en cuenta que el ancho de banda estará limitado por las capacidades de la placa base. Por lo tanto, en este caso, no creo que valga la pena pagar de más por una tarjeta de video con una versión más nueva de PCI Express ( aunque sólo sea para el futuro, es decir ¿Estás pensando en comprar una nueva placa base con PCI-E 3.0?). Además, y viceversa, digamos que su placa base admite la versión PCI Express 3.0 y su tarjeta de video admite la versión 1.0, entonces esta configuración también debería funcionar, pero solo con capacidades PCI-E 1.0, es decir. No hay limitación aquí, ya que la tarjeta de video en este caso funcionará al límite de sus capacidades.

Diferencias entre PCI Express y PCI

La principal diferencia en las características es, por supuesto, el rendimiento; para PCI Express es mucho mayor, por ejemplo, PCI a 66 MHz tiene un rendimiento de 266 MB/seg y PCI-E 3.0 (x16). 32 GB/s.

Externamente, las interfaces también son diferentes, por lo que no funcionará conectar, por ejemplo, una tarjeta de video PCI Express a una ranura de expansión PCI. Las interfaces PCI Express con diferentes números de carriles también son diferentes, ahora mostraré todo esto en imágenes.

Ranuras de expansión PCI Express y PCI en placas base

Ranuras PCI y AGP

Ranuras PCI-E x1, PCI-E x16 y PCI

Interfaces PCI Express en tarjetas de video

¡Eso es todo lo que tengo por ahora!

El estándar PCI Express es una de las bases de las computadoras modernas. Las ranuras PCI Express han ocupado durante mucho tiempo un lugar importante en la placa base de cualquier computadora de escritorio, desplazando a otros estándares, como PCI. Pero incluso el estándar PCI Express tiene sus propias variaciones y patrones de conexión que difieren entre sí. En las placas base nuevas, a partir de 2010, se puede ver una gran cantidad de puertos en una placa base, designados como PCIE o PCI-E, que puede diferir en el número de líneas: una x1 o varias x2, x4, x8, x12, x16 y x32.

Entonces, descubramos por qué existe tanta confusión entre el aparentemente simple puerto periférico PCI Express. ¿Y cuál es el propósito de cada estándar PCI Express x2, x4, x8, x12, x16 y x32?

¿Qué es el bus PCI Express?

En la década de 2000, cuando se produjo la transición del antiguo estándar PCI (extendido: interconexión de componentes periféricos) a PCI Express, este último tenía una gran ventaja: en lugar de un bus serie, que era PCI, un bus punto a punto Se utilizó autobús de acceso. Esto significaba que cada puerto PCI individual y las tarjetas instaladas en él podían aprovechar al máximo el ancho de banda máximo sin interferir entre sí, como ocurría con una conexión PCI. En aquellos días, era abundante la cantidad de dispositivos periféricos insertados en tarjetas de expansión. Tarjetas de red, tarjetas de audio, sintonizadores de TV, etc., requerían una cantidad suficiente de recursos de PC. Pero a diferencia del estándar PCI, que utilizaba un bus común para la transferencia de datos con múltiples dispositivos conectados en paralelo, PCI Express, considerado en general, es una red de paquetes con topología en estrella.


PCI Express x16, PCI Express x1 y PCI en una placa

En términos sencillos, imagine su PC de escritorio como una pequeña tienda con uno o dos vendedores. El antiguo estándar PCI era como una tienda de comestibles: todos esperaban en la misma fila para ser atendidos, experimentando problemas de velocidad con la limitación de un vendedor detrás del mostrador. PCI-E se parece más a un hipermercado: cada cliente sigue su propia ruta individual para comprar alimentos y, en la caja, varios cajeros toman el pedido a la vez.

Obviamente, un hipermercado es varias veces más rápido que una tienda normal en términos de velocidad de servicio, debido a que la tienda no puede permitirse la capacidad de más de un vendedor con una caja registradora.

También con líneas de datos dedicadas para cada tarjeta de expansión o componentes integrados de la placa base.

La influencia del número de líneas en el rendimiento.

Ahora, para ampliar nuestra metáfora de tienda e hipermercado, imaginemos que cada departamento del hipermercado tiene sus propios cajeros reservados solo para ellos. Aquí es donde entra en juego la idea de múltiples líneas de datos.

PCI-E ha pasado por muchos cambios desde sus inicios. Hoy en día, las nuevas placas base suelen utilizar la versión 3 del estándar, mientras que la versión 4, más rápida, se vuelve más común y se espera la versión 5 para 2019. Pero las diferentes versiones utilizan las mismas conexiones físicas, y estas conexiones se pueden realizar en cuatro tamaños principales: x1, x4, x8 y x16. (Existen puertos x32, pero son extremadamente raros en las placas base de computadoras normales).

Los diferentes tamaños físicos de los puertos PCI-Express permiten dividirlos claramente por el número de conexiones simultáneas a la placa base: cuanto más grande sea físicamente el puerto, mayor número de conexiones podrá transmitir a la tarjeta o viceversa. Estas conexiones también se llaman pauta. Se puede considerar una línea como una pista que consta de dos pares de señales: uno para enviar datos y otro para recibir.

Las diferentes versiones del estándar PCI-E permiten velocidades diferentes en cada carril. Pero en términos generales, cuantos más carriles haya en un solo puerto PCI-E, más rápido podrán fluir los datos entre el periférico y el resto de la computadora.

Volviendo a nuestra metáfora: si hablamos de un vendedor en una tienda, entonces la tira x1 será este único vendedor que atiende a un cliente. Una tienda con 4 cajeros ya tiene 4 líneas x4. Y así sucesivamente, puedes asignar cajeros por el número de líneas, multiplicando por 2.


Varias tarjetas PCI Express

Tipos de dispositivos que utilizan PCI Express x2, x4, x8, x12, x16 y x32

Para la versión PCI Express 3.0, la velocidad máxima general de transferencia de datos es de 8 GT/s. En realidad, la velocidad para la versión PCI-E 3 es ligeramente inferior a un gigabyte por segundo por carril.

Así, un dispositivo que utilice el puerto PCI-E x1, por ejemplo una tarjeta de sonido de bajo consumo o una antena Wi-Fi, podrá transferir datos a una velocidad máxima de 1 Gbps.

Una tarjeta que cabe físicamente en una ranura más grande. x4 o x8, por ejemplo, una tarjeta de expansión USB 3.0 podrá transferir datos cuatro u ocho veces más rápido, respectivamente.

La velocidad de transferencia de los puertos PCI-E x16 está teóricamente limitada a un ancho de banda máximo de unos 15 Gbps. Esto es más que suficiente en 2017 para todas las tarjetas gráficas modernas desarrolladas por NVIDIA y AMD.


La mayoría de las tarjetas gráficas discretas utilizan una ranura PCI-E x16

El protocolo PCI Express 4.0 permite el uso de 16 GT/s, y PCI Express 5.0 utilizará 32 GT/s.

Pero actualmente no hay componentes que puedan utilizar esta cantidad de carriles con el máximo rendimiento. Las tarjetas gráficas modernas de alta gama suelen utilizar PCI Express 3.0 x16. No tiene sentido usar los mismos carriles para una tarjeta de red que solo usará un carril en el puerto x16, ya que el puerto Ethernet solo es capaz de transferir datos hasta un gigabit por segundo (que es aproximadamente un octavo del rendimiento de una línea PCI-E (recuerde: ocho bits en un byte).

Hay SSD PCI-E en el mercado que admiten el puerto x4, pero parece que serán reemplazados por el nuevo estándar M.2 en rápida evolución. para SSD que también pueden utilizar el bus PCI-E. Las tarjetas de red de alta gama y el hardware entusiasta, como los controladores RAID, utilizan una combinación de formatos x4 y x8.

Los tamaños de carril y puerto PCI-E pueden variar

Este es uno de los problemas más confusos con PCI-E: se puede crear un puerto en el factor de forma x16, pero no tener suficientes líneas para pasar datos, por ejemplo, solo x4. Esto se debe a que, aunque PCI-E puede transportar un número ilimitado de conexiones individuales, todavía existe un límite práctico para la capacidad de ancho de banda del chipset. Es posible que las placas base más baratas con conjuntos de chips de gama baja solo tengan una ranura x8, incluso si esa ranura puede acomodar físicamente una tarjeta de factor de forma x16.

Además, las placas base dirigidas a jugadores incluyen hasta cuatro ranuras PCI-E completas con x16 y la misma cantidad de carriles para un ancho de banda máximo.

Obviamente esto puede causar problemas. Si la placa base tiene dos ranuras x16, pero una de ellas solo tiene líneas x4, agregar una nueva tarjeta gráfica reducirá el rendimiento de la primera hasta en un 75%. Por supuesto, esto es sólo un resultado teórico. La arquitectura de las placas base es tal que no notará una caída brusca en el rendimiento.

La configuración correcta de dos tarjetas de video gráficas debe usar exactamente dos ranuras x16 si desea la máxima comodidad de un tándem de dos tarjetas de video. El manual de la oficina le ayudará a saber cuántas líneas tiene una ranura concreta en su placa base. sitio web del fabricante.

A veces, los fabricantes incluso marcan el número de líneas en la PCB de la placa base junto a la ranura.

Debe saber que una tarjeta x1 o x4 más corta puede caber físicamente en una ranura x8 o x16 más larga. Esto es posible gracias a la configuración de pines de los contactos eléctricos. Naturalmente, si la tarjeta es físicamente más grande que la ranura, no podrás insertarla.

Por eso, recuerda, a la hora de adquirir tarjetas de expansión o actualizar las actuales, siempre debes tener en cuenta tanto el tamaño de la ranura PCI Express como el número de carriles necesarios.

Si pregunta qué interfaz se debe utilizar para una unidad de estado sólido que admita el protocolo NVMe, cualquier persona (que siquiera sepa qué es NVMe) responderá: ¡por supuesto, PCIe 3.0 x4! Es cierto que lo más probable es que tenga dificultades para justificarse. En el mejor de los casos, obtendremos la respuesta de que dichas unidades son compatibles con PCIe 3.0 x4 y que el ancho de banda de la interfaz es importante. Lo es, pero todo lo que se habló al respecto comenzó solo cuando algunas unidades en algunas operaciones quedaron abarrotadas dentro del marco del SATA "normal". Pero entre sus 600 MB/s y los (igualmente teóricos) 4 GB/s de la interfaz PCIe 3.0 x4 hay simplemente un abismo lleno de un montón de opciones. ¿Qué pasa si una línea PCIe 3.0 es suficiente, ya que ya es una vez y media más grande que SATA600? Añadiendo más leña al fuego están los fabricantes de controladores que amenazan con cambiar a PCIe 3.0 x2 en productos económicos, así como el hecho de que muchos usuarios no tienen tal o cual cosa. Más precisamente, en teoría los hay, pero solo se pueden liberar reconfigurando el sistema o incluso cambiando algo en él que no desea hacer. Pero quiero comprar una unidad de estado sólido de alta gama, pero me temo que no obtendré ningún beneficio (ni siquiera satisfacción moral por los resultados de las pruebas de utilidad).

¿Pero es esto cierto o no? En otras palabras, ¿es realmente necesario centrarse exclusivamente en el modo de funcionamiento soportado o todavía es posible en la práctica? renunciar a los principios? Esto es exactamente lo que decidimos comprobar hoy. Dejemos que la verificación sea rápida y no pretenda ser exhaustiva, pero la información recibida debería ser suficiente (como nos parece) al menos para pensar en ello... Por ahora, conozcamos brevemente la teoría.

PCI Express: estándares existentes y su ancho de banda

Comencemos con qué es PCIe y a qué velocidad funciona esta interfaz. A menudo se le llama “bus”, lo cual es algo ideológicamente incorrecto: como tal, no existe un bus al que estén conectados todos los dispositivos. En realidad, hay un conjunto de conexiones punto a punto (similares a muchas otras interfaces serie) con un controlador en el medio y dispositivos conectados a él (cada uno de los cuales podría ser un concentrador de siguiente nivel).

La primera versión de PCI Express apareció hace casi 15 años. El enfoque en el uso dentro de una computadora (a menudo dentro de la misma placa) hizo posible realizar la alta velocidad estándar: 2,5 gigatransacciones por segundo. Debido a que la interfaz es serial y full-duplex, un solo carril PCIe (x1; efectivamente una unidad atómica) proporciona velocidades de transferencia de datos de hasta 5 Gbps. Sin embargo, en cada dirección es sólo la mitad de esto, es decir, 2,5 Gbps, y esta es la velocidad máxima de la interfaz, no la "útil": para mejorar la confiabilidad, cada byte está codificado con 10 bits, por lo que el rendimiento teórico de una línea PCIe 1.x es de aproximadamente 250 MB/s en cada sentido. En la práctica, todavía es necesario transferir información del servicio y, al final, es más correcto hablar de ≈200 MB/s de transferencia de datos del usuario. Lo cual, sin embargo, en aquel momento no sólo cubría las necesidades de la mayoría de los dispositivos, sino que también proporcionaba una reserva sólida: basta recordar que el predecesor del PCIe en el segmento de interfaces de sistemas masivos, concretamente el bus PCI, proporcionaba un rendimiento de 133 MB/ s. E incluso si consideramos no solo la implementación masiva, sino también todas las opciones PCI, el máximo fue 533 MB/s, y para todo el bus, es decir, dicho PS se dividió en todos los dispositivos conectados a él. En este caso, 250 MB/s (ya que en PCI también se suele indicar el rendimiento total y no el útil) por línea, de uso exclusivo. Y para los dispositivos que necesitan más, inicialmente fue posible agregar varias líneas en una sola interfaz, en potencias de dos, de 2 a 32, es decir, la versión x32 prevista por el estándar podía transmitir hasta 8 GB/s en cada dirección. En las computadoras personales no se utilizó x32 debido a la complejidad de crear y cablear los controladores y dispositivos correspondientes, por lo que el máximo era la opción con 16 líneas. Se utilizaba (y se sigue utilizando) principalmente en tarjetas de vídeo, ya que la mayoría de los dispositivos no requieren tanto. En general, para un número considerable de ellos, una línea es suficiente, pero algunos utilizan con éxito tanto x4 como x8: solo en el tema del almacenamiento: controladores RAID o SSD.

El tiempo no se detuvo y hace unos 10 años apareció la segunda versión de PCIe. Las mejoras no se referían sólo a la velocidad, sino que también se dio un paso adelante en este sentido: la interfaz comenzó a proporcionar 5 gigatransacciones por segundo manteniendo el mismo esquema de codificación, es decir, el rendimiento se duplicó. Y se duplicó de nuevo en 2010: PCIe 3.0 proporciona 8 (en lugar de 10) gigatransacciones por segundo, pero la redundancia se ha reducido: ahora se utilizan 130 bits para codificar 128, no 160 como antes. En principio, la versión PCIe 4.0 con otra duplicación de velocidades ya está lista para aparecer en el papel, pero es poco probable que la veamos en hardware en un futuro próximo. De hecho, PCIe 3.0 todavía se usa en muchas plataformas junto con PCIe 2.0, porque el rendimiento de este último simplemente... no es necesario para muchas aplicaciones. Y cuando sea necesario, funciona el viejo método de agregación de líneas. Solo que cada uno de ellos se ha vuelto cuatro veces más rápido en los últimos años, es decir, PCIe 3.0 x4 es PCIe 1.0 x16, la ranura más rápida en las computadoras de mediados de la década de 2000. Esta opción es compatible con los controladores SSD de gama alta y se recomienda utilizarla. Está claro que si existe esa oportunidad, mucho no es poco. ¿Y si ella no existe? ¿Habrá algún problema y, de ser así, cuáles son? Ésta es la cuestión con la que tenemos que abordar.

Metodología de prueba

No es difícil realizar pruebas con diferentes versiones del estándar PCIe: casi todos los controladores permiten utilizar no solo el que admiten, sino también todos los anteriores. Es más difícil con la cantidad de carriles: queríamos probar directamente opciones con uno o dos carriles PCIe. La placa Asus H97-Pro Gamer con chipset Intel H97 que utilizamos habitualmente no soporta el conjunto completo, pero además de la ranura de “procesador” x16 (que se suele utilizar), tiene otra que funciona en PCIe 2.0 x2 o modos x4. Usamos este trío y le agregamos el modo de ranura de “procesador” PCIe 2.0 para evaluar si había alguna diferencia. Aún así, en este caso, no hay "intermediarios" extraños entre el procesador y el SSD, pero cuando se trabaja con una ranura de "chipset", sí: el propio chipset, que en realidad está conectado al procesador mediante el mismo PCIe 2.0 x4 . Era posible agregar varios modos operativos más, pero aún así íbamos a realizar la parte principal del estudio en otro sistema.

El hecho es que decidimos aprovechar esta oportunidad y al mismo tiempo comprobar una "leyenda urbana", es decir, la creencia sobre la utilidad de utilizar procesadores de primera calidad para probar las unidades. Así que tomamos el Core i7-5960X de ocho núcleos, un pariente del Core i3-4170 que se usa habitualmente en las pruebas (estos son Haswell y Haswell-E), pero que tiene cuatro veces más núcleos. Además, la placa Asus Sabertooth X99 que se encuentra en los contenedores nos resulta útil hoy en día debido a la presencia de una ranura PCIe x4, que de hecho puede funcionar como x1 o x2. En este sistema probamos tres opciones x4 (PCIe 1.0/2.0/3.0) del procesador y chipset PCIe 1.0 x1, PCIe 1.0 x2, PCIe 2.0 x1 y PCIe 2.0 x2 (en todos los casos, las configuraciones del chipset están marcadas en los diagramas con (do)). ¿Tiene sentido recurrir ahora a la primera versión de PCIe, dado que apenas existe una placa que admita únicamente esta versión del estándar y pueda arrancar desde un dispositivo NVMe? Desde un punto de vista práctico, no, pero nos será útil comprobar la relación a priori supuesta de PCIe 1.1 x4 = PCIe 2.0 x2 y similares. Si la prueba muestra que la escalabilidad del bus corresponde a la teoría, entonces no importa que todavía no hayamos podido obtener formas prácticamente significativas de conectar PCIe 3.0 x1/x2: la primera será idéntica a PCIe 1.1 x4 o PCIe 2.0 x2, y el segundo - PCIe 2.0 x4 . Y los tenemos.

En términos de software, nos limitamos únicamente a Anvil's Storage Utilities 1.1.0: mide bastante bien una variedad de características de bajo nivel de las unidades y no necesitamos nada más. Al contrario: cualquier influencia de otros componentes del sistema es extremadamente indeseable, por lo que los sintéticos de bajo nivel para nuestros propósitos no tienen otra alternativa.

Usamos un Patriot Hellfire de 240 GB como “fluido de trabajo”. Como se demostró durante las pruebas, este no es un poseedor de un récord de rendimiento, pero sus características de velocidad son bastante consistentes con los resultados de los mejores SSD de la misma clase y la misma capacidad. Sí, y ya hay dispositivos más lentos en el mercado, y cada vez habrá más. En principio, sería posible repetir las pruebas con algo más rápido, pero, en nuestra opinión, no es necesario: los resultados son predecibles. Pero no nos adelantemos, veamos qué tenemos.

Resultados de la prueba

Al probar Hellfire, notamos que la velocidad máxima para operaciones secuenciales se puede "exprimir" solo con una carga de subprocesos múltiples, por lo que esto también debe tenerse en cuenta para el futuro: el rendimiento teórico es solo teórico, porque los datos "reales" recibidos en diferentes programas bajo diferentes escenarios ya no dependerán de ellos, sino de estos mismos programas y escenarios - en el caso, por supuesto, cuando circunstancias de fuerza mayor no interfieran :) Estas son exactamente las circunstancias en las que estamos ahora observando: ya se ha dicho arriba que PCIe 1.x x1 es ≈200 MB/s, y eso es exactamente lo que vemos. Dos carriles PCIe 1.x o un carril PCIe 2.0 son dos veces más rápidos, y eso es exactamente lo que estamos viendo. Cuatro carriles PCIe 1.x, dos PCIe 2.0 o un PCIe 3.0 son incluso el doble de rápidos, lo que se confirmó para las dos primeras opciones, por lo que es poco probable que la tercera sea diferente. Es decir, en principio, la escalabilidad, como se esperaba, es ideal: las operaciones son lineales, flash las maneja bien, por lo que la interfaz es importante. El flash se detiene hacer frente bien a PCIe 2.0 x4 para grabar (lo que significa que PCIe 3.0 x2 también es adecuado). La lectura "puede" ser más, pero el último paso ya da un aumento de un año y medio, y no del doble (como debería ser potencialmente). También observamos que no hay una diferencia notable entre el chipset y los controladores del procesador, ni tampoco entre plataformas. Sin embargo, LGA2011-3 está un poco por delante, aunque sólo ligeramente.

Todo es suave y hermoso. Pero no rompe plantillas: el máximo en estas pruebas es sólo un poco más de 500 MB/s, y esto es bastante capaz incluso de SATA600 o (en la aplicación de las pruebas de hoy) PCIe 1.0 x4 / PCIe 2.0 x2 / PCIe 3.0 x1. Así es: no se alarme por el lanzamiento de controladores económicos para PCIe x2 o la presencia de un número limitado de líneas (y la versión 2.0 del estándar) en las ranuras M.2 de algunas placas cuando no se necesitan más. A veces no se necesita tanto: los resultados máximos se lograron con una cola de 16 comandos, lo cual no es típico del software producido en masa. Más a menudo hay una cola con 1-4 comandos, y para esto puede arreglárselas con una línea del primer PCIe e incluso del primer SATA. Sin embargo, hay gastos generales y otras cosas, por lo que una interfaz rápida es útil. Sin embargo, ser demasiado rápido quizás no sea perjudicial.

Además, en esta prueba las plataformas se comportan de manera diferente y, con una única cola de comandos, de manera fundamentalmente diferente. El "problema" no es que muchos núcleos sean malos. De todos modos, no se utilizan aquí, excepto quizás uno, y no tanto como para que el modo de impulso esté completamente implementado. Entonces tenemos una diferencia de aproximadamente el 20% en la frecuencia de los núcleos y una vez y media en la memoria caché; en Haswell-E funciona a una frecuencia más baja y no sincrónicamente con los núcleos. En general, una plataforma de gama alta solo puede ser útil para eliminar el máximo de "Yops" a través del modo más multiproceso con una gran profundidad de cola de comandos. La única lástima es que desde el punto de vista del trabajo práctico, se trata de sintéticos completamente esféricos en el vacío :)

Según la grabación, la situación no ha cambiado fundamentalmente, en todos los sentidos. Pero lo curioso es que en ambos sistemas el modo PCIe 2.0 x4 en la ranura del "procesador" resultó ser el más rápido. ¡En ambos! Y con múltiples controles/recontroles. En este punto no puedes evitar pensar si necesitas estos son tus nuevos estándares¿O es mejor no apresurarse a ninguna parte...?

Cuando se trabaja con bloques de diferentes tamaños, el idilio teórico se rompe por el hecho de que aumentar la velocidad de la interfaz todavía tiene sentido. Las cifras resultantes son tales que un par de líneas PCIe 2.0 serían suficientes, pero en realidad en este caso el rendimiento es inferior al de PCIe 3.0 x4, aunque no varias veces. Y, en general, aquí la plataforma presupuestaria "obstruye" mucho más a la superior. Pero es precisamente este tipo de operación la que se encuentra principalmente en el software de aplicación, es decir, este diagrama es el más cercano a la realidad. Como resultado, no sorprende que las interfaces gruesas y los protocolos modernos no proporcionen ningún efecto sorpresa. Más precisamente, se dará el cambio de mecánica, pero exactamente lo mismo que le proporcionará cualquier unidad de estado sólido con cualquier interfaz.

Total

Para que sea más fácil percibir la imagen del hospital en su conjunto, utilizamos la puntuación dada por el programa (total - para lectura y escritura), normalizándola según el modo “chipset” PCIe 2.0 x4: por el momento es el más disponible, ya que se encuentra incluso en plataformas LGA1155 o AMD sin necesidad de “ofender” la tarjeta de video. Además, es equivalente a PCIe 3.0 x2, que los controladores económicos se están preparando para dominar. Y en la nueva plataforma AMD AM4, nuevamente, este es exactamente el modo que se puede obtener sin afectar la tarjeta de video discreta.

Entonces, ¿qué vemos? El uso de PCIe 3.0 x4, si es posible, es ciertamente preferible, pero no necesario: aporta literalmente un 10% de rendimiento adicional a las unidades NVMe de clase media (en su segmento inicialmente superior). E incluso entonces, debido a operaciones que, en general, no se encuentran con tanta frecuencia en la práctica. ¿Por qué se implementa esta opción particular en este caso? En primer lugar, existía esa oportunidad, pero la reserva no es suficiente para el bolsillo. En segundo lugar, hay unidades incluso más rápidas que nuestro Patriot Hellfire de prueba. En tercer lugar, hay áreas de actividad en las que las cargas "atípicas" para un sistema de escritorio son bastante típicas. Además, aquí es donde el rendimiento del sistema de almacenamiento de datos, o al menos la capacidad de hacer que parte del mismo sea muy rápido, es más crítico. Pero esto no se aplica a las computadoras personales comunes.

En ellos, como vemos, el uso de PCIe 2.0 x2 (o, en consecuencia, PCIe 3.0 x1) no conduce a una disminución drástica del rendimiento, solo entre un 15 y un 20%. ¡Y esto a pesar de que en este caso limitamos cuatro veces las capacidades potenciales del controlador! Para muchas operaciones este rendimiento es suficiente. Una línea PCIe 2.0 ya no es suficiente, por lo que tiene sentido que los controladores admitan PCIe 3.0 y, dada la grave escasez de líneas en un sistema moderno, esto funcionará bien. Además, el ancho x4 es útil: incluso si el sistema no admite versiones modernas de PCIe, aún así le permitirá trabajar a una velocidad normal (aunque más lenta de lo que podría) si hay una ranura más o menos ancha. .

En principio, una gran cantidad de escenarios en los que la propia memoria flash resulta ser el cuello de botella (sí, esto es posible y es inherente no solo a la mecánica) lleva al hecho de que los cuatro carriles de la tercera versión de PCIe en este son aproximadamente 3,5 veces más rápidos que el primero; el rendimiento teórico de estos dos casos difiere 16 veces. Lo que, por supuesto, no significa que deba apresurarse a dominar interfaces muy lentas: su tiempo se acabó para siempre. Lo que pasa es que muchas de las posibilidades de las interfaces rápidas sólo podrán realizarse en el futuro. O en condiciones que un usuario normal de una computadora normal nunca encontrará directamente en su vida (a excepción de aquellos a quienes les gusta compararse con quién sabe qué). En realidad, eso es todo.

PCI - Expresar (PCIePCI -MI)– Se presenta por primera vez el bus universal de serie. 22 de julio de 2002 año.

Es general, unificando un bus para todos los nodos de la placa del sistema, en el que coexisten todos los dispositivos conectados a él. Vino a reemplazar un neumático obsoleto. PCI y sus variaciones AGP, debido al aumento de los requisitos de rendimiento de los autobuses y a la incapacidad de mejorar la velocidad de estos últimos a un coste razonable.

El neumático actúa como cambiar, simplemente enviando una señal de un punto a otro sin cambiarlo. Esto permite, sin pérdida evidente de velocidad, con mínimos cambios y errores transmitir y recibir una señal.

Los datos en el autobús van. simplex(full duplex), es decir, simultáneamente en ambas direcciones a la misma velocidad, y señal a lo largo de las líneas fluye continuamente, incluso cuando el dispositivo está apagado (como corriente continua o una señal de bits de ceros).

Sincronización construido utilizando un método redundante. Es decir, en lugar de 8 bits la información se transmite 10 bits, dos de los cuales son oficial (20% ) y servir en una secuencia determinada balizas Para sincronización generadores de reloj o identificando errores. Por lo tanto, la velocidad declarada para una línea en 2,5 GB, en realidad es igual a aproximadamente 2,0 Gbps real.

Nutrición cada dispositivo en el autobús, seleccionado por separado y regulado mediante tecnología ASPM (Gestión de energía en estado activo). Permite cuando el dispositivo está inactivo (sin enviar señal) bajar su generador de reloj y poner el autobús en modo consumo de energía reducido. Si no se recibe ninguna señal en unos pocos microsegundos, el dispositivo considerado inactivo y cambia al modo esperanzas de heredar(el tiempo depende del tipo de dispositivo).

Características de velocidad en dos direcciones. PCI - Expreso 1.0 :*

1 incógnita PCI-E~ 500Mbps

4x PCI-E~ 2 Gbps

8 incógnita PCI-E~ 4 Gbps

16x PCI-E~ 8 Gbps

32x PCI-E~ 16 Gbps

*La velocidad de transferencia de datos en una dirección es 2 veces menor que estos indicadores

15 de enero de 2007, PCI-SIG lanzó una especificación actualizada llamada PCI-Express 2.0

La principal mejora se produjo en 2 veces mayor velocidad transferencia de datos ( 5,0 GHz, contra 2,5 GHz en la versión antigua). También mejorado protocolo de comunicación punto a punto(punto a punto), modificado componente de software y sistema agregado monitoreo de software según la velocidad del neumático. Al mismo tiempo se conservó compatibilidad con versiones de protocolo PCI-E 1.x

En la nueva versión del estándar ( PCI -Expreso 3.0 ), la principal innovación será sistema de codificación modificado Y sincronización. En lugar de 10 bits sistemas ( 8 bits información, 2 bits oficial), se aplicará 130 bits (128 bits información, 2 bits oficial). Esto reducirá pérdidas en velocidad del 20% al ~1,5%. También será rediseñado algoritmo de sincronización transmisor y receptor, mejorado PLL(bucle de fase bloqueada).Velocidad de baudios se espera que aumente 2 veces(en comparación con PCI-E 2.0), mientras la compatibilidad se mantendrá con versiones anteriores PCI Express.




Arriba