Los detalles técnicos de H.264

69 0 0 0

Detalles técnicos

H.264 / AVC contiene una serie de nuevas características que lo hacen no solo más eficiente que el códec anterior, sino que también se puede utilizar en varios entornos de red. Estas nuevas características incluyen:

Compensación de movimiento de cuadros multi-referencia. En comparación con los estándares de codificación de video anteriores, H.264 / AVC utiliza más cuadros codificados como cuadros de referencia de una manera más flexible. En algunos casos, se pueden usar hasta 32 cuadros de referencia (en estándares anteriores, el número de cuadros de referencia es 1 o 2 para cuadros B). Esta función puede reducir la tasa de bits o mejorar la calidad de la mayoría de los escenarios. Para algunos tipos de escenarios, como el flash repetitivo rápido, el recorte repetido u la oclusión de fondo, puede reducir significativamente la tasa de codificación.

Compensación de movimiento de bloque variable. La estimación de movimiento y la compensación de movimiento se pueden realizar utilizando bloques de hasta 16x16 y hasta 4x4, que pueden dividir con mayor precisión las regiones de movimiento en la secuencia de la imagen. Estos tipos son 16 * 16, 16 * 8, 8 * 16, 8 * 8, 8 * 4, 4 * 8 y 4 * 4.

Para reducir el alias y obtener imágenes más nítidas, se utiliza un filtro de seis pulsaciones (un filtro digital de sexto orden) para generar un valor de predicción de componente de luminancia de medio píxel.

El modo de campo permisible de macrobloque a estructura utiliza macrobloques 16x16 (a diferencia de 16x8 en MPEG-2).

La compensación de movimiento con una precisión de 1/4 píxeles puede proporcionar una predicción de bloque de movimiento más precisa. Como el croma suele ser la mitad de la muestra de brillo (consulte 4: 2: 0), la precisión de la compensación de movimiento puede alcanzar una precisión de 1/8 píxeles.

La predicción de movimiento ponderado se refiere al uso de métodos ponderados y de compensación en la compensación de movimiento. Puede proporcionar una considerable ganancia de codificación en algunas situaciones especiales, como el desvanecimiento, desvanecimiento, desvanecimiento y luego desvanecimiento.

Se utiliza un filtro de desbloqueo de bucle para mitigar los efectos de bloqueo que son comunes en otros códecs de video basados en la transformada de coseno discreto (DCT).

Una transformada 4x4 con enteros emparejados (similar al diseño de la transformada de coseno discreta) también usa la transformada 8x8 en la expansión de alta precisión, y puede seleccionarse de forma adaptativa en la transformación 4x4 y la transformada 8x8.

Después de la primera transformación 4x4, se aplica una transformada de Hadamard a los coeficientes de CC (coeficientes de cromaticidad de CC y coeficientes de brillo de CC en algunas condiciones especiales) para obtener un mejor efecto de compresión en la región suave.

Predicción intraespacial utilizando píxeles límite de bloques adyacentes (mejor que los coeficientes de CC utilizados en el video MPEG-2 y los coeficientes de transformación utilizados en el video H.263 + y MPEG-4).

La codificación aritmética binaria basada en el contexto (CABAC, por sus siglas en inglés) puede codificar de manera flexible varios elementos gramaticales en una codificación de entropía sin pérdida más eficiente con una distribución de probabilidad conocida del contexto correspondiente.

La codificación de longitud variable basada en el contexto (CAVLC) se utiliza para codificar los coeficientes de variación cuantificados. En comparación con CABAC, su complejidad es relativamente baja y su relación de compresión no es alta, pero es bastante efectiva en comparación con el esquema de codificación de entropía utilizado en los estándares de codificación de video anteriores.

Para los elementos gramaticales que no son CABAC ni CAVLC, el esquema de codificación de entropía exponencial-Golomb (Exp-Golomb) se utiliza para codificarlos.

Use una Capa de imagen de red (NAL) para hacer que la misma gramática de video sea aplicable a una variedad de entornos de red; y use conjuntos de parámetros en serie (SPS) y conjuntos de parámetros de imagen (PPS) para proporcionar mayor robustez y flexibilidad.

Los segmentos de conmutación (incluidos SP y SI) permiten al codificador dar instrucciones al decodificador para que salte a una secuencia de video que se está procesando para resolver la conmutación de velocidad y la operación del "modo truco" de la secuencia de video. Cuando el decodificador usa tiras SP / SI para saltar al medio de un flujo de video, puede obtener una imagen reconstruida descodificada completamente consistente a menos que el cuadro decodificado subsiguiente se refiera a la imagen antes del cuadro de cambio como marco de referencia.

Los modos de ordenamiento de macrobloques flexibles (FMO para ordenamiento de macrobloques flexible, también conocidos como grupos de segmentos de grupo de bandas) y el ordenamiento de bandas arbitrario (ASO para ordenamiento de segmentos arbitrarios) se utilizan para cambiar el orden de codificación de los macrobloques, la unidad básica de codificación de imágenes. Se puede utilizar para mejorar la robustez de los flujos de bits en los canales de derivación y algunos otros propósitos.

La partición de datos (DP para partición de datos) puede empaquetar y transmitir elementos gramaticales de diferente importancia por separado, y usar la tecnología de protección de datos desigual (UEP para protección de errores desigual) para mejorar la robustez del flujo de video contra el error de canal / pérdida de paquetes.

* Redundant Slices (RS para Redundant Slices) también es una tecnología para mejorar la robustez de los flujos de bits. Los codificadores pueden usar esta técnica para enviar otra representación de codificación de un área (o toda) de una imagen (generalmente un flujo de codificación de baja resolución) para que la segunda representación de codificación redundante pueda usarse para decodificar la representación primaria cuando se produce un error o una pérdida.

Se utiliza un método automático de empaquetado de flujo de bytecode para evitar la aparición de palabras en clave duplicadas con el código de inicio en th

  • x
  • convención:

Responder

Responder
Debe iniciar sesión para responder la publicación Inicio de sesi | Registrarse

Aviso: Para garantizar sus legítimos derechos e intereses, la comunidad y los terceros no publicarán contenido que pueda generar riesgos legales a las partes, por ejemplo, pornografía, contenido político, contenido sobre juego, consumo y tráfico de drogas, así como contenido que viole los derechos de propiedad intelectual de terceros, por ejemplo, secretos comerciales, marcas, derechos de autor, patentes y privacidad personal. No comparta su cuenta ni su contraseña con terceros. Todas las operaciones realizadas usando su cuenta se considerarán como sus acciones y todas las consecuencias que estas acciones generen serán responsabilidad suya. Para obtener información detallada, consulte la “ Política de privacidad.”
Si el botón para adjuntar no está disponible, actualice Adobe Flash Player con la versión más reciente

¡Ingresa y disfruta de todos los beneficios para los miembros!

Aterrizaje
Respuesta rápida Desplácese hasta arriba