SGCG

…esto no es un subtítulo…

Ir a: contenido categorías calendario archivo suscripción

Volver arriba

Cambios en el sistema de distribución de vídeos de RTVE

2010-04-10

Actualización:
El sistema de distribución de vídeo de la página de RTVE ha cambiado varias veces desde la escritura de este artículo y el método aquí descrito está obsoleto. El método que funciona en el momento de escribir esta actualización (septiembre de 2012) está en un artículo más reciente. También hay una versión al día del programita rtve-mediateca-dl que implementa esté método.

Hace unas semanas, vimos un método para descargar vídeos de la mediateca de RTVE. Anoche recibí un mensaje en el que un buen ciudadano (un saludo y muchas gracias, A) me avisaba de que el método dejó de funcionar debido a cambios realizados en el sistema de distribución de vídeo. Aun suponiendo que los cambios han sido realizados de forma bienintencionada, la situación es censurable: debemos recordar que los vídeos de RTVE han de ser patrimonio de todos los españoles.

Nuevo programa

Tenemos una nueva versión del programa para descargar vídeos de la mediateca que es compatible con el nuevo sistema. Los requisitos son los de siempre: una máquina *NIX con conexión a Internet y GNU Wget instalado. He aquí la dirección de descarga del tarball con el código:
rtve-mediateca-dl-2.0.tar.gz.

Para instalar el programa, hay que extraer el contenido del tarball, echarle un vistazo al Makefile y editarlo si es necesario y, finalmente, instalar:
make install

El funcionamiento del programa está documentado en una página de manual:
man rtve-mediateca-dl
También es posible acceder a la ayuda del programa con la opción --help:
rtve-mediateca-dl --help

Cómo funciona el nuevo método para descargar los ficheros de vídeo

Una pequeña investigación ha permitido descubrir el funcionamiento del nuevo sistema. Algunas cosas siguen como antes; en concreto, el identificador del vídeo que extraíamos del código JavaScript de la página con el reproductor de vídeo incrustado sigue siendo el mismo. Vamos a ver, paso por paso, cómo podemos usar esta información para recuperar la dirección del fichero de vídeo.

  1. Supongamos que el número identificador es A1A2A3A4A5A6, donde cada letra con subíndice representa un dígito. Este número aparece en varios lugares como las variable flashcontentId y assetID.
  2. Vigilamos las comunicaciones de nuestro navegador y descubrimos la descarga del fichero http://www.rtve.es/swf/data/es/videos/video/A6/A5/A4/A3/A1A2A3A4A5A6.xml. La dirección se construye con los 4 últimos dígitos del número en orden inverso y con separadores de directorio entre dígitos y, finalmente, con el número completo.
  3. Descargamos el fichero XML. Tiene varios elementos, pero el último es el más interesante. Indica la carga de un complemento llamado multicdn (cdn como en content delivery network, red de entrega de contenidos). Tiene un parámetro que se llama assetDataID cuyo valor es un número de varias cifras: B1B2B3B4B5B6.
  4. A partir de aquí, el análisis de la actividad de nuestro navegador revela poca información la comunicación empieza a estar ofuscada, pero si nos quedamos un rato mirando fijamente el complemento de la red de entrega de contenidos, descubrimos muchas cosas. Resulta que podemos construir la dirección de otro recurso XML de un modo semejante al anterior, pero esta vez usando el nuevo número de assetDataID. Esta dirección tiene el siguiente aspecto: http://www.rtve.es/scd/CONTENTS/ASSET_DATA_VIDEO/B6/B5/B4/B3/ASSET_DATA_VIDEO-B1B2B3B4B5B6.xml. Igual que antes, usamos los cuatro últimos dígitos del número en orden inverso y con separadores de directorio entre ellos y, finalmente, el número completo.
  5. Descargamos el nuevo recurso XML. ¡Está lleno de información sobre el vídeo que queremos bajar! Rápidamente, identificamos la presencia de una dirección relativa: /…/ZZZZZZZZZZZZZ.flv. Aparece dos veces: en un parámetro llamado defaultLocation y en un campo llamado ASD_FILE.
  6. Nos inventamos una dirección que probablemente será la correcta: añadimos el prefijo http://www.rtve.es a la dirección que descubrimos en el anterior paso.
  7. Descargamos el contenido de la dirección que acabamos de construir. ¡Tenemos éxito! Queda ver cuánto tiempo pasará hasta que este método deje de funcionar, por supuesto.

Actualización:
El sistema de distribución de vídeo de la página de RTVE ha cambiado varias veces desde la escritura de este artículo y el método aquí descrito está obsoleto. El método que funciona en el momento de escribir esta actualización (septiembre de 2012) está en un artículo más reciente. También hay una versión al día del programita rtve-mediateca-dl que implementa esté método.


Categorías: Informática

Permalink: http://sgcg.es/articulos/2010/04/10/cambios-en-el-sistema-de-distribucion-de-videos-de-rtve/