SONIDO PROFESIONAL: 2018

En este artículo...

Un cuadro de rendimiento que Waves acaba de publicar nos permite una reflexión indirecta sobre los plugins. ¿Se mantienen nuestras intuiciones sobre ellos frente a la realidad de las cifras? ¿Gasta una reverb mucha más CPU que otros efectos? ¿Cómo de costoso en cómputo llega a ser el modelado ‘analógico’? ¿96kHz frente a 48 dobla o cuadriplica el cómputo?

Introducción

Este ejercicio de hoy nace de que Waves lanzará en enero un nuevo 'SoundGrid Server One-C', que permite llevar a él la ejecución de sus plugins y liberar así la CPU de nuestro ordenador principal. Podría ser noticia para portada, desde luego. Pero nos ha llamado la atención más todavía el cuadro que han publicado para indicar cuántas instancias de muchos de sus plugins podrían ejecutarse en ese nuevo sistema. No tanto porque las cifras sean novedad (son semejantes a la de otros server anteriores) sino por hacer una reflexión a partir de ellas.

Haciendo una lectura interpretativa de lo que las cifras apuntan, podemos intentar sacar algunas conclusiones. La validez de esas conclusiones no es definitiva, hay muchos factores que no podemos tener en cuenta con tan pocos datos. Tampoco deben considerarse como una crítica, ni a favor ni en contra, de los distintos productos del catálogo de Waves o frente a los de otros desarrolladores. Es más un intento de cotejar nuestras muchas intuiciones sobre los plugins frente a estos datos reales, a falta de otros mejores y más completos. ¿Hay tantas diferencias entre plugins 'modelados' y 'nativamente digitales'? ¿Es todavía la reverb mucho más compleja en cómputo que los demás efectos? ¿Qué consecuencias puede tener el uso en altas velocidades de muestreo? En definitiva indagar un poco más qué se nos ofrece a día de hoy en el mundo de los plugins.

Los datos

La tabla de Waves lista decenas de sus plugins, de todo tipo de familias (EQ, reverb, dinámica...) y describe cuántas instancias simultáneas puede ejecutar su nuevo 'SoundGrid Server One-C' de cada uno antes de que la CPU se use al 85% o de que empiecen a aparecer problemas en audio (cortes, etc.). Lo hace además distinguiendo cuántas llegan a poder instanciarse si se usan en un entorno a 44,1kHz o en un entorno a 96kHz de velocidad de muestreo. He partido del primer cuadro que ofrecen, relativo al uso conjunto con ‘MultiRack’. Podéis acceder a esa tabla y a los detalles de SoundGrid Server One-C en este enlace. Podríamos haber usado también el cuadro que hay relativo a ‘StudioRack’, y hay aún algunas otras cifras más disponibles, pero nos vale quedarnos con el primero, uso en Multirack.

Hay un límite en las cifras a 512 instancias que corresponde a plugins relativamente ‘sencillos’ en el sentido de requerir poca carga computacional. Hemos descartado para nuestro estudio aquellos que llegan a esa cifra tanto a velocidad de muestreo de 44,1 como a la de 96kHz. Sencillamente porque la cifra no representa realmente información útil, más allá de que son plugins de escasísima demanda computacional, comparados con el resto. Y ello pese a que algunos de ellos tienen funciones que a priori parecerían reclamar algo más intenso en cómputo.

Nuestros descartados (todos ellos en sus versiones mono, salvo el efecto precisamente de generación de sensación estéreo) son por tanto: AudioTrack (un channel strip con EQ, puerta y compresión), DeEsser, Dorrough Stereo, TransX Wide (un conformador de transitorios), Renaissance Compressor, Renaissance Vox (dinámica para voz), Renaissance Equalizer (REQ6), SSL G-Equalizer.

En ese grupo de efectos el tan escaso cómputo parece hablar de unos algoritmos más básicos que los que otros productos del listado desarrollan. Llamativo que una emulación de todo un SSL (aunque sea un ecualizador) esté en este grupo. A priori, con la leyenda de los SSL uno esperaría que su magia fuera más costosa de emular… Pero claro, se trata de unos EQ que son reconocidos más por su limpieza que por otra cosa. Y si algo es natural a lo digital es la limpieza, al menos con procesos lineales como la ecualización cuando está libre de coloraciones tímbricas y saturaciones internas. Pero no me negaréis que es llamativo.

Agrupando los demás en familias un tanto globales, podemos ver enormes diferencias dentro de cada grupo (hasta extremos muy llamativos) y quizá menos de las esperadas entre grupos.

Channel Strips

El cuadro refleja cuántas instancias ‘caben’ a 44,1 y cuántas a 96 kHz, más la relación entre ambas cifras (cuántas veces más plugins entran a 44 que a 96).

Plugin	44.1kHz	96kHz	Ratio 44/96
SSL E-Channel	504	235	2,14
SSL G-Channel	496	232	2,14
REDD 17	212	104	2,04
EMI TG 12345	40	42	0,95

Las diferencias son muy evidentes. Es curioso que de nuevo las emulaciones SSL tengan cifras tan enormes, a pesar de que al ser ya unos canales completos, parecería más importante la cuestión de sus no linealidades (distorsiones internas). El que el factor sea cercano a 2 en los tres primeros es también llamativo. Es cierto que el número de muestras que hay que tratar se dobla, y eso dobla el cómputo, pero según cómo se implementen las cosas y que tipo de algoritmos estén en juego, las versiones a 96 podrían usar algunas economías que redujeran eso, o podrían al revés incluso cuadriplicar (en vez de sólo doblar) el cómputo, para así conseguir una bastante mejor calidad a 96 que a 44. Sin más datos, y siempre sólo como orientación, mi sensación es que ese factor ‘2’ apunta a que en esencia es prácticamente el mismo algoritmo el que se está usando en las dos velocidades sin buscar mucho mayor beneficio que el, ya importante, de tener un ancho de banda doblado para acomodar productos altos que de otra forma se convertirían en aliasing.

Pero fijaros finalmente en otra cuestión: el último de los plugins, el EMI TG 12345 es diez veces más costoso computacionalmente que el SSL-E. Algo que de nuevo nos lleva a hablar de su diferente carácter.

El SSL-E simula un sistema de estado sólido con VCA basado en clase A y compresor de codo suave. En definitiva bastante ‘contenido’ a la hora de colorear, y por tanto menos necesitado de un algoritmo pesado.

El TG12345 simula sin embargo un sistema que se usó en la grabación del Abbey Road de los Beatles y mucho más amigo de colorear todo lo que pasaba por él. Recrear esos efectos de saturación/distorsión de una forma controlada en digital (sin incurrir en aliasing excesivo) conlleva algoritmos claramente pesados, y al final ese peso es prácticamente equivalente y dominante tanto en el uso a 44 como a 96. Así para este plugin tenemos 40 y 42 instancias posibles, de hecho ‘cabe’ alguna más a 96 que a 44, porque a 96 estamos en un entorno más cómodo para evitar el alias.

EMI TG 12345

waves.com

SSL E-Channel

waves.com

Dinámica

El cuadro refleja cuántas instancias ‘caben’ a 44,1 y cuántas a 96 kHz, más la relación entre ambas cifras (cuántas veces más plugins entran a 44 que a 96).

Plugin	44.1kHz	96kHz	Ratio 44/96
MaxxVolume	512	371	¿aprox.2?
SSL G-Master Buss Comp	512	310	¿aprox.2?
H-Comp Hybrid Compressor	512	264	¿aprox.2?
L2 Ultramaximizer	512	260	¿aprox.2?
CLA-76 Compressor / Limiter	512	259	¿aprox.2?
Renaissance Channel	476	252	1,89
API 2500	498	250	1,99
Renaissance Bass	512	224	2,29
PuigChild Compressor	312	132	2,36
CLA-3A Compressor / Limiter	275	119	2,31
CLA-2A Compressor / Limiter	253	116	2,18
C6 Multiband Compressor	138	55	2,51
dbx® 160 Compressor / Limiter	56	56	1,00

Compresores y limitadores principalmente. Varios de ellos llegan al techo de 512 instancias en 44,1 kHz, con lo que nos hemos de fijar más bien en el valor a 96kHz y asumir que su ratio entre ambas velocidades probablemente sea cercana a 2. Es de hecho cercana a 2 en casi todos ellos. Lo que, como antes, apuntaría posiblemente al uso prácticamente del mismo algoritmo en ambas velocidades, sin preocuparse por una optimización específica a cada una.

Pero en el momento en que vamos a los plugins con una mayor complejidad de cómputo, como lo es el dbx 160, vemos que la mayor parte del cómputo es insensible a la velocidad de muestreo. Obtener un buen comportamiento dispara el coste, tanto a 44 como a 96, y los acerca en cantidad de cómputo. Sin querer decir que sea el caso (no conocemos las tripas del código) pensad por ejemplo en que pueda estar sobremuestreando internamente para el cálculo a velocidades bien superiores incluso a los 96. Algo como eso es una forma de mejorar la calidad frente a procesos no lineales y justificaría el incremento de cómputo y el hecho de que sea tan idéntico sin importar que en origen la señal venga a 44,1 o cuente con el mayor margen de partida que dan los 96.

DBX 160

waves.com

Ecualizadores

El cuadro refleja cuántas instancias ‘caben’ a 44,1 y cuántas a 96 kHz, más la relación entre ambas cifras (cuántas veces más plugins entran a 44 que a 96).

Type	Plugin	44.1kHz	96kHz	Ratio 44/96
EQ	API 550 (mono)	512	452	1,13
PhaseAlign	InPhase (mono)**	184	184	1,00
EQ	Scheps 73 (mono)	152	157	0,97
EQ	H-EQ Hybrid Equalizer (mono)	144	126	1,14
EQ	PuigTec EQP1A (mono)	176	104	1,69
EQ	API 560 (mono)	104	87	1,20

Hemos incluido también PhaseAlign por tratarse de un plugin de tipo muy ‘lineal’, como en principio se considera también a los EQs.

Lo más llamativo es cómo ahora en vez de abundar la ratio ‘2’ lo que abunda es ratios cercanas a ‘1’. Es decir, un coste computacional prácticamente igual a 44 y a 96. Si pensamos en la ecualización como filtrado, es decir, como proceso líneal, un mismo grado de calidad es cierto que puede obtenerse con el mismo cómputo. Esencialmente aunque se dobla el número de muestras, en la velocidad alta se puede reducir el número de coeficientes (el orden de los filtros) porque la señal es conocida con más detalle. Estas cifras indicarían que en este tipo de sistemas sí hay un cierto replanteamiento / optimización para cada velocidad.

Llamativo y mucho también que en media los plugins de dinámica/compresión están ofreciendo un total de instancias más alto que los EQs. Quizá todavía estamos en una situación en la que (de nuevo en media, siempre hay excepciones) los desarrolladores atienden con más cuidado los sistemas lineales como los ecualizadores (para los que los modelos son mucho más conocidos y sencillos) y no tanto con los compresores. Se entiende así mejor que todavía a día de hoy muchos prefieran la compresión hardware frente a la software. No es tanto un problema de que no haya buenos compresores software, sino que una mayoría de ellos, no están a la altura de lo que sí nos ofrecen ya los ecualizadores. Pero tiempo al tiempo, que todo llega. Mientras tanto, algo que parece muy evidente: en el uso de compresores y en general sistemas no lineales por software, tenemos que ser muy críticos con el oído y probar y elegir desde las orejas más que desde las cuestiones de funcionalidades amplísimas o, menos aún, los interfaces superatractivos.

Scheps 73

waves.com

Reverberaciones

El cuadro refleja cuántas instancias ‘caben’ a 44,1 y cuántas a 96 kHz, más la relación entre ambas cifras (cuántas veces más plugins entran a 44 que a 96).

Plugin	44.1kHz	96kHz	Ratio 44/96
Renaissance Reverb (stereo)	178	90	1,98
IR-Live Convolution Reverb (stereo)*	85	26	3,27
IR1 Convolution Reverb (stereo)*	47	22	2,14
H-Reverb Hybrid Reverb (stereo)*	14	10	1,40

De partida, el bofetón esperable: los números más bajos de instancias se producen, en media, con las reverberaciones. Siguen siendo la ‘categoría estrella’ en cuanto a demanda de CPU. Pero quizá menos de lo que esperaríamos. Podemos estar hablando de unas cinco o seis veces más que los ecualizadores, por dar un orden de magnitud. Pero es un salto que se debe principalmente a las reverb por convolución, no a las algorítmicas (que estarían consumiendo menos del doble de CPU que las ecualizaciones).

Insisto, un salto esperable, pero quizá menos pronunciado de lo que pensaríamos.

H-Reverb

waves.com

Amplificadores, saturaciones

El cuadro refleja cuántas instancias ‘caben’ a 44,1 y cuántas a 96 kHz, más la relación entre ambas cifras (cuántas veces más plugins entran a 44 que a 96).

Plugin	44.1kHz	96kHz	Ratio 44/96
Kramer HLS Channel (mono)	240	96	2,50
Vitamin Sonic Enhancer (mono)	192	88	2,18
J37 Tape (mono)	64	72	0,89
Kramer Master Tape (mono)	111	32	3,47

Esta categoría nos sitúa de nuevo en el terreno siempre difícil en digital de la ‘saturación/distorsión’. Y por tanto el cómputo, si nos fijamos, anda en el mismo orden que una reverberación algorítmica.

Curioso que aquí andemos en cifras de algo menos de 100 instancias (a 96kHz) frente a las típicamente 200 (a 96kHz) que ofrecían muchos de los compresores. Pero es lo que tiene el hecho de que aquí hablamos de unas distorsiones típicamente mucho más instantáneas y más severas, y en las que vamos a prestar atención en la escucha, más incluso que con los compresores, a su efecto de alteración tímbrica. Más computo por tanto para atender una mayor exigencia.

Kramer Master Tape

waves.com

Otros

Reunimos en un mismo cajón de sastre los demás. De nuevo el cuadro refleja cuántas instancias ‘caben’ a 44,1 y cuántas a 96 kHz, más la relación entre ambas cifras (cuántas veces más plugins entran a 44 que a 96).

Plugin	44.1kHz	96kHz	Ratio 44/96
LoAir (generación de subarmónicos)	512	268	¿aprox 2?
TransX Multi (conformador de transitorios)	380	184	2,07
H-Delay Hybrid Delay	412	155	2,66
NLS Non-Linear Summer	308	117	2,63

Se mantiene esa tendencia al cómputo doble al saltar a fs 96kHz. Y los simples retardos, cuando deben emular comportamiento analógico con saturaciones, o los sumadores que deben recrear no linealidades, vuelven a tener cifras semejantes a las que vemos en otros sistemas con presencia de distorsión y no tan alejados de lo que implica una reverberación algorítmica.

Trans-X Multi

waves.com

Conclusiones

De nuevo, insisto: no puede haber conclusiones sólidas cuando se parte de tan pocos datos y sólo cabe una especulación. Las diferencias internas y de obejtivos de los distintos plugins son enormes. Pero, siendo tantos, sí creo que las cifras analizadas apuntan algunas tendencias representativas de lo que se nos ofrece hoy en el mercado de los plugins.

Globalmente saltar a 96kHz nos va a llevar a duplicar el cómputo (sólo en algunos plugins específicos más que doblar), pero personalmente no lo encuentro exagerado. Puede ser asumible.

La reverb sigue apuntándose como merecedora al premio al más hambriento, pero por un margen que se estrecha a medida que nos hemos ido haciendo más exigentes con la calidad y no sólo con la funcionalidad del resto de los efectos más típicos. Una ecualización o un compresor que manifiesten un comportamiento de coloración tímbrica / saturación, pasan a ser también hoy consumidores de operaciones en un grado que no era tal hace unos años. Parece que esos otros procesos ‘coloreantes’ van mejorándose, a costa lógicamente de demandar más procesador.

Pero son muy excepcionales los plugins ‘devoradores’ intesivos de CPU. Parece que como clientes seguimos reacios a comprar algo que sea demasiado intenso en consumo y nos deje sin poder disfrutar de crear infinidad de plugins simultáneos. Sólo por esa dificultad de venderlo puedo entender que no haya a día de hoy una mayor oferta de plugins de calidad ‘extraordinaria’ incluso para las tareas más difíciles. Y no es que falten soluciones digitales para llevarlas a cabo. Sencillamente, a día de hoy se venden como carísimos equipos hardware de interior digital, muchas veces hacia entornos ‘mastering’ en donde se manejan presupuestos más elevados que en el ámbito de los plugins convencionales.

Y desde luego, por encima de todo. Pocas veces sabemos bien qué estamos comprando si atendemos sólo a la información ‘de folleto’. Por fortuna las versiones demo están a la orden del día, y en el caso de tener que tomar una decisión de compra difícil (por el importe y por la existencia de varias alternativas) podremos casi siempre realizar unas pruebas con calma y en nuestro propio entorno de trabajo. Qué situación tan idílica frente a tener que acudir a un entorno desconocido.

Sí, soy positivo. No vamos por mal camino. Tanto el presente como el futuro parece que pintan bien.

¡Tranquilos, no hay spoilers!. O sí, según se mire. Aunque poco os podríamos revelar que no sepáis de la trágica historia de Freddie Mercury y Queen, que ahora ha sido recogida en la película “Bohemian Rhapsody”. Siempre es difícil contentar a los seguidores acérrimos de cualquier fenómeno cultural, pero parece ser que el trabajo final del director Dexter Fletcher (o tal vez del ex director Bryan Singer, quien aparece en los títulos de crédito) ha conseguido satisfacer las expectativas del público, habiendo logrado recaudar 72 millones de dólares.

Nosotros no haremos una crítica del filme (ni estamos capacitados ni somos el medio al que le corresponde hacerlo), pero sí vamos a compartir algo con vosotros: nos hemos sentido halagados por la cantidad de detalles “guitarrísticos” que aparecen en ella. “Siendo una película sobre una banda de rock, es normal, ¿no?”, diréis. Pues sí, pero lo cierto es que no siempre ocurre: todos estamos hartos de ver películas en las que se dejan los detalles musicales en segundo plano, llegando a provocar momentos directamente imposibles. Como esa típica situación recurrente en películas y series de bandas adolescentes en que el/la protagonista decide subir al escenario a cantar en el último momento — aunque no estaba planeado — , y por alguna razón, todos los músicos conocen el tema — aunque lo ha compuesto él o ella mismo/a — y se acaban uniendo, sonando incluso instrumentos que ni siquiera están en el escenario. Y como esa, muchas otras escenas similares. Sin embargo, todos aceptamos tácitamente esas situaciones como parte necesaria de que un guión fluya, y las películas sean divertidas. Y es verdad, hay veces en que aportar más rigor tampoco mejoraría la experiencia de la película.

Pero en este caso, “Bohemian Rhapsody” ofrece escenas cuyo único propósito es el de reflejar con un mínimo de fidelidad cosas que ocurren en el estudio o el escenario, a veces casi diríamos que con carácter didáctico. Y es que el filme ya comienza con la sintonía de la 20th Century Fox interpretada por la guitarra de May, armonizada al más puro estilo “God save the Queen”, advirtiendo que habría varios guiños a los guitarristas y músicos en general.

Un ejemplo de ello es la secuencia en que Freddie quiere hablar con Brian May desde la sala de control, y repara en que si no presiona el botón del “Talkback”, Brian no puede oírle. A su vez, Brian tiene que gritar para que, a un par de metros de él, el micrófono de su ampli capte su voz (un Shure SM7B que roba un primer plano durante unos instantes, un modelo lanzado al mercado 2 años antes del momento en que se sitúa la acción). Aunque, al final, May decide hablar a través de las pastillas de la guitarra, para que en la sala de control puedan escuchar lo que dice. No podía faltar el equipo completo de May sobre el escenario, con todos sus Vox apilados, así como algunos Hiwatts que aparecen fugazmente junto a otros equipos de la época. Incluso el montaje de audio y vídeo del Live Aid de 1985 ha sido reproducido con un nivel de fidelidad muy importante. Por supuesto, es probable que haya habido licencias y algunos detalles tal vez no del todo exactos que no conozcamos, pero el resultado es suficientemente convincente.

También el mundo de la producción se ve reflejado: Freddie pidiendo un panoramizado de unos coros, pudiendo escuchar primero la toma centrada, y después viajando de izquierda a derecha en la sala de proyección. “Nos estamos quedando sin cinta”, una frase que los ajenos a la grabación de música tal vez no comprendan del todo, pero que se pronuncia después de que Freddie Mercury haga grabar a Roger Taylor la palabra “Galileo” decenas de veces (en la vida real, la canción requirió 180 overdubs, realizados en 5 estudios diferentes) en el 24 pistas del estudio. Puede que muchas personas que no están en contacto con la música habitualmente descubran por primera vez estos conceptos, o pasen por alto los detalles que hemos expuesto en el párrafo anterior. Pero son momentos del filme en que el espectador que es cercano a la música se vuelve preferente frente a la masa.

Brian May y Roger Taylor fueron responsables de la producción de la película, lo cual probablemente supone un doble beneficio: no sólo hay un testimonio directo de alguien que realmente estuvo allí, sino que al ser miembros de la banda es más probable que se preocuparan de estos pequeñas referencias al mundo de los músicos. Además, siendo Queen una banda de culto, parece lógica la importancia de reproducir los equipos, los espacios, los vestuarios, e incluso los gestos. Por hacer un símil, cualquier fan de Star Wars detectaría alguna mínima variación o error en el uniforme de sus personajes favoritos.

Por todo ello, y aunque no son realmente necesarios para la exposición de la historia de Freddie Mercury y Queen, es de agradecer que se haya hecho todo el trabajo de documentación para poder ofrecer una sensación sólida a todo el colectivo de seguidores del grupo. Como decíamos unas líneas más arriba, no os estamos prometiendo que os vaya a gustar necesariamente, ni nos atrevemos a pronunciarnos sobre su calidad como obra cinematográfica. Pero hay algo de ella que nos parece notable, y es que demuestra respeto por la música: prueba de ello son los cuatro temas completos del grupo que se interpretan como parte de la película. Una secuencia de varios minutos en que la música es la verdadera protagonista.

SONIDO PROFESIONAL

viernes, 16 de noviembre de 2018

Plugins y consumo de CPU: mitos y realidades

Introducción

Los datos

Channel Strips

Dinámica

Ecualizadores

Reverberaciones

Amplificadores, saturaciones

Otros

Conclusiones

“Bohemian Rhapsody”, la película a través de los ojos de un guitarrista

Reaper 6 llega con apariencia renovada y muchas funciones expandidas

Vistas de página en total