Dossier
Recepción: 23 Abril 2024
Resumen: Cuando escuchamos una canción grabada, nos exponemos a la audición de mucho más que la canción en sí. En este sentido, si concebimos la canción grabada como el texto primario, y adoptamos una perspectiva endofonográfica de análisis, encontraremos que, en ella, hay más que una letra cantada con un acompañamiento armónico, grabados en un soporte en particular. En este artículo, nos proponemos indagar en esta afirmación, tomando como objeto de estudio la canción «Desierto» perteneciente a Fito Páez (Argentina, 1963). Empleando una estrategia metodológica centrada en el análisis auditivo, el objetivo es poder reconocer, describir y analizar no solamente la configuración específica de las estructuras musicales, de la letra y de las operaciones técnico–discursivas, sino también dar cuenta de la interrelación singular que ocurre entre ellas, y a partir de la que se constituye la resultante sonora final de «Desierto» en tanto canción grabada. Nuestra hipótesis inicial es que diversos aspectos de la resultante sonora final de esta canción grabada no son exclusivamente atribuibles a la canción y/o a su performance musical, sino que las operaciones técnico–discursivas realizadas en la etapa de mezcla son, al igual que las anteriores, determinantes en su constitución.
Palabras clave: endofonografía, análisis auditivo, mezcla, producción fonográfica, teoría de la constitución.
Abstract: When we listen to a recorded song, we are exposed to hearing much more than the song itself. In this sense, if we conceive the recorded song as the primary text, and adopt an endophonographic perspective of analysis, we will find that there is more than a lyric sung with a harmonic accompaniment in it, recorded on a particular medium. In this article, we propose to investigate this statement, taking as an object of study the song «Desierto» belonging to Fito Páez (Argentina, 1963). Using a methodological strategy focused on auditory analysis, the objective is to be able to recognize, describe and analyze not only the specific configuration of musical structures, lyrics and technical–discursive operations, but also to account for the unique interrelation that occurs. among them, and from which the final sound result of «Desierto» as a recorded song is constituted. Our initial hypothesis is that various aspects of the final sound result of this recorded song are not exclusively attributable to the song and/or its musical performance, but rather the technical–discursive operations carried out in the mixing stage are, like the previous ones, determinants in its constitution.
Keywords: endophonography, auditory analysis, mixing, music production, constitution theory.
1. Introducción
Cuando escuchamos una canción grabada, nos exponemos a la audición de mucho más que la canción en sí. Las consideraciones y los abordajes analíticos pueden realizarse desde perspectivas tanto contextualistas como también formalistas o inmanentistas, cada una atendiendo a sus tradiciones de estudio.[1] En este sentido, si concebimos la canción grabada como el texto primario (Moore, 2012), y adoptamos una perspectiva endofonográfica de análisis (Lacasse, 2005), encontraremos que, en ella, hay más que una letra cantada con un acompañamiento armónico grabados en un soporte determinado, para ser reproducido a posteriori. Si bien autores como Philip Tagg sostienen que para los estudios de música popular no es suficiente el estudio del texto primario o «nivel neutro», entendemos que el análisis de los procesos y operaciones que constituyen a la canción en tanto canción grabada, o «performativamente fijada», y de su relación con la letra y sus estructuras musicales (tal como abona la musicología de la producción fonográfica), aporta líneas de desarrollo analítico que permiten dar cuenta de la complejidad en su constitución, y al mismo tiempo, tender puentes con perspectivas analíticas que se proponen indagar en las dimensiones culturales, sociales, económicas, antropológicas y/o semióticas que ocurren y constituyen, de la misma manera, a la canción grabada[2] (González, 2013).
En este artículo, tomamos como objeto de estudio la canción «Desierto» de Fito Páez (Argentina, 1963), para realizar un análisis auditivo desde la perspectiva endofonográfica. El objetivo es poder reconocer, describir y analizar no solamente la configuración específica de las estructuras musicales, de la letra y de las operaciones técnico–discursivas (Di Cione, 2023), sino también focalizar en la interrelación singular mediante la cual estos textos constituyen a «Desierto» en tanto canción grabada. Es importante señalar que, en cuanto al texto lingüístico de la canción (la letra), si bien es un componente central, no es propósito de este trabajo indagar en las significaciones posibles que pueden asociarse con el discurso que ella despliega, ni con sus aspectos narrativos. Tampoco lo es atender a los llamados «efectos fonográficos».[3] Como mostraremos más adelante, la elección de «Desierto» como objeto de estudio no es azarosa, sino que se debe, principalmente, a entender como hipótesis de partida que un conjunto considerable de configuraciones específicas de la resultante sonora de esta canción grabada no son atribuibles únicamente a la canción y/o a su performance musical, sino que operaciones realizadas en la etapa de mezcla son también determinantes en su constitución. Considerando que la canción grabada en tanto master[4] será el texto primario para desarrollar nuestro análisis, la estrategia metodológica estará principalmente conformada por el análisis auditivo (desarrollaremos este punto más adelante).
«Desierto» forma parte del disco Abre, décimo álbum de estudio de Fito Páez, editado por el sello discográfico Warner Music y publicado en Argentina el 27 de julio de 1999, en formato CD–Audio. De acuerdo con Martín Liut, «Abre muestra la madurez artística y la experiencia profesional de Fito Paéz. Hay en el disco un arco dramático pensado cuidadosamente en el que se alternan baladas y rockanroles con asuntos y temas diversos» (Liut, 2020:161). El disco, perteneciente al estilo musical «rock», fue producido por Phil Ramone,[5] mezclado por Frank Filipetti,[6] entre los estudios Circo Beat[7](Buenos Aires) y Right Track Studios (Nueva York), y masterizado por Ted Jensen[8] en Sterling Sound (Nueva York).
2. Canción, producción fonográfica, fonograma
La canción performativamente fijada, en tanto fonograma,[9][10] es el resultado de un complejo proceso de producción, conocido como proceso de producción fonográfica, o también proceso de producción musical.[11] Más allá de su grado de profesionalización, y en términos abarcativos y generales, este proceso tiene, en directa relación con el estilo musical que se está produciendo, etapas más o menos definidas, que pueden secuenciarse en forma lineal y, en principio, no reversible, tal como propone Roey Izhaki (2008), o bien en forma más móvil, con avances y retrocesos, similar al “puzle”, un rompecabezas a armar no necesariamente de manera secuencial, tal como propone Marco Antonio Juan de Dios Cuartas (2022). En términos generales, suele conformarse por la grabación, la edición, la mezcla y la masterización.
En el proceso de producción fonográfica tienen agencia tanto las tecnologías utilizadas (micrófonos, preamplificadores, consolas, procesadores –espectrales, dinámicos, temporales–, efectos, entre muchos otros), como los individuos especializados que las operan, realizando, de acuerdo con Lisa Di Cione, operaciones técnico–discursivas, es decir «un conjunto de acciones concretas que dejan marcas audibles en los fonogramas» (2023,p.72) y que suelen, a su vez, estar guiadas por una poética sonora en particular.[12]
En resumen, cada una de las etapas del proceso de producción fonográfica incide sobre diferentes aspectos de la resultante sonora final del fonograma. Algunos de estos aspectos guardan mayor relación con la canción (letra, melodías, armonías, combinaciones instrumentales y vocales, entre otros), mientras que otros pueden ser atribuibles a alguna de las etapas del proceso de producción fonográfica. En particular, la etapa de mezcla tiene una incidencia medular en la resultante sonora del fonograma, considerando la posibilidad que existe aquí para intervenir individualmente cada uno de los sonidos grabados. En efecto, el ingeniero de sonido argentino Mario Breuer define a la mezcla como el
proceso de producción posterior a la grabación de un disco en el que se definen los volúmenes, ecualizaciones y efectos de cada uno de los sonidos registrados (...) se revisan volumen, color, reverberancia, posición (si a la izquierda, a la derecha, al centro), si lo quiero adelante o atrás. Eso se hace con cada canal; se trabaja un poco con cada árbol y después sobre el bosque. (Breuer, 2018, p.171)
Incluir y atender, en particular, el texto sonoro en nuestra empresa analítica, y articular su análisis con los textos musicales, lingüístico y performativo,[13] implica repensar cómo concebimos, en términos ontológicos, a la canción grabada.
Al respecto, dice Roger Pouivet, pensando la canción grabada desde la «teoría de la constitución»,[14] que «la grabación y la obra forman una unidad en la que lo que constituye, la grabación, y lo que se constituye, la obra, no son idénticos. (...) La teoría de la constitución lleva a decir (...) que son dos cosas distintas, pero unidas»[15] (Pouivet, en Frangne & Lacombe, 2014, pp.168,169). En particular, respecto a lo que Pouivet refiere como «grabación», es preciso recordar a Simon Frith y Simon Zagorski–Thomas, quienes al afirmar que «En el estudio las decisiones técnicas son estéticas, las decisiones estéticas son técnicas y todas esas decisiones son musicales» (2012,p.3), habilitan a pensar la canción grabada no solo como una grabación–documento (la fijación en soporte fonográfico de una performance musical específica), donde la incidencia del proceso de producción fonográfica en la resultante sonora final sería secundaria, sino en tanto grabación–obra, donde se entiende que las decisiones tomadas en éste son centrales para la resultante sonora final de la canción grabada (Arbo, 2017). Al respecto, Arbo explica que « (...) limitarse a escuchar lo que se escucha sin tender intencionadamente a otra cosa significa en realidad que sólo la grabación debe reunir todas las propiedades estéticas de la obra».[16](p.30)
Es preciso, entonces, reponer categorías que nos permitan poder indagar y poder explicitar, a partir del análisis auditivo, algunas de las particularidades de la canción grabada en tanto texto primario para el análisis.
2. Endofonografía, opacidad y espacio textural
2.1. Endofonografía[17]
El musicólogo franco–canadiense Serge Lacasse (2005) afirma que
la música popular grabada no consiste únicamente en melodías fáciles de recordar, acompañadas de armonías simples, presentadas de forma repetitiva. Por supuesto, estos parámetros más abstractos (melodía, armonía, forma, etc.) constituyen un aspecto esencial del género; pero la estética de los estilos más populares se basa principalmente en la valorización de otros parámetros más concretos, que llamaré parámetros interpretativos (vinculados a la ejecución) y parámetros tecnológicos (derivados de las técnicas de grabación)”.[18] (Lacasse, 2005, p.1)
Los tres parámetros (abstractos, interpretativos y tecnológicos) conforman lo que el autor denomina «endofonografía». Un análisis endofonográfico, entonces, es aquel que se propone analizar los tres parámetros en términos individuales y, a su vez, en su interrelación singular. En la cita anterior, vemos cómo los parámetros «abstractos» pueden ser analizados desde abordajes que busquen realizar un análisis musical, mientras que los parámetros « interpretativos» pueden ser vinculados con la ejecución instrumental y vocal que puso en hecho sonoro los parámetros abstractos. Finalmente, los parámetros tecnológicos están vinculados con las operaciones técnico–discursivas a las que referimos previamente y que, en tanto atribuibles al proceso de producción fonográfica, subsumen a los dos anteriores. A los fines de este artículo, es preciso mencionar que, en relación con nuestro objeto de estudio, los parámetros tecnológicos a los que nos referiremos se recortarán a aquellos atribuibles a la etapa de mezcla.
Sobre estos últimos —los tecnológicos—, Lacasse propone organizarlos en cuatro subtipos: 1) dinámica, relacionada con la intensidad de registro en la etapa de grabación y el volumen relativo que la fuente sonora finalmente obtiene durante la etapa de mezcla; 2) la espacialización, para la que propone pensar en términos de «difusión estereofónica» para describir, desde la audición, la localización relativa de las fuentes sonoras, como también de «entorno» para describir el aparente entorno particular en el que una fuente parece estar sonando y, finalmente, la distancia relativa con la que la fuente sonora grabada parece sonar; 3) tiempo, para referir las eventuales modificaciones temporales que puedan operarse sobre las fuentes sonoras (tales como, por ejemplo, su procesamiento mediante reverberación y eco) y 4) timbre, para describir las modificaciones en términos espectrales que puedan realizarse a una fuente o conjunto de fuentes sonoras grabadas (por ejemplo, filtrado o amplificación de una o varias bandas del espectro, agregado de distorsión, entre algunas posibilidades). La conceptualización de estos cuatro subtipos de parámetros tecnológicos se revela particularmente útil para indagar en las particularidades del texto sonoro.
2.2. Opacidad
Los parámetros tecnológicos que describe Lacasse, en tanto etapa de mediación sonora indispensable para originar una grabación (tanto la canción y su performance, hasta ahí, pueden ser consideradas, respecto de la grabación, en tanto pre–mediáticas),[19] forman parte de cualquier canción grabada. No obstante, es preciso discutir de qué manera se produce la mediación tecnológica o, más precisamente, cómo y con qué finalidades es utilizada. Bien nos recuerda Alessandro Arbo, parafraseando a Pouivet, que «nuestras formas de responder a la música no son las mismas cuando sabemos o creemos saber que lo que estamos escuchando es una construcción fonográfica o el documento de una interpretación»[20] (Arbo,2017,p.16). En este sentido, la investigadora noruega Ragnhild Brøvig–Hanssen ha propuesto las categorías de mediación «opaca» y mediación «transparente» para poder dar cuenta del uso explícito que, en el proceso de producción fonográfica, se hace de las técnicas y tecnologías involucradas en su concreción. En relación con la búsqueda que lleva adelante un sujeto que escucha, a partir de la audición de un fonograma, por reconocer una fuente sonora en particular, la autora explica que
(...) la atención del oyente no solo se dirige hacia lo mediado sino también hacia el acto de mediación en sí. A esta estética particular la llamo «mediación opaca» para resaltar el grado de exposición de la tecnología mediadora relevante, en contraposición a la «mediación transparente», en la que lo ideal es un uso de la tecnología mediadora que el oyente puede ignorar por completo.[21] (Brøvig–Hanssen, 2010, p.1).
A partir del análisis que desarrollaremos más adelante, veremos cómo esta categoría resulta particularmente útil para señalar diferentes momentos del fonograma.
2.3. Espacio textural
En su libro Song means: analysing and interpreting recorded popular song (2012), Allan F. Moore desarrolla, entre varios asuntos relacionados con la música popular grabada, una estrategia de análisis auditivo para poder dar cuenta de lo que él llama la «forma» de la grabación (shape of the recording).[22] En efecto, Moore propone un desplazamiento en el sentido con el que habitualmente se comprende la categoría «textura» en la musicología sistemática y la teoría musical[23] occidental, sobre todo, en el uso extendido de la categoría para el análisis de músicas de tradición escrita. Si bien podemos dar cuenta de las configuraciones específicas de los componentes musicales en tanto superposiciones de estratos rítmicos, melódicos y armónicos que discurren en el tiempo, Moore argumenta que, en las músicas populares grabadas, esta superposición, ocurre al interior del espacio acústico virtual, propio del fonograma.[24] De esta manera, el autor propone, a partir del análisis auditivo de una canción grabada, concebir al espacio acústico virtual en tanto «espacio textural» (textural space) que es ocupado por las fuentes sonoras grabadas que lo constituyen.
Este cambio epistémico allana el camino para diseñar una metodología de análisis auditivo, a partir de tres categorías: estratos funcionales (functional layers), soundbox y timbre.
En cuanto a los estratos funcionales, propone cuatro tipos que, según él, se ajustan en gran medida al instrumental empleado en el rock, y que aspiran a reconocer, organizar y describir las fuentes sonoras presentes en un fonograma[25] perteneciente a este estilo: 1) estrato de pulsación explícita (explicit beat layer), relacionado con instrumentos de percusión y/o de altura no puntual, generadores del tactus; 2) estrato de bajo funcional (functional bass layer), dedicado al instrumento (usualmente de registro grave, por ejemplo, como el bajo eléctrico, el contrabajo o el registro grave del piano) que, además de reforzar el estrato de pulsación explícita, usualmente también refuerza las tónicas o las notas más graves (en el caso de los acordes invertidos) de los acordes pertenecientes al estrato armónico; 3) estrato melódico (melodic layer), dedicado a las melodías, tanto principales como secundarias y 4) estrato armónico (harmonic filler layer), dedicado a los instrumentos y sonidos que cumplen una función armónica, desarrollando el acompañamiento armónico (o, según Moore, el «relleno» –sic– armónico) de las melodías que se ubican en el estrato anterior. Moore también afirma, dando una pista en relación con el uso estilístico en particular de estos estratos en el rock, que «el enfoque de voz, guitarra, bajo y batería hacia los estratos funcionales ha sido un pilar de las canciones de rock durante unas cuatro décadas»[26] (p.27).
El soundbox (también traducido al español como «caja de sonido», «caja de resonancia» o «caja acústica») es la categoría analítica que Moore propone para dar cuenta, desde el análisis auditivo, de la localización espacial de las fuentes sonoras grabadas que constituyen al fonograma. Ampliando lo explicado por Lacasse en cuanto a la espacialización en su conceptualización de los parámetros tecnológicos, y avanzando hacia una categorización analítica concreta, según Moore, « la soundbox proporciona una forma de conceptualizar el espacio textural que habita una grabación, al permitirnos escuchar literalmente grabaciones ocupando espacio»[27] (p.30). Concretamente, se trata de concebir este espacio textural, metafóricamente, como un cubo en el que cada una de sus dimensiones tendrá gradientes en cuanto a sus posibilidades de descripción para precisar la localización de las fuentes sonoras en su interior: 1) lateralidad (izquierda–centro–derecha); 2) profundidad, asociada con el volumen relativo y el contenido espectral de una fuente sonora, y eventuales procesamientos temporales (reverberación y eco, por ejemplo) que puedan aplicarse y 3) altura, relacionada con el registro que ocupan las fuentes sonoras, entendidas tanto como alturas puntuales así como bandas del espectro frecuencial.[28]
La localización relativa de las fuentes sonoras grabadas puede ser graficada entonces, según Moore, realizando una “transcripción del soundbox”(soundbox transcription) a partir del análisis auditivo. Esta distribución no debe ser fija ni permanente, sino que puede modificarse, desde la mezcla, en cualquier momento. En efecto, Moore y Rut Dockwray (2010) proponen la existencia de cuatro “taxonomías de mezcla” (mix taxonomies) en relación con la distribución y localización de fuentes sonoras en el soundbox: 1) en racimo (clustered), cuando las fuentes sonoras parecen estar localizadas juntas y superpuestas, en un mismo sitio del soundbox; 2) triangular (triangular), donde la voz principal, el tambor y el bajo eléctrico se localizan cada uno en un punto fijo del soundbox (proponen, en este sentido, el centro, y los extremos laterales a la izquierda y a la derecha); 3) dinámica (dynamic), donde la localización de las fuentes sonoras es modificada durante la extensión del fonograma; y 4) en diagonal (diagonal), donde describen a la voz líder, el bajo y el tambor ubicados en una línea al centro del soundbox, mientras las demás fuentes sonoras se localizan a los laterales, ya sea en los extremos, o bien en posibilidades intermedias entre el centro y éstos.
Por último, Moore concibe al timbre como una vía fundamental para comprender el significado y el sentido de las configuraciones específicas de los sonidos. Si bien desarrollar esta perspectiva no es parte de nuestros objetivos, sí lo es el recorte en términos de atributos sonoros a los que Moore se refiere al describir esta categoría. Si bien no da precisiones categoriales al respecto, aunque abunda en ejemplos y «casos testigo» seleccionados ad hoc, los atributos sonoros con los que Moore pretende dar cuenta del timbre son similares a aquellos que Lacasse conceptualizó en tanto «parámetros tecnológicos» (recordemos: dinámica, espacialización, tiempo y timbre)[29] y en los procesamientos específicos que operan sobre ellos. Aquí, al hablar de timbre nos referimos, concretamente, a eventuales modificaciones en la envolvente espectral de una fuente sonora grabada (por uso de ecualización, por ejemplo), de su perfil dinámico (por modificación de su volumen relativo, por compresión), y/o de su espacialidad (por su procesamiento mediante reverberación, eco).
3. Estrategia metodológica
La estrategia metodológica para el análisis endofonográfico de «Desierto» abarcó tres ejes complementarios: la tecnología utilizada, el análisis auditivo y el análisis cuantitativo.
En cuanto a la tecnología utilizada, como sistema de reproducción empleamos auriculares cerrados Beyer Dynamic DT 770 Pro.[30] Realizar la escucha mediante audífonos y no a partir de un sistema estereofónico de altavoces es coherente con lo que proponen Moore y Dockwray, al sostener que «(...) los auriculares producen una imagen estéreo más clara que los altavoces. La imagen estéreo más nítida es principalmente el resultado del efecto in the head – “en la cabeza” – producido por los auriculares, que pueden dirigir “la atención de los oyentes a diferentes zonas del espacio interior”, lo que permite localizar el sonido y la transcripción de la localización de la fuente sonora con mayor precisión»[31] (Moore & Dockwray, 2010, p.184). Utilizamos también softwares para generar diferentes insumos de análisis, tales el Sonic Visualiser (para confección de espectrograma y análisis formal), y MuseScore4 (para transcripción en notación tradicional de diferentes fragmentos melódicos, rítmicos y armónicos). La reproducción del fonograma se realizó desde la plataforma YouTube.[32]
Para el análisis auditivo, fue necesario organizar las escuchas del fonograma, estableciendo pautas que permitieran direccionar nuestra atención en cada audición hacia los objetivos propuestos. En efecto, partimos de la afirmación que hace William Moylan en relación con realizar el análisis auditivo «con intención», y en atención a diferentes perspectivas del objeto de estudio (Moylan, en Hepworth–Sawyer & Hodgson, 2017,p.32), es decir, realizar audiciones reiteradas teniendo en cuenta las categorías conceptuales y analíticas desarrolladas, y focalizando nuestra atención en el reconocimiento y la descripción de lo escuchado. En este sentido, siguiendo también a Moylan, realizamos audiciones enfocando nuestra escucha, primero, en rasgos generales y globales de la canción grabada, para luego avanzar hacia el estudio particular de cada fuente sonora grabada. Por cada audición se confeccionaron, progresivamente, cada uno de los insumos necesarios para el análisis.
El análisis cuantitativo, consistió en la generación de insumos, entre los que incluimos un espectrograma y transcripciones en notación musical tradicional de diferentes fragmentos rítmicos y melódico–armónicos. Simultáneamente, se llevó adelante una bitácora donde se recogieron algunas conclusiones preliminares y ensayaron hipótesis en relación con explicaciones posibles para la configuración específica de la resultante sonora del fonograma.
4. Análisis
4.1. Descripción general y análisis formal
«Desierto» tiene una duración total de 7:09 minutos (es el segundo fonograma más extenso del disco Abre, siendo el primero «La casa desaparecida» con 11:28 minutos de duración). El tempo aproximado es de negra = 97,[33] con un indicador de compás de 4/4. Ambos se mantienen estables durante toda la canción. Las fuentes sonoras que identificamos son: máquina de ritmo, cantante masculino, coro,[34] guitarras eléctricas (sin distorsión y con distorsión, tocando arpegios, riff y acordes plaqué), sintetizador (tocando una contramelodía a la voz líder en segmentos microformales a, y tocando intervalos de cuarta justa y quinta justa, con otro timbre, en segmentos B), arpegiador, batería,[35] piano rhodes (a5). A la audición, identificamos una clara preeminencia de la voz líder, las guitarras eléctricas, el bajo eléctrico y la batería. Formalmente, la canción está organizada siguiendo la forma estándar A–B en términos macroformales, dividiéndose cada segmento macroformal en dos (o tres, en el caso de B2) segmentos microformales. La decisión de utilizar, para el análisis comparativo, la combinación de letras del abecedario en mayúscula y minúscula, junto con números correlativos de acuerdo con su orden de ocurrencia, responde también a una opción metodológica cuyo fundamento es no haber encontrado en «Desierto» características o aspectos específicos que nos sugieran nominar los segmentos formales de acuerdo con otras perspectivas analíticas.[36]
La segmentación formal de tipo A–B, sobre todo en términos macro, puede verse claramente a partir del siguiente espectrograma:
Luego, avanzamos con la segmentación microformal de cada uno de los segmentos macroformales:
La segmentación formal propuesta responde a los siguientes criterios: 1) los segmentos A poseen una secuencia armónica diferente a los segmentos B, aunque ambos comparten la misma tonalidad (ampliaremos este aspecto cuando desarrollemos el estrato armónico); 2) cada tipo de segmento formal está guiado por un tipo estructural[37] de melodía líder (la voz de Fito Páez), configurada de una manera específica para cada caso (ampliaremos al abordar el estrato melódico); 3) existe una marcada diferencia entre los segmentos A y B, en términos de ocupación espectral, de intensidad sonora y de distribución en el campo estéreo (cada segmento es compatible con diferentes tipologías de mezcla); 4) los segmentos A suelen incluir mayor cantidad de operaciones técnico–discursivas móviles, que caracterizan de diferente manera a cada segmento microformal a, mientras que los segmentos B son, desde este punto de vista, más bien estáticos (ampliaremos estos últimos dos puntos al desarrollar el análisis del espacio textural).
Por último, en cuanto a la concatenación de los segmentos formales, identificamos una marcada tendencia hacia la superposición, a excepción de los pasajes b1→ a3 y b4 → a5, donde se produce una yuxtaposición entre segmentos formales. Contrariamente al argumento que desarrollamos respecto de la segmentación formal, estos momentos de pasaje son coincidentes con el único fragmento de la letra que podríamos definir, a partir de su configuración específica y de sus reiteraciones, como «estribillo» (« y nada de lo que me digas, amor, va a sacarme de este desierto…») donde toda la frase funciona como cierre del segmento formal precedente, excepto las dos últimas sílabas de la palabra «de–sier–to», que se ubican en los primeros pulsos del segmento formal posterior.
4.2. La letra
En cuanto a la letra, cabe destacar la alta regularidad en su organización métrica. Está compuesta en estrofas de cuatro versos, de ocho sílabas cada uno, a excepción del final de los segmentos micro formales b1, b3 y b4 que incluyen la frase « Y nada de lo que me digas, amor, va a sacarme de este desierto»,[38] cuya inclusión, por tener mayor cantidad de sílabas, rompe con la regularidad métrica.
Como mencionamos antes, un hecho que atraviesa la segmentación formal, la configuración melódico–armónico y la letra de «Desierto», es la marcada tendencia a la concatenación por superposición de segmentos formales. Concretamente, lo que ocurre es que en los momentos donde se presenta este modo de concatenación, mientras la secuencia armónica de un segmento formal está finalizando, comienza la letra del segmento formal siguiente. Este procedimiento estratégico[39] (Madoery, 2000) en la interrelación entre melodía, texto cantado y acompañamiento armónico produce una gran continuidad en el discurrir temporal del fonograma.
4.3. Estratos funcionales
4.3.1. Estrato melódico
Simultáneamente al estrato armónico, se despliegan melodías a cargo de la voz líder, el coro, un sintetizador (en a1, a3 y a4) y un sintetizador con un arpegiador con una alta densidad cronométrica (en a2 y a5). Mientras que la melodía cantada por la voz líder es la melodía principal en toda la canción, las otras funcionan como melodías secundarias. Transcribimos a continuación la melodía estructural de la voz líder para los segmentos macroformales A y B:
Ambas melodías estructurales se caracterizan por tener un comienzo acéfalo, con ritmo de corcheas (siendo la segunda melodía un tiempo más largo que la primera), que resuelven melódicamente hacia la nota mi. La melodía principal gravita en torno a la nota mi, siendo característica una configuración melódica de ámbito reducido (generalmente, dentro de la tercera menor), y repitiendo el mismo fragmento melódico, con mínimas variaciones, en cada verso. Es interesante remarcar que, a pesar de que la melodía estructural para los segmentos B tiene características compatibles con una configuración modal (sensible modal que asciende por tono a la tónica), argumentaremos en favor de una interpretación tonal de la organización de alturas en «Desierto» (ampliaremos esto al desarrollar el estrato armónico).
Al final de cada segmento B suena un riff[40] al unísono entre guitarras eléctricas y bajo eléctrico, que no solamente funciona como melodía secundaria, sino que fundamentalmente funge en tanto articulador formal (marca el final de la progresión armónica, para volver a comenzar):
4.2.2. Estrato armónico
Cada uno de los segmentos microformales está caracterizado por una organización particular de la armonía. El estrato armónico lo conforman las guitarras eléctricas (tanto en acordes arpegiados como plaqué), el coro, y el sintetizador. Transcribimos a continuación la progresión armónica resultante en cada segmento microformal:
Segmentos a1, a2, a3 y a4: ||: Em | Em/7M | Em7 |Em6M :||: A | C | Em | E° | A | C | Bsus4 | B (a1 y a3) ó Bsus4 (a2 y a4) :||
Segmento b1y b2: ||: E5 | A5 A5/G :||: G | D/F# | G | (riff):||
Segmentos b3 y b4: ||: Em | D/F# | G | (riff):||
Segmentos a5 y a6: ||: Em | Em/7M | Em7 |Em6M :||
Armónicamente, y considerando la polarización del estrato melódico principal en torno a la nota mi, podemos identificar la preeminencia del modo menor con tónica en esta nota, con dos desvíos. Primero, el descenso cromático de las notas mi–re#–re–do# (tocadas por el coro – a1 –, la guitarra eléctrica sin distorsión tocando arpegios– a1, a3, a4, a5, a6), que podría dar lugar a considerar un uso situado de la escala de mi menor melódica (notas mi fa# sol la si do# re# mi), con la inclusión de sus notas de movimiento obligado ascendentes (do#, re#) y descendentes (do, re). Este hecho, que analíticamente ubicamos en el estrato armónico, le otorga dinamismo al estrato melódico, caracterizado fundamentalmente por la repetición de alturas y de una estructura melódica en particular. El segundo desvío armónico respecto de la tonalidad propuesta lo encontramos en los segmentos microformales a2 y a4, con la inclusión del acorde E° (mi disminuido, notas mi sol sib), que incluye la nota sib, ajena a la tonalidad de mi menor. En cualquier caso, habida cuenta del análisis melódico–armónico que realizamos, y reponiendo la categorización propuesta por Nicole Biamonte (2017), podemos afirmar que, desde el punto de vista armónico, «Desierto» es una canción tonal, organizada en torno a la tonalidad[41] de mi menor.
Mención aparte merecen los acordes usados en los segmentos B: E5 G5 y A5. Estos acordes, tocados por las guitarras y cifrados como powerchords,[42] en lugar de definir la armonía tonal aportando terceras «tocadas» efectivamente (pensemos en la secuencia de acordes Em G A, por ejemplo), incluyen en su sonoridad distorsionada mayor preeminencia de la tercera mayor que de la tercera menor.[43] Con lo cual, al análisis auditivo, los acordes G5 y A5 podrían aparentar ser acordes mayores, por la presencia, más o menos audible, de la tercera mayor de cada uno de ellos, debido al espectro distorsionado de las guitarras.
4.2.3. Estrato de bajo funcional
El estrato de bajo está ocupado por el bajo eléctrico, sin participación de otra fuente sonora en toda la extensión del fonograma. Son de destacar dos aspectos: 1) la alternancia entre ausencia y presencia del estrato de bajo funcional, como factor determinante en la administración espectral de todo el fonograma (ver el espectrograma, la parte inferior coloreada en rojo corresponde a la presencia del bajo eléctrico), y 2) el ritmo con el que suena en cada segmento macroformal. Esta afirmación puede verse reflejada claramente en el espectrograma mientras que para los segmentos a3, a4, a5 la combinación de sonido y silencio produce un espectro grave «troquelado»,[44] en los segmentos b1, b2, b3 y b4 el espectro es continuo, más próximo a una «masa» de sonido grave que a una melodía con función de base.
El Bajo eléctrico también toca las tónicas de cada acorde, excepto cuando la armonía es D/F#, donde toca el F# (tercera mayor de la triada de re mayor).
4.2.4. Estrato de pulsación explícita
El estrato de pulsación explícita lo ocupan dos fuentes sonoras: primero, una máquina de ritmos y, luego, una batería. Mientras la máquina de ritmos ocupa el estrato en forma individual los segmentos formales a1, a2 y a6, la batería hace lo propio en b1, a3, a4, b2, b3, b4 y a5. Dos cuestiones resultan interesantes a destacar para nuestro análisis: 1) ambas fuentes comparten un patrón rítmico estructural (ver transcripción a continuación), y 2) la superposición de ambas es audible en los segmentos a3, a4 y a5.
Es interesante también señalar que, cuando la letra dice «...y nada de lo que me pidas, amor…», momento en el que la batería deja de tocar, puede escucharse, de fondo, la máquina de ritmo sonando.
4.3. Soundbox
En términos de distribución y localización de las fuentes sonoras, encontramos que, siguiendo las tipologías de Moore & Dockwray, «Desierto» es compatible con tres tipologías, cada una caracterizando un segmento formal: 1) «en racimo» (clustered mix) para los segmentos formales a1, a2 y a6 (coincidente con una poca intensidad sonora resultante, y también con poca ocupación del espectro total del fonograma – ver espectrograma –), 2) en diagonal (diagonal), para los segmentos b1, b2, b3 y b4 y 3) dinámica (dynamic), para los segmentos a3, a4 y a6.
A los fines de nuestro análisis, es interesante poder dar cuenta de cómo se modifica la localización espacial de la voz líder a lo largo del fonograma. Para ellos, utilizamos el dispositivo de «mapa de mezcla» (mixmap), propuesto por William Moylan:[45]
4.4. Timbre
Realizar una descripción pormenorizada del timbre de cada fuente sonora grabada en todo el fonograma, siguiendo los tipos de parámetros tecnológicos propuestos por Lacasse, excede el propósito y los alcances de este trabajo. No obstante, considerando su importancia para la canción, analizaremos el timbre la voz líder y las modificaciones a lo largo del fonograma.[46] Para ello, realizamos un mapa de mezcla, combinado con una tabla descriptiva, donde describen las diferentes envolventes espectrales de la voz según los segmentos formales y, al mismo tiempo, se explicita la configuración de los procesamientos espaciales y temporales operados sobre la voz líder.
Este insumo nos permite ver cómo la envolvente espectral de la voz líder guarda configuraciones relativamente estables de acuerdo con el segmento formal del fonograma. En este sentido, mientras que los segmentos A encontramos una voz filtrada en graves y agudos, de diferentes maneras según cada segmento microformal, en los segmentos B la envolvente espectral de la voz cubre las tres bandas del espectro propias de esta fuente sonora, en forma estática.
En cuanto a los procesamientos temporales, al análisis auditivo reconocemos la presencia en la voz líder de reverberación y eco, aunque con configuraciones diferentes conforme se sucede el fonograma. En atención a nuestros objetivos, consideramos importante poder visualizar, a través de este insumo, las sucesivas modificaciones que se operan en la configuración de estos procesamientos en diferentes momentos del fonograma. Ante la estabilidad en el perfil melódico estructural de la voz líder, y la alta regularidad de la letra, estas modificaciones aportan variedad. Más allá de esto, dos observaciones más son importantes de realizar en este sentido: 1) el fragmento de letra «yo soy un espectro…» (a4) está procesado mediante una operación que, si bien no pudimos describir a partir de nuestro análisis auditivo, sí podemos decir que es el único fragmento de texto que está procesado de esta manera, logrando esa resultante sonora particular, y 2) que producto de la suma de instrumentos, del aumento en la intensidad sonora de cada uno de ellos, y del aumento en la ocupación de la envolvente espectral total del fonograma, los casilleros completados con signos de interrogación («¿?») cifran nuestra imposibilidad, a partir de la estrategia metodológica adoptada, de poder dar cuenta de la configuración de estos procesamientos en esos segmentos formales.[47]
5. Conclusiones
Al comenzar este artículo afirmamos que al escuchar una canción grabada estamos en presencia no solamente de los textos musicales, lingüísticos y performativos, sino también de las huellas audibles del proceso de producción fonográfica a través del cual la canción se vuelve fonograma. Advertimos también sobre la transparencia implícita con la que puede quedar opacada la incidencia del proceso de producción fonográfica en la resultante sonora final de la canción grabada si se la concibe como performance fijada. En este sentido, repusimos sucintamente marcos teóricos que permiten pensar la canción, su performance y el proceso mediante el cual se vuelve canción grabada, como constitutivos de esta y, particularmente, recuperamos categorías útiles y pertinentes para nuestro trabajo a los fines de indagar en el texto sonoro de la canción grabada. A modo de cierre, puntualizaremos conclusiones parciales respecto del análisis realizado, como también reflexiones finales de intenciones más amplias.
En primer lugar, podemos decir que en «Desierto», además de la letra, cada conjunto de segmentos macroformales A y B están caracterizados por configuraciones específicas tanto de estructuras musicales (parámetros abstractos y performativos) como de parámetros tecnológicos. Los segmentos formales A poseen una intensidad intermedia, una ocupación espectral intermedia (ninguno de los segmentos microformales alcanzan los extremos graves ni agudos del espectro que muestra el espectrograma), una tendencia a la ocupación del espacio textural «en racimo» (clustered mix) y a una mayor opacidad en los procesamientos aplicados a diversas fuentes sonoras (filtrado del contenido espectral de la voz líder, desplazamiento lateral de la voz líder, filtrado de la máquina de ritmos, procesamientos con reverb y eco de la voz líder) que se revela no solo en la exposición explícita del procesamiento, sino en las modificaciones sucesivas de un procesamiento conforme discurre el fonograma (recordemos, por ejemplo, las diferentes localizaciones laterales de la voz líder entre los segmentos formales a1, a2, a3 y a4). Mientras que en los segmentos B, al haber un cambio notable en la configuración de la estructura musical (mayor dinámica, mayor densidad espectral, mayor actividad instrumental –fills de batería, solos de guitarra eléctrica, fills de bajo eléctrico–), los parámetros tecnológicos y el espacio textural (el soundbox y el timbre de cada elemento), se conservan idénticos y, asimismo, no se modifican en las sucesivas ocurrencias de los segmentos microformales.
Otro punto de interés han sido los pasajes entre segmentos macroformales, tanto A→B como B→A. Dijimos, al momento de describir la concatenación de segmentos formales, que ella ocurre por superposición en ambos niveles (macro y micro). Ahora bien, en términos macro, hasta que la voz líder canta la primera frase del segmento B (en el caso de la transición A→B), o bien en el caso donde comienza la armonía de la parte A, sin la voz líder (en el caso de B→A), tienen lugar, simultáneamente, modificaciones en los parámetros interpretativos y tecnológicos. En el caso de los pasajes A→B: guitarras eléctricas distorsionadas tocando con palm mute[48] y en crescendo (configurando una textura homofónica con el bajo eléctrico y los toms de la batería), el acorde de si mayor (dominante de mi menor, centro tonal de la canción) sumándose al soundbox en los extremos laterales y adelante, la voz líder sin filtrar, con mayor exposición de los procesamientos de reverberación y eco. Esto nos permite afirmar que, en relación con nuestra hipótesis de partida, a la escucha de la resultante sonora final del fonograma, los pasajes entre segmentos macroformales no pueden explicarse únicamente por una configuración de la estructura musical, ya sea por la resolución de un proceso cadencial (en el caso de B→A, la resolución V–I, del si mayor al mi menor), o por una configuración textural específica, en términos tradicionales (en el caso de A→B, la textura homofónica tocada en crescendo por las guitarras eléctricas, el bajo eléctrico y los toms). Ellos constituyen una parte, atribuible fundamentalmente a los textos musicales y performativos. La otra parte, atribuible a las operaciones técnico–discursivas realizadas en la etapa de mezcla (es decir, al texto sonoro, o a los parámetros tecnológicos), es la ocupación espectral variable (ver espectrograma; nótese cómo en pasajes A→B el espectro ocupado se amplía hacia los extremos, mientras que en los B→A se restringe) y la localización relativa de las fuentes sonoras (comparar las transcripciones soundbox de los segmentos A y B). En efecto, nótese cómo la localización relativa en los pasajes A→B dan cuenta de una transición de las fuentes sonoras desde el centro–medio del soundbox hacia el centro–frente producido, en parte, por el aumento en la intensidad de la performance y, en simultáneo, se amplía la ocupación lateral del soundbox por la inclusión de las guitarras eléctricas.
Por último, la melodía principal, cantada por la voz líder, en términos estructurales es considerablemente estática entre los segmentos formales. Inclusive, las melodías estructurales de cada segmento formal son similares entre sí. Como contrapeso a este estatismo en términos de estrato melódico, encontramos, por un lado, las variaciones del estrato armónico (recordemos el coro, cantando el descenso cromático) y, por otro, las intervenciones realizadas desde la mezcla, realizadas con una resultante opaca en diferentes momentos del fonograma, aportan variaciones y contrastes a esta fuente sonora (recordemos las diferentes gradaciones de filtrado de la voz, así como también las diferentes localizaciones en el soundbox, tanto en términos laterales como de profundidad, y las diversas configuraciones en sus procesamientos temporales). En este sentido, los segmentos formales A se caracterizan por ser más opacos, o como explica Brøvig–Hanssen, por contener fragmentos sonoros donde el grado de exposición de la tecnología relevante es más explícito que los segmentos B, más transparentes, donde la resultante sonora no evidencia huellas de un uso explícito de alguna tecnología en particular, con la finalidad de captar la atención del oyente. Esta opacidad que describimos en nuestro análisis, y que solo es posible realizar mediante la operación de los parámetros tecnológicos en la etapa de mezcla, lejos de considerarlo como un «efecto» o un agregado lateral, es un elemento fundamental en la constitución de la canción grabada y, por lo tanto, de su resultante sonora final.
Si retomamos la «teoría de la constitución» propuesta por Pouivet y recuperada sucintamente en la introducción de este artículo, podemos afirmar a partir de nuestro análisis que «Desierto» está constituida, por un lado, como propone Arbo, por las «huellas reales o efectivas» de la canción y su performance específica (2017:30). Así como también, y en la misma medida, constituyen a «Desierto» en tanto fonograma las operaciones técnico–discursivas de sus parámetros tecnológicos que definimos con Di Cione y Lacasse. Afirmamos, a la luz de nuestro análisis, que ambas (obra y grabación, en términos de Pouivet) reúnen todas las propiedades estéticas disponibles a la escucha. En efecto, una etapa del proceso de producción fonográfica (la mezcla) se revela como ineludible para lograr la resultante sonora final de la canción grabada, producto de las operaciones que allí se realizaron y que, además de dejar marcas audibles en el fonograma, entendemos a partir de nuestro análisis, y con Frith y Zagorski–Thomas, fueron realizadas con una finalidad estética, o como propone Di Cione, con una poética sonora en particular. Es condición no solo que existan, sino que se hayan concretado estas operaciones técnico–discursivas en particular, relevadas a partir de nuestro análisis auditivo, con sus diferentes grados de transparencia y opacidad, así como también las diferentes configuraciones específicas de sus textos musicales, performativo y lingüístico, para lograr la resultante sonora final de «Desierto» en tanto master.
Finalmente, entendemos que la perspectiva endofonográfica de análisis, puesta en acción mediante una estrategia metodológica con énfasis en el análisis auditivo, ha probado, al menos con este objeto de estudio, y a partir de los objetivos e hipótesis propuestos aquí, ser una perspectiva eficaz no solamente para lograr mayor incisividad en el análisis del texto sonoro en términos individuales, sino fundamentalmente, para poder avanzar hacia el análisis de las interrelaciones entre éste y los textos lingüístico, performativo y musical y, de esta manera, poder dar cuenta de cómo su singular entramado conforma la resultante sonora final de «Desierto» .
Referencias bibliográficas
Arbo, Alessandro (2017). Enregistrement–document ou enregistrement–oeuvre? Un problème épistémique, en Arbo, Alessandro & Lephay, Pierre–Emmanuel (eds.), Quand l’enregistrement change la musique. Hermann
Basso, Gustavo (2006). Percepción auditiva. Bernal, Argentina: Universidad Nacional de Quilmes
Biamonte, Nicole. (2017). Pop/Rock Tonalities, en Wörner, Felix; Scheideler, Ulrich; Rupprecht, Philip (eds.), Tonality since 1950. Franz Steiner Verlag
Breuer, Mario. (2018). Rec& Roll. Una vida grabando el rock nacional. Aguilar
Bresler, Zak. (2021). Inmersed in pop: 3D Music, Subject Positioning, and Compositional Design in The Weeknd’s Blinding Lights for Dolby Atmos, en Journal of Popular Music Studies Vol. 33 nº3, pp. 84–103
Brøvig–Hanssen, Ragnhild. (2010). Opaque Mediation: The Cut–and–Paste Groove in DJ Food’s ‘Break’, en Danielsen, Anne (Ed.), Musical Rhythm in the Age of Digital Reproduction. Ashgate
Camilleri, Lelio. (2010). Shaping sounds, shaping spaces en Popular Music Vol. 29, No. 2, pp. 199–211
Di Cione, Lisa. (2022). Musicología de la Producción Fonográfica en Revista Argentina de Musicología, Vol. 23 Nº 2 (2022). Disponible en https://ojs.aamusicologia.ar/index.php/ram/article/view/413/471
Di Cione, Lisa. (2023). Musicología de la producción fonográfica: las operaciones técnico– discursivas en el estudio de grabación analógica y las poéticas sonoras del rock en la Argentina, [Tesis de Doctorado, Universidad de Buenos Aires]. Disponible en http://repositorio.filo.uba.ar/handle/filodigital/16966
Frith, Simon & Zagorski–Thomas, Simon. (2012). The Art of Record Production. An introductory reader for a new academic field. Ashgate publishing
González, Juan Pablo. (2013). Pensar la música desde América Latina, 1era ed. Gourmet Musical Ediciones
Herrera, Enric. (1990). Teoría musical y armonía moderna, vol.1. Antoni Bosch Editores
Izhaki, Roey. (2008). Mixing audio. Concepts, practices and tools, 1 ed. Focal press
Juan de Dios Cuartas, Marco Antonio. (2022). Puzzles sonoros y construcciones tímbricas: hacia una categorización de los parámetros de análisis de una producción fonográfica, en Revista Argentina de Musicología, vol. 23 nº2. Disponible en https://ojs.aamusicologia.ar/index.php/ram/article/view/415
Katz, Mark. (2010). Capturing sound: How Technology Has Changed Music, edición revisada. University of California Press
Kraugerud, Emil. (2017). Meanings Of Spatial Formation In Recorded Sound en Journal of the Art of Record Production, Vol. 11
Lacasse, Serge. (2001). The Evocative Power of Vocal Staging in Recorded Rock Music and Other Forms of Vocal Expression, Tesis de Doctorado. University of Liverpool. Disponible en https://www.researchgate.net/publication/35721252_'Listen_to_my_voice'_the_evocative_power_of_vocal_staging_in_recorded_rock_music_and_other_forms_of_vocal_expression
Lacasse, Serge. (2005). La musique populaire comme discours phonographique : fondements d'une démarche d'analyse, en Musicologies, printemps 2005, n° 2
Liut, Martín. (2020). Representaciones musicales de la Argentina: Desmesura y pesadumbre en «La casa desaparecida» de Fito Páez, en Revista Argentina de Musicología, Vol. 21 Nro. 2: 153–181. Disponible en: https://ojs.aamusicologia.ar/index.php/ram/article/view/297/366
Liu–Rosenbaum, Aaron. (2012) The Meaning In The Mix: Tracing A Sonic Narrative In ‘When The Levee Breaks, Journal on The Art of Record Production, vol.7. Disponible en https://www.arpjournal.com/asarpwp/the–meaning–in–the–mix–tracing–a–sonic–narrative–in–%E2%80%98when–the–levee–breaks%E2%80%99/
Madoery, Diego. (2000). Los procedimientos de producción musical en la música popular, en Revista del Instituto Superior de Música nº7. Disponible en https://bibliotecavirtual.unl.edu.ar/publicaciones/index.php/ISM/issue/view/81
Madoery, Diego. (2021). Charly y la máquina de hacer música. Un viaje por el estilo musical de Charly García (1972–1996). Gourmet Musical Ediciones
Madoery, Diego. (2022). Formas estandarizadas y no estandarizadas en música popular. Una propuesta. Ponencia presentada en las Segundas jornadas Interamericanas de Teoría musical. Virtual. 2 al 5 de Agosto de 2022
Moore, Allan F. (2012). Songmeans: analysing and interpreting popular recorded song. Ashgate publishing
Moore, Allan F. & Dockwray, Rut. (2010). Configuring the sound–box 1965–1972, en Popular Music Vol. 29 n°2
Moylan, William. (2002). The Art of Recording: understanding and crafting the mix. Focal Press
Moylan, William. (2009). Considering space in music en Journal of the Art of Record Production, vol.4. Disponible en https://www.arpjournal.com/asarpwp/considering–space–in–music/
Moylan, William. (2017). How to listen, what to hear en Hepworth–Sawyer, Russ & Hodgson, Jay (Eds.). (2017). Mixing music. Routledge
Pouivet, Roger. (2014). La triple ontologie des deux sortes d’enregistrements musicaux en Frangne, Pierre–Henry & Lacombe, Hervé (eds.), Musique et enregistrement. Presses Universitaires de Rennes
Tagg, Philip. (2014). Everyday tonality II —Towards a tonal theory of what most people hear. MassMediaMusic Scholar Publishing
Zak, Albin J. III. (2001). The poetics of rock: cutting tracks, making records. University of California Press
Notas
Notas de autor