Loading documents preview...
Vox 5, di Trevor Wishart Biografia Trevor Wishart ha iniziato la sua carriera come compositore di musica orchestrale ma ben presto i suoi interessi si sono rivolti esclusivamente alla computer music, grazie alla quale è riuscito a manipolare la voce umana e a interpolarla con i suoni della natura. Ha studiato presso l’Università di Oxford (BA, ’68), di Nottingham (MA, ’69) e di York (PhD, ’73); dal 2006 insegna presso il Dipartimento di Musica dell’ Università di Durham e ad oggi viene riconosciuto come il padre di tutta la ricerca sull’analisi e la risintesi del suono e per questo motivo recentemente è stato insignito del “Gran Prize” durante il Giga-Hertz Award for Electroacoustic Music (’08). Wishart ha raggiunto notevoli traguardi artistici ma soprattutto tecnici sviluppando strumenti di trasformazione del suono inclusi nel pacchetto Sound Loom (Computers’ Desktop Project) e scrivendo libri importanti come “On Sonic Art” e “Audible Design” in cui ha condiviso la sua vasta ricerca sull’estensione della voce umana e sulle tecniche di computer music. Vale la pena ricordare ciò che egli stesso dice a riguardo in un’intervista1 concessa non molto tempo fa: “Ho scelto di plasmare il mio strumento digitale personale per due ragioni principali, la prima è la povertà. Sono stato un compositore freelance per quasi tutta la mia vita, ed essere un compositore sperimentale freelance in Inghilterra è sicuramente difficile. Durante i primi lavori di elettronica si era dipendenti da scatole nere come per esempio l’unità multieffetto Yamaha SPX 90. Il mio problema è stato fondamentalmente quello di non potermi permettere un aggiornamento periodico di queste macchine, come invece erano in grado di fare i dipartimenti di musica delle Università. Era chiaro che la soluzione a questo problema sarebbe stata avere, come all’Ircam, dei software di esecuzione sul desktop del proprio computer. Cosi, insieme ad altri compositori e ingegneri, abbiamo creato il progetto Computers’ Desktop (’85-’86) iniziando ad importare alcuni software Ircam/Standford su Atari ST (allora il Mac era troppo lento per l’audio professionale). In seguito abbiamo iniziato a creare il nostro software. La seconda ragione è che creare un proprio strumento significa seguire l’immagine sonora ovunque essa ti conduca, piuttosto che essere limitati da software commerciali. E’ possibile sviluppare o estendere lo strumento quando si sente la necessità, non quando il produttore commerciale decide che è redditizio farlo, e si può anche metterlo apposto se si dovesse rompere”. Analisi estesico-cognitiva Vox 5 è una composizione elettroacustica a 4 canali, per nastro magnetico, anche se ne esiste una riduzione stereo, commissionata dall’ Ircam nel 1981 e rilasciata nel 1986, appartenente al ciclo Vox. Dopo un primo ascolto orientativo, ho condotto una serie di ascolti più approfonditi sul brano, che hanno dato l’avvio all’analisi vera e propria. La partitura d’ascolto, una partitura intuitiva che fa da guida all’ascolto ultimo, stesa in base ai primi ascolti, mi ha aiutato nella successione delle varie fasi analitiche. Livello formale Vox 5 può essere divisa in 3 sezioni: • • •
Sezione A (0’00’’- 1’17’’) Sezione B (1’17’’ – 4’17’’) Sezione C (4’17’’ – 6’00)
1 Trevor Wishart: la chimica del suono – Matteo Milani
Sezione A La Sezione A è caratterizzata da un materiale piuttosto disomogeneo con eventi di natura puntuale scanditi nel tempo ed eventi di natura continua e iterativa che si avvicendano e si sovrappongono tra loro già dall’inizio della sezione per poi impastarsi completamente sul finire della stessa. Il comportamento è ordinato e dimostra una particolare direzionalità in quanto l’andamento degli eventi non assume evidenti caratteristiche di irregolarità percettiva. Nonostante la disomogeneità del materiale utilizzato, la sezione è coerente dal punto di vista compositivo, perché esprime un pensiero musicale di tipo naturalistico che può essere ricondotto per certi aspetti a quello concreto. Sezione B Nella Sezione B il materiale è palesemente più abbondante rispetto a quella precedente e si caratterizza per una prevalenza di eventi continui, glissandi ed eventi iterativi di natura prettamente vocale. Uno dei tanti compare a 2’14’’, ed è quello che seconde me risulta essere il più significativo di tutti sotto l’aspetto timbrico, e cioè quello che momentaneamente chiamo “supervoce” per una questione di comodità espositiva. Questa supervoce funge da collante tra due sottosezioni che analizzerò in seguito, decretando la fine dell’una e l’inizio dell’altra. Il comportamento tende ad un addensamento omogeneo di tutti gli eventi, imprimendo una coerenza strutturale di direzionalità ben definita. Sezione C La Sezione C è contraddistinta dallo stesso tipo di materiale presente nella Sezione A, ma a differenza di quest’ultima, il suo comportamento procede ad una progressiva attenuazione dei parametri mantenendo anche qui una coerenza strutturale di direzionalità definita con un conseguente allontanamento omogeneo dal piano sonoro. Livello Strutturale Sezione A La Sezione A presenta 3 famiglie timbriche distinte: suoni puntuali tonici e complessi, gruppi di suoni continui complessi e gruppi di suoni iterativi variabili. Gli attacchi sono improvvisi per i suoni puntuali e progressivi per i gruppi continui e iterativi, mentre gli inviluppi sono per questi ultimi prevalentemente in crescendo. Sul piano dello spazio virtuale i suoni continui fanno da sfondo a quelli puntuali e iterativi, anche se si assiste ad un susseguirsi di giustapposizioni di piani sonori in cui sono collocati i suoni continui e i suoni iterativi. Questo tipo di gerarchia scenica viene avvalorata dall’aumento della dinamica dei suoni iterativi e continui che emergono poi in primo piano come masse fluttuanti e che alla fine convergono verso un unico punto di fuga, che non è da considerarsi come l’uscita di scena di entrambi i personaggi, ma semplicemente una ricomparsa in nuove vesti. La presenza sempre più marcata di questa categoria genera una tensione che diventa subito rilevante e con tendenza ad un progressivo aumento sempre verso la fine della sezione stessa. Sezione B La Sezione B è sicuramente la più complessa da analizzare perché assai articolata di gesti e tessiture contenenti le manipolazioni e le trasformazioni timbriche più rilevanti. In base ai 6 criteri del livello strutturale essa risulta ulteriormente frazionata in 6 sottosezioni:
• • • • • •
b1 (1’17’’ – 1’34’’) b2 (1’34’’ – 2’14’’) b3 (2’14’’ – 2’39’’) b4 (2’39’’ – 3’21’’) b5 (3’21’’ – 3’52’’) b6 (3’52’’ – 4’17’’)
La Sottosezione b1, dal punto di vista del criterio di massa-fattura, contiene suoni puntuali complessi e suoni continui timbricamente ricchi e dinamicamente intensi. Gli attacchi dei suoni puntuali sono improvvisi mentre quelli dei suoni continui sono ripidi e caratterizzati da un inviluppo a delta. Ciò è testimoniato dal fatto che dinamicamente dal mezzo forte si passa al forte e viceversa, con un andamento quasi ciclico. Il tutto si ripercuote anche sui singoli movimenti dei suoni continui che sono spazialmente decentrati rispetto al punto 0 di equilibrio tra canale destro e sinistro. La tensione rimane inizialmente costante per poi aumentare sul finire della sottosezione stessa. Nella Sottosezione b2, in cui si articolano la maggior parte dei suoni percussivi, dei suoni puntuali complessi, dei suoni continui, dei glissandi e dei gruppi di suoni iterativi fin’ora trattati, Wishart introduce un primo tentativo di manipolazione rivolto soprattutto ai suoni vocali, attraverso l’utilizzo del pitch shifting. In primo piano, glissandi ascendenti e discendenti, caratterizzati da attacchi progressivamente morbidi con inviluppi decrescenti, precedono altrettanti glissandi ascendenti e discendenti, caratterizzati questa volta da attacchi piatti e inviluppi a mordente. Fanno da sfondo i gruppi di suoni iterativi e continui che smorzano la tensione accumulata dalla sottosezione in seguito all’addensamento del materiale e spostano l’attenzione dell’ascoltatore verso un panorama sonoro diverso da quello precedente. La Sottosezione b2 è più marcata a livello ritmico e presenta anche una maggiore direzionalità dei suoni, che confluiscono, anche questa volta, in un unico punto che non è né di inizio né di fine, ma di passaggio a una nuova sottosezione, che forse è quella che incarna meglio l’idea compositiva dell’autore. Ed è proprio nella sottosezione b3 che si assiste finalmente alla trasformazione e all’interpolazione degli spettri del suono vocale nel suono naturale, la supervoce2, che evoca palesemente l’immagine di uno sciame di insetti nella mente dell’ascoltatore. Le sottosezioni b4 e b5 vengono analizzate contemporaneamente, affinchè si possano cogliere al meglio le analogie, ma soprattutto le differenze, che hanno reso possibile un tale confronto . Dal punto di vista del moto, l’accelerazione progressiva che interessa il gruppo di suoni iterativi della sottosezione b4 diventa improvvisa per lo stesso gruppo nella sottosezione b5, nella quale anche l’intensità va aumentando linearmente. Il tutto si consuma sul primo piano dello spazio virtuale di entrambe le sottosezioni, in alternanza stereofonica tra un canale e l’altro, a discapito dei glissandi che comunque, per coerenza compositiva, ondeggiano tra il secondo e il primo piano delle sottosezioni. Gli attacchi, in corrispondenza del gruppo dei suoni iterativi della sottosezione b5, sono improvvisi, contrariamente a quanto accade per gli attacchi di quelli della sottosezione b4, che sono progressivi con inviluppo risonante. Timbricamente i suoni della sottosezione b4 sono inarmonici rispetto a quelli della sottosezione b5 che, agglomerandosi, danno l’idea di un suono rugoso con grana mediovariabile. La sottosezione b6 è anch’essa intrisa di suoni percussivi e puntuali, di glissandi di natura rumorosa e complessa e di gruppi di suoni iterativi e continui. Spicca su tutti l’attacco ripido del
Per l’analisi della supervoce si consideri la tabella allegata mentre per la tecnica con cui è stata realizzata si leggano le strategie compositive. 2
nitrito di un cavallo, che assume importanza globale all’interno della sezione, in quanto reindirizza l’ascoltatore verso un panorama a lui più congeniale, quello cioè del paesaggio sonoro che si svilupperà nell’intero arco temporale della sezione C. Sullo stesso piano ritroviamo un glissando costruito con la stessa tecnica che ho esposto nelle strategie compositive di questa analisi, e che concorre a dare coerenza compositiva alla sottosezione. Sezione C La Sezione C potrebbe essere considerata come una ripresa con variazione della Sezione A. La variazione potrebbe essere rappresentata dalla coda al minuto 2’14’’, che timbricamente è simile ai suoni continui già citati, ma dinamicamente differente, giacché tende al piano e poi al pianissimo fino alla sua scomparsa. L’attacco è immediato mentre l’inviluppo è in decrescendo. Nell’economia della sezione questo suono continuo riveste un ruolo centrale: fino alla coda si mantiene stabile su tutto il secondo piano per poi spostarsi lungo il primo a 2’14’’ e infine traslare sullo sfondo verso la fine della sezione stessa. La ripresa dei suoni puntuali e iterativi, invece, rievoca nell’ascoltatore un territorio già esplorato in precedenza; mi riferisco al paesaggio sonoro intravisto sempre nella sezione A. Anche qui l’attacco dei suoni percussivi e puntuali è improvviso con inviluppi risonanti, che rendono al meglio l’idea della profondità dello spazio in cui si articolano i movimenti. Contrariamente a quanto avviene nella Sezione A, la comparsa di riverberazione, seppur sporadica, induce l’ascoltatore a limitare la propria immaginazione per quanto riguarda eventuali cambiamenti di scena, guidandolo verso la conclusione del brano. Strategie compositive Wishart utilizza campioni vocali cui assegna particolari significati simbolici. In Vox 5, infatti, la voce percepita non è una voce umana, ma una voce mitologica, quella di Shiva, creatore e distruttore del mondo. Al fine di realizzare sonoramente questa immagine, egli analizza e risintetizza i dati ottenuti con il Phase Vocoder 3. Come nel Vocoder, anche nel PVOC il passaggio del segnale originale avviene all’interno di una batteria di filtri posti in parallelo, tale da coprire l’intera lunghezza di banda del segnale originale. In questo caso i filtri permettono di misurare sia l’ampiezza che la fase di ciascun suono sinusoidale per ciascuna banda di frequenza. Questa si definisce fase di analisi. Da questi valori si ricavano due inviluppi, uno per l’ ampiezza e uno per la frequenza. Durante la fase di sintesi i dati ottenuti con l’analisi si possono sia lasciare invariati, sia modificarli, ad esempio agendo sui due inviluppi, per ottenere risultati timbrici differenti. Strategie di significazione
Una prima versione del Phase Vocoder è stata sviluppata nel 1966 da J. Flanagan e R. Goldh, entrambi ricercatori ai Bell Laboratories, dove Dadley aveva messo a punto il Vocoder. Il principio da cui partirono i due ricercatori era che facendo passare un segnale sonoro attraverso una batteria di filtri in parallelo non si comprometteva la qualità del segnale in uscita. Su questa intuizione, in verità, si fonda anche il Vocoder. Mentre quest’ultimo consentiva, per ciascun filtro, esclusivamente la trasmissione dei valori di ampiezza, la tecnica adottata da Flanagan e Goldh si estendeva anche alla trasmissione della fase, da cui il nome di Phase Vocoder. In realtà, rispetto alle intuizioni iniziali, il risultato iniziale della ricerca non fu soddisfacente. Riuscirono si nell’intento di migliorare il processo di sintesi(quindi la qualità del segnale sonoro), tuttavia l’insieme dei dati raccolti durante il processo di analisi restituivano un file con dimensione maggiore di quella del segnale originale. Sul piano computazionale, questo comportava un notevole sforzo. La prima simulazione al computer fu condotta con un IBM 7094 e un software realizzato con il linguaggio BLODI-‐B sviluppato appositamente per processare segnali di parlato digitalizzato. La difficoltà nella gestione dei dati rese difficile, per diversi anni, l’utilizzo del PVOC. In seguito, verso la metà degli anni ’70, il ricercatore Portnoff sviluppò un PVOC ancora + efficiente implementando al suo interno la FFT. 3
L’idea di una connessione che si stabilisce tra mondo virtuale e mondo reale muove Wishart a ricreare un paesaggio sonoro unicamente attraverso l’uso di suoni concreti, in particolare quelli vocali. D. A. Smalley chiama “source bonding 4 ” la connessione tra intrinseco ed estrinseco, il collegamento dall’interno del lavoro verso il mondo sonoro esterno. A questo proposito Wishart (come qualcun altro che già lo aveva preceduto nel tempo…) afferma che la voce è molto più di uno strumento musicale. “Attraverso il discorso ci si connette al mondo sociale […] L’ascoltatore riconosce una voce anche quando è minimamente indicata, o notevolmente trasformata, cosi come riconosciamo volti umani da pochi dettagli. Egli verrà coinvolto maggiormente da un multifonico della voce, con cui si stabilisce un collegamento empatico immediato, in una maniera più coinvolgente di quanto accadrebbe con un multifonico prodotto da un clarinetto […] E poiché il processo funzioni diventa importante dichiarare preventivamente all’ascoltatore le “materie prime” in un contesto sonoro in cui non è utilizzato il linguaggio musicale tradizionale”. Questo perché se i gesti sono deboli, se essi sono troppo allungati nel tempo e se la loro evoluzione diventa troppo lenta, si perderebbe il riferimento alla fisicità umana e nello stesso tempo avverrebbe un cambiamento nella focalizzazione dell’ascolto. Ripetizione, sviluppo e ricapitolazione dei materiali quindi sono particolarmente importanti per l’ascoltatore nel tracciare questo tipo di percorso attraverso una forma musicale estesa. Conclusioni Come esempio di musica elettroacustica dalle proprietà mimetiche predominanti, Simon Emmerson5 include, oltre al lavoro del francese Luc Ferrari, “Presque rien n° 1”, “Red Bird” di Trevor Wishart, che evoca immagini di libertà e di terrore claustrofobico, utilizzando suoni di origine ambientale e suoni del corpo umano. A differenza di Presque rien n° 1, in cui il compositore si è astenuto dall’effettuare operazioni di montaggio sui materiali, in Red Bird la sintassi è regolata sia da operazioni di montaggio basate su proprietà specifiche del suono [sintassi estrapolata – “abstracted”] che da operazioni basate su schemi astratti [sintassi astratta – “abstract”], su una linea narrativa e simbolica ponderata. Inoltre, l’impegno di Wishart, in una posizione filosofica realista, è paragonabile a quello di Luigi Nono nella “Fabbrica Illuminata” ma ne differisce per quanto riguarda la trasformazione dell’immagine sonora: le parole di una voce diventano un canto d’uccello oppure uno sciame d’insetti. Red Bird comunque rimane uno dei pochissimi lavori nei quali trasformazioni mimetiche tra diversi materiali sonori sono usate per mediare delle idee di carattere sociale e politico. Fonti di riferimento: Metodo estesico-cognitivo e analisi della musica elettroacustica – Francesco Giomi e Marco Ligabue. http://www.musicainformatica.it - computer music resources. Giuseppe Imbimbo Avellino 21-03-2014
4
La Spettromorfologia: una spiegazione delle forme del suono -‐ D. A. Smalley
5 La relazione tra linguaggio e materiali nella musica elettroacustica – Simon Emmerson