Anche il microfono
diventa "liquido"

 
Digital Video N. 135
Luglio-agosto 2011

BROADCAST
di Manlio Cammarata

Le fotografie

Il futuro quasi presente dell’audio digitale: trentadue microfoni in una sfera di otto centimetri di diametro. Un solo cavo, una scatola nera e un computer portatile. Il nuovo studio di registrazione è tutto qui. Ma le possibilità sono infinite.

Milano, 21 maggio 2011. Una puntata speciale di Che tempo che fa, tutta dedicata alla West-Eastern Divan Orchestra, diretta da Daniel Baremboim. Qualcosa di straordinario, anche perché è raro che la nostra televisione pubblica trasmetta concerti di musica classica. Per di più nell’orario di massimo ascolto.

Ma non è per questo che sono ritornato nel centro di produzione TV di corso Sempione (anche se mi piacerebbe starmene tra il pubblico ad ascoltare Beethoven e Tchaikovsky…). Sono qui perché mi ha stimolato un invito del direttore di produzione Enzo D’Urbano, in cui si parlava di audio ambisonico (che sarà mai?), microfoni virtuali e altri esperimenti preparati dal Centro Ricerche della Rai di Torino. Da non perdere.

Arrivo mentre si sta allestendo lo studio. Impresa non banale, perché nella scenografia di Che tempo che fa una grande orchestra sinfonica non è di casa. La preparazione richiede un certo impegno, soprattutto per predisporre la ripresa del suono.

Ventiquattro microfoni. Più uno

La registrazione di una grande orchestra è una faccenda complicata, oggetto di discussioni fra gli appassionati, oltre che fra i tecnici. Ci sono due scuole di pensiero: una ritiene che la ricostruzione migliore della scena sonora si possa avere con una coppia di microfoni stereo, posti nel luogo in cui si dovrebbe trovare l’ascoltatore "ideale"; la seconda preferisce usare diversi gruppi di microfoni, opportunamente disposti in prossimità degli strumenti. In questo caso i segnali vengono mixati su due (o più) canali per ottenere il migliore equilibrio tra il dettaglio e la tridimensionalità dell’effetto complessivo.

Di fatto la prima soluzione è applicabile sono in sale con basso riverbero ambientale, con un’acustica perfetta. Altrimenti i suoni riflessi vanno a "sporcare" le emissioni degli strumenti e il risultato è opaco, confuso e con pochi dettagli.

Il problema è che una grande orchestra produce un fronte sonoro molto largo e profondo. L’equilibro tra le sezioni deve essere trovato anche in funzione delle diverse zone dalle quali provengono i suoni, che per di più subiscono riflessioni differenti a seconda della distanza dalle pareti e dell’assorbimento dei materiali che le compongono. Lo Studio 3 di corso Sempione, come tutti i grandi studi televisivi, ha il soffitto molto alto: una decina di metri. Questo può comportare una specie di eco, un "rimbombo" deleterio per l’ascolto. Ma lo spazio tra la parte superiore della scena e il soffitto è così ingombro di luci, proiettori, tralicci, cavi e apparecchiature di ogni genere, a diverse altezze, che l’onda sonora si frammenta e diventa inoffensiva. In sostanza l’acustica dello studio si rivela neutra, complici anche i materiali della scenografia, in buona parte abbastanza assorbenti. Non è certo quella di un grande auditorium, ma nella sostanza l’acustica è "pulita" quanto basta per una ripresa corretta dei suoni di un’orchestra sinfonica.

Per il concerto del 21 maggio si impiega la tecnica tradizionale, combinando le due soluzioni alle quali ho accennato: ventiquattro microfoni nell’orchestra e una coppia stereo posta in posizione sopraelevata (in gergo: il "cornetto"). Così al suono diretto degli strumenti si può possono aggiungere i segnali, opportunamente dosati, che determinano l’effetto d’ambiente della ripresa. Fino a questo punto è la solita routine: si dispongono le sedie e i leggii, il podio del direttore e i microfoni. Poi si aspetta l’orchestra per le prove e la messa a punto finale. Tutto si svolge con la massima calma, anche se i tempi sono stretti. I tecnici sanno il fatto loro, non ci sono problemi.

Anzi, no, un piccolo problema c’è: si deve installare un nuovo microfono in alto, proprio sopra l’orchestra, in posizione stabile. E’ una sfera del diametro di 8,4 centimetri, montata all’estremità di un cilindro, munito del supporto elastico che serve per isolare i microfoni più sensibili dai rumori che possono essere captati dal sostegno. Sulla sfera si vedono trentadue cerchietti, che corrispondono ad altrettante capsule microfoniche "fisiche", incaricate di riprendere i suoni che provengono da tutte le direzioni. Si chiama Eigenmike microphone array.

Il suono "ambisonico"

E’ questa la grande novità: accanto alla ripresa tradizionale, il concerto della West-Eastern Divan sarà registrato in forma "ambisonica", con una tecnica messa a punto dal Centro Ricerche della Rai di Torino in collaborazione con l’Università di Parma.

Trentadue microfoni sono molti. Disposti su una sfera realizzano una perfetta sorgente puntiforme omnidirezionale, che può riprodurre bene un ambiente acustico totale, più che analizzare una scena dettagliata. Ma, grazie alle tecnologie digitali, il segnale di ciascuno dei microfoni può essere trattato individualmente in funzione di particolari risultati.

Il principio è che un segnale sonoro registrato, specialmente in digitale, può essere modificato secondo diversi parametri, fra i quali assumono particolare importanza il livello e la fase. Quest’ultima è significativa, ancora più del livello, perché i suoni che partono da distanze diverse giungono alle orecchie dell’ascoltatore con differenze di fase che il cervello elabora per ricostruire la profondità della scena sonora e la collocazione degli strumenti. Dunque modificando questi due parametri si può virtualmente "spostare" una capsula microfonica rispetto alle altre. Ma si può anche "avvicinare" o "allontanare" il microfono da uno o più strumenti dell’orchestra, con una tecnica concettualmente abbastanza semplice: basta mixare i segnali che provengono da alcune capsule con quelli che provengono dalle altre, spostando la fase di ciascuna in modo che venga sommata o sottratta a quella del segnale principale. Al limite si cancella un segnale sovrapponendogli se stesso con la fase ruotata di 180° (è il sistema usato da diversi sistemi di riduzione del rumore, oggi inseriti anche nelle cuffie più evolute).

In questo modo è possibile isolare un’area della scena sonora come se fosse ripresa da un apposito microfono, il cui diagramma polare (in parole povere, l’angolo della ripresa) può essere modificato da "panoramico" a supercardiode, fino a simulare il tipo "a fucile", estremamente direzionale. Il sogno di tutti gli ingegneri del suono!

Naturalmente tutto questo può essere fatto in diretta o in post-produzione, con grande flessibilità. E, grazie alla registrazione multicanale, si possono realizzare di volta in volta soluzioni "liquide" su misura dell’ascoltatore e del suo impianto di riproduzione, dalla semplice stereofonia al più articolato surround.

Lo schema generale sembra elementare: all’interno dell’Eigenmike ogni capsula ha il proprio convertitore analogico-digitale a 24 bit, il cui segnale è raccolto da una matrice, dalla quale esce un normale collegamento Ethernet che trasporta i trentadue segnali in multiplex. All’altro capo del cavo Ethernet c’è la EMIB (Eigenmike Microphone Interface Box) una "scatola nera" che decodifica il segnale in arrivo e lo invia a una porta FireWire del computer (in questo caso è un potente MacBook quadriprocessore). E’ sorprendente: non solo sparisce la massa dei cavi, ma l’intero studio di registrazione diventa "virtuale", ridotto alle dimensioni di un computer laptop.

Questo apparato produce musica liquida allo stato puro. Da ascoltare in tutti i modi possibili, con una fedeltà che può essere limitata solo dalla qualità dei componenti e dalla potenza di calcolo del sistema informatico. La tecnica è ancora in fase sperimentale e ci sono diversi problemi da risolvere prima che diventi di uso comune. Ma la strada è aperta e conduce alla massima qualità della riproduzione sonora con il minimo di attrezzature fisiche. Un altro aspetto della "dematerializzazione" resa possibile dalle tecnologie digitali.

Come si avvera il sogno degli ingegneri del suono
Intervista a Leonardo Scopece

Il deus ex machina del suono ambisonico è Leonardo Scopece. Tutti lo chiamano ingegnere, ma è un fisico (la differenza è notevole, in questa materia). Il biglietto da visita lo qualifica semplicemente come "supporto tecnologico aziendale". In realtà è il motore di un gruppo di eccellenza in campo internazionale nel trattamento digitale del suono, che opera nel Centro Ricerche e Innovazione Tecnologica della Rai a Torino (che spero di visitare presto per i lettori di Digital Video).

Ho assistito all’installazione del microfono Eigenmike: trentadue capsule, ma un solo cavo che si perde nei meandri dello Studio 3 di corso Sempione e ricompare misteriosamente su un tavolino della regia audio, per finire in una scatola nera con qualche LED e l’attacco per la cuffia. Ci sono anche un MacBook e una cuffia Sony. Nient’altro. Evidentemente il resto è software. Ma la mia prima domanda, al tempo della musica liquida, è sulla qualità della digitalizzazione del suono. La risposta, in prima battuta, è quasi deludente: "24 bit, 48 kHz".

Ma oggi quelli che si considerano veri audiofili vogliono almeno 96 kHz!

Sì, ma qui posso arrivare solo a 48, che è la frequenza che si usa nel broadcast. E poi più del campionamento è importante la qualità delle capsule che si usano. Qualcuno ritiene che sia meglio usare una profondità minore e una più alta frequenza. Io personalmente, dopo avere fatto tante prove, preferisco guadagnare più in quantizzazione che in frequenza. Questo sistema può lavorare anche a 16 o 32 bit, ma ho visto che il campionamento a 24 bit e 48 Khz è la soluzione migliore.

Qual è il software che serve a trattare i segnali?

Si chiama Plogue Bidule. Questo programma mi permette di mandare i trentadue segnali in ingresso sull’hard disk del computer. In sostanza ricevo i trentadue segnali grezzi che arrivano via Ethernet sull’interfaccia EM32. Da qui, via Firewire, entrano nel computer, che di fatto in questa fase è soltanto un registratore. Attraverso il Bidule combino i trentadue segnali in ingresso, che mi permettono di costruire quanti punti di vista voglio, definendo i sette microfoni virtuali della registrazione.

Perché sette e non otto, come sembrerebbe naturale?

Perché un canale è occupato da altre operazioni. Ma se sette microfoni non bastano, faccio un riversamento e ne posiziono altri sette. Se il computer ce la fa, posso usare quanti microfoni voglio, a multipli di sette. Stiamo sviluppando una matrice che ci consenta di utilizzare otto microfoni su otto, ma per adesso neanche un quadriprocessore ce la fa a lavorare in tempo reale con otto microfoni su 360 gradi azimutali, su 180 mediani e cambiando la direttività dall’ordine zero Ambisonic all’ordine sei.

Ambisonic? Forse occorre una spiegazione…

L’Ambisonic è un sistema teorico che usa funzioni sferiche per calcolare la quantità di suono in ogni punto dello spazio. La teoria ambisonica dice semplicemente che, conoscendo la pressione di una particella in un punto dello spazio e la sua velocità di spostamento, posso ricavarne la quantità di suono in quel punto dello spazio. Con un sistema empirico più che teorico, cioè facendo delle misure e facendo i calcoli su queste misure, abbiamo determinato la matrice. Così possiamo costruire microfoni virtuali che vanno dall’ambisonico di ordine zero, cioè omnidirezionale, all’ordine 1 di un cardiode semplice, fino all’ordine 6, che è superiore al "fucile", fino a 2-3000 Hz. Arrivare all’ordine 6 non è facile e probabilmente al Centro Ricerche e Innovazione Tecnologica di Torino ci siamo arrivati per primi al mondo. In diverse riunioni internazionali abbiamo visto che probabilmente nessuno è arrivato oltre l’ordine 3. Qualcuno è arrivato anche all’ordine 4, ma non dinamico. "Dinamico" significa che se voglio spostare un microfono, anche in tempo reale durante la registrazione, lo prendo e lo sposto sulla scena.

Come si è arrivati a questo risultato?

Abbiamo incominciato con un sistema portatile, semplice da usare, che non costasse molto all’azienda: un microfono con otto canali fisici già posizionati (destra, sinistra, surround eccetera). Ma dalle prime prove abbiamo visto che era troppo grosso, entrava in campo, prendeva troppi rumori. Il risultato non era buono. Allora ho pensato di fare quello che anche molti colleghi chiedevano da tanto tempo, uno zoom per i microfoni come per gli obiettivi della telecamera. E così ho proposto ad Angelo Farina dell’AIDA lo sviluppo del sistema della Eigenmike, che arrivava al secondo o terzo ordine, ma step-by-step. Come operatore audio di un broadcaster, devo poter cambiare al volo le distanze. Se a un certo punto nell’orchestra spunta un flauto, devo "stringere" su quel flauto come fa il cameraman. Prendo un microfono e lo punto là, anche in tempo reale.

Sul registrato?

Sul registrato, ma anche in tempo reale, in diretta.

In pratica, se ho capito bene, si prendono una o più capsule e da queste si "estrae" la parte di suono che interessa.

No, non è proprio così. Tutti i trentadue microfoni fisici della sfera concorrono a creare ciascuno dei sette microfoni virtuali. Per esempio, se costruisco un microfono virtuale frontale, che di fatto interessa dieci capsule, e poi un altro che riprende da sinistra, anche per questo posso usare i trentadue segnali a disposizione. Questo è il vantaggio di avere i segnali "grezzi", così come sono generati dalle capsule.

Dunque il suono finale di ciascuno dei sette microfoni virtuali si costruisce modificando ritardi e fasi di ciascuno dei trentadue segnali in entrata.

Più o meno.

E tutto questo con qualche clic del mouse…

Qui dai monitor della regia audio si sente il suono che arriva dai microfoni tradizionali. Quello ambisonico lo posso sentire in cuffia e appare molto equilibrato e definito. Ma in parte si confonde con quello esterno, che l’isolamento della cuffia non riesce ad attenuare completamente. E tra i due c’è un anche ritardo che confonde le idee.

Voglio ascoltare questa registrazione in un altro momento, la curiosità è forte. A presto, dottor Scopece.


L'Eigenmike sospeso sulla verticale dell'orchestra è quasi invisibile tra le mille apparecchiature dello studio televisivo

Inizio pagina      Indice      Home

© 2018 Manlio Cammarata    Informazioni sul copyright