Anche il microfono
diventa "liquido" |
Digital Video N. 135
Luglio-agosto 2011
BROADCAST
di Manlio Cammarata
Le fotografie |
|
|
|
Il futuro quasi presente dell’audio digitale:
trentadue microfoni in una sfera di otto centimetri di diametro. Un
solo cavo, una scatola nera e un computer portatile. Il nuovo studio
di registrazione è tutto qui. Ma le possibilità sono infinite.
Milano, 21 maggio 2011. Una puntata speciale di Che tempo che
fa, tutta dedicata alla West-Eastern Divan Orchestra,
diretta da Daniel Baremboim. Qualcosa di straordinario, anche
perché è raro che la nostra televisione pubblica trasmetta
concerti di musica classica. Per di più nell’orario di massimo
ascolto.
Ma non è per questo che sono ritornato nel centro di produzione
TV di corso Sempione (anche se mi piacerebbe starmene tra il
pubblico ad ascoltare Beethoven e Tchaikovsky…). Sono qui perché
mi ha stimolato un invito del direttore di produzione Enzo D’Urbano,
in cui si parlava di audio ambisonico (che sarà mai?), microfoni
virtuali e altri esperimenti preparati dal Centro Ricerche della Rai
di Torino. Da non perdere.
Arrivo mentre si sta allestendo lo studio. Impresa non banale,
perché nella scenografia di Che tempo che fa una grande
orchestra sinfonica non è di casa. La preparazione richiede un
certo impegno, soprattutto per predisporre la ripresa del suono.
Ventiquattro microfoni. Più uno
La registrazione di una grande orchestra è una faccenda
complicata, oggetto di discussioni fra gli appassionati, oltre che
fra i tecnici. Ci sono due scuole di pensiero: una ritiene che la
ricostruzione migliore della scena sonora si possa avere con una
coppia di microfoni stereo, posti nel luogo in cui si dovrebbe
trovare l’ascoltatore "ideale"; la seconda preferisce
usare diversi gruppi di microfoni, opportunamente disposti in
prossimità degli strumenti. In questo caso i segnali vengono mixati
su due (o più) canali per ottenere il migliore equilibrio tra il
dettaglio e la tridimensionalità dell’effetto complessivo.
Di fatto la prima soluzione è applicabile sono in sale con basso
riverbero ambientale, con un’acustica perfetta. Altrimenti i suoni
riflessi vanno a "sporcare" le emissioni degli strumenti e
il risultato è opaco, confuso e con pochi dettagli.
Il problema è che una grande orchestra produce un fronte sonoro
molto largo e profondo. L’equilibro tra le sezioni deve essere
trovato anche in funzione delle diverse zone dalle quali provengono
i suoni, che per di più subiscono riflessioni differenti a seconda
della distanza dalle pareti e dell’assorbimento dei materiali che
le compongono. Lo Studio 3 di corso Sempione, come tutti i grandi
studi televisivi, ha il soffitto molto alto: una decina di metri.
Questo può comportare una specie di eco, un "rimbombo"
deleterio per l’ascolto. Ma lo spazio tra la parte superiore della
scena e il soffitto è così ingombro di luci, proiettori, tralicci,
cavi e apparecchiature di ogni genere, a diverse altezze, che l’onda
sonora si frammenta e diventa inoffensiva. In sostanza l’acustica
dello studio si rivela neutra, complici anche i materiali della
scenografia, in buona parte abbastanza assorbenti. Non è certo
quella di un grande auditorium, ma nella sostanza l’acustica è
"pulita" quanto basta per una ripresa corretta dei suoni
di un’orchestra sinfonica.
Per il concerto del 21 maggio si impiega la tecnica tradizionale,
combinando le due soluzioni alle quali ho accennato: ventiquattro
microfoni nell’orchestra e una coppia stereo posta in posizione
sopraelevata (in gergo: il "cornetto"). Così al suono
diretto degli strumenti si può possono aggiungere i segnali,
opportunamente dosati, che determinano l’effetto d’ambiente
della ripresa. Fino a questo punto è la solita routine: si
dispongono le sedie e i leggii, il podio del direttore e i
microfoni. Poi si aspetta l’orchestra per le prove e la messa a
punto finale. Tutto si svolge con la massima calma, anche se i tempi
sono stretti. I tecnici sanno il fatto loro, non ci sono problemi.
Anzi, no, un piccolo problema c’è: si deve installare un nuovo
microfono in alto, proprio sopra l’orchestra, in posizione
stabile. E’ una sfera del diametro di 8,4 centimetri, montata all’estremità
di un cilindro, munito del supporto elastico che serve per isolare i
microfoni più sensibili dai rumori che possono essere captati dal
sostegno. Sulla sfera si vedono trentadue cerchietti, che
corrispondono ad altrettante capsule microfoniche
"fisiche", incaricate di riprendere i suoni che provengono
da tutte le direzioni. Si chiama Eigenmike microphone array.
Il suono "ambisonico"
E’ questa la grande novità: accanto alla ripresa tradizionale,
il concerto della West-Eastern Divan sarà registrato in
forma "ambisonica", con una tecnica messa a punto dal
Centro Ricerche della Rai di Torino in collaborazione con l’Università
di Parma.
Trentadue microfoni sono molti. Disposti su una sfera realizzano
una perfetta sorgente puntiforme omnidirezionale, che può
riprodurre bene un ambiente acustico totale, più che analizzare una
scena dettagliata. Ma, grazie alle tecnologie digitali, il segnale
di ciascuno dei microfoni può essere trattato individualmente in
funzione di particolari risultati.
Il principio è che un segnale sonoro registrato, specialmente in
digitale, può essere modificato secondo diversi parametri, fra i
quali assumono particolare importanza il livello e la fase. Quest’ultima
è significativa, ancora più del livello, perché i suoni che
partono da distanze diverse giungono alle orecchie dell’ascoltatore
con differenze di fase che il cervello elabora per ricostruire la
profondità della scena sonora e la collocazione degli strumenti.
Dunque modificando questi due parametri si può virtualmente
"spostare" una capsula microfonica rispetto alle altre. Ma
si può anche "avvicinare" o "allontanare" il
microfono da uno o più strumenti dell’orchestra, con una tecnica
concettualmente abbastanza semplice: basta mixare i segnali che
provengono da alcune capsule con quelli che provengono dalle altre,
spostando la fase di ciascuna in modo che venga sommata o sottratta
a quella del segnale principale. Al limite si cancella un segnale
sovrapponendogli se stesso con la fase ruotata di 180° (è il
sistema usato da diversi sistemi di riduzione del rumore, oggi
inseriti anche nelle cuffie più evolute).
In questo modo è possibile isolare un’area della scena sonora
come se fosse ripresa da un apposito microfono, il cui diagramma
polare (in parole povere, l’angolo della ripresa) può essere
modificato da "panoramico" a supercardiode, fino a
simulare il tipo "a fucile", estremamente direzionale. Il
sogno di tutti gli ingegneri del suono!
Naturalmente tutto questo può essere fatto in diretta o in
post-produzione, con grande flessibilità. E, grazie alla
registrazione multicanale, si possono realizzare di volta in volta
soluzioni "liquide" su misura dell’ascoltatore e del suo
impianto di riproduzione, dalla semplice stereofonia al più
articolato surround.
Lo schema generale sembra elementare: all’interno dell’Eigenmike
ogni capsula ha il proprio convertitore analogico-digitale a 24 bit,
il cui segnale è raccolto da una matrice, dalla quale esce un
normale collegamento Ethernet che trasporta i trentadue segnali in
multiplex. All’altro capo del cavo Ethernet c’è la EMIB (Eigenmike
Microphone Interface Box) una "scatola nera" che
decodifica il segnale in arrivo e lo invia a una porta FireWire del
computer (in questo caso è un potente MacBook quadriprocessore). E’
sorprendente: non solo sparisce la massa dei cavi, ma l’intero
studio di registrazione diventa "virtuale", ridotto alle
dimensioni di un computer laptop.
Questo apparato produce musica liquida allo stato puro. Da
ascoltare in tutti i modi possibili, con una fedeltà che può
essere limitata solo dalla qualità dei componenti e dalla potenza
di calcolo del sistema informatico. La tecnica è ancora in fase
sperimentale e ci sono diversi problemi da risolvere prima che
diventi di uso comune. Ma la strada è aperta e conduce alla massima
qualità della riproduzione sonora con il minimo di attrezzature
fisiche. Un altro aspetto della "dematerializzazione" resa
possibile dalle tecnologie digitali.
Come si avvera il sogno degli ingegneri del suono
Intervista a Leonardo Scopece
Il deus ex machina del suono ambisonico è Leonardo
Scopece. Tutti lo chiamano ingegnere, ma è un fisico (la
differenza è notevole, in questa materia). Il biglietto da
visita lo qualifica semplicemente come "supporto
tecnologico aziendale". In realtà è il motore di un
gruppo di eccellenza in campo internazionale nel trattamento
digitale del suono, che opera nel Centro Ricerche e
Innovazione Tecnologica della Rai a Torino (che spero di
visitare presto per i lettori di Digital Video).
Ho assistito all’installazione del microfono Eigenmike:
trentadue capsule, ma un solo cavo che si perde nei meandri
dello Studio 3 di corso Sempione e ricompare misteriosamente
su un tavolino della regia audio, per finire in una scatola
nera con qualche LED e l’attacco per la cuffia. Ci sono
anche un MacBook e una cuffia Sony. Nient’altro.
Evidentemente il resto è software. Ma la mia prima domanda,
al tempo della musica liquida, è sulla qualità della
digitalizzazione del suono. La risposta, in prima battuta, è
quasi deludente: "24 bit, 48 kHz".
Ma oggi quelli che si considerano veri audiofili vogliono
almeno 96 kHz!
Sì, ma qui posso arrivare solo a 48, che è la frequenza
che si usa nel broadcast. E poi più del campionamento è
importante la qualità delle capsule che si usano. Qualcuno
ritiene che sia meglio usare una profondità minore e una più
alta frequenza. Io personalmente, dopo avere fatto tante
prove, preferisco guadagnare più in quantizzazione che in
frequenza. Questo sistema può lavorare anche a 16 o 32 bit,
ma ho visto che il campionamento a 24 bit e 48 Khz è la
soluzione migliore.
Qual è il software che serve a trattare i segnali?
Si chiama Plogue Bidule. Questo programma mi permette di
mandare i trentadue segnali in ingresso sull’hard disk del
computer. In sostanza ricevo i trentadue segnali grezzi che
arrivano via Ethernet sull’interfaccia EM32. Da qui, via
Firewire, entrano nel computer, che di fatto in questa fase è
soltanto un registratore. Attraverso il Bidule combino i
trentadue segnali in ingresso, che mi permettono di costruire
quanti punti di vista voglio, definendo i sette microfoni
virtuali della registrazione.
Perché sette e non otto, come sembrerebbe naturale?
Perché un canale è occupato da altre operazioni. Ma se
sette microfoni non bastano, faccio un riversamento e ne
posiziono altri sette. Se il computer ce la fa, posso usare
quanti microfoni voglio, a multipli di sette. Stiamo
sviluppando una matrice che ci consenta di utilizzare otto
microfoni su otto, ma per adesso neanche un quadriprocessore
ce la fa a lavorare in tempo reale con otto microfoni su 360
gradi azimutali, su 180 mediani e cambiando la direttività
dall’ordine zero Ambisonic all’ordine sei.
Ambisonic? Forse occorre una spiegazione…
L’Ambisonic è un sistema teorico che usa funzioni
sferiche per calcolare la quantità di suono in ogni punto
dello spazio. La teoria ambisonica dice semplicemente che,
conoscendo la pressione di una particella in un punto dello
spazio e la sua velocità di spostamento, posso ricavarne la
quantità di suono in quel punto dello spazio. Con un sistema
empirico più che teorico, cioè facendo delle misure e
facendo i calcoli su queste misure, abbiamo determinato la
matrice. Così possiamo costruire microfoni virtuali che vanno
dall’ambisonico di ordine zero, cioè omnidirezionale, all’ordine
1 di un cardiode semplice, fino all’ordine 6, che è
superiore al "fucile", fino a 2-3000 Hz. Arrivare
all’ordine 6 non è facile e probabilmente al Centro
Ricerche e Innovazione Tecnologica di Torino ci siamo arrivati
per primi al mondo. In diverse riunioni internazionali abbiamo
visto che probabilmente nessuno è arrivato oltre l’ordine
3. Qualcuno è arrivato anche all’ordine 4, ma non dinamico.
"Dinamico" significa che se voglio spostare un
microfono, anche in tempo reale durante la registrazione, lo
prendo e lo sposto sulla scena.
Come si è arrivati a questo risultato?
Abbiamo incominciato con un sistema portatile, semplice da
usare, che non costasse molto all’azienda: un microfono con
otto canali fisici già posizionati (destra, sinistra,
surround eccetera). Ma dalle prime prove abbiamo visto che era
troppo grosso, entrava in campo, prendeva troppi rumori. Il
risultato non era buono. Allora ho pensato di fare quello che
anche molti colleghi chiedevano da tanto tempo, uno zoom per i
microfoni come per gli obiettivi
della telecamera. E così ho proposto ad Angelo Farina dell’AIDA
lo sviluppo del sistema della
Eigenmike, che arrivava al secondo o terzo ordine, ma
step-by-step. Come operatore audio di un broadcaster, devo
poter cambiare al volo le distanze. Se a un certo punto nell’orchestra
spunta un flauto, devo "stringere" su quel flauto
come fa il cameraman. Prendo un microfono e lo punto là,
anche in tempo reale.
Sul registrato?
Sul registrato, ma anche in tempo reale, in diretta.
In pratica, se ho capito bene, si prendono una o più
capsule e da queste si "estrae" la parte di suono
che interessa.
No, non è proprio così. Tutti i trentadue microfoni
fisici della sfera concorrono a creare ciascuno dei sette
microfoni virtuali. Per esempio, se costruisco un microfono
virtuale frontale, che di fatto interessa dieci capsule, e poi
un altro che riprende da sinistra, anche per questo posso
usare i trentadue segnali a disposizione. Questo è il
vantaggio di avere i segnali "grezzi", così come
sono generati dalle capsule.
Dunque il suono finale di ciascuno dei sette microfoni
virtuali si costruisce modificando ritardi e fasi di ciascuno
dei trentadue segnali in entrata.
Più o meno.
E tutto questo con qualche clic del mouse…
Qui dai monitor della regia audio si sente il suono che
arriva dai microfoni tradizionali. Quello ambisonico lo posso
sentire in cuffia e appare molto equilibrato e definito. Ma in
parte si confonde con quello esterno, che l’isolamento della
cuffia non riesce ad attenuare completamente. E tra i due c’è
un anche ritardo che confonde le idee.
Voglio ascoltare questa registrazione in un altro momento,
la curiosità è forte. A presto, dottor Scopece.
|
|
L'Eigenmike sospeso sulla verticale dell'orchestra è
quasi invisibile tra le mille apparecchiature dello studio
televisivo |