Si vous voulez qu'un morceau soit mixé avec créativité et musicalité tout en ayant un son moderne, Manny Marroquin est l'homme qu'il vous faut : demandez à Kanye West, Miley Cyrus, Lady Gaga, John Mayer, John Legend ou Alicia Keys, pour ne citer que quelques-uns des artistes de tout premier plan que Manny a mixés. À ce jour, il a remporté neuf Grammy Awards au cours de sa carrière et a mixé plus de quarante albums classés chacun à la première place des ventes.
Il en connait aussi un rayon sur le plan technique, et a même collaboré avec Waves à la conception d’une gamme de plug-ins 'signature’. Inutile de dire qu’il est plus qu’occupé, c’est pourquoi nous étions particulièrement excités à l’idée d’avoir l’opportunité de l’interviewer pour parler de son boulot et de ses techniques de mixage.
Mixez-vous toujours dans votre propre studio ?
J’ai mon propre studio, les studios Larrabee à Los Angeles. Ça fait vingt ans que j’y suis. Avoir un espace que l’on connait et où l’on se sent à l’aise est vraiment important pour la qualité du produit final.
Le cœur de ce studio, c’est une console ?
Oui. Je ne travaille pas « in the box ». J’ai une config hybride, j’utilise une SSL, une 9000K qui est une super console. Elle dispose de 80 entrées, je passe tout par les tranches et je fais encore tout en analogique, tout subit une forme ou une autre de traitement analogique. Et puis bien sûr, j’utilise aussi des processeurs analogiques externes. J’en utilise moins maintenant, mais encore beaucoup.
Donc vous passez toutes les pistes dans les entrées individuelles de votre console, puis vous les renvoyez dans Pro Tools ?
Voilà, c’est exactement ça.
Je suppose que faire un rappel des paramètres est plus difficile avec votre config qu’en faisant tout « in the box » ?
Ce que je fais, c’est que j’enregistre les stems. J’ai une config qui est très bien faite et qui me permet d’enregistrer des stems ; ils sonnent à 98% comme la version mixée directement. Quand je reprenais les mêmes paramètres, ça n’était jamais totalement identique à la fois précédente, il y avait toujours une petite différence. Avec les stems, c’est à 98% identique, à 100% même parfois. A partir de là, je peux travailler « in the box ».
Les stems sont-ils enregistrés avec les effets ?
Oui, avec les effets analogiques.
Mais du coup si vous avez besoin de revenir en arrière, vous ne pouvez pas modifier les effets qui ont été appliqués, seulement ajuster les niveaux ?
Voilà. C’est comme avec un livre de coloriages, on utilise des crayons et on ne peut que rajouter couleurs sur couleurs, pas effacer les couleurs qui sont déjà là. C’est toute la beauté de la chose, les pistes sont gardées avec les traitements analogiques, et je ne peux qu’ajouter à ce qu’il y a déjà.
Mais vous avez toujours les pistes originales, non traitées.
Oui.
Ça semble être une bonne façon de faire.
Oui, j’aime autant avoir 95% de mes pistes avec traitement, et les 5% qui restent, ça peut être par exemple la basse sur laquelle j’aurais appliqué trop de traitements, et là je peux les enlever, mais j’aurai toujours 95% de mon son qui sonnera analogique.
Utilisez-vous beaucoup de traitements sur le bus de sortie ?
Pas vraiment. Si j’ai une session sur laquelle le bus stéréo a subi trop de traitements, je dois rester dans l’univers qui a été défini. Je ne peux plus séparer tous les éléments. C’est comme prendre une voiture et la désosser complètement pour la remonter ensuite, je ne ferais que revenir au point de départ. Donc autant garder la voiture telle qu’elle est et la modifier, changer la couleur de la peinture ou je ne sais quoi. Mon boulot, c’est de rester dans le bus stéréo, et travailler à partir de ce que j’ai. Si on me donne un mix non traité, c’est super, dans ce cas je ne mets pratiquement rien sur le bus stéréo.
Pouvez-vous développer ?
Je compresse sur ma SSL, via le bus stéréo de ma console. Mais dans Pro Tools, je n’utilise que très peu de traitements. Peut-être un égaliseur, pour aérer le mix, ou alors l’inverse si le son a trop de brillance parce que j’avais réglé mes moniteurs à trop bas volume et que j’ai ajouté trop de brillance un peu partout. Quoi que je fasse, je le fais tout à la fin. De façon générale, je ne mets pas trop de traitements sur le bus stéréo.
Je suppose que la plupart des sessions vous arrivent sous la forme soit de fichiers audio séparés, soit de sessions Pro Tools ?
C’est ça.
Si l’on vous donne quelque chose qui a été partiellement mixé, comme vous disiez, êtes-vous plus susceptible de repartir de zéro ?
Non. Pour moi, ça n’avance à rien de repartir de zéro si on me donne une session Pro Tools avec les plug-ins et tout le reste. Dans ces cas-là je garde tout, mais je vais passer en revue tous les plug-ins qui sont en place pour voir quel impact ils ont sur le résultat. En gros, je me demande « est-ce que c’est là par choix artistique, ou pour améliorer le son ? ». Par exemple, s’il y a un filtre et qu’il est utilisé de façon créative, c’est un choix artistique. Mais s’il est juste là pour ajouter un peu de graves à la grosse caisse, c’est clairement une question d’amélioration sonore, et dans ce cas la plupart du temps je l’enlève et je le remplace par ce que moi je veux y mettre. Donc, s’il y a une égalisation ou bien une compression qui ne me semblent pas là à des fins de production artistique, j’enlève ces plug-ins. Mais si ça sonne bien, ça sonne bien, dans ce cas je n’y touche pas.
Comment savez-vous vers quel type d’ambiance vous diriger sur un mix donné ? Est-ce qu’en général le producteur vous le spécifie ?
Ils nous donnent une sorte de version de brouillon. On est dans le domaine de l’approximation. Souvent, on trouve des ébauches dont je n’irai pas jusqu’à dire qu’elles sonnent « bien », mais en tout cas elles donnent une bonne idée de la direction à prendre. J’écoute et je vois s’ils veulent quelque chose qui sonne plus agressif, ou moins agressif, avec un peu plus d’espace, ou je ne sais quoi. Aujourd’hui, tout l’art de ce métier, c’est vraiment ça : percevoir ce vers quoi ils tendent, essayer de deviner ce qu’ils veulent, de voir comment la chanson est supposée rendre, comment eux s’imaginent le résultat final, et on part de là. Et pour ça, il n’y a pas de règle.
Décrivez-nous comment vous intégrez ces ébauches dans votre façon de travailler.
Je les écoute, j’analyse en profondeur ce qu’ils essaient d’obtenir ; ensuite je démarre avec tous mes faders à zéro et j’essaie de construire le mix tel que j’ai l’impression de l’entendre. Dès que je sens que je perds le fil, je retourne écouter la version de brouillon. Avec un peu de chance, au final, quand le résultat « sonne », vous obtenez une représentation fidèle à leur vision de la chanson. Et peut-être même encore mieux ! Parfois, ça peut être amélioré de 5%, parfois 60%, vous ne pouvez jamais savoir. Chaque chanson est différente au sein d’un même album, même si elles sont du même artiste. Chaque morceau peut avoir besoin d’être abordé et traité d’une manière différente.
Parlez-nous de la façon dont vous gérez la largeur du signal dans un mixage stéréo.
Certains mixages nécessitent de la profondeur, elle peut être amenée par des réverbes dont les queues sont traitées à la même fréquence que la source, et là tout d’un coup ça apporte de la profondeur. Je ne suis pas très fan de l’idée d’utiliser la largeur du signal pour donner du mouvement. À moins que ce ne soit une démarche artistique et une demande explicite du réalisateur artistique, par exemple s’il faut rendre explicitement le mouvement d’un élément de la gauche vers la droite. Évidemment, je peux le faire, mais si ça ne tient qu’à moi, je ne prends pas cette voie-là. Je ne prends pas ce genre de libertés. J’ai conscience de la largeur du signal et de sa puissance à susciter des émotions, par exemple si j’ai un élément au centre en stéréo et que je l’élargis un peu, qu’est-ce que ça produit comme effet en termes d’émotions? Est-ce que ça en produit plus, ou moins ? Est-ce que ça change mon état d’esprit ? J’aime les effets psychologiques du son en 3D, de sa largeur, de sa profondeur, de sa hauteur.
Comment faites-vous pour lui donner de la hauteur ?
Quelle que soit la piste qui sonne le plus fort, c’est elle qui a le plus de hauteur dans le champ stéréo. Vous verrez que bientôt, on pourra panoramiser le son en hauteur, ça serait cool. Mais là encore, ça pourrait être sympa, mais ça pourrait aussi être source de confusion. En tout cas, pour moi, la hauteur, c’est le volume.
Et donc, le placement dans l’espace du plus éloigné au plus proche, c’est l’ambiance ?
Exactement. La profondeur. Quand vous avez un son avec plein de réverbe, il a l’air d’être dans le lointain, vous voyez ? Eh bien, dès que vous enlevez la réverbe, le volume augmente. Imaginez deux faders, l’un contrôlant le signal nu et l’autre le signal avec les effets. Pour le signal nu, vous baissez la réverbe de façon à ce que le son se rapproche.
J’ai remarqué que vous utilisiez pas mal de réverbe dans vos mixages…
Ouais.
Mettez-vous beaucoup de traitements sur la réverbe ? De l’égalisation, autre chose ?
Je suis plutôt du genre à utiliser des presets. Plutôt que de prendre une réverbe et de trifouiller les réglages jusqu’à obtenir ce que je cherche, je préfère faire défiler 20 presets et utiliser celui qui est le plus proche du son que j’ai en tête. Et si je ne trouve rien d’approchant, je continue de chercher. « Alors, quel est celui auquel je pense ? Non… Non… Non plus… Ah, voilà, c’est celui-là ! ». Et ensuite, vous n’y touchez plus ! À mon sens, c’est une démarche plus créative.
Ceux de nos lecteurs qui utilisent beaucoup de presets seront ravis de lire ça !
Je suis à fond dans l’utilisation des deux hémisphères du cerveau. Utiliser le cerveau gauche, ce serait manipuler le son jusqu’à trouver celui qu’on cherche, alors que faire appel au cerveau droit c’est passer des sons en revue et en trouver un qui marche. Ensuite, vous pouvez continuer votre démarche sur le plan créatif, vous n’êtes pas bloqué par le son. Honnêtement, la façon dont ça sonne n’importe pas tant que ça. Ce qui compte, c’est « est-ce que ça marche sur cette chanson ? ». Encore une fois, ça tient plus de l’émotion que d’autre chose. Si je mixe, disons du Charlie Puth par exemple, peut-être n’y a-t-il besoin sur le couplet que de peu d’effets parce qu’il faut capter l’attention de l’auditeur. Et ensuite, sur les refrains, il faut changer son fusil d’épaule et là on ajoute de la réverbe parce qu’on veut donner un peu de mollesse, c’est l’émotion qu’on veut donner sur ce passage-ci, et ensuite le deuxième couplet revient à un son sans trop d’effets. Pour moi, c’est une façon de contrôler l’esprit de l’auditeur, de le faire se dire « tiens, qu’est-ce qu’il se passe là tout d’un coup ? ». Une oreille peu exercée ne réalisera peut-être même pas ce qu’il se passe, mais nous, nous tirons les ficelles.
Un peu comme un peintre qui joue avec les contrastes ?
D’une certaine manière, oui ! Vous avez les peintures cubistes de Picasso, qui semblent toutes plates, et puis vous avez celles de Monet, qui ont tellement de profondeur. Aucun style n’est meilleur que l’autre, mais imaginez une chanson qui en trois minutes parvient à jouer avec toutes ces émotions. Le contraste, c’est ça qui créé l’émotion. Certaines peintures doivent ressembler à du Monet, et d’autres à du Picasso. Il est très utile de comprendre ça et de connaître la psychologie des émotions.
Justement, disons que vous avez une piste de voix qui en manque, d’émotion. Comment faites-vous pour l’insérer au mieux dans le mixage ?
Il y a quelques trucs pour arranger ça. Je dis toujours que concernant les délais et les autres effets du même genre, je n’en ajoute pas à moins que ça ne soit nécessaire. Seulement si le travail de production du morceau a besoin d’un coup de pouce. Par exemple, supposons qu’un chanteur manque de souffle en fin de phrase et que la phrase se finisse de manière un peu abrupte, par manque d’entraînement ou de talent ou que sais-je, alors je mettrais quelque chose sur la queue du signal. Peut-être un délai un peu dingue, captivant, qui sonne super, pour détourner votre attention des limites vocales du chanteur et l’attirer vers quelque chose de cool. La deuxième fois que vous l’écoutez, vous entendez autant l’effet que la voix elle-même.
Bonne idée.
On détourne l’attention, on utilise différents moyens pour distraire l’attention de l’auditeur des capacités vocales du chanteur. Bien sûr, on peut aussi modifier la hauteur des notes et peut-être même le timing. Peut-être est-ce que la voix manque d’âme, et alors peut-être est-ce qu’on va décaler la piste pour qu’il soit moins dans le temps mais que du coup ça donne une sensation d’émotion. On peut jouer sur tout ça. Mais si la voix a tout ce qu’il faut en termes d’émotion, qu’elle sonne juste et dans le temps mais que malgré tout on sent qu’il manque quelque chose, c’est là qu’on commence à ajouter des trucs qui sembleront au final relever davantage de la démarche artistique. Là, on dispose de plus de marge. Mais encore une fois, on pense moins au chanteur qu’à l’espace sonore. Il est important de savoir faire les choses dans l’ordre. Et aussi, de savoir quand faire l’inverse, quand on a un chanteur extraordinaire et qu’on veut mettre en lumières ses capacités vocales, on en met moins. C’est peut-être une question de choix. S’il y en a besoin, alors OK, on y va, mais si ce n’est pas le cas, on n’y touche pas.
En moyenne, combien de temps cela vous prend-il pour boucler un mixage ?
Ça dépend. Il n’y a pas de moyenne fiable. Parfois ça va me prendre six heures, et d’autres fois deux jours. C’est vraiment dur à dire. Honnêtement, ça peut aller de quatre ou six heures à deux jours. Et j’essaie de ne pas faire dans la précipitation. Auparavant, on nous fixait un jour: « OK, donc tu vas mixer telle chanson tel jour ». Dans de telles conditions, il nous fallait une journée pour faire le mix, on commençait à midi, on finissait vers dix heures du soir, et pour minuit tout était bouclé et le morceau était là. Je trouve que c’était injuste pour l’ingénieur en mixage, parce que ça faisait de lui la dernière étape du processus. Imaginez la pression qu’il y a à devoir absolument finir quelque chose en moins de douze heures, alors que ceux qui ont écrit et produit le morceau ont passé des mois entiers dessus !
Ça fait une sacrée différence.
C’était injuste pour l’ingénieur en mixage de n’avoir qu’une si petite fenêtre de tir. Heureusement, aujourd’hui, la technologie nous permet d’avoir plus de temps. Je ne pense pas qu’on devrait imposer de contrainte de temps aux artistes. Ceci dit, mentalement je me sens plus libre en pouvant prendre autant ou aussi peu de temps que ce dont j’ai vraiment besoin. Je ne suis pas limité à tel jour fixe pour, peut-être, créer une sorte de magie. Je trouve que c’est injuste de mettre ce genre de pression sur les épaules de quelqu’un. C’est pourquoi je peux faire un mixage en quatre heures ou en deux jours, et que dans les deux cas ça coûtera la même chose. Alors qu’avant, si ça vous prenait deux jours, le label vous disait « tiens, mais pourquoi est-ce que ça vous a pris deux jours ? ».
Parce que ça leur coûtait du temps de studio ?
Exactement.
Qu’est-ce qui vous fait vous dire qu’un mix est terminé ? Parce qu’on sait tous qu’on pourrait continuer indéfiniment sur un même mix.
Oui, ça pourrait ne jamais finir. En fait, je vois ça comme des drapeaux qui se lèvent. Imaginez quand vous écoutez un mixage au début, tous ses éléments sont autant de drapeaux. Et plus ça va, il y a de drapeaux. Il peut s’agir de : "la voix a besoin de plus de réverbe", et boum, vous ajoutez de la réverbe et ce drapeau s’abaisse, mais il en reste peut-être 200 autres. Un autre drapeau, ça pourra être la grosse caisse qui manque de puissance, ou qui n’est pas assez ci, ou alors trop ça : quel que soit le problème, vous faites ce qu’il faut, et ce drapeau-là aussi s’abaisse. A l’écoute suivante, au lieu de 200 drapeaux levés, vous n’en avez plus que 175, et la fois suivante plus que 100. Et le moment où il ne me reste plus de drapeaux, c’est que mon mixage est terminé !
Comme une sorte de liste de points à contrôler ?
C’est exactement ça. Donc que ça me prenne quatre heures ou deux jours, c’est fini quand je n’ai plus rien à vérifier, ou plus de drapeau levé. Et là, je peux écouter le morceau dans tous les sens et me laisser emporter par la chanson sans avoir à me préoccuper du son ou du rendu de tel ou tel élément. C’est à ce moment quej’ai fini mon boulot.
Après avoir fait autant de mixages, vous devez les connaître par cœur ces drapeaux, toutes ces chosesà faire pour arriver au bout ?
Il y a aussi un aspect très technique. Et comme vous dites, j’ai fait ça tellement de fois que je me suis entraîné à réfléchir d’une certaine manière. Alors qu’un jeune ingé son ferait ça de manière inconsciente, jusqu’à ce qu’il apprenne à le faire consciemment. On a alors un peu plus de contrôle sur les choses.
Utilisez-vous beaucoup de filtres passe-haut ?
Ouais, j’utilise beaucoup de passe-bas et de passe-haut, ça permet de créer de la hauteur, vous vous souvenez de ce que je disais sur la hauteur, la largeur et tout ça. Je pense toujours à la partie de la chanson qui va venir. Si je suis sur le refrain, je réfléchit déjà au deuxième couplet autant qu’au refrain lui-même, parce que je pense qu’en matière de musique ce sont les transitions qui font tout. Surtout dans la pop actuelle. « OK, alors c’est quoi la partie suivante? Comment est-ce que ça va jouer sur nos émotions ? ». Et c’est très important, parce que ça vous permet de penser à votre état émotionnel à ce moment de cette partie spécifique de la chanson.
Pouvez-vous nous donner un exemple ?
Mettons que je suis dans le deuxième couplet, j’ai le refrain en tête mais sur le passage où j’en suis ce deuxième couplet est bien énervé. Ça veut dire qu’il faut que je calme quelque chose, parce qu’en passant du refrain au deuxième couplet il faut lâcher du lest mentalement parlant. Parce que c’est ça qui fait la dynamique, surtout dans la pop où tout sonne si fort à cause du limiteur et du volume, donc il faut de l’espace, redescendre un peu de temps en temps. Il faut équilibrer le tout. Oui, mais comment faire sans que notre esprit se dise « tiens, c’est plus du tout la même chose ? » C’est un défi passionnant que l’on doit relever à chaque fois. Donc, mentalement, comment fais-je pour baisser tout cela de manière à pouvoir ensuite remonter le volume ?
Je suppose que beaucoup de tout ça dépend déjà de l’arrangement, mais parfois ce n’est pas le cas et c’est alors à vous de créer cet effet ?
Tout à fait. Quand vous avez un morceau avec un bon réalisateur artistique, un bon arrangeur et un bon artiste, ça peut donner un mix qui ne me prendra que quatre heures comme je le disais tout à l’heure [rires]. Mais quand ce n’est pas le cas, c’est là que ça peut me prendre deux jours, parce qu’il faut en quelque sorte créer tout ça sans changer l’esprit de leur production, et ça c’est loin d’être facile.
Vous pouvez peut-être créer une section de break, en coupant le volume de certaines pistes ?
Bien sûr. Peut-être pas en coupant complètement leur volume, parce que le réalisateur artistique dira « non mais je ne veux pas qu’on supprime ça », mais en les traitant différemment. Au final ça sera audible, mais différemment, du coup le réalisateur et l’artiste ne se mettent pas dans tous leurs états en disant que vous avez pris des initiatives dans le domaine créatif et que ça transforme ou dénature leur « vision » de l’œuvre, quelle que soit cette vision. Vous maniez le contenu de façon à ce qu’il soit toujours présent, mais qu’il produise un autre impact sur le plan émotionnel.
Par exemple vous pouvez ajouter un effet, ou changer l’égalisation ?
Exactement. Ça peut dépendre de ma manière d’utiliser les filtres, ou de manipuler le volume, ou encore d’un effet particulier. Ça peut être tout ça. Donc effectivement, au final, je n’aurai rien coupé, mais j’aurai changé l’aspect émotionnel. Tous les éléments seront toujours là, mais j’aurai obtenu ce dont j’avais besoin et eux aussi, le tout sans qu’il faille revoir l’arrangement de la chanson, ni la modifier, ni couper ou ajouter ou quoi que ce soit d’autre de ce genre. C’est du gagnant-gagnant.
Sur le plan technique, remarquez-vous des problèmes particuliers sur les morceaux qui vous sont envoyés en provenance de home studios ?
De nos jours, que les enregistrements soient faits chez soi ou dans un grand studio, j’ai le sentiment que l’art de la prise de son s’est perdu. Il y a moins de très bons ingés son aujourd’hui que dans le passé. C’est un art qui ne se transmet plus. Aujourd’hui, c’est un peu le Far West. J’ai parfois de très bons projets, et d’autres qui ont vraiment besoin d’un bon coup de main. Mais mon boulot n’est pas de juger de la qualité de ces enregistrements. J’essaie d’oublier tout ça et de m’attacher à rentrer dans l’esprit du morceau. Et pour reprendre votre image picturale de tout à l’heure, la qualité de la peinture n’est peut-être pas optimale mais d’une façon ou d’une autre il faut faire avec. Parce que l’objectif, c’est de voir ce que le résultat final donnera, que la peinture utilisée soit du très bas de gamme ou au contraire ce qui se fait de mieux. Du coup, en tant que peintre, ce qu’il faut c’est passer à l’action, pas réfléchir. C’est un peu comme la façon de travailler que j’ai élaborée dans ma tête au fil des années, je ne me demande pas si c’est bien enregistré ou pas, j’essaie juste de voir la vision qu’il y a derrière et d’aller dans cette direction, que la qualité soit là ou non.
Merci beaucoup !
De rien.