Commentaires : FLAC, WAV, MP3, DSD, ALAC... Vers quel format audio dois-je me tourner?

Vous connaissez probablement le célèbre format audio MP3. Il y a même de fortes chances pour que vous n’utilisiez que lui au quotidien. Mais saviez-vous qu’il est possible de passer votre musique à un niveau supérieur grâce à d’autres formats audio ? Si les termes FLAC, DSD, fréquence d’échantillonnage ou encore lossless ne vous disent rien, alors vous êtes au bon endroit. On vous dit tout ce qu’il faut savoir sur les bases de l’audio numérique dans ce guide conçu spécialement pour les néophytes.

1 « J'aime »

Et pourquoi pas un petit DAP en passant ?
Heu … C’est quoi un petit DAP ?

Je déplace vers Image et son

1 « J'aime »

Hello !
DAP est l’abréviation de Digital Audio Player, soit lecteur audio numérique. Ces appareils embarquent un DAC et un ampli, ce qui les rend plus puissants que le bon vieux lecteur MP3 des familles. Nous allons bientôt publier des tests de quelques DAP très sympathiques, restez donc à l’affût pour en savoir plus :slight_smile:

2 « J'aime »

Pour le dsd j’ai pas compris la phrase « Étant donné la rapidité de l’analyse » et le 1 bit qui suffit.
Après recherche c’est simplement que c’est une autre système que le PCM que je connaissais bien, ici c’est du PDM (Pulse-Density Modulation (modulation d’impulsion-densité))
On a juste besoin de 1bit car on veut juste savoir, en gros, s’il faut monter (1) ou descendre (0) alors qu’en PCM on veut savoir quelle est exactement la prochaine valeur

Par exemple si on est a 188/255 (en 16bits donc ) a 44.1Khz elle passera a 189 en PCM si on est dans une courbe montante sur l’image de l’article
image
En DSD64 (64fois plus rapide que la fréquence 44.1Khz) on saura 64 fois si le signal est monté ou descendu (d’un écart défini pour chaque cran) entre ce passage 188 et 189 du PCM comme en vert sur cette image, plus bas, issue de l’article qui explique mieux que moi ce système (il y a une complexité ajouté dans le calcul apres cette base logique simple pour avoir un signal plus propre donc c’est pas que cela le PDM https://www.lesnumeriques.com/fabuleux-monde-son-art-faire-vibrer-nos-tympans-a1103/concepts-son-numerique-modulation-delta-sigma-ap920.html )

Ici le cran des montés/descentes fait 0.2 et la frequence est faible pour voir l’action(donc c’est peu précis) )
image

2 « J'aime »

Merci pour cet article :slightly_smiling_face:

2 « J'aime »

Certains font la diff?

j’ai beau avoir un super casque couplé à un dac/amp impossible de faire la diff.

2 « J'aime »

J’ai un pauvre Shure SE215 avec la sortie son de mon Mac, j’ai réussi à voir la différence sur les trois morceaux.

3 « J'aime »

« La différence à l’écoute avec le FLAC est presque impossible à détecter. » Le « presque » est de trop, un FLAC décompressé est bit pour bit comme le wav d’origine…

4 « J'aime »

autant de betise c’est fou

le DSD est juste un truc d’idiophile

« os chères galettes sont enregistrées en 16 bits/44.1 kHz. La fréquence d’échantillonnage de 44.1 kHz signifie que la musique produite par notre groupe est analysée 44.100 fois chaque seconde par les appareils d’enregistrement du studio. Quant à la profondeur de bits, elle donne une indication du nombre d’informations enregistrée sur cette même période. Plus la profondeur est grande, plus on aura d’informations codées au final. »

Pourquoi 44Khz, à cause du théorème de Nquyst, si on souhaite pouvoir restituer un son de 0hz a 22khzh il faut enregistrer a 2 fois plus rapide que la fréquence qu’on souhaite, d’où le 44khz

Pourquoi 22Khz car l’oreille humaine entend pas a plus de 20Khz (22khz pour des oreilles très jeunes et sans dommage), si boite de nuits, concerts, vieillesse au revoir les 20Khz
le bit est le niveau du noise floor 16bit va donner 96db de dynamic ce qui est ce que peut entendre l’oreille.
Ca fait en une image simple être a 1m d’un marteau piqueur et être en même temps capable d’entendre une mouche voler dans la mème pièce

Pourquoi les Studios bossent en 24 bit lors des enregistrements? Car ça va permettre d’avoir un noise floor a -144 db (plus souvent en mesure -130db sur les carte son) pro, ce qui est pratique puisqu’on va utiliser des EQ, compresseur etc qui va faire monter le noise floor tout comme l’empilement de pistes (il existe des gate ou denoiser si on souhaite pour enlever le noise)

Mais les morceaux aujourd hui sont souvent à un niveau de -10LUFS on est très loin de la dynamic que permet déjà les 16bits
donc 24 bit est déjà trop et apportera strictement rien, si on passe de 24 bit a 16bit on va utiliser un dither contre la truncation, mais c’est juste un bruit a -96db

« 12.228 MHz. Pour le DSD »
Les EQ pro et autre en mastering on va jusqu’à 22Khz, très souvent on va couper au-dessus car on n’entend pas donc on va éviter des problèmes, ou alors ça va être de l’export en 88Khz, donc il y aura obligatoirement un Low pass filter. qui est le filtre anti repliement

Donc quel est l’intérêt d’enregistrer de la donnée qu’on entend pas et qui sera que du silence. AUCUN

Pourquoi on bosse en 88KHZ ou rarement 192KHZ, car cela va éviter d’avoir ce qui s’appelle l’aliasing en utilisant des effets vst de saturation type preamp, saturation, fuzz,…
Mais également d’avoir une latence plus basse avec l’asio

ensuite toutes les enceintes studio pro coupent vers les 22Khz (même quand le fabriquant marque 40Khz ca va être a du -10db) Car on contrôle ce qu’on entend pas et qu’on pourra pas traiter, et on évite les problèmes au monitorings

Donc LE DSD N’EST PAS LE SON STUDIO, juste de la bêtise d’idiophile

au lieu de raconter n’importe quoi

10 « J'aime »

Vous avez des liens à partager pour acheter (oui oui, certains achètent encore de la musique ! C’est fou hein :innocent::wink:) des albums en flac à 25€ comme c’est dit dans l’article car ceux que j’avais trouvé dépassent les 45€… alors pour un album ça pique un peut quand même :yum:
Et si quelqu’un connaît la différence entre un flac et un flac en hi-res et qui peux expliquer un peut je suis preneur, merci

1 « J'aime »

Mp3 320 ou flac, je suis bien incapable de faire la différence aujourd’hui…après 40 ans de travail en environnement bruyant.
Je subissais régulièrement des tests d’audition dans le cadre de visites médicales d’aptitude, au delà de 10000hz, je peux dire que je n’entends plus grand chose, la courbe est en chute libre.

5 « J'aime »

Dommage que le TWINVQ (extension .VQF) n a pas percé, c était entre le mp3 et le wav

2 « J'aime »

J’y crois pas :
« Certes, une musique encodée en MP3 ne pèse que quelques méga-octets. Mais l’algorithme appliqué est très agressif, coupant tout simplement les fréquences jugées inaudibles par l’oreille humaine. Dans les faits, le MP3 perd bien des parties audibles. Pire encore, la musique perd toute sa dynamique. Les morceaux semblent alors plats, dénués de vie. L’écoute peut même devenir désagréable après plusieurs dizaines de minutes. »
Moi je dirais plutôt :
« Certes, un article écrit par Clubic est vite lu. Mais il est écrit si vite par des journalistes mal renseignés qui essayent tellement de vulgariser l’information pour être tout public que pour finir, les articles de Clubic perdent toute valeur scientifique. Ils sont souvent sujets à controverse. La lecture de Clubic peut même devenir désagréable après plusieurs dizaines d’articles. »

3 « J'aime »

A l’écoute il y a une claire différence entre un mp3 en 128k (surtout en CBR) et un CD : les aigues particulièrement sont dégueulasse, par contre un mp3 à partir de 256k (particulièrement en VBR) j’ai bien du mal à entendre une quelconque difference avec un lossless …

CBR: constant bitrate: le debit est constant quel que soit la complexité variable du morceau
VBR: variable bitrate: le debit varie selon la complexité du morceau

4 « J'aime »

« Apple a de son côté développé son propre format audio, le AAC - pour Apple Audio Codec. »

Vous êtes sérieux là ?

AAC = Advanced Audio Coding, et il a été développé par Bell, Fraunhofer, Dolby, Sony, Nokia, LG Electronics, NEC, NTT Docomo et Panasonic.

Apple n’a fait que le remultiplexer dans leur propre container.

3 « J'aime »

Bonjour,
après lecture de l’article et au vu des commentaires et en ajoutant mon expérience sur les formats avec fl studio que j’utilise depuis 15 ans et après avoir demandé des conseils a 1 ingénieur je n’ai jamais eu de réponse complète mais partiel sur le sujet.

D’après ce que l’on peut comprendre c’est l’ouïe humaine ne sentirait pas les différences au delà de 16 bits / 44,1 khz pour un enregistrement de musique en studio sur de la stéréo. Cependant avec la profondeur augmente la qualité du son dans la spatialisation : pour avoir connu le seigneur des anneaux en version dvd comme blu-ray et passer de la bande originale vo à la vf qui est plus compressée notamment à cause d’un retour au son 16 bits au lieu de 24 bits il y a une nette différence : les sons murmuré et plus faible sont également plus audible. Par ailleurs pareil pour les systèmes qui utilise le dolby atmos (qui n’est pas un format mais bien un processeur de traitement du signal sonore) qui possède un DAC audio de 32 bits jusqu’à 768 khz. Alors bien sûr le cela ne sert à rien d’aller au delà de 16 ou 24 bits à 44,1khz pour une simple musique en stéréo mais dès lors que vous voulez reproduire et multiplier une multitude de sons dans l’espace et au même moment (jeux monde ouvert et films ) il faut avoir assez d’espace sonore pour meubler le contenu et éviter la saturation sans passer 5 ans sur un mastering qui de toute façon n’aboutirait pas au delà d’un certain seuil. Cependant le dts-x et le dolby atmos ont tendance à renverser les règles établi afin de bénéficier d’une spatialisation sonore irréprochable peu importe la qualité d’échantillonnage.

1 « J'aime »

Juste une remarque: 1 bit à 2.8MHz, c’est le même débit que … 16bits stéréo à 88KHz.
Par ailleurs, la conversion « 1 bit » était utilisée dans les lecteurs CD. Au lieu d’avoir une conversion numérique-analogique dont il était difficile de garantir la linéarité, les lecteurs se focalisaient sur la conversion parfaite d’un bit… en garantissant surtout que tous les bits sont utilisés et restitués (certaines chaînes fonctionnant en 14 bits)

« pour avoir connu le seigneur des anneaux en version dvd comme blu-ray et passer de la bande originale vo à la vf qui est plus compressée notamment à cause d’un retour au son 16 bits au lieu de 24 bits il y a une nette différence : »

ce n’est pas un compression de passer de 24 bit a 16 bit.

Si les bruits sont plus audibles peut être que lors de l’édition de la VF le son a été retravaillé et ajusté notamment a cause du doublage.
Ensuite pour faire une comparaison il faut faire une écoute A/B sur le même système a l’exact même place sinon un test audio est faussé.
Ce qui rend très difficile les comparatifs audio.

Vous pouvez multiplier les sons 768khz comme les AKM ne change rien. Le son sera toujours du 44khz ou 96kz ou autre mais pas échantillonné a 748kz.

L’important va être combien de sortie le DAC peut gérer mais pas la fréquence. Ça n’a pas de rapport l’espace sonore non plus. Pour un bon espace sonore stereo il faut un triangle équilatéral par rapport à votre point d’écoute ne pas être au milieu de sa pièce mais souvent 1/3, avoir le système placé de manière symétrique dans sa pièce que les 2 enceinte soit calibré pareille,…
Et du 5.1 , 7.1 etc c’est encore plus complexe

L’avantage de l’export en 32 bit, va faire qu’un musicien qui comprend pas la technique et qui son master sur son soft sature au max, en 32bit export, le son ne clippera pas, il suffit de le redescendre apres, mais c’est que lors d’un export DAW, on enregistre pas en 32 bit.

1bit =6db, donc 16bit=96db de dynamic, le meilleur vinyl avec meilleur platine, meilleur diamant,… on est peut être au max 14bit

Pas tout à fait. Cette valeur « bâtarde » de 44100 hertz n’a pas été choisie par hasard. Le développement du CD a commencé dans les années 70s. A cette époque, le seul équipement utilisable pour procéder aux enregistrements était le magnétoscope format U-Matic de Sony, modifié pour l’audio-numérique.

Ce magnéto avait une définition de 294 lignes et pouvait stocker 6 échantillons (2 x 3 stéréo) par ligne à 25 images (50 frames) par seconde :

294 x 6 x 25 = 44100 hertz

Sachant que finalement peu de personnes perçoivent des sonorités supérieure à 20000 hertz, une fréquence d’échantillonnage « ronde » de 40 000 aurait été suffisante. Mais d’après ce que j’ai pu lire à ce sujet, comme toute l’électronique avait été développée autour de cette fréquence, les décideurs n’ont pas voulu de dépenses supplémentaires pour une nouvelle ; 44100 a été conservée.

1 « J'aime »