Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
Enveloppe temporelle et structure temporelle fine
Другие языки:

Enveloppe temporelle et structure temporelle fine

Подписчиков: 0, рейтинг: 0

L’enveloppe temporelle (ENV) et la structure temporelle fine (TFS) sont des variations d’amplitude et de fréquence dans les sons. Ces fluctuations temporelles sont responsables de nombreux aspects de la perception auditive, notamment la perception de la sonie, de la hauteur et du timbre, et la localisation sonore.

Lorsqu’ils sont traités par le système auditif périphérique, les sons sont décomposés sur un ensemble de bandes fréquentielles. Les signaux à bande étroite résultants véhiculent de l’information à différentes échelles de temps, allant de moins d’une milliseconde à plusieurs centaines de millisecondes. Une séparation entre l’enveloppe temporelle (les fluctuations lentes) et la structure temporelle fine (les fluctuations rapides) dans chaque bande de fréquence a été proposée pour expliquer différents aspects de la perception auditive. Une série d’études psychophysiques, électrophysiologies et computationnelles basées sur cette dichotomie enveloppe temporelle / structure temporelle fine ont examiné le rôle de ces indices temporels dans l’identification de sons et la communication, comment ces indices sont traités par le système auditif central et périphérique, ainsi que l’effet du vieillissement et des dommages cochléaires sur ce traitement. Bien que cette dichotomie soit encore débattue et que la question de l’encodage de ces indices par le système auditif reste ouverte, ces études ont donné lieu à un certain nombre d’applications dans des champs incluant le traitement de la parole, l’audiologie clinique, et la correction des surdités de perception au moyen d’implants cochléaires et de prothèses auditives.

Définition

Les termes d’enveloppe temporelle et de structure temporelle fine peuvent recouvrir des notions différentes selon les études. Une distinction importante porte sur la différence entre les descriptions physique (c.-à-d. acoustique) et biologique (ou perceptuelle) de ces caractéristiques.

Tout son couvrant une bande de fréquences limitée (signal à bande étroite) peut être décrit comme une enveloppe (ENVp, où p indique le signal physique) modulant une porteuse oscillant rapidement, la structure temporelle fine (TFSp).

Dans la vie courante, la plupart des sons, notamment les sons de parole et la musique, sont large bande : ils sont distribués sur tout le spectre des fréquences, et il n’existe pas de façon bien définie de représenter le signal en termes d’ENVp et TFSp. Cependant, dans la cochlée fonctionnelle, les sons sont décomposés par la membrane basilaire en une série de signaux à bande étroite. Ainsi, la vibration de chaque cellule ciliée peut-elle être considérée comme une enveloppe ENVBM superposée à une structure temporelle fine TFSBM. Ces composantes dépendent de la position considérée le long de la membrane basilaire (BM). Au niveau de l’apex, répondant aux fréquences basses, les fluctuations d’ENVBM et TFSBM sont relativement lentes, tandis qu’elles sont les plus rapides à l’extrémité basale répondant aux fréquences hautes.

Grâce à la transduction mécanoélectrique effectuée par les cellules ciliées, ENVBM et TFSBM sont tous deux transmis par le nerf auditif, sous la forme de potentiels d'action, donnant naissance à ENVn et TFSn. TFSn (la TFS neurale) est encodée principalement par les neurones accordés sur les fréquences audio basses. Au contraire, ENVn (l'enveloppe neurale) est encodée principalement dans les neurones accordés sur les fréquences audio élevées. Dans un signal à large bande, il n’est pas possible de manipuler TFSn sans affecter ENVBM et ENVn et, inversement, il n’est pas possible de manipuler ENVn sans affecter TFSBM et TFSn.

Rôles pour la perception de la parole et de la musique

L’ENVp joue un rôle crucial dans de nombreux aspects de la perception auditive, notamment pour la perception des sons de parole et de la musique . Ainsi un son de parole reste-t-il intelligible dans une certaine mesure même lorsque l’information de TFSp qu’il contient est artificiellement supprimée . De même, lorsque la TFSp d’une première phrase est combinée avec l’ENVp d’une seconde, seuls les mots de la seconde phrase sont compris . Les composantes de l’ENVp les plus importantes pour la compréhension de la parole fluctuent à des cadences inférieures à 16 Hz (ce qui correspond à peu près au rythme des syllabes) .

Le traitement de l’information de TFSp joue un rôle dans la perception de la hauteur des sons, une capacité importante pour la perception de la musique mais aussi pour la perception de la parole, puisqu’elle contribue à la prosodie de la voix. Ainsi les indices de TFSp sont-ils importants pour l’identification du locuteur, et de ses émotions et intention, transmises par la prosodie . Dans les langues à ton, ils ont également un rôle fondamental pour la transmission du contenu phonétique . De plus, plusieurs études basées sur des sons de parole vocodés ont suggéré que les indices de TFSp contribuent à l’intelligibilité . Bien qu’il soit difficile sinon impossible d’isoler l’effet de la TFSp de celui de l’ENVp, certaines études menées sur des auditeurs malentendants indiquent que la perception de la parole en présence d’un bruit de fond nécessite un traitement efficace de la TFSp. Dans le cas de la musique, les variations lentes de l’ENVp transmettent les informations de rythme et de tempo tandis que les variations plus rapides véhiculent les informations d’attaque et de coupure des sons, importantes pour la perception du timbre .

Voir aussi

Références


Новое сообщение