Merci pour l'explication, je ne suis pas du tout un spécialiste, juste curieux.
Alors si je prends le Mi grave (E2) d'une guitare (pas basse) cela fait 1/82.41 = 12 ms environ. Effectivement, c'est un retard faiblement perceptible.
Mais je croyais que le plus gros problème de l'algo de reconnaissance est la transitoire :
comment reconnaitre la note fondamentale (le E2 par exemple) parmis toutes les fréquences générées lors l'attaque de la note par les bruits de cordes, mediator, frettes, etc
De plus, la fondamentale ne sonne pas dès le départ du son mais après un temps de stabilisation.
En fait, il faudrait avoir un algo de reconnaissance des transitoires pour reconnaitre la fondamentale, d'où je suppose les algos de reconnaissance de forme (réseaux neuronaux) employés dans le
Yamaha G-50 et l'Axon
AX-100.
Il y a pas mal de littérature au sujet du "pitch detection", voici le site d'un étudiant francais :
https://web.media.mit.edu/~tristan/