Shazam
DIVERS
+ DE 2 ANS
Le 21/02/2017 à 17h12
711 vues
Question d'origine :
Sur quels principes mathématiques fonctionne l'application Shazam de reconnaissance de morceaux de musique ?
Réponse du Guichet
gds_et
- Département : Équipe du Guichet du Savoir
Le 24/02/2017 à 09h36
Bonjour,
Voici tout d'abord quelques indications sur le principe général de cette application de reconnaissance musicale :
"Ce logiciel utilise le microphone du téléphone pour capturer un échantillon de musique jouée. Une empreinte acoustique est créée à partir de cet échantillon, elle est comparée à la base de données centrale de la société pour comparaison. En cas de correspondance, les informations de la base de données comme le nom de l'artiste, le titre de la chanson, et l'album sont retournées à l'utilisateur. Des liens vers des services partenaires comme iTunes, YouTube, Spotify, Deezer ou Zune sont également diffusés par Shazam."
Source : Wikipdedia
« Expliquons tout d'abord comment Shazam fonctionne. La société dispose d'une discothèque de plus de 8 millions de titres; elle a aussi élaboré une technique permettant de définir la signature numérique de chaque titre - en bref, dans leur base de données, chaque chanson a un code qui lui est propre. «L'idée, c'était de créer l'"empreinte digitale'' de chaque morceau», avait expliqué Andrew Fisher, le PDG de Shazam. Quand vous demandez à Shazam de reconnaître une chanson via votre téléphone, l'application décompose le son et le transforme en code en employant la même méthode. Ensuite, il lui suffit de comparer ce code à ceux de la discothèque numérique, et de trouver celui auquel il correspond.
D'accord, mais comment s'y prennent-ils pour élaborer ces «empreintes»? Comme l'expliquait Avery Wang (expert scientifique en chef et co-fondateur de Shazam) au Scientific American en 2003, on a longtemps considéré que l'approche de la société était computationnellement peu réalisable: les chansons contiennent tellement de données qu'il semblait impossible de les réduire à l'état de simples signatures. C'est alors que Wang eut une idée de génie: laisser de côté la majeure partie de la chanson, pour se concentrer uniquement sur les passages «intenses». Shazam a ainsi créé un spectrogramme pour chacune des chansons présentes dans sa base de données, qui prend la forme d'un graphique permettant de visualiser trois dimensions musicales (la fréquence, l'amplitude et le temps). L'algorithme repère alors les points représentant les sommets du graphique — les notes disposant d'une «teneur en énergie plus élevée» que celles qui les entourent, comme l'explique Wang dans un compte rendu de recherche [PDF] décrivant le fonctionnement de Shazam. En pratique, l'algorithme semble pouvoir repérer trois points d'intensité par seconde par chanson. »
Source : Pourquoi Shazam est si magique, slate.fr
Vous trouverez ci-dessous plusieurs articles qui expliquent plus en détail comment fonctionne l’algorithme de Shazam :
- La Magie de Shazam : dans les entrailles de l'algorithme, lesnumeriques.com
- Derrière les programmes de reconnaissance musicale, des algorithmes originaux, whatsupdata.fr
- Comment marche Shazam, drgoulu.com
Si vous êtes anglophone, vous trouverez également des informations intéressantes dans ces liens:
- How Shazam works, coding-geek.com
- An Industrial-Strength Audio Search Algorithm, ee.columbia.edu
- Creating Shazam in Java, royvanrijn.com
Bonne journée.
Voici tout d'abord quelques indications sur le principe général de cette application de reconnaissance musicale :
"Ce logiciel utilise le microphone du téléphone pour capturer un échantillon de musique jouée. Une empreinte acoustique est créée à partir de cet échantillon, elle est comparée à la base de données centrale de la société pour comparaison. En cas de correspondance, les informations de la base de données comme le nom de l'artiste, le titre de la chanson, et l'album sont retournées à l'utilisateur. Des liens vers des services partenaires comme iTunes, YouTube, Spotify, Deezer ou Zune sont également diffusés par Shazam."
Source : Wikipdedia
« Expliquons tout d'abord comment Shazam fonctionne. La société dispose d'une discothèque de plus de 8 millions de titres; elle a aussi élaboré une technique permettant de définir la signature numérique de chaque titre - en bref, dans leur base de données, chaque chanson a un code qui lui est propre. «L'idée, c'était de créer l'"empreinte digitale'' de chaque morceau», avait expliqué Andrew Fisher, le PDG de Shazam. Quand vous demandez à Shazam de reconnaître une chanson via votre téléphone, l'application décompose le son et le transforme en code en employant la même méthode. Ensuite, il lui suffit de comparer ce code à ceux de la discothèque numérique, et de trouver celui auquel il correspond.
D'accord, mais comment s'y prennent-ils pour élaborer ces «empreintes»? Comme l'expliquait Avery Wang (expert scientifique en chef et co-fondateur de Shazam) au Scientific American en 2003, on a longtemps considéré que l'approche de la société était computationnellement peu réalisable: les chansons contiennent tellement de données qu'il semblait impossible de les réduire à l'état de simples signatures. C'est alors que Wang eut une idée de génie: laisser de côté la majeure partie de la chanson, pour se concentrer uniquement sur les passages «intenses». Shazam a ainsi créé un spectrogramme pour chacune des chansons présentes dans sa base de données, qui prend la forme d'un graphique permettant de visualiser trois dimensions musicales (la fréquence, l'amplitude et le temps). L'algorithme repère alors les points représentant les sommets du graphique — les notes disposant d'une «teneur en énergie plus élevée» que celles qui les entourent, comme l'explique Wang dans un compte rendu de recherche [PDF] décrivant le fonctionnement de Shazam. En pratique, l'algorithme semble pouvoir repérer trois points d'intensité par seconde par chanson. »
Source : Pourquoi Shazam est si magique, slate.fr
Vous trouverez ci-dessous plusieurs articles qui expliquent plus en détail comment fonctionne l’algorithme de Shazam :
- La Magie de Shazam : dans les entrailles de l'algorithme, lesnumeriques.com
- Derrière les programmes de reconnaissance musicale, des algorithmes originaux, whatsupdata.fr
- Comment marche Shazam, drgoulu.com
Si vous êtes anglophone, vous trouverez également des informations intéressantes dans ces liens:
- How Shazam works, coding-geek.com
- An Industrial-Strength Audio Search Algorithm, ee.columbia.edu
- Creating Shazam in Java, royvanrijn.com
Bonne journée.
DANS NOS COLLECTIONS :
Ça pourrait vous intéresser :
Commentaires 0
Connectez-vous pour pouvoir commenter.
Se connecter