Definition
Lydklassificering er processen med at tildele etiketter til lydoptagelser baseret på deres indhold. Kategorier kan omfatte tale, musik, dyrelyde, alarmer eller miljøstøj.
Formål
Formålet er at automatisere genkendelse og kategorisering af lyd, hvilket gør lyd søgbar og analyserbar af AI. Det bruges i vid udstrækning i sikkerhedssystemer, medieorganisering og hjælpeteknologier.
Vigtighed
- Muliggør automatisering i tale-, musik- og lydgenkendelse.
- Forbedrer tilgængeligheden gennem lydbaserede grænseflader.
- Afhænger af forskellige træningsdata for nøjagtighed på tværs af forhold.
- Fejl kan påvirke sikkerhedskritiske applikationer (f.eks. alarmer).
Hvordan det virker
- Optag eller importer rå lydsignaler.
- Uddrag funktioner såsom spektrogrammer eller MFCC'er.
- Træn klassifikatorer (f.eks. neurale netværk) på mærkede data.
- Evaluer nøjagtigheden i forhold til testsæt.
- Implementer modeller til klassificering i realtid eller batch.
Eksempler (den virkelige verden)
- Shazam: identificerer musiknumre fra korte lydklip.
- Google Sound Classifier: Registrerer hverdagslyde som gøen eller sirener.
- BirdNET: identificerer fuglearter baseret på optagede sange og kald.
Referencer / Yderligere læsning
- Lydklassificering med maskinlæring — TensorFlow.
- Klassificering af miljøstøj med CNN'er — IEEE (Piczak, 2015).
- Maskinlæring til lydsignalbehandling — MIT OpenCourseWare.