New York engelsk datasæt

Højkvalitets new York engelsk call-center, generel samtale og podcast-datasæt til kunstig intelligens og talemodeller

Oversigt

Titel

New York engelsk sprogdatasæt

Datasættype

Callcenter

Beskrivelse

Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

103

Prøvefrekvens

8 kHz

Audio Channel

Mono

Optageplatform

desktop

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

Danmark

Sprog

New York engelsk

Køn

Kvinde 610, Mand 532, Ukendt 0

Antal højttalere

1,142

Alder

18-50

Oversigt

Titel

New York engelsk sprogdatasæt

Datasættype

Generel samtale

Beskrivelse

Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) – 15-60 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

107

Prøvefrekvens

8 kHz

Audio Channel

Dual

Optageplatform

desktop

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

Danmark

Sprog

New York engelsk

Køn

Kvinde 118 Mand 114 Ukendt 0

Antal højttalere

232

Alder

18-50

Oversigt

Titel

New York engelsk sprogdatasæt

Datasættype

TTS

Beskrivelse

Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

140

Prøvefrekvens

16 kHz

Audio Channel

Mono

Optageplatform

Web Sourcing

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

Danmark

Sprog

New York engelsk

Køn

Kvinde 66, Mand 230, Ukendt 11

Antal højttalere

307

Alder

18-50

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Amazon
Google
microsoft
Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.
  • Dette felt er til validering og bør overlades uændret.