Chain-of-Thought

Chain-of-Thought-anmodning – alt hvad du behøver at vide om det

Problemløsning har været en af ​​menneskers medfødte evner. Lige siden vores primitive dage, hvor vores store udfordringer i livet ikke var at blive spist af et rovdyr til nutiden for at få noget leveret hjem hurtigt, har vi kombineret vores kreativitet, logiske ræsonnement og intelligens for at finde løsninger på konflikter .

Nu, hvor vi ser tilblivelsen af ​​AI-følere, står vi over for nye udfordringer med hensyn til deres beslutningsevner. Mens det foregående årti handlede om at fejre mulighederne og potentialet i AI-modeller og -applikationer, handler dette årti om at gå et skridt videre – at sætte spørgsmålstegn ved legitimiteten af ​​beslutninger taget af sådanne modeller og at udlede ræsonnementet bag dem.

Efterhånden som forklarbar kunstig intelligens (XAI) bliver mere fremtrædende, er dette tidspunktet til at diskutere et nøglekoncept i udviklingen af ​​AI-modeller, vi kalder Chain-of-Thought Prompting. I denne artikel vil vi udførligt afkode og afmystificere, hvad dette betyder og simple udtryk.

Hvad er Chain-of-Thought tilskyndelse?

Når det menneskelige sind er klar til en udfordring eller et komplekst problem, forsøger det naturligvis at bryde det ned i fragmenter af mindre sekventielle trin. Drevet af logik etablerer sindet forbindelser og simulerer årsag-og-virkning scenarier for at planlægge den bedst mulige løsning på udfordringen.

Processen med at replikere dette i en AI-model eller et system er Chain-of-Thought prompting.

Som navnet antyder, genererer en AI-model en række eller en kæde af logiske tanker (eller trin) for at nærme sig en forespørgsel eller konflikt. Visualiser dette som at give en sving-for-sving-instruktion til nogen, der beder om en rute til en destination.

Dette er den fremherskende teknik, der anvendes i OpenAIs ræsonnementmodeller. Da de er konstrueret til at tænke, før de genererer et svar eller et svar, har de været i stand til at knække konkurrencedygtige eksamener taget af mennesker.

[Læs også: Alt du behøver at vide om LLM]

Fordele ved Chain-of-Thought-prompting

Alt, der er logisk drevet, giver en betydelig fordel. Tilsvarende tilbyder modeller, der er trænet i tankekæde-anmodninger, ikke kun nøjagtighed og relevans, men en bred vifte af fordele, herunder:

Udvidet problemløsning kapaciteter, hvor deres betydning er afgørende inden for områder som sundhedspleje og finans. LLM'er, der implementerer kæde-af-tanke-anmodninger, forstår bedre eksplicitte og underliggende udfordringer og genererer svar efter at have overvejet forskellige sandsynligheder og worst-case scenarier.

formildende antagelser og resultater genereret ud fra antagelser, fordi modeller anvender logisk og sekventiel tænkning og bearbejdning til at konkludere i stedet for at springe til konklusioner.

Øget alsidighed da modeller ikke behøver at blive trænet strengt på en ny use case, da de går efter logik og ikke formål.

Optimeret sammenhæng i opgaver, der involverer flerfoldede/flerdelte besvarelser. 

Anatomien af ​​Chain-of-Thought Prompt-teknikkens funktion

Hvis du er bekendt med den monolitiske softwarearkitektur, vil du vide, at hele softwareapplikationen er udviklet som en enkelt sammenhængende enhed. Forenklingen af ​​en så kompleks skat kom med mikroservicearkitekturmetoden, der involverede nedbrydning af software i uafhængige tjenester. Dette resulterede også i hurtigere udvikling af produkter og problemfri funktionalitet.

CoT-opfordring i AI er lignende, hvor LLM'er guides gennem en række sekventielle processer af ræsonnement for at generere et svar. Dette gøres gennem:

  • Eksplicitte instruktioner, hvor modeller er direkte instrueret i at nærme sig et problem sekventielt gennem ligetil kommandoer.
  • Implicit instruktion er mere subtil og nuanceret i sin tilgang. I dette tages en model gennem logikken i en lignende opgave og udnytter dens slutnings- og forståelsesevner til at replikere logikken for dens præsenterede problemer.
  • Demonstrative eksempler, hvor en model ville lægge trin-for-trin-ræsonnementer frem og generere trinvis indsigt for at løse et problem.

3 Forekomster i den virkelige verden, hvor CoT-prompt bruges

Finansielle beslutningsmodeller

Finansielle beslutningsmodeller

Multimodal CoT i bots

Multimodal tremmeseng i bots

Sundhedsvæsen

Sundhedsvæsen

I denne meget volatile sektor kan CoT-anmodninger bruges til at forstå en virksomheds potentielle økonomiske bane, udføre risikovurderinger af kreditansøgere og mereChatbots, der er udviklet og implementeret til virksomheder, kræver nichefunktioner. De skal vise evner til at forstå forskellige inputformater. CoT-prompt fungerer bedst i sådanne tilfælde, hvor bots skal kombinere tekst- og billedprompter for at generere svar til forespørgsler.Fra diagnosticering af patienter ud fra sundhedsdata til generering af personlige behandlingsplaner for patienter, CoT-anmodning kan supplere sundhedsplejemål for klinikker og hospitaler.

Eksempel

Kundeforespørgsel: Jeg har bemærket en transaktion på min konto, som jeg ikke genkender, mit betalingskort er gået tabt, og jeg vil konfigurere advarsler for mine kontotransaktioner. Kan du hjælpe mig med disse problemer?

Trin 1: Identificer og kategoriser problemerne

  • Ikke anerkendt transaktion.
  • Tabt betalingskort.
  • Opsætning af transaktionsadvarsler.

Trin 2: Adresser den ikke-genkendte transaktion

Spørg for detaljer: Kan du oplyse dato og beløb for transaktionen?

  • Afdeling 1: Hvis der er angivet detaljer:
    • Gennemgå transaktionen. Hvis det er svigagtigt, så spørg, om kunden ønsker at bestride det.
  • Afdeling 2: Hvis ingen detaljer:
    • Tilbyd at give en liste over seneste transaktioner.

Trin 3: Adresser det mistede betalingskort

Frys kortet: Anbefal omgående nedfrysning.

  • Afdeling 1: Hvis kunden er enig:
    • Frys kortet og spørg, om de vil have en erstatning. Bekræft leveringsadresse.
  • Afdeling 2: Hvis kunden afslår:
    • Rådgive overvågning af kontoen for uautoriserede transaktioner.

Trin 4: Konfigurer transaktionsadvarsler

Vælg advarselsmetode: SMS, e-mail eller begge dele?

  • Afdeling 1: Hvis en kunde vælger:
    • Indstil advarsler for transaktioner over et angivet beløb. Spørg efter beløbet.
  • Afdeling 2: Hvis du er usikker:
    • Foreslå et standardbeløb (f.eks. $50), og bekræft.

Trin 5: Giv en oversigt og næste trin

  • Undersøgelse af den ikke-genkendte transaktion.
  • Indfrysning af betalingskortet og eventuelt udstedelse af en erstatning.
  • Opsætning af transaktionsadvarsler som anmodet.

Grundlag:

Denne proces adresserer effektivt flere kundeforespørgsler gennem klare trin og beslutningsgrene, hvilket sikrer omfattende løsninger.

Begrænsninger af CoT-anmodning

Begrænsninger af tilskyndelse til barneseng

Chain-of-thought er faktisk effektiv, men den er også underlagt den anvendelse, den anvendes på, og flere andre faktorer. Der er specifikke udfordringer forbundet med CoT-anmodning i AI der forhindrer interessenter i at udnytte deres potentiale fuldstændigt. Lad os se på de almindelige flaskehalse:

Overkomplicerede simple opgaver

Selvom CoT-prompt fungerer bedst til komplekse opgaver, kan det komplicere simple opgaver og generere forkerte svar. Til opgaver, der ikke kræver nogen begrundelse, fungerer modeller med direkte svar bedst.

Øget beregningsbelastning

Behandlingen af ​​CoT-prompting kræver betydelig beregningsbelastning, og hvis teknikken er implementeret på mindre modeller, der er bygget med begrænsede behandlingsevner, kan den overvælde dem. Konsekvenserne af sådanne implementeringer kan omfatte langsommere svartider, dårlig effektivitet, usammenhæng og meget mere.

Kvaliteten af ​​AI Prompt Engineering

CoT-opfordring i AI arbejder under antagelsen (eller princippet), at en specifik prompt er velartikuleret, struktureret og klar. Hvis en prompt mangler disse faktorer, mister CoT-prompten evnen til at forstå kravet, hvilket resulterer i generering af irrelevante sekventielle trin og i sidste ende svar.

Reducerede kapaciteter i stor skala

Interessenter kan opleve, at deres modeller kæmper, hvis de skal udnytte tankekæden til massive mængder af datasæt eller kompleksiteten af ​​problemer. For opgaver, der involverer større begrundelsestrin, kan teknikken sænke responstiden, hvilket gør den uegnet til applikationer eller brugssager, der kræver generering af svar i realtid.

CoT prompting er en fænomenal teknik til at optimere ydeevnen af Store sprogmodeller. Hvis sådanne mangler kan løses og løses gennem optimeringsteknikker eller løsninger, kan de give utrolige resultater. Efterhånden som teknologien udvikler sig, vil det være interessant at se, hvordan Chain-of-Thought-tilskyndelse udvikler sig og bliver enklere, men også mere niche.

Social Share