JavaScript is currently disabled.Please enable it for a better experience of Jumi. Han vill ge dina produkter en röst, med hjälp av AI

Framstegen inom generativ AI väntas leda till en explosion av konverserande gränssnitt. Mattias Falkendal på Stockholmskonsulten Talking to me har koll på utvecklingen.

Automatisk kundsupport. Katalogsökning med naturligt språk. Röstgränssnitt på apparater. Det är några idéer om var AI-drivna lösningar av Chat GPT-typ kan skapa bättre användargränssnitt.

Kundsupport är en naurlig nisch för konverserande gränssnitt. Minst 20 procent av alla samtal går att hantera automatiskt.

Elektroniktidningen gav sig ut på jakt efter en svensk konsult inom området konverserande gränssnitt – program som använder informellt naturligt språk i text eller röst. Vi hittade AI-byrån Talking to me i Stockholm.

– Den utveckling som skett under de senaste månaderna är otrolig, säger vd Mattias Falkendal.

Företaget registrerades 2018 och har idag tio anställda. Verksamheten är digitalisering, i olika former. Erfarenheten bland grundarna går ända tillbaka till när Internet föddes.

Artikeln är tidigare publicerad i magasinet Elektroniktidningen.
Prenumerera kostnadsfritt!

– Vi arbetar allmänt med teknologi som ligger lite, lite grand före kurvan, så att säga – i framkant.

Vad gäller konversationsgränssnitt ser han dem som en del i en allmän trend att gränssnitt blir mer och mer naturligt anpassade för människor.

– Söker man information – så frågar man någon. Man klickar inte ner sig djupt ner i någon hierarki av menyval.

– Det är tydligt att vi ser mer och mer konversationsgränssnitt. Och mer och mer av konversationen blir röst.

Talking to me såg en tillväxt på området redan innan Chat GPT knep rubrikerna. Omsättningen dubblades i fjol. Med Chat GPT har nu i princip alla fått upp ögonen för att det går att ställa frågor till datorer och få svar.

– Det är en helt ny typ av upplevelse. Det har lett till att företag börjat fundera på hur det kan utnyttjas.

Grundidén är samma som för Siri, Alexa, et al – att skapa AI-assistenter som kan hjälpa till att få saker och ting utförda. Talkings klienter vill underlätta för sina kunder.

Ganska länge var dialogteknik ganska enkel. Med assistenterna för några år sedan lyfte det. Och nu tas ett jättesprång.

– Det är ett sådant steg framåt att det nästan inte går att begripa. Även vi som redan jobbat med det här är fascinerade.

Många lösningar med ”gammel-AI” fungerar fortfarande utmärkt.

– Men den stora skillnaden med vågen nu, är att språkförståelsen är på en helt otrolig nivå. Du kan formulera dig nästan hur som helst och ändå uppfattar botten vad du vill. Så har det inte varit. Det är ett rejält skifte.

Talking to me gör ingen egen AI-utveckling av verktygen i sig utan skapar anpassade lösningar och appar. Idag arbetar företaget bland annat med prototyper och produkter baserade på GPT-4.

– De har fortfarande några steg kvar till att klara en levande produktionsmiljö.

Kan elektronikföretag ha nytta av AI-bottar?

– Ok, för att koppla till era läsare, så skulle teknologin till exempel kunna användas för att snabbare och smidigare söka efter produkter och komponenter som matchar varandra. Det är ett klassiskt problem, eller hur? Att navigera rätt i en djungel av artikelnummer.

– Istället kan användaren ställa direkta frågor, som till en människa – ”funkar den här komponenten med den här artikeln”? Det råkar vara ett bra tillämpningsområde för GPT-tekniken.

Chat GPT i sig är tränad på öppen data och har ingen aning om vilka komponenter som finns bland dina artiklar.

Det är där som Talking to me kan komma in och visa hur man skapar ett gränssnitt mot klientens egna system, som lager och order. En GPT-modell tränas på en databas över sortimentet. Efteråt kan den hantera frågor kring det.

Ett annat vanligt användningsområde är kundservice.

– Du får nya sätt att nå fram och interagera – automatiserade kundmöten av olika slag.

Målet är att ersätta klassiska användargränssnitt och deras kryssalternativ och filter, som kan vara komplexa och svåra att navigera.

– Det blir en helt annan snabbhet och smidighet – en bättre upplevelse.

Blir era bottar rumsrena och fria från hallucinationer?

– Det finns metoder för att hantera och minimera riskerna med detta. Som exempel så hämtar våra lösningar innehåll ur dokument och använder dem som källa, och inget annat. När man avgränsar på det viset blir det mycket lättare att säkerställa och kontrollera svaren.

Problem finns mest i de generella språkmodeller som tränas på gigantiska volymer data för att lära sig lite grand om allt.

– Det finns sätt att avgränsa, att få dem att inte svara frågor som ligger utanför det innehåll de fått. Du kan instruera dem om vad de får och inte får göra. Om du gör det minimerar du eller tar bort risken för konstiga svar.

Vilka jobb är det som er AI ersätter?

– Det jag snarare ser nu i första hand är inte att AI tar jobb. AI används för att skriva text, sammanfatta text, förstå tabeller.

Den stöder personalen och ersätter den inte. Mattias Falkendal beskriver AI av idag som ”amplified intelligence” snarare än artificiell.

– Sedan på sikt, visst, så kommer vissa uppgifter att påverkas. Så är det alltid med teknisk utveckling. Man ska vara medveten om att lösningar kan leda till effektiviseringar och nedskärningar.

– Men jag kan säga att i princip alla de projekt vi arbetat med snarare handlar om att frigöra tid för dem som inte hinner med i utgångsläget.

– De frigör tid för att göra det de är anställda för att göra, helt enkelt.

Han tar kundtjänst som exempel. Många av klienterna vill avlasta sin kundtjänst.

– Vi har alla varit med om att sitta i en telefonkö i 45 minuter. Så borde det inte vara år 2023. Minst 20 procent av alla samtal går direkt att hantera automatiskt och behöver inte bygga upp kön.

Hur adderar man röst?

– I princip samma dialog som du har via text kan du ha via röst. Det är en av fördelarna.

Det är bara att addera ytterligare två pusselbitar – text-till-tal och tal-till-text. Det sker en stor utveckling även på det området.

– Rösterna är inte robotröster längre utan knappt särskiljbara från riktiga röster,

– Vad gäller tal-till-text finns fortfarande utmaningar – som dialekt. Men även där sker en otroligt snabb utveckling.

Vad kommer att hända nu?

– Vi kommer att få se ”conversation everywhere”. Dialog kommer att vara det sätt du interagerar med datorer och datorprodukter. Jag tror att det kommer att göra skillnad snabbare än många tror.

Han pekar på hur Microsoft, Google, med flera skyndat sig att stoppa in GPT-tekniken i sina program och tjänster – med AI-assistenter och dialog.

Har ni kunder inom inbyggda system – robotar, gräsklippare, dammsugare, ugnar?

– Inte i dagsläget – inga fysiska produkter. Våra lösningar är främst inom mobilappar, webb, telefoni.

– Men tekniken är på väg till fysiska produkter och man kan absolut vända sig till oss. Vi är ledande inom dialoggränssnitt, vågar jag påstå.

– Jag tror det här är något vi kommer att få se, att det är på väg dit. Inte minst tal-till-text, att ge kommandon via röst. Som i miljöer där man vill ha händerna fria, som en bilverkstad.

– Fysiska produkter är bara ytterligare ett tillämpningsområde. Grundteknologin, den naturliga språkförståelsen är densamma.

Prenumerera på Elektroniktidningens nyhetsbrev eller på vårt magasin.


MER LÄSNING:
 
KOMMENTARER
Kommentarer via Disqus

Rainer Raitasuo

Rainer
Raitasuo

+46(0)734-171099 rainer@etn.se
(sälj och marknads­föring)
Per Henricsson

Per
Henricsson
+46(0)734-171303 per@etn.se
(redaktion)

Jan Tångring

Jan
Tångring
+46(0)734-171309 jan@etn.se
(redaktion)