Stockholmsföretaget Bumbee Labs har utvecklat en mätmetod som kan följa hur människor rör sig i offentliga miljöer. Det är den enda mätmetoden i världen som är officiellt godkänd av en dataskyddsmyndighet. Därför gör företaget tummen upp till GDPR och andra åtgärder för att skydda den personliga integriteten.
Bumbee Labs affärsidé är att mäta besöksflöden genom att använda befintlig infrastruktur för wifi i allt från köpcenter, kontor, järnvägsstationer till bussar och andra offentliga miljöer. Företaget lyssnar – enkelt förklarat – efter mobiltelefoner som letar wifi-uppkoppling.
Visserligen är det inte nytt att räkna besökare. Kameror och laserbrytare vid butiksentréer har använts under många år för att detektera folk.
Staffan Liljestrand |
– Men det går inte att mäta flöden med det jag elakt kallar pling-plong i dörren eftersom du inte får den longitudinella kopplingen, säger Staffan Liljestrand, företagets analyschef och grundare, och fortsätter:
– Det är först när man förstår relationer mellan olika zoner som det går att förstå hur människor rör sig, exempelvis hur de byter buss eller var en specifik butik ska ligga i ett köpcenter.
Staffan Liljestrand drar parallellen med hur stora teleoperatörer försöker förstå flödet mellan telemaster som sitter separerade långt ifrån varandra. Genom att beskriva relationer i ett makroperspektiv kan de mäta flödet mellan städer eller olika delar av en större stad.
– Men för att denna tjänst ska bli verkligt attraktiv vill de också addera mikrodata. Där kommer vi in med vår wifi-data som vi samlar in.
För att nå ut brett satsar Bumbee Labs på att samarbeta med stora telekombolag. I Skandinavien och Baltikum är Telia den stora partnern idag. Genom tjänsten Crowd Insights kombinerar Telia mastdata med Bumbee Labs data.
Plus 21 miljoner i sommarBumbee Labs lockar telekomveteraner – det vittnar sommarens kapitalrunda om. I juni tog både Eirik Lunde och Mats Lindoff plats i företagets styrelse i samband med en nyemission som gav 21 miljoner kronor från framförallt investerare i Norge.Eirik Lunde, som bland annat varit vd för de tre telebolagen Nextgentel, Telio och Ventelo, har dessutom utsetts till ny ordförande i Bumbee Labs. Hans uppdrag är att tillsammans med företagsledningen dra igång samarbeten i USA, Europa och Asien. Idag har företaget ett tajt samarbete med Telia. Mats Lindoff känns främst igen från Sony Ericsson, där han var teknikchef. |
Den nämnda tjänsten kan exempelvis användas vid planering av en ny busslinje i en stad genom att rörelsemönster för passagerargrupper analyseras. För att skydda den personliga integriteten anonymiseras och aggregeras all data automatiskt innan den används.
– Vårt ip har att göra med att vi är det enda företaget i världen som är officiellt godkänt av en dataskyddsmyndighet. Då Datainspektionen, nu IMY.
Till saken hör att Bumbee Labs några år efter start tvingades ändra i sin mätmetod efter att Datainspektionen år 2015 bedömde att den dåvarande versionen bröt mot personuppgiftslagen (PUL). Datainspektionen ansåg att en Mac-adress, som är unik för varje dator, mobiltelefon eller annan pryl, ska räknas som en personuppgift.
– Idag är vår data anonymiserad enligt alla regler, medan alla andra wifi-analysbolag använder hashning och påstår sig hålla sig till integritetskrav. Men så är det inte, för vid hashning går det att återskapa data om man har krypteringsnyckeln.
– Det är bra för oss för idag är alla stora teleoperatörer medvetna om det. GDPR har gjort att de vet vad som krävs för privacy-godkännande.
Bumbee Labs metod bygger helt på en välkänd metod med många namn: statistisk modellering, statistisk inferens och statistiskt fingeravtryck är tre av de vanligare. Här handlar det om att skapa rörelsemönster – antal personer per tidsenhet som rör sig med en viss hastighet i en viss riktning – genom att plocka ut nycklar som aldrig går att återskapa.
– Vi jobbar med distribution av sannolikheter och skapar rörelsemönster i procentsats, typ att ”25 procent går ditåt”. Det gör att vår modell kommer till sin rätt i lite större sammanhang. Där det är mycket trafik och man tittar på flöden och olika relationer.
Detaljhandeln är en typisk tillämpning, men på senare år har även kontor dykt upp stort. Numera vill allt fler till exempel mäta kontorsytor för att förstå hur de används för att med den informationen mer effektivt kunna styra uppvärmning och kylning. Flygplatser, järnvägsstationer och bussterminaler är andra exempel.
Vanligen utnyttjar Bumbee Labs befintlig wifi-infrastruktur, även om det i vissa fall har använt egna accesspunkter. Idag stöder företaget nära nog alla stora routertillverkare för företagsnät, såsom Cisco, HP Aruba, Extreme Networks och Ruckus.
– Ska vi skala bolaget kan vi inte hålla på att installera egna grejer, utan då måste vi kunna samla in data från befintlig infrastruktur med bra accesspunkter, förklarar Staffan Liljestrand.
Bumbee Labs får access till styrenheten i nätet (cloud-controllern) genom sin samarbetspartner, kopplar därefter upp sig mot dess API och tankar över data som krävs (se text intill).
– Anledningen till att vi använder cloud-controllern för datainsamlingen är att de olika routertillverkarna gör på lite olika sätt.
Från cloud-controllern hämtar företaget bland annat information om var de olika accesspunkterna sitter: matsalszonen, kontorszon A, kontorszon B och så vidare.
Av två skäl görs alla beräkningar på historisk data. Dels går det inte att återge en koppling mellan olika zoner i realtid eftersom ingen vet hur folk planerar att gå. Dels skyddas den personliga integriteten ytterligare när det finns en tidsfördröjning på data.
På frågan vad som står överst på företagets att-göra-lista just nu svarar Staffan Liljestrand:
– Vår strategi på säljsidan är att skala med flera stora partners världen över. Det håller vi på med just nu och vi vet att vi har något unikt här.
Artikeln är tidigare publicerad i magasinet Elektroniktidningen. Prenumerera kostnadsfritt! |
När det gäller den tekniska utvecklingen är svaret försiktigare. Företaget arbetar dagligen med att förbättra och optimera systemet, och framförallt att effektivt hantera de enorma datavolymerna som skapas.
– Men om jag får drömma kan vi inom en överskådlig framtid förutsäga mycket mer genom att använda den historiska data vi har, kopplat till andra data. Vi har en del forskningscase där man är intresserade av att förstå hur exempelvis ett visst väder påverkar besök till ett visst ställe, säger han och fortsätter:
– Enkla resultat kan man visserligen göra med statistik genom att till exempel ta genomsnittet över åtta måndagar och se resultatet, men det är ju inte riktigt AI. Det vi vill göra är mycket mer träffsäkra skattningar.
Statistisk inferens ger rörelsemönsterBumbee Labs arbetar med statistisk inferens för att se rörelsemönster. I själva verket handlar det om att leverera volymer och procentsatser på hur grupper av människor rör sig.
– På nätet kallas konceptet statistisk fingerprinting eller wifi-fingerprinting, säger Staffan Liljestrand, och adderar: – Teoretiskt är det välkänt. Praktiskt är det svårt. Det är vår usp. Vi är duktiga på att lösa detta. Det hela går till så att när en mobiltelefon letar efter uppkoppling till ett wifi-nät, kanske i fickan på en person som vandrar i ett köpcentrum, skickar den ut en signal. Det är den Bumbee Labs lyssnar på. – Det finns ett antal parametrar som vi använder, men eftersom det är vårt ip vill jag inte gå närmare in på det, även om jag kan ge några exempel som är uppenbara. Han berättar att varje mätsampel anger vilken accesspunkt det kommer ifrån, en tidsstämpel samt ett RSSI-värde (signalstyrka). Likaså plockar företaget randomiserade fragment av mac-adressen som bland annat anger mobiltillverkare. – Vi tar ett antal nycklar som aldrig går att återskapas till riktig identitet. Det kallar man gruppklassificering, vi klassificerar grupper inte personer, och presenterar procentvärden på flöden. Anonymiseringsprocessen är momentan och irreversibel. En annan viktig detalj är att förstå hur många individer som inte upptäcks. Kanske har någon inte wifi påslaget på sin mobil eller inte ens en mobil med sig. Bortfallet skiljer sig mellan installationer. I Skandinavien är bortfallet generellt väldigt litet, här har vanligen runt 80 procent wifi påslaget. I Tyskland är borfallet lite högre. Även i USA och England ser det annorlunda ut, men marginellt. I Asien kan det skilja sig mer. Under de senaste fem åren har dessutom mobilerna utvecklats till att vara mindre aktiva när de inte används. – De pratar inte lika mycket i sovläge, det innebär att en mobil kanske inte fångas in om den bara är kort i en butik. Detta måste vi bygga in i våra modeller. Ständig träning är lösningen. – Vi måste göra mätningar på olika typer av installationer. Då använder vi det man inom AI och ML kallar ”ground truth”. Det betyder att vi använder andra typer av datakällor för att träna våra modeller. I exempelvis ett bussystem kan företaget använda viss entrédata för att matchar sin egen data för att hitta relevant extrapoleringsfaktor. Extrapoleringsmodellerna bygger på att hitta någon form av facit (”real world ground truth”). – Vi har ett system som kontinuerligt tränar och lär sig. Det beror av att det är uppdateringar i operativsystem och annat. – Däremot behöver vi inte träna alla installationer. Vi har olika templates, så i framtiden, om vi har 1 000 köpcentrum, kanske vi behöver träna tio procent. |