Fråga till experten: Är det sant att sociala nätverk tittar på oss
Dmitry Kurkin
Svar på de största frågorna i USA vi brukade söka på nätet. I den nya serien av material frågar vi sådana frågor: brinnande, oväntat eller utbrett - till yrkesverksamma inom olika områden.
10 års utmaning flash mob, lanserad i sociala nätverk i början av året, skapade inte bara konspirationsteorier att kampanjens mål var att samla in foton av användare och träna dem för att känna igen ansiktsigenkänningssystemet, men också återigen få dem att tänka på hur mycket de vet om oss. sociala nätverk och tredje parter som arbetar med dem (från kommersiella företag till myndigheter).
Det faktum att teknikjättar samlar och analyserar de så kallade digitala fotspåren som lämnas av miljarder användare dagligen är ingen hemlighet för någon. Och medvetenheten om detta ger upphov till en ny typ av rädsla för "storebror": sociala nätverk vet mycket om oss, men vad om de vet för mycket om oss? Kan stora data användas för att ta reda på alla samband, smak, vanor hos en person, hans förflutna och nutid? Och i så fall, vilken skada kan vår önskan att umgås på nätet, för att vi frivilligt delar information om oss själva, orsaka oss?
Vi frågade experter om hur användardata behandlas av stora företag och hur stor risken är att erva på sociala nätverk.
Liliya Zemnukhova
Forskare vid Centrum för vetenskap och teknik Forskning vid Europeiska universitetet i St Petersburg
Ett digitalt fotavtryck innehåller alla möjliga typer av data - texter, bilder, ljud och videoinspelningar, geolokalisering och mycket metadata (till exempel gadgetmodell, mobiloperatör, operativsystem, dynamik och besökstid etc.). Och det är inte bara oss som fyller på vårt digitala fotavtryck. Sociala nätverk bildar oss som användare med hjälp av tre datakällor: det faktum att vi själva rapporterar om oss själva; som andra rapporterar om oss och vad som oftast sker utan vår vetskap. Särskilt ogenomskinlig sist. Vi läser som regel inte användaravtal och policy för insamling och användning av personuppgifter. Vi noterar bara att denna "svarta lådan" på något sätt påverkar vår användarupplevelse: målad annonsering, förslag från vänner, rekommendationer för musik, förfarandet för att lansera nyheter ... Vi bygger en liten del av den här erfarenheten själv när vi manuellt bygger nyhetsflödet, men i huvudsak algoritmer utför funktionerna inbäddade i standardprofilerna. Det är därför vi aldrig kommer att bli av med kontextuell reklam eller påträngande förslag från grupper eller (inte) vänner. Sociala nätverk som företag använder data om sina användare för kommersiella ändamål och erbjuder sin plattform för att sälja riktade innehåll. Och under tiden fortsätter de att samla in data om oss: till exempel, om du har betalat för annonsering minst en gång, finns även bankkortet och transaktionsdata hos företaget. Data kan också lämnas till myndigheter när det finns ett stort behov: till exempel samarbetar Facebook regelbundet med amerikanska myndigheter i enlighet med sin öppenhetspolitik.
Förutom den interna politiken för sociala nätverk finns ytterligare en viktig detalj: konton kan kopplas till hundratusentals andra tillämpningar och funktioner. Detta var till exempel orsaken till stora diskussioner förra året om tredje parts tillgång till användardata. Ett viktigt försök att reglera utvecklarnas frihet gjordes i Europeiska unionen - Allmänna dataskyddsbestämmelserna (GDPR) trädde i kraft förra året. Han bestämde sig för att inte överföra dataproblem, utan uppmärksammade användarna på denna fråga. Detta förpliktar oss inte att läsa alla användaravtal, men det får oss att tänka och åtminstone vara mer ansvariga för våra digitala fotspår och följa de grundläggande reglerna för digital hygien.
Valeria Karavaeva
datavetenskapare vid Spiking
Vi tänker ibland inte på hur många spår vi lämnar på webben och hur mycket senare hjälper det företag, inte bara sociala nätverk - även om sociala nätverk. Sociala nätverk samlar in data inte bara för sig själva, de kan sälja dem - jag vet det, eftersom jag arbetade på en reklambyrå och vi köpte data från Facebook. Och oftast vi, användarna, ger samtycke till detta utan att märka det. Människor spenderar hälften av sina liv på sociala nätverk och ger mycket information om sig själva.
Men det var möjligt att samla in data tidigare - så varför har du bara börjat prata om stora data bara nyligen? Först och främst, för att datakraften växer och följaktligen blir billigare. Huvudproblemet med stora data är inte hur man samlar in data - i princip kan vi alla idag samla och lagra terabytor av information - men hur man arbetar med dem. De flesta av de data som erhållits från sociala nätverk (text, röst, bilder, video) är inte strukturerade på något sätt, och därför är ingen data större än data. Nu, eftersom kraften och minnet har blivit billigare, har efterfrågan på neurala nätverk och djupt lärande ökat - vi lärde oss äntligen att bearbeta stora datamängder.
Ta till exempel bilder - och det här är verkligen stora data, de kan ge mycket information. Det finns miljontals bilder, men vad ska man göra med dem? Vilka fördelar kan utvinnas från dem? Vilka mönster låter de dig veta? Maskininlärning är faktiskt inte så långt borta. Det här är inte så enkelt som det verkar: det finns ingen sådan sak att du trycker på en knapp och i en vecka får hela beräkningarna.
Direkt maskininlärning föregås av mer komplicerade uppgifter. Samma bilder måste först behandlas på rätt sätt (till exempel beskurna, centrerade bilder, det här är viktigt för att lära sig) - det här är första etappen, som vanligtvis tar lång tid. Det andra steget är att välja en nätverksarkitektur som är lämplig för att lösa problemet. I stort sett bygger du tio olika neurala nätverk, och de ger tio olika resultat. Då behöver du på något sätt utvärdera resultaten. Och därefter kommer du med stor sannolikhet tillbaka till första etappen. Det är omöjligt att bygga ett universellt nätverk för någon uppgift: du bygger antingen den från början eller modifierar en befintlig. Ansiktsigenkänning är en uppgift, erkännandet av katter är en annan.
I processen med maskininlärning deltar vi också, utan att veta det. Till exempel introducerar captcha på webbplatser: med hjälp av captcha utbildade Google neurala nätverk för att digitalisera böcker.
Vi måste förstå att företag som samlar stora data inte är intresserade av våra personliga profiler. De behöver data om många olika människor som är intresserade av något specifikt. När det gäller de särskilda tjänsterna tycker jag att de kan samla in data utan att tillgripa sociala nätverk. Jag tror att vår rädsla för att vi övervakas snart kommer att passera. Det här är den nya världen: det är möjligt att inte spåra nätet, men det är svårt. Det är lättare att inte visas på webben alls.
FOTO: antonsov85 - stock.adobe.com