LinkedIns Al-leder deler 3 træk ved top datavidenskabstalent

LinkedIn’s Al leader shares 3 traits of top data science talent

I et nyt interview med VentureBeat, Ya Xu, VP of engineering og chef for data og kunstig intelligens (AI) hos LinkedIn, er mere end glad for at dele sine tanker om alt fra hendes passion for at bringe videnskab og teknik sammen til de bedste egenskaber, hun leder efter, når hun interviewer datavidenskab talent.

Hun har langt mindre at sige om en New York Times artikel fra sidste weekend. Stykket fokuserede på en undersøgelse offentliggjort i Videnskab at “analyserede data fra flere randomiserede eksperimenter i stor skala på LinkedIns People You May Know-algoritme, som anbefaler nye forbindelser til LinkedIn-medlemmer, for at teste, i hvilket omfang svage bånd øgede jobmobiliteten i verdens største professionelle sociale netværk.” The Times sagde, at LinkedIn kørte “eksperimenter” på mere end 20 millioner brugere i løbet af fem år, der “selv om de havde til hensigt at forbedre, hvordan platformen fungerede for medlemmer, kunne have påvirket nogle menneskers levebrød.”

Ifølge Xu, som leder LinkedIns centraliserede datateam, der omfatter alle AI-, datavidenskabs- og privatlivsingeniørhold, involverede undersøgelsen “ingen eksperimentering.” I stedet fortalte hun VentureBeat, at forskningen “helt og holdent var baseret på observationel kausal undersøgelse – det betyder, at vi brugte banebrydende samfundsvidenskabelige metoder (de samme som vandt Nobelprisen i økonomi i 2021) til at analysere historiske data og opdage årsagsmønstre.”

En bro mellem forskning og produkt

Xu sagde, at hun tænker meget over de etiske implikationer af LinkedIn-forskning, især når det kommer til at bruge nye algoritmer og maskinlæringsarkitektur som GPT og Transformers. Samtidig er AI kernen i LinkedIn-produkter, som det er for så mange af nutidens virksomheder — så hun forklarede, at hendes filosofi er, at forskning og produktgrupper skal arbejde hånd i hånd for at imødekomme behovene hos virksomhedens tre forskellige kundeøkosystemer — jobsøgende og ansættelsesvirksomheder; B2B købere og sælgere; og vidensøgende/-producenter.

“Sand magi kommer virkelig, når vi kan skabe en meget tæt forbindelse og bro mellem forskningen og de praktiske anvendelser,” sagde hun.

Det starter med den organisatoriske struktur, hvor forskere og ingeniører arbejder sammen.

“Problemet i sig selv bør informere forskningsdagsordenen, men samtidig burde produktionsbegrænsningerne faktisk inspirere til selve forskningen,” forklarede hun. “For eksempel, hvis du ikke har nogen skalerbarhedsbegrænsninger, kan du komme med den mest komplicerede algoritme, men hvis du skal passe alt i denne hukommelse, skal du bruge denne form for beregningsmæssige begrænsninger, du har disse latensbegrænsninger, lige pludselig inspirerer og motiverer man faktisk forskningen til at blive lavet på en anden måde.”

3 toptræk ved LinkedIn data science talent

Denne samarbejdskultur kræver det rigtige datavidenskabstalent – Xu sagde, at der er tre vigtige ting, hun leder efter hos kandidater. For det første, er den enkelte mission-drevet og effekt-drevet?

“De vil gerne opnå noget i sidste ende,” forklarede hun. “De kan have en anden tilgang til at opnå det … men i sidste ende ønsker de at gøre det rigtige for medlemmer og kunder.”

Dernæst ønsker Xu at ansætte folk, der – ikke overraskende – samarbejder. De burde være dem, “der virkelig holder af hinanden, som virkelig respekterer folk, der kommer med forskellige færdigheder,” sagde hun. “Du ønsker ikke at ansætte personer, der siger ‘hej, jeg er den klogeste og den bedste og den smarteste, og ingen andre har ret’.”

Til sidst sagde Xu, at hun vil have folk, der er villige til at lære, tilpasse sig og forblive nysgerrige. “Ingen kan komme ind på dette felt og sige, ‘Jeg ved alt’,” sagde hun. ”Jeg mener, jeg havde min ph.d. i maskinlæringsstatistikker for 10 år siden, og hvis jeg sammenligner, hvad jeg gjorde, med det, der er [going on] i dag, åh gud, det er nat og dag,” sagde hun.

LinkedIns AI og data udfordringer

LinkedIns tre økosystemer skaber AI- og dataudfordringer, sagde Xu, fordi deres heterogenitet gør det svært at definere en “ægte nord”-værdi. “AI fungerer bedst, hvis du kan sige ‘Dette er den objektive funktion’ og optimere hen imod det,” sagde hun.

Det betyder, at der skal være en multi-objektiv optimeringsramme for AI, kompliceret yderligere af det faktum, at der er så mange forskellige personas involveret. “Det er en anden udfordrende ting at forstå, hvad deres behov er, og hvordan man balancerer disse forskellige behov,” sagde hun.

Til sidst, fra et teknisk synspunkt, kommer hver af disse personas med forskellige problemer på forskellige skalaer: “Vi har mange flere indlæg på LinkedIn, end vi har på for eksempel læringskurser,” sagde hun. “Og de kommer med forskellige latenskrav – du skal returnere annoncer inden for millisekunder, men du har meget mere fleksibilitet, når det kommer til, måske, en søgning returneret fra vores Sales Navigator eller anbefalinger via e-mail.”

AI-muligheder og ansvarlig AI

De seneste AI-fremskridt, såsom store sprogmodeller inklusive GPT-3, giver LinkedIn muligheder for at binde sine markedspladser sammen med fælles teknologi, der kan bruges over hele linjen, sagde Xu.

“Uanset om det er et feed-indlæg, en jobbeskrivelse eller et medlems profil, kan vi forstå den tekst meget bedre, og vi kan så kortlægge emner, som et indlæg handler om eller måske jobkompetencer og så koble det tilbage til det, som dette medlem leder efter,” sagde hun og tilføjede, at fremskridt inden for algoritmer, hardware og software vil være et centralt fokus overordnet i at fremme LinkedIns AI og dataambitioner.

Hun tilføjede, at der nu også findes bedre teknologiske metoder til bedre at måle AI-retfærdighed i LinkedIns feedanbefalinger eller forbindelsesanbefalinger.

Retfærdighed er dog kun et område, LinkedIn investerer i, når det kommer til ansvarlig AI ved hjælp af Microsofts Responsible AI-ramme.

“På retfærdighedsområdet presser vi hele tiden på for både måling og afbødning – hvordan kan vi forstå, hvordan vores algoritme klarer sig i forhold til det, den er beregnet til?” hun sagde. “Og så afbødning er, hvis vi identificerer områder, hvor der er huller, hvad er de tilgange, vi kan gøre for at afbøde det?”

Gennemsigtighed er et andet fokusområde. om at forklare, hvad algoritmer gør, sagde hun: “Kan de modelbyggere, der bygger disse algoritmer, forklare dem for udviklerne? Kan vi så forklare det for de brugere, der interagerer med algoritmer?”

Det er et “meget udfordrende” rum, indrømmer hun: “Men det er virkelig, virkelig spændende fra et teknologisk synspunkt.”

Posten LinkedIns Al-leder deler 3 træk ved top datavidenskabstalent dukkede op først Venture Beat.

Loading...