Duke datalog vinder 'Nobelprisen' til en værdi af $1M for kunstig intelligens arbejde

Udgivelsesdato:

af Ken Kingery

Uanset om man forhindrer eksplosioner på elektriske net, opdager mønstre blandt tidligere forbrydelser eller optimerer ressourcer i behandlingen af kritisk syge patienter, så vil computerforsker Cynthia Rudin fra Duke University have kunstig intelligens (AI) til at vise sit arbejde. Især når det handler om at træffe beslutninger, der dybt påvirker folks liv.

Mens mange forskere inden for det udviklende område af maskinlæring var fokuseret på at forbedre algoritmer, ønskede Rudin i stedet at bruge AI's magt til at hjælpe samfundet. Hun valgte at forfølge mulighederne for at anvende maskinlæringsteknikker på vigtige samfundsproblemer og indså i processen, at AI's potentiale bedst frigøres, når mennesker kan kigge ind og forstå, hvad det laver.

Nu, efter 15 års fortaler for og udvikling af "fortolkelige" maskinlæringsalgoritmer, der gør det muligt for mennesker at se inde i AI, har Rudins bidrag til feltet givet hende $1 million Squirrel AI Award for Artificial Intelligence til gavn for menneskeheden fra Association for Advancement of Artificial Intelligence (AAAI). AAAI blev grundlagt i 1979 og fungerer som det fremtrædende internationale videnskabelige samfund, der betjener AI-forskere, praktikere og undervisere.

"Kun verdenskendte anerkendelser, såsom Nobelprisen og AM Turing Award fra Association of Computing Machinery, bærer pengebelønninger på million-dollar niveau. Professor Rudins arbejde fremhæver vigtigheden af gennemsigtighed for AI-systemer i højrisikodomæner. Hendes mod til at tackle kontroversielle spørgsmål fremhæver vigtigheden af forskning for at løse kritiske udfordringer i ansvarlig og etisk brug af AI."

YOLANDA GIL

Rudin, professor i datalogi og teknik ved Duke, er den anden modtager af den nye årlige pris, finansieret af onlineuddannelsesvirksomheden Squirrel AI for at anerkende præstationer inden for kunstig intelligens på en måde, der kan sammenlignes med toppriser inden for mere traditionelle områder.

Hun bliver citeret for "banebrydende videnskabeligt arbejde inden for fortolkelige og gennemsigtige AI-systemer i implementeringer i den virkelige verden, fortalervirksomhed for disse funktioner på meget følsomme områder som social retfærdighed og medicinsk diagnose, og fungerer som en rollemodel for forskere og udøvere.”

"Kun verdenskendte anerkendelser, såsom Nobelprisen og AM Turing-prisen fra Association of Computing Machinery, bærer pengebelønninger på million-dollar niveau," sagde formanden for AAAI-prisens udvalg og tidligere præsident Yolanda Gil. “Professor Rudins arbejde fremhæver vigtigheden af gennemsigtighed for AI-systemer i højrisikodomæner. Hendes mod til at tackle kontroversielle spørgsmål fremhæver vigtigheden af forskning for at løse kritiske udfordringer i ansvarlig og etisk brug af AI."

Rudins første anvendte projekt var et samarbejde med Con Edison, energiselskabet, der er ansvarlig for at drive New York City. Hendes opgave var at bruge maskinlæring til at forudsige, hvilke brønde der var i risiko for at eksplodere på grund af nedbrydende og overbelastede elektriske kredsløb. Men hun opdagede hurtigt, at uanset hvor mange nyligt offentliggjorte akademiske klokker og fløjter hun føjede til sin kode, kæmpede den for at forbedre ydeevnen meningsfuldt, når den blev konfronteret med udfordringerne ved at arbejde med håndskrevne noter fra koordinatorer og regnskaber fra Thomas Edisons tid.

"Vi fik mere nøjagtighed fra simple klassiske statistikteknikker og en bedre forståelse af dataene, mens vi fortsatte med at arbejde med dem," sagde Rudin. "Hvis vi kunne forstå, hvilken information de prædiktive modeller brugte, kunne vi bede Con Edisons ingeniører om nyttig feedback, der forbedrede hele vores proces. Det var fortolkningen i processen, der hjalp med at forbedre nøjagtigheden i vores forudsigelser, ikke nogen større eller mere avanceret maskinlæringsmodel. Det var det, jeg besluttede mig for at arbejde på, og det er fundamentet, som mit laboratorium er bygget på.” https://www.youtube.com/embed/PwLN5irdMT8?wmode=opaque&wmode=opaque

I løbet af det næste årti udviklede Rudin teknikker til fortolkelig maskinlæring, som er prædiktive modeller, der forklarer sig selv på måder, som mennesker kan forstå. Mens koden til at designe disse formler er kompleks og sofistikeret, kan formlerne være små nok til at blive skrevet i et par linjer på et kartotekskort.

Rudin har anvendt sit mærke af fortolkelig maskinlæring til adskillige effektfulde projekter. Sammen med samarbejdspartnerne Brandon Westover og Aaron Struck på Massachusetts General Hospital og sin tidligere studerende Berk Ustun designede hun et simpelt punktbaseret system, der kan forudsige, hvilke patienter der har størst risiko for at få destruktive anfald efter et slagtilfælde eller anden hjerneskade. Og sammen med sin tidligere MIT-studerende Tong Wang og Cambridge Police Department udviklede hun en model, der hjælper med at opdage fællestræk mellem forbrydelser for at afgøre, om de kan være en del af en serie begået af de samme forbrydere. Det open source-program blev til sidst grundlaget for New York Police Departments Patternizr-algoritme, et kraftfuldt stykke kode, der afgør, om en ny forbrydelse begået i byen er relateret til tidligere forbrydelser.

"Cynthias engagement i at løse vigtige problemer i den virkelige verden, ønske om at arbejde tæt sammen med domæneeksperter og evne til at destillere og forklare komplekse modeller er uden sidestykke," sagde Daniel Wagner, viceinspektør for Cambridge Police Department. "Hendes forskning resulterede i betydelige bidrag til feltet kriminalitetsanalyse og politi. Mere imponerende er hun en stærk kritiker af potentielt uretfærdige 'black box'-modeller inden for strafferetsplejen og andre områder med høj indsats, og en intens fortaler for gennemsigtige fortolkbare modeller, hvor nøjagtige, retfærdige og bias-fri resultater er afgørende."

Black box-modeller er det modsatte af Rudins gennemsigtige koder. Metoderne anvendt i disse AI-algoritmer gør det umuligt for mennesker at forstå, hvilke faktorer modellerne afhænger af, hvilke data modellerne fokuserer på, og hvordan de bruger dem. Selvom dette måske ikke er et problem for trivielle opgaver, såsom at skelne en hund fra en kat, kan det være et stort problem for beslutninger med høj indsats, der ændrer folks liv.

"Cynthias forpligtelse til at løse vigtige problemer i den virkelige verden, ønske om at arbejde tæt sammen med domæneeksperter og evne til at destillere og forklare komplekse modeller er uden sidestykke. Hendes forskning resulterede i betydelige bidrag til området for kriminalitetsanalyse og politiarbejde. Mere imponerende er hun en stærk kritiker af potentielt uretfærdige 'black box'-modeller inden for strafferetsplejen og andre områder med høj indsats, og en intens fortaler for gennemsigtige fortolkbare modeller, hvor nøjagtige, retfærdige og bias-fri resultater er afgørende."

DANIEL WAGNER

"Cynthia ændrer landskabet for, hvordan AI bruges i samfundsmæssige applikationer ved at omdirigere indsatsen væk fra black box-modeller og mod fortolkbare modeller ved at vise, at den konventionelle visdom - at sorte bokse typisk er mere nøjagtige - meget ofte er falsk," sagde Jun Yang , formand for datalogiafdelingen hos Duke. "Dette gør det sværere at retfærdiggøre at udsætte enkeltpersoner (såsom tiltalte) for black-box-modeller i situationer med høj indsats. Fortolkningen af Cynthias modeller har været afgørende for at få dem vedtaget i praksis, da de muliggør menneskelige beslutningstagere i stedet for at erstatte dem.”

Et virkningsfuldt eksempel involverer COMPAS – en kunstig intelligens-algoritme, der bruges på tværs af flere stater til at træffe afgørelser om frigivelse af kaution, som i en ProPublica-undersøgelse blev beskyldt for delvist at bruge race som en faktor i sine beregninger. Anklagen er dog svær at bevise, da detaljerne i algoritmen er proprietære oplysninger, og nogle vigtige aspekter af analysen fra ProPublica er tvivlsomme. Rudins team har vist, at en simpel fortolkelig model, der afslører præcis, hvilke faktorer den tager i betragtning, er lige så god til at forudsige, om en person vil begå en anden forbrydelse eller ej. Dette rejser spørgsmålet, siger Rudin, om, hvorfor black box-modeller overhovedet skal bruges til denne type beslutninger med høj indsats.

Ændringshastighed · Åbning af den sorte boks

"Vi har systematisk vist, at for høj-satsede applikationer er der intet tab i nøjagtighed for at opnå fortolkning, så længe vi optimerer vores modeller omhyggeligt," sagde Rudin. "Vi har set dette for strafferetlige afgørelser, adskillige sundhedsbeslutninger, herunder medicinsk billeddannelse, beslutninger om vedligeholdelse af elnet, beslutninger om finansielle lån og mere. At vide, at dette er muligt, ændrer den måde, vi tænker på AI som ude af stand til at forklare sig selv."

Gennem hele sin karriere har Rudin ikke kun skabt disse fortolkbare AI-modeller, men udviklet og udgivet teknikker til at hjælpe andre med at gøre det samme. Det har ikke altid været nemt. Da hun først begyndte at udgive sit arbejde, eksisterede udtrykkene "data science" og "tolkbar maskinlæring" ikke, og der var ingen kategorier, som hendes forskning passede pænt ind i, hvilket betyder, at redaktører og anmeldere ikke vidste, hvad de skulle gøre med det. Cynthia fandt ud af, at hvis et papir ikke beviste teoremer og hævdede, at dets algoritmer var mere nøjagtige, var det - og er det ofte stadig - sværere at publicere.

"Jeg har haft enorm beundring for Cynthia fra meget tidligt af, for hendes ånd af uafhængighed, hendes beslutsomhed og hendes ubarmhjertige stræben efter sand forståelse af alt nyt, hun stødte på i klasser og papirer. Selv som kandidatstuderende var hun en samfundsbygger, der stod op for andre i sin årgang."

INGRID DAUBECHIES

Da Rudin fortsætter med at hjælpe folk og udgive hendes fortolkelige designs – og efterhånden som flere bekymringer fortsætter med at dukke op med black box-kode – begynder hendes indflydelse endelig at vende skibet. Der er nu hele kategorier i maskinlæringsjournaler og konferencer, der er viet til fortolkeligt og anvendt arbejde. Andre kolleger på området og deres samarbejdspartnere fortæller, hvor vigtig fortolkning er for at designe pålidelige AI-systemer.

"Jeg har haft enorm beundring for Cynthia fra meget tidligt af, for hendes ånd af uafhængighed, hendes beslutsomhed og hendes ubarmhjertige stræben efter sand forståelse af noget nyt, hun stødte på i klasser og papirer," sagde Ingrid Daubechies, James B. Duke Distinguished Professor i matematik og elektro- og computerteknik, en af verdens førende forskere inden for signalbehandling og en af Rudins ph.d.-rådgivere ved Princeton University. "Selv som kandidatstuderende var hun en samfundsbygger, der stod op for andre i sin årgang. Hun fik mig til maskinlæring, da det ikke var et område, hvor jeg overhovedet havde nogen ekspertise, før hun blidt, men meget vedholdende skubbede mig ind i det. Jeg er så meget glad for denne vidunderlige og meget fortjente anerkendelse til hende!"

"Jeg kunne ikke være mere begejstret for at se Cynthias arbejde hædret på denne måde," tilføjede Rudins anden ph.d.-rådgiver, Microsoft Research-partner Robert Schapire, hvis arbejde med "boosting" var med til at lægge grundlaget for moderne maskinlæring. "For hendes inspirerende og indsigtsfulde forskning, hendes selvstændige tænkning, der har ført hende i retninger, der er meget forskellige fra mainstream, og for hendes mangeårige opmærksomhed på spørgsmål og problemer af praktisk, samfundsmæssig betydning."

Rudin opnåede bachelorgrader i matematisk fysik og musikteori fra universitetet i Buffalo, før hun afsluttede sin ph.d. i anvendt og beregningsmæssig matematik ved Princeton. Hun arbejdede derefter som National Science Foundation-postdoktor ved New York University og som associeret forsker ved Columbia University. Hun blev lektor i statistik ved Massachusetts Institute of Technology, før hun kom til Dukes fakultet i 2017, hvor hun har ansættelser inden for datalogi, elektro- og computerteknik, biostatistik og bioinformatik og statistisk videnskab.

Hun er tre gange modtager af INFORMS Innovative Applications in Analytics Award, som anerkender kreative og unikke anvendelser af analytiske teknikker, og er fellow i American Statistical Association og Institute of Mathematical Statistics.

"Jeg vil gerne takke AAAI og Squirrel AI for at skabe denne pris, som jeg ved vil være en game-changer for feltet," sagde Rudin. "At have en 'Nobelpris' til AI for at hjælpe samfundet gør det endelig klart uden tvivl, at dette emne - AI arbejder til gavn for samfundet - faktisk er vigtigt."

(C) Duke University 

Oprindelig kilde: WRAL TechWire