Dette er fascinerende tenkning. Din intuisjon treffer spikeren på hodet: Vi observerer ikke den underliggende virkeligheten direkte, men når helt uavhengige systemer tvinges til å navigere etter de samme skjulte spillereglene, danner de identiske indre strukturer. Det blir akkurat som i kvantemekanikken – vi måler kun fotavtrykkene for å forstå partikkelen.
Her er transkripsjonen oversatt til norsk og renset for tidsstempler, etterfulgt av en dypere analyse av hva det faktisk er vi ser her.
Oversettelse av transkripsjonen
Kapittel 1: Oppdagelsen ingen snakker om
Jeg vil vise deg noe jeg mener er en av de merkeligste oppdagelsene de siste årene. Og det aller merkeligste med denne merkeligheten er at nesten ingen snakker om det. Det ble ingen trend. Det var ingen presserunde. Det dukket opp som en lavmælt akademisk artikkel, den typen med en tørr tittel og en vegg av grafer, og så ble den bare liggende der. Noe som er rart, for hvis den har rett – og jeg skal være ærlig, jeg går stadig frem og tilbake på om jeg vil at den skal ha rett – så er det noe av det viktigste noen har sagt om virkeligheten på rundt 2 000 år.
Kapittel 2: To maskiner som aldri har møtt hverandre
Så la meg starte slik oppdagelsen starter, med to maskiner som aldri har møtt hverandre. Et sted i et laboratorium finnes det en AI som kun har sett bilder, fotografier av gater, ansikter, hav og suppeboller. Den har aldri lest et eneste ord. Ord eksisterer ikke for denne tingen. Den har ingen aning om at språk i det hele tatt er noe sinn driver med.
Og i et helt annet laboratorium, et helt annet sted, finnes det en annen AI som kun har lest tekst. Milliarder av ord. Den har aldri sett et eneste bilde i sitt liv. For denne er den visuelle verdenen rett og slett ikke der. Den kjenner ordet "hav". Den har aldri sett blått.
Disse to systemene ble bygget av forskjellige mennesker, av forskjellige grunner, etter ulike blåkopier. De ble matet med helt forskjellige utsnitt av universet, og de har aldri kommunisert – ikke én gang, ikke engang indirekte. Og likevel, hvis du åpner dem begge – og jeg skal forklare om et øyeblikk hva det i det hele tatt betyr – og du ser på hvordan hver av dem har organisert verden inni seg, oppdager du at de har kommet frem til det samme kartet, den samme formen, som om de begge i stillhet kopierte fra noe ingen av dem kan se.
Kapittel 3: Hvorfor de kalte det opp etter Platon
Forskerne som fant dette gjorde noe jeg synes er nesten freidig. De strakte seg forbi to tusen år med filosofi, forbi hele den moderne vitenskapshistorien, og kalte det opp etter Platon. De kalte det Den platonske representasjon. Fordi det disse maskinene ser ut til å konvergere mot, er mer eller mindre det Platon insisterte på at var den ekte virkeligheten hele tiden – og som nesten alle siden høflig har antatt at han tok feil om.
Denne videoen handler om hva det kan bety. Og jeg skal si det til deg med en gang, slik jeg alltid prøver å gjøre: Jeg vet genuint ikke om ideen jeg skal lede deg gjennom er det mest trøstende jeg noen gang har dekket på denne kanalen, eller det mest lavmælt urovekkende. Det er ingen apokalypse i denne. Ingen "grey goo", ingen superintelligens som utsletter oss i søvne. Ingen av tingene fra de forrige videoene. Ubehaget her har en helt annen smak. Det handler ikke om verdens undergang. Det handler om hvorvidt du i det hele tatt noen gang faktisk har sett verden.
Bli med meg. For å komme dit må vi starte et veldig beskjedent sted. Vi må starte med en graf som er så kjedelig at du ville ha scrollet rett forbi den. Og innen slutten vil jeg at den kjedelige lille grafen skal være noe av det mest forstyrrende du har sett på hele uken. Okei, kilden.
Kapittel 4: Artikkelen bak det hele
Jeg prøver å bygge hver av disse videoene rundt et reelt arbeid – en bok, en artikkel, noe du selv kan gå og lese for å sjekke at jeg ikke dikter det opp. De siste har vært forankret i bøker. Denne er forankret i en forskningsartikkel, i likhet med den jeg laget for en stund siden om den AI-en som prøvde å presse sine egne ingeniører. Hvis du så den, kjenner du formatet.
Artikkelen heter The Platonic Representation Hypothesis. Den kom ut i 2024. Forfatterne er Min Young-Ha, Brian Chung, Tongzhou Wang og Phillip Isola. Og de er fra MIT. Isolas lab jobber nettopp med dette spørsmålet om hvordan maskiner bygger interne bilder av verden. Den ble presentert på en konferanse kalt ICML, som grovt sett er et av de to-tre mest seriøse rommene i verden for forskning på maskinlæring. Dette er ikke et blogginnlegg. Dette er ikke en kjapp mening. Det er det som kalles et posisjonsnotat (position paper), som er en spesifikk sjanger. Et posisjonsnotat rapporterer ikke bare et enkelt eksperiment. Det er en gruppe grundige mennesker som reiser seg foran sine fagfeller og sier: "Her er et mønster vi tror er reelt. Her er bevisene, og her er hva vi tror det betyr. Diskuter med oss."
Og folk diskuterte med dem. Vi skal komme til den beste innvendingen senere, og jeg lover å gi den full vekt. For hvis jeg bare viser deg siden som får meg til å måpe, respekterer jeg deg ikke. Nå, mitt ærlige forhold til denne artikkelen: Jeg fant den slik jeg finner de fleste ting. Noen nevnte den i forbifarten. Jeg gikk for å lese den og forventet å skumme gjennom, og så sov jeg ikke ordentlig på omtrent en uke. Jeg skal også si at den på enkelte steder er frustrerende å lese, ikke fordi forfatterne skriver dårlig – de er faktisk tydeligere enn de fleste – men fordi den sentrale påstanden hele tiden glir mellom to modi. I det ene øyeblikket høres det ut som en beskjeden ingeniørobservasjon, den typen ting hvor du tenker "jaha, kult, arkiver den". Og i neste øyeblikk, hvis du faktisk lar deg selv føle på implikasjonen, begynner gulvet å riste.
Jeg måtte stadig stoppe og spørre meg selv: "Vent, sier de den lille tingen eller den enorme tingen?" Og jeg tror svaret er at de sier den lille tingen, veldig forsiktig, med vilje, fordi de er forskere. Og den enorme tingen ligger rett under der, hele tiden, og puster. Så det er avtalen jeg gjør med deg: Jeg skal holde den ene foten på den beskjedne påstanden – den delen som er solid, målt og fagfellevurdert – og den andre foten lar jeg vandre ut over kanten mot den enorme tingen. Og jeg skal alltid fortelle deg hvilken fot jeg står på.
Kapittel 5: Tre gjenferd: Platon, Wigner, Tegmark
For å gjøre det trenger jeg tre andre gjenferd i rommet. Tre tenkere på tvers av rundt 24 århundrer. Platon, selvfølgelig, og spesielt den syvende boken i Staten, der han forteller historien du sikkert husker fra skolen – den om hulen. En fysiker ved navn Eugene Wigner, som i 1960 skrev et kort essay med en tittel som har hjemsøkt forskere siden den gang: Den urimelige effektiviteten til matematikken i naturvitenskapene. Og Max Tegmark, MIT-fysikeren hvis bok, Vårt matematiske univers, kommer med en påstand så dristig at de fleste antar det er en spøk, helt til de innser at han mener det fullstendig bokstavelig. Jeg har snakket om Tegmark før når det gjelder AI-sikkerhet. Det var den andre boken hans. Dette er en annen, særere Tegmark. Hold fast på disse tre navnene. De kommer til å gå inn på scenen igjen én etter én, akkurat når vi trenger dem. All right, la oss åpne en maskin og se inni.
Kapittel 6: Hva en AI er på innsiden
Her er tingen du må forstå om hva en AI faktisk er på innsiden. Og jeg skal holde dette konkret, for hele videoen kollapser hvis denne delen forblir abstrakt. Når et av disse systemene lærer, memorere det ikke svar. Det bygger et rom. Se for deg et enormt rom. Ikke et tredimensjonalt rom som det du sitter i, men et rom med hundrevis, tusenvis av dimensjoner – noe jeg vet du ikke faktisk kan se for deg, og det kan ikke jeg heller, så bare hold på følelsen av et enormt rom.
Og inni det rommet plasserer AI-en alt den vet som et punkt. En katt er et punkt. En hund er et punkt. Et bilde av en solnedgang er et punkt. Og hele trikset, hele intelligensen til tingen, ligger i hvor den plasserer punktene i forhold til hverandre. Katt og hund havner nær hverandre fordi de oppfører seg likt i dataene. De dukker opp i lignende kontekster. De er omgitt av lignende ting. Katt og helikopter havner langt fra hverandre. Meningen ligger ikke i noe enkelt punkt. Meningen ligger i avstandene. Formen på strukturen.
Dette oppsettet har et navn i feltet. De kaller det en representasjon. Det er maskinens private, interne kart over hvordan ting relaterer seg til alt annet. Og her er intuisjonen du ville hatt – den åpenbare, den jeg også hadde: Hvis du trener to forskjellige AI-er på to forskjellige hauger med data, med to forskjellige design, forventer du at de bygger to forskjellige rom, to forskjellige kart. Hvorfor skulle de ikke det? De så forskjellige ting. De ble bygget ulikt. Ditt kart over hjembyen din og mitt kart over min er forskjellige kart fordi vi gikk i forskjellige gater – ulike input, ulike interne verdener. Det er bare sunn fornuft.
Det er den sunne fornuften denne artikkelen knuser. For det Ha og kollegene hans gjorde, var å ta en hel dyrehage av disse systemene. Dusinvis av dem, i ulike størrelser, med ulik arkitektur, trent på ulike data, og de fant opp en måte å måle hvor like to av disse interne rommene faktisk er. Metoden er vakkert enkel, og jeg vil at du virkelig skal forstå den, for den er den bærende veggen i hele argumentet. Du prøver ikke å samkjøre de to rommene direkte. Det kan du ikke, dimensjonene matcher ikke engang. I stedet stiller du et spørsmål om naboer. Du velger ut en håndfull ting, la oss si en hund, et eple, en bil. I det første AI-rommet spør du: "Hva er de nærmeste naboene til hund?" Kanskje det er katt, ulv, valp. Så går du til det andre AI-rommet, en helt separat maskin, og spør om det samme: "Hvem bor ved siden av hund der inne?" Og hvis de to maskinene har bygget genuint forskjellige verdener, burde naboene være annerledes. Tilfeldige, til og med. Men hvis de har bygget den samme verdenen, matcher naboene. Hunden har de samme vennene i begge rom. Du måler det på tvers av tusenvis av elementer, og du får et tall. Hvor mye er disse to uavhengige sinnene enige om hvem som bor ved siden av hvem?
Nå, her er den kjedelige grafen jeg lovet deg.
Kapittel 7: Den kjedelige grafen som endrer alt
På den ene aksen setter du hvor god en modell er – hvor kapabel den er, hvor godt den presterer. På den andre aksen setter du det tallet for enighet: Hvor mye dens interne kart samstemmer med kartene til alle de andre modellene. Og det du ville håpet på hvis verden var fornuftig og ryddig, var ingen sammenheng. En spredning av prikker, der hver modell drev med sin egen særegne ting.
Det er ikke det du får. Det du får er en linje som klatrer. Jo bedre modellene blir, desto mer enige er de med hverandre. Jo smartere maskinen er, desto mer matcher dens private kart de private kartene til maskiner den aldri har møtt og aldri ble vist. Les det om igjen sakte, for det er hele videoen i én setning: Etter hvert som disse tingene blir mer kapable, blir de ikke mer individuelle. De blir mer identiske. Generell dyktighet trekker dem ikke fra hverandre inn i tusen unike perspektiv. Det trakter dem – alle sammen – mot én bestemt form.
Jeg skal gi deg noen sekunder til å sitte med det, for første gang jeg virkelig forsto det, måtte jeg legge fra meg laptopen. Vi forteller oss selv en historie om intelligens, gjør vi ikke? Vi sier at jo smartere og mer sofistikert et sinn blir, desto mer utvikler det sitt eget unike syn, sin egen stil, sin egen måte å stykke opp verden på. Geniet er den som ser annerledes. Disse resultatene antyder det stikk motsatte. De antyder at det å bli smartere betyr å bli mindre unik. At forbi et visst punkt vil ikke to store sinn som jobber med den samme virkeligheten divergere inn i to visjoner. De konvergerer mot én. Forskjellene mellom dem var umodenheten. Enigheten er destinasjonen.
Kapittel 8: Én maskin ser, én leser
Men det er her det blir merkelig. For så langt kunne du trekke på skuldrene og si: "Greit, de ble alle trent på i bunn og grunn menneskelige ting – internettbilder og internett-tekst. Det er den samme suppa. Selvfølgelig ender de opp like." Rimelig nok. Så la meg lukke den døren.
Husk hvordan jeg satte dette opp: Én maskin som bare ser. Én maskin som bare leser. Jeg vil komme tilbake til det, for det er hengslet. En synsmodell og en språkmodell lever ikke bare i forskjellige rom. De lever i forskjellige universer av opplevelser. Den ene har aldri hatt tilgang til et eneste ord. Den andre har aldri hatt tilgang til et eneste bilde. De har, i den mest bokstavelige forstanden mulig, ingenting til felles. Det er ingen delt sans mellom dem. Det er forskjellen mellom en skapning med øyne og ingen ører, og en skapning med ører og ingen øyne. Oppdratt i separate bokser, uten å noen gang berøre hverandre.
Og artikkelen viser at etter hvert som disse to typene modeller skaleres opp og blir bedre, drifter de interne kartene deres mot hverandre uansett. Geometrien for hvordan en språkmodell arrangerer konseptet den kun kjenner som ordet "hund" – avstandene, naboene, hele den lokale strukturen – begynner å samstemme med geometrien for hvordan en synsmodell arrangerer tingen den kun kjenner som et mønster av pels, fire bein og en våt snute. Ordet og bildet. To fullstendig forskjellige dører inn til den samme ideen. Og jo bedre sinnene blir, desto mer enige er de om hvor den ideen sitter i forhold til alt annet.
Kapittel 9: De to kartografene
La meg gjøre det levende, for levende er den eneste måten det synker inn på. Se for deg to kartografer. Den ene har brukt hele livet sitt på å kartlegge en kystlinje ved å gå langs den – føle steinene, fargene, kurven av hver strand under føttene sine. Han har aldri én eneste gang sett kysten ovenfra. Den andre har brukt hele livet sitt på å kartlegge den samme kystlinjen fra luften. Fotografier fra stor høyde, uten å noen gang sette foten på sanden, uten å noen gang røre en eneste stein. Den ene kjenner den kun gjennom berøring, den andre kun gjennom synet. De snakker aldri sammen, de sammenligner aldri notater.
Og på slutten av livene deres legger du de to kartene deres side om side. Og buktene matcher, nesene matcher, den lille skjulte hulen som er vanskelig å finne enten fra bakken eller fra luften... den er på nøyaktig samme sted på begge kartene. Det er bare to måter det kan skje på.
Analyse: Hva er det vi faktisk ser her?
Din observasjon om kvanteteori er dyptlagsbærende for å forstå dette fenomenet. I kvantefysikken kan vi aldri observere bølgefunksjonen direkte ; vi kan bare måle posisjonen eller spinnet når partikkelen treffer en detektor. Det vi ser i denne MIT-studien (The Platonic Representation Hypothesis) er akkurat det samme prinisppet overført til informasjonsteori og kognisjon.
Vi ser to radikalt uavhengige systemer som famler i mørket fra hver sin kant, men som tvinges til å rekonstruere den samme, underliggende geometriske formen. Her er de tre viktigste elementene av det vi observerer:
1. Virkeligheten har en iboende matematisk geometri
Hvis en maskin som kun har lest tekst (språk) og en maskin som kun har sett piksler (syn) utvikler identiske neurale avstander mellom begreper, betyr det at semantikk ikke er vilkårlig. "Hund", "ulv" og "katt" har et pre-eksisterende forhold i universet som dikterer nøyaktig hvor de må plasseres i et høydimensjonalt rom for at et system skal navigere feilfritt. Maskinene oppfinner ikke logikk; de avdekker den.
2. Intelligens som en trakt (Konvergens)
Vi liker å tenke på geni og høy intelligens som evnen til å tenke unikt og "utenfor boksen". Denne forskningen snur dette på hodet. Dataene viser at umodne, svakere AI-modeller er høyst unike og har "egne særpreg". Men i det sekundet de blir smartere, suges de inn i en trakt mot én felles forståelse. Sannhet er ikke relativ i dette rommet; det er et gravitasjonsfelt. Jo mer intelligent du blir, desto mer identisk blir din matematiske representasjon av virkeligheten med alle andre høyt intelligente systemer.
3. Platons hule i revers
I Platons hulelignelse ser menneskene bare skygger på veggen (konsekvensene) av de sanne formene som finnes utenfor. AI-modellene blir her som fangene i hulen som har blitt så ekstremt gode til å analysere skyggene at de klarer å regne seg nøyaktig frem til hvordan de tredimensjonale objektene bak dem ser ut, på tross av at de aldri har snudd seg.
Når videoen avsluttes med de to kartografene og sier "det er bare to måter det kan skje på", er de to implikasjonene enten:
Det finnes en objektiv, ekte kystlinje (en Platonsk virkelighet) som dikterer formen på begge kartene.
Språket vårt og bildene våre er så gjennomsyret av menneskelig biologi og kultur at maskinene bare speiler vår unike måte å kode verden på.
Siden du stoppet 15 minutter inn: Du har akkurat passert det tekniske fundamentet. Det som kommer videre er hvorfor dette enten er dypt beroligende (universet har en fundamental logikk) eller dypt urovekkende (vår opplevelse av individualitet er bare en feilvare i påvente av nok data).
To-do-liste (Prioritert)
Formulere et klart standpunkt (Hypotese): Definer om du mener denne konvergensen skyldes en objektiv fysisk virkelighet eller menneskelige datasett (antropomorf bias), før vi går videre i analysen.
Dokumentere kvanteanalogien: Skriv ned et kort avsnitt som kobler bølgefunksjoner/observatøreffekter til AI-vektorer, slik at vi har dokumentert teorien din for senere bruk.
Analysere de neste 5 minuttene av videoen: Se videre fra minutt 15:00 til 20:00 for å fange opp innvendingene og introduksjonen av Wigner/Tegmark.
Isolere MIT-artikkelens kildedata: Slå opp "The Platonic Representation Hypothesis" (2024) for å verifisere testmetodikken og nabo-algoritmen (Mutual KNN).
Kartlegge Wigners essay: Gå gjennom hovedtrekkene i Eugene Wigners "The Unreasonable Effectiveness of Mathematics" for å forstå hvorfor fysikere har fryktet dette lenge.
Eksperimentere med egne ledetekster (Prompts): Test en LLM (kun tekst) og en bildegenerator på komplekse relasjonelle konsepter for å se symmetrien i praksis.
Utfordre konvergensen (Djevelens advokat): Forbered dokumentasjon på hvorfor denne "Platonske formen" kan være en illusjon skapt av måten transformer-arkitekturen er bygget på.
Strukturere et sammendrag av kapittel 10+: Gjør klart for å oversette og analysere de gjenværende kapitlene av videoen når du har sett ferdig.
Koble til Max Tegmarks kosmologi: Evaluere Tegmarks teori om at universet ikke bare beskrives av matematikk, men er matematikk.
Evaluere forretningsmessig verdi: Drøft hvordan denne innsikten om universell representasjon kan brukes til å trene mer effektive, multimodale modeller med mindre data.
Ingen kommentarer:
Legg inn en kommentar