Kunstig intelligens-nyheter fra Google
På Googles årlige I/O-arrangement kom de med en rekke nyheter som viser at de fortsatt er en av de viktigste aktørene innen kunstig intelligens. Men selskapet sliter med å finne balansen mellom å bruke kunstig intelligens på en ansvarlig måte, og å stå i mot forventningspresset som er skapt etter at OpenAI og Microsoft lanserte ChatGPT og nye Bing.
Google har i årevis vært en av de fremste utviklerne av avanserte kunstig intelligens-teknologier. De har imidlertid vært forsiktige med å gjøre teknologien tilgjengelig for vanlige folk. Søkemotoren, Google Maps, Google Translate har i årevis bruk kunstig intelligens til å tilby gode tjenester til brukerne, og en del av modellene har vært tilgjengelige for utviklere gjennom Google Cloud. Men rene KI-tjenester for publikum har de holdt seg unna. Frem til nå.
Les mer om kunstig intelligens her.
Med verktøy som DALL-E og ChatGPT har publikum fått se i praksis hvor avanserte de store bilde- og språkmodellene har blitt. Men de har også synliggjort svakheter og potensielle problemer med teknologien. Google hadde nok foretrukket å kunne jobbe mer med å forbedre modellene før de åpnet dem for publikum, men OpenAI og Microsoft har tvunget Google til å kaste seg rundt.
Her er noen av produktene de presenterte på onsdagen I/O-konferanse.
Bard
Chatroboten Bard er Googles svar på ChatGPT. Den nye versjonen av Bard kjører på PaLM 2 språkmodellen, og har fått en rekke nye funksjoner. Ved siden av at den nye språkmodellen gjør at Bard har blitt mye mer avansert, er den også integrert med Adobes bildegenerator Firefly for å kunne kombinere bilder og tekst.
I tillegg til å generere tekst, vil Bard hente inn bilder i resultatene der det er relevant. Ber du for eksempel om en liste over de største attraksjonene i Oslo, vil svaret fra Bard inneholde bilder av attraksjonene i tillegg til beskrivelsen.
Du kan også laste opp et bilde, og be Bard beskrive innholdet i bildet.
Gjennom integrasjonen med Adobe Firefly kan du be Bard om å lage bilder også. Det fungerer omtrent som DALL-E, Stable Diffusion og andre bildenmodeller.
Er du utvikler, kan Bard hjelpe deg med å skrive, analysere og feilsøke datakode på 20 ulike programmeringsspråk.
Bard blir nå tilgjengelig over hele verden, bortsett fra i EU og Norge. Det skal visstnok skyldes GDPR, og at Google vil avklare at Bard ikke bryter de europeiske personvernreglene før de lanserer den her også.
PaLM 2 språkmodell
PaLM 2 er Googles nye språkmodell, som blant annet Bard er bygget på. Ved siden å være mye større enn forgjengeren (den største versjonen av PaLM 2 skal visstnok ha 540 milliarder parametre), har Google lagt vekt på å trene PaLM 2 på logikk, matematikk og resonnering, områder som GPT og andre språkmodeller har slitt med. Den skal og kunne 20 ulike programmeringsspråk.
Språkmodellen skal være trent på over 100 ulike språk, inkludert norsk. Ifølge den tekniske dokumentasjonen er 0,67% av den internasjonale teksten PaLM 2 er trent på norsk.
PaLM 2 kommer i fire ulike størrelser, hvor den minste skal være så kompakt at den kan kjøre på en mobiltelefon.
Google har også laget versjoner av PaLM 2 som er spesielt trent på ulike fagområder. Med-PaLM 2 er trent på medisinsk tekst. I tillegg til å tolke og skrive medisinske tekster, skal den også integreres med bildemodeller, for å kunne analysere for eksempel røntgenbilder.
KI-baserte søkeresultater
Googles nye søkeopplevelse bruker språkmodellen til å gi deg et sammendrag av innholdet i søkeresultatene. På samme måte som med Bard, kan du ha en dialog med søkemotoren for å få den til å gi deg nøyaktig det du er ute etter. Google vil også gi deg forslag til spørsmål du kan stille for å spesifisere søket bedre.
Du vil fortsatt finne de vanlige ti lenkene nedenfor teksten fra den kunstige intelligensen, så du kan klikke deg inn på de aktuelle nettsidene. Du vil også se referanser til kilder i den KI-genererte teksten.
Søket er også integrert med Google Shopping, så du får opp forslag til hvilke nettbutikker du finner ulike produkter i.
KI-verktøy i Android
Snart kan du lage dine egne bakgrunner i Android med generativ kunstig intelligens. Fortell Android hva slags bakgrunn du ønsker deg, så lager den kunstige intelligensen unike bilder for deg. Når du velger en bakgrunn, vil Android justere fargepalletten på resten av telefonen til den nye bakgrunnen din.
Du kan også ta et bilde og får den kunstige intelligensen til å gjøre den om til et 3D-bilde som du kan bruke som bakgrunn. Liker du emojis, kan du også lage din egen emoji-bakgrunn.
Magic Compose
Bruker du Google Messages-appen, kan kunstig intelligens hjelpe deg med formuleringen av meldinger du skriver. Skriv meldingen, og velg en av stemningsknappene for å få hjelp til å lage meldingen mer engasjert, mer chill, som om den var skrevet av Shakespeare og så videre.
Magic Compose vil lanseres i beta senere i sommer.
Bilderedigering med kunstig intelligens
Bruker du Google Photos, kan du bruke Magic Editor til å redigere bildet ved hjelp av kunstig intelligens. Du kan for eksempel fjerne eller flytte objekter i bildet, og så vil den kunstige intelligensen fylle inn tomrommet i bildet automatisk.
Magic Editor kan også synkronisere farger og lys og endre himmelen eller andre objekter.
Help me write for Gmail
Når du mottar en epost i Gmail, kan du be den kunstige intelligensen om å lage forslag til svar for deg. Gi den kunstige intelligensen noen hint om hva du vil at svaret skal inneholde, så formulerer den et svar, basert på innholdet i den opprinnelige eposten og dine instruksjoner.
Duet AI for Workspace
Duet AI for Google Workspace er Googles intelligente assistent for de som bruker kontorverktøyene i Google Workspace. Enten du skal skrive en tekst i Docs, lage et regnerak i Sheets eller en presentasjon i Slides, kan Duet AI hjelpe deg i gang med tekst og bilder.
Duet AI er ikke tilgjengelig i Norge ennå.
Immersive View på ruter
Immersive View er en funksjon i Google Maps som lar deg utforske steder og bygninger i naturtro 3D. Nå utvides denne funksjonen til ruter du planlegger i Maps. Ber du Maps om å foreslå en rute fra A til B, kan du nå «fly» gjennom ruten med Immersive View, som om du var en drone.
Immersieve View blir i første omgang tilgjengelig i femten utvalgte byer.
MusicLM
MusikLM er en lydmodell som lar deg skape musikk fra tekst. Fortell MusicLM hva slags musikk du vil ha, så lager den musikken for deg. Du kan beskrive type musikk, stemning og ulike instrumenter du vil ha med. Vil du ha flere alternativer, kan MusicLM lage flere versjoner til deg.
Andre produkter
I tillegg til alle KI-produktene, lanserte Google en rekke andre produkter.
De lanserte tre nye telefonmodeller; budsjettmodellen Pixel 7a, den utbrettbare Pixel Fold og nettbrettet Pixel Tablet.
Wear OS 4 er den nye versjonen av operativsystemet for smartklokker og wearables.
Vil du ha enda flere detaljer om nye produkter, kan du lese Googles egen oversikt over «100 ting vi lanserte på I/O 2023».
Alle bilder: Google.
1 Response
[…] Jeg har skrevet en egen sak om Googles lanseringer her. […]