Op Google I/O 2024, de jaarlijkse ontwikkelaarsconferentie van Google, toonde Dennis Hassabis, het hoofd van Google DeepMind, een vroege versie van de formidabele multimodale AI van de technologiegigant: Project Astra.
Project Astra kan de wereld om u heen zien en begrijpen
De AI-assistent is het antwoord van Google op OpenAI’s GPT-4o, die maandag werd onthuld. Het bedrijf beweert dat zijn multimodale grote taalmodel (LLM) de wereld kan zien, weet wat de dingen zijn en waar je ze hebt achtergelaten, en een breed scala aan vragen kunt beantwoorden.
Tijdens de conferentie liet Hassabis het publiek een demovideo zien waarin een Astra-gebruiker op het hoofdkantoor van Google in Londen hem vroeg om te identificeren naar welk deel van een luidspreker hij keek en hoe deze functioneert, om de ontbrekende bril op te sporen en de code te beoordelen. Astra deed de klus in realtime terwijl hij voortdurend in gesprek was met de gebruiker.
Het meest indrukwekkende was dat het model er zelfs in slaagde om het deel van Londen waar de persoon zich bevond te identificeren door simpelweg de buitenomgeving door het raam te lezen.
De nieuwe multimodale AI-agent van Google kan informatie uit zowel het internet als de fysieke wereld rondom de gebruiker halen, door de lens van de smartphonecamera.
Er zijn ook andere interessante gebruiksscenario’s voor de Astra, zoals het vinden van uw auto op een grote parkeerplaats. In dat geval hoeft u Astra alleen maar te vertellen of te laten zien waar de auto zich bevindt, waarna het systeem u terug naar de exacte plek leidt.
Het kan fragmenten van een regel code bekijken en u vertellen waar de code voor dient, of een gedicht inlijsten, afhankelijk van hoe u zich op dat moment voelt.
Voorlopig bevindt Project Astra zich nog in de beginfase van testen en zijn er nog geen specifieke releasedata aangekondigd. Google heeft op de I/O 2024 laten doorschemeren dat sommige mogelijkheden van het AI-model zullen worden geïntegreerd in bestaande of aankomende producten die later dit jaar worden gelanceerd.
Google I/O 2024 stond in het teken van Gemini
Astra is slechts een van de vele Gemini-aankondigingen die Google dit jaar op zijn ontwikkelaarsconferentie deed.
Er is een nieuw model genaamd Gemini 1.5 Flash, dat is ontworpen om veelvoorkomende taken zoals tekstsamenvatting en ondertiteling sneller uit te voeren. Een generatief AI-videomodel genaamd Veo, dat video’s van hoge kwaliteit met een resolutie van 1080p van meer dan een minuut kan genereren in een breed scala aan visuele en filmische stijlen vanaf een tekstprompt. Gemini Nano, een AI die lokaal kan worden gebruikt op kleinere apparaten zoals smartphones, en de superverbeterde Gemini Pro die bij een vraag 2 miljoen mogelijkheden kan overwegen voordat hij antwoordt.
Veel van de producten die op de Google I/O werden aangekondigd, gingen erom gebruikers een gemakkelijkere en snellere manier te bieden om Gemini te benutten. Google heeft een nieuw product uitgebracht met de naam Gemini Live, een stemassistent waarmee je gemakkelijk heen en weer gesprekken met de AI kunt voeren, deze kunt onderbreken als deze langdradig wordt of terug kunt bellen naar eerdere delen van het gesprek.
Door Gemini aangedreven functies zijn ook te vinden op Google Lens, dat nu een functie heeft waarmee gebruikers op internet kunnen zoeken door een video op te nemen en te vertellen.
Hassabis beweert dat dit allemaal mogelijk is vanwege het grote contextvenster van Gemini, waardoor het in één keer toegang heeft tot een enorme hoeveelheid informatie. De CEO van DeepMind zegt dat dit vermogen cruciaal is voor de gebruiker om zich normaal en natuurlijk te voelen bij interactie met een AI.
Google Glass maakt een door AI aangedreven comeback
Bovendien werkt Google al samen met Samsung en Qualcomm om een AI-bril met camera te ontwikkelen. De Silicon Valley-gigant erkent dat AI een link mist die een brug kan slaan naar Extended Reality (XR)-technologieën zoals augmented reality (AR), virtual reality (VR) en mixed reality (MR).
Het is tien jaar geleden dat Google Google Glass uitbracht, een apparaat dat zijn tijd ver vooruit was. Zou het een grote AI-aangedreven comeback kunnen maken?
Laatste nieuws: Google Brengt Gemini Nano AI Naar Chrome