arrow_backVoltar

Google I/O 2024

Do Veo, a Gen AI de vídeos, à nova busca

14.05.24

Mal foi anunciada a evolução do principal modelo de IA da OpenAI, o GPT-4o, tão aprimorado que chega a parecer um assistente pessoal (leia aqui), e o mercado já recebe mais uma novidade na acelerada corrida das big techs em torno da inteligência artificial. Nesta terça-feira, 14, durante o Google I/O, um dos eventos que mais chama atenção dos desenvolvedores, foram apresentadas as armas da companhia nesse segmento. Entre elas estão o Veo, ferramenta de IA generativa para vídeos, e o Project Astra... que pretende funcionar como um assistente pessoal.

E é claro que houve anúncios para o Gemini, o principal modelo de IA do Google, antes conhecido como Bard. A empresa conta agora com o Gemini 1.5 Flash, otimizado para tarefas de alto volume e alta frequência em escala. É mais leve que o 1.5 Pro (lançado em fevereiro) e é apontado como “excelente em resumos, aplicativos de bate-papo, legendagem de imagens e vídeos, extração de dados de documentos e tabelas longas”. o Google explica que ele consegue tudo porque foi treinado pelo 1.5 Pro por meio de um processo chamado destilação, no qual o conhecimento e as habilidades mais essenciais de um modelo maior são transferidos para um modelo menor e mais eficiente.

O Gemini Nano, versão da IA para Android, ganhou mais recursos. A partir do Pixel, ainda neste ano, o modelo com multimodalidade será capaz de processar inputs de texto e também entender informações e contextos por meio da visão, do som e da linguagem falada.

A integração do Gemini com outros produtos do Google também está maior. No caso do Google Fotos, quem for assinante poderá encontrar imagens a partir da descrição do que está buscando. No Google Meet, a IA fará um resumo dos principais assuntos discutidos.

A busca, serviço que deu origem à companhia, estará incrementada pela IA. Hoje, a tecnologia já está gerando respostas quando o usuário faz uma pergunta na barra de search. Mas o recurso foi aprimorado a partir de um experimento conhecido antes como "Search Generative Experience" (SGE). Ele foi rebatizado como “IA Overview” - ou “Resumos de IA”, em português. “Com os Resumos de IA, as pessoas podem visitar uma diversidade muito maior de sites e obter ajuda com questões mais complexas”, informou o Google.

A big tech esclareceu também que, além de encontrar a informação mais certeira para uma pergunta complexa, a busca poderá ajudar a fazer planejamentos. Será possível organizar férias ou criar um plano alimentar com maiores detalhes. A nova “busca da era da IA” está disponível para usuários nos EUA a partir desta terça e chegará “em breve” a outros países.

IA generativa

O vídeo também foi foco do Google, que fez um lançamento quase três meses depois que a OpenAI anunciou o Sora. A big tech apresentou o Veo, modelo de IA generativa que cria vídeos a partir de prompts de texto e imagem. De acordo com a companhia, a ferramenta pode gerar vídeos de alta qualidade com resolução de 1080p e duração superior a um minuto, com ampla variedade de estilos visuais e cinematográficos.

O Google ressaltou ainda que o Veo tem “uma compreensão avançada da linguagem natural” e de termos do universo do cinema como “timelapse” ou “fotos aéreas de paisagem”. Com o modelo, os vídeos são consistentes e coerentes, retratando movimentos mais realistas de pessoas, animais e objetos.

A empresa convocou fillmakers e criadores para experimentar o Veo e descobrir como a ferramenta “pode apoiar o processo criativo”. Segundo o Google, a colaboração ajudará a melhorar a maneira como estão desenhando, construindo e desenvolvendo a tecnologia de IA generativa para vídeo. Um dos nomes convidados é o do artista Donald Glover, que participou de um projeto com seu estúdio Gilga (veja mais abaixo).

O Veo foi disponibilizado nesta quinta para um grupo selecionado de criadores dentro da plataforma VideoFX, no qual há uma lista de espera para experimentar a ferramenta. No futuro, parte das aplicações do Veo poderá ser acessada no YouTube Shorts.

Por falar em YouTube, foi lançado o Music AI Sandbox, para criação de música por meio da IA. Também nessa área o Google contou com colaboradores para aprimoramento da ferramenta. Um deles é Wyclef Jean (confira o vídeo abaixo).

Assistente

O evento tratou de diversos lançamentos, mas havia também experimentos. O Project Astra ainda não está disponível para os usuários, mas promete atrair muitos olhares. Ele está sendo apontado como um futuro assistente pessoal. No Google I/O, foi mostrado um vídeo de demonstração da ferramenta, indicando seu potencial (abaixo).

A câmera do celular foi apontada para uma mesa para uma mesa de trabalho e se perguntou que aparelho que faz barulho. A resposta foi: alto-falante. Outras questões foram feitas e todas as vezes a tecnologia respondeu com informações corretas, ajudando, inclusive, a usuária a encontrar seus óculos no ambiente.

Google I/O pode ser visto em vídeo aqui.

Google I/O 2024

/