Mark Zuckerberg anunciou hoje que Metasua mídia social que virou metaverso e virouinteligência artificial conglomerado, atualizará seus assistentes de IA para dar a eles uma variedade de vozes de celebridades, incluindo as de Dame Judi Dench e John Cena. A atualização mais importante para as ambições de longo prazo da Meta, no entanto, é a nova capacidade de seus modelos de ver fotos dos usuários e outras informações visuais.
A Meta também anunciou hoje o Llama 3.2, a primeira versão de seus modelos de IA gratuitos a ter habilidades visuais, ampliando sua utilidade e relevância para robótica, realidade virtual e os chamados agentes de IA. Algumas versões do Llama 3.2 também são as primeiras a serem otimizadas para rodar em dispositivos móveis. Isso pode ajudar os desenvolvedores a criar aplicativos com tecnologia de IA que rodam em um smartphone e tocam em sua câmera ou assistem à tela para usar aplicativos em seu nome.
“Este é nosso primeiro modelo multimodal de código aberto e permitirá muitas aplicações interessantes que exigem compreensão visual”, disse Zuckerberg no palco do Connect, um evento da Meta realizado na Califórnia hoje.
Dado o enorme alcance da Meta com Facebook, Instagram, O que você acha do WhatsApp?e Mensageiroa atualização do assistente pode dar a muitas pessoas o primeiro gostinho de uma nova geração de ajudantes de IA mais vocais e visualmente capazes. A Meta disse hoje que mais de 180 milhões de pessoas já usam a Meta AI, como é chamada a assistente de IA da empresa, toda semana.
Ultimamente, a Meta deu à sua IA um faturamento mais proeminente em seus aplicativos — por exemplo, tornando-a parte da barra de pesquisa no Instagram e no Messenger. As novas opções de voz de celebridades disponíveis para os usuários também incluirão Awkwafina, Keegan Michael Key e Kristen Bell.
A Meta anteriormente deu personas de celebridades para assistentes baseados em texto, mas esses personagens não conseguiram ganhar muita força. Em julho, a empresa lançou uma ferramenta chamada AI Studio que permite que os usuários criem chatbots com qualquer persona que escolherem. A Meta diz que as novas vozes serão disponibilizadas para usuários nos EUA, Canadá, Austrália e Nova Zelândia no próximo mês. Os recursos de imagem do Meta AI serão lançados nos EUA, mas a empresa não disse quando os recursos podem aparecer em outros mercados.
A nova versão do Meta AI também poderá fornecer feedback e informações sobre as fotos dos usuários; por exemplo, se você não tiver certeza de qual pássaro você tirou uma foto, ele pode dizer a espécie. E poderá ajudar a editar imagens, por exemplo, adicionando novos fundos ou detalhes sob demanda. Google lançou uma ferramenta semelhante para seus smartphones Pixel e para o Google Fotos em abril.
Alimentando os novos recursos do Meta AI está uma versão atualizada do Llama, o principal modelo de linguagem grande do Meta. O modelo gratuito anunciado hoje também pode ter um amplo impacto, dado o quão amplamente a família Llama já foi adotada por desenvolvedores e startups.
Em contraste com os modelos da OpenAI, o Llama pode ser baixado e executado localmente sem custos — embora haja algumas restrições ao uso comercial em larga escala. O Llama também pode ser mais facilmente ajustado, ou modificado com treinamento adicional, para tarefas específicas.