Carregando agora

Aposta de US$ 2,3 bilhões da General Intuition de que os videogames podem treinar agentes de IA para o mundo real

Aposta de US$ 2,3 bilhões da General Intuition de que os videogames podem treinar agentes de IA para o mundo real

Assim que entrei no andar de P&D da General Intuition em seu escritório de Nova York, o cofundador e CEO da empresa, Pim de Witte, de 31 anos, dirigiu minha atenção para um monitor empoleirado em uma mesa vertical. Alguém parecia estar jogando algo parecido com Fortnite. Não foi uma pessoa.

“Nosso agente está jogando há 100 horas seguidas”, disse Kent Rollins, diretor de produtos da empresa, radiante.

Antes que eu pudesse me absorver no espetáculo de uma IA navegando no ambiente virtual do jogo, ouvi os passos eletrônicos de um grande robô quadrúpede se aproximando.

“O mesmo cérebro que alimenta o agente que joga o jogo alimenta o robô”, disse-me de Witte. Josh Duplantis, um analista de dados que carregava um laptop transmitindo uma transmissão ao vivo da única câmera do robô, explicou que o modo padrão do bot era “exploração”.

Confiando naquela câmera, seu olho singular, o bot gigante parecido com um inseto caminhou até mim, circulou ao meu redor e continuou em direção ao escritório. Ocasionalmente, ele cortava as pernas de cadeiras ou esbarrava em uma lixeira errante, como uma criança que ainda não aprendeu como seu corpo se relaciona com o mundo ao seu redor. Duplantis disse que foram necessários apenas oito minutos de dados robóticos do mundo real para ajustar um modelo de IA para quadrúpedes. Além do mais, esses dados foram coletados na rua, e não dentro do escritório onde o bot estava navegando.

Um modelo agente que pode generalizar da jogabilidade à simulação e à incorporação é a razão de ser da General Intuition. E a capacidade desse modelo de descobrir o seu lugar no mundo garantiu o apoio de alguns pesos pesados.

Na quinta-feira, a General Intuition disse que levantou US$ 320 milhões em uma avaliação de US$ 2,3 bilhões, confirmando Relatórios anteriores do TechCrunch. A rodada eleva o financiamento total divulgado da General Intuition para US$ 454 milhões, após o Rodada de US$ 134 milhões foi levantado no lançamento em outubro passado.

A startup surgiu de outra empresa de De Witte, a Medal, que permite aos jogadores fazer upload e compartilhar clipes de videogame. As centenas de milhões de horas de jogo carregadas forneceram o conjunto de dados inicial para treinar o modelo da General Intuition no raciocínio espaço-temporal – ou na compreensão de como se mover no espaço e no tempo.

Mas o ingrediente principal não foram as imagens do jogo; foram os rótulos de ação incorporados nesses clipes: registros de exatamente quais botões um jogador pressionou e quando. A maioria dos concorrentes, diz de Witte, está tentando inferir ações apenas a partir do vídeo, o que ele argumenta ser insuficiente.

“Vemos isso apenas como a próxima etapa do futuro pré-treinamento”, disse de Witte. “Temos um modelo único que pode responder às informações do Fortnite na tela e agir, mas também à dinâmica do mundo real de uma forma que um LLM nunca poderia.”

A certa altura, de Witte me configurou um laptop rodando o modelo de mundo da General Intuition, um ambiente simulado gerado quadro a quadro em vez de renderizado por um mecanismo de jogo tradicional. Como costumo fazer quando testando modelos mundiaisfui direto para uma série de paredes. Em outras demonstrações que experimentei, os agentes que você controla às vezes passam direto, mas esta não. Com os milhões de horas de jogo, de alguma forma ele aprendeu que paredes são paredes, escadas são para escalar e que as sombras aumentam à medida que o sol se move.

Para a Intuição Geral, este modelo mundial não é o produto; é o ambiente de treinamento (referido internamente como “academia”). Em última análise, a empresa quer vender o próprio modelo de agência, e de Witte argumenta que os dados de ação incorporados na jogabilidade ajudam o modelo a discernir o “eu” do “ambiente” de uma forma que lhe dá uma compreensão mais rica da causalidade.

Por mais impressionante que a tecnologia da General Intuition apareça nas demonstrações, a empresa não é a única que está tentando resolver esse problema. Além disso, conseguir que tal modelo se mantenha no mundo físico, em escala, ainda não foi feito. A maioria das abordagens desse tipo exige enormes quantidades de dados do mundo real, coletados de forma lenta e dispendiosa. A aposta da General Intuition é que a jogabilidade seja um atalho escalável.

Seus investidores também concordam com essa aposta. A última rodada da General Intuition foi liderada pela Khosla Ventures, com a participação da General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg e pesquisadores do Google DeepMind e do MIT.

A grande maioria da rodada será voltada para o dimensionamento da capacidade computacional. A General Intuition tem um acordo com a CoreWeave e planeja se concentrar no pré-treinamento da próxima versão do modelo. Uma fatia foi reservada para tornar sua API mais amplamente disponível até o final do verão.

Vinod Khosla, cuja empresa liderou a rodada, diz que ficou atraído pela visão de De Witte e pela posição de dados proprietários da empresa.

“Se você olhar para os LLMs, quando o raciocínio surgiu, foi um salto quântico”, disse-me Khosla em entrevista por telefone. “Em modelos mundiais, acho que o salto quântico é o surgimento da intuição na IA, uma capacidade semelhante à intuição humana. Os dados de ação humana e de reação que você tem nos jogos são a parte chave para o surgimento da intuição.”

A visão é uma empresa geracional

General Intuition depende de dados de clipes de videogame da Medal. Créditos da imagem:Medalha.TV

A General Intuition não é a única empresa a notar que os dados de ação humana da Medal são uma peça-chave no quebra-cabeça da construção de modelos mundiais dinâmicos e agentes gerais. Brianna Martin, chefe de gabinete da startup, disse que a empresa nasceu, em parte, depois que a Medal recusou uma oferta de aquisição de um grande laboratório. Houve outras ofertas desde então também.

De Witte e seus cofundadores, Eloi Alonso, Adam Jelley e Vincent Micheli, não estão interessados ​​em serem adquiridos, e nem os investidores da startup estão procurando uma saída ainda. A quantidade e a qualidade dos dados proprietários que a General Intuition possui via Medal é uma das razões pelas quais Khosla está convencido de que a startup é uma aposta geracional, não um alvo de fusões e aquisições; que poderia se tornar a espinha dorsal de agentes generalizados e modelos mundiais na simulação e no mundo real.

“Neste ponto, seria uma aquisição de dados, o que é um tanto desinteressante”, disse Khosla.

Parte dessa aposta também envolve confiar nos valores de De Witte.

O empresário passou três anos trabalhando na área humanitária, inclusive com Médicos Sem Fronteiras. Como tal, ele traçou uma linha clara sobre como a tecnologia da General Intuition será usada: nenhum agente será empregado para prejudicar humanos.

“Não queremos ser uma parte crescente do sistema”, disse de Witte. “Digamos que eu dissesse: ‘Estamos exercendo uma autonomia letal’. O que você acha que aconteceria em outros países?”

Esse limite para casos de uso militar ocorre no momento em que o Vale do Silício está cada vez mais otimista em relação à guerra, embora De Witte diga que está feliz que seus modelos sejam usados ​​para missões de busca e resgate.

De Witte é holandês e grande parte da sua equipa é europeia, o que molda a identidade da empresa. Ele diz que trouxe Martin em parte devido à decisão dela de saiu publicamente da Palantir sobre seu trabalho com a Imigração e Fiscalização Aduaneira dos Estados Unidos.

“Não sei por que o Vale do Silício faz o que faz”, disse ele. “Há uma razão para eu não estar lá.”

A ética de De Witte não limita simplesmente o que os modelos não fazem. Como um jogador que ganhou US$ 1,5 milhão construindo e hospedando um servidor RuneScape privado na adolescência, de Witte também está pensando no que acontece com as pessoas que ficam para trás devido ao que os modelos de IA podem fazer.

A General Intuition lançou recentemente uma plataforma chamada Nerve, um mercado de empregos que permite aos jogadores ganhar dinheiro usando suas configurações existentes. Aqueles que se inscrevem começam com a rotulagem de dados e podem eventualmente passar para a teleoperação de robôs e outras tarefas. A base de usuários da Medal, observou de Witte, é precisamente a geração mais exposta ao deslocamento impulsionado pela IA, e ele deseja que eles tenham interesse no que está por vir.

Um volante de dados

De Witte deseja que a General Intuition seja um facilitador de ecossistema, como Anthropic ou OpenAI – um fornecedor modelo que permite que outros desenvolvam com base em sua tecnologia. Hoje, a startup tem vários clientes em jogos, simulação e robótica.

“Não vamos construir uma empresa de automóveis autônomos”, disse de Witte. “Vamos tornar 10 vezes mais fácil para a próxima pessoa construir uma empresa de automóveis autônomos.”

A empresa diz que assim que colocar sua API nas mãos de mais clientes, ela poderá testar sua coragem com uma variedade de casos de uso – como testar um robô em um gêmeo digital de uma fábrica, alimentar um bot semelhante a um humano dentro de um estúdio de jogos ou enviar um quadrúpede para navegar em ambientes perigosos.

Embora um quadrúpede seja a primeira personificação física que a General Intuition experimentou no mundo real, ela também experimentou drones e outros dispositivos, incluindo testes do modelo em jogos de direção.

“Ele funciona em qualquer coisa que você possa controlar usando um controlador de jogo ou um teclado e mouse”, disse de Witte.

A possibilidade de construir um volante de dados é um dos objetivos.

“Escolheremos clientes onde possamos diversificar as concretizações para as quais este modelo de base generalizada está servindo como espinha dorsal”, disse de Witte. “Portanto, vamos priorizar a escolha dos clientes para saber se eles podem oferecer dados do mundo real que serão interessantes e úteis para impulsionar a pesquisa. E se eles tiverem uma equipe interna ágil onde possamos ser verdadeiros parceiros incorporados e aprender uns com os outros.”

Khosla disse que os dados proprietários da General Intuition foram o que o trouxe até aqui, e sua capacidade de continuar coletando dados que ninguém mais possui será essencial. Especialmente porque, apesar das demonstrações impressionantes, se a transferência da simulação para o mundo real pode ser mantida em escala é uma questão em aberto que ninguém respondeu totalmente ainda.

Correção: a manchete anteriormente distorcia quanto a Intuição Geral arrecadou nesta rodada. O erro foi corrigido.

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.

Publicar comentário

ISSO PODE LHE INTERESSAR