NVIDIA está treinando robôs para realizar tarefas humanas, muito melhor que os próprios humanos!
Prof. Ms. Luciano do Amaral Dornelles
@prof.lucianodornelles
31/10/23
Olá, entusiastas da tecnologia! Hoje, temos uma notícia empolgante e assustadora para compartilhar com vocês: A NVIDIA, uma das líderes globais em inteligência artificial, acaba de anunciar a criação de um novo agente de IA chamado Eureka, e acredite ou não, Eureka está ensinando robôs a fazer truques de girar canetas tão bem quanto os humanos!
Eureka é um agente de IA alimentado pelo GPT-4 que treinou robôs para realizar tarefas usando algoritmos de recompensa. O Eureka é um agente de IA desenvolvido pela NVIDIA Research, e sua principal função é treinar robôs para realizar tarefas complexas. O processo envolve a geração automáca de algoritmos de recompensa, essenciais para treinar robôs através do aprendizado por reforço. Eureka ensinou uma mão robóca a realizar truques de girar canetas tão bem quanto um humano pode, além disso, também ensinou vários pos de robôs – como quadrúpedes, mãos dexterous, braços cobot e outros – a realizar quase 30 tarefas diferentes, incluindo abrir gavetas, usar tesouras e pegar bolas (FIELDING, 2023).
O GPT-4 é o modelo de IA mais avançado da OpenAI, e está sendo usado pela NVIDIA por resolver problemas diceis com maior precisão graças ao seu conhecimento geral mais amplo e habilidades avançadas de resolução de problemas. O GPT-4 é mais criavo e colaboravo do que seus similares e pode gerar, editar e interagir com os usuários em tarefas de escrita criava e técnica, como compor músicas, escrever roteiros ou aprender o eslo de escrita de um usuário.
De acordo com a NVIDIA Research, os programas de recompensa baseados em tentava e erro do agente de IA são 80% mais eficazes do que aqueles escritos por especialistas humanos e isso resultou em uma melhoria de mais de 50% no desempenho dos robôs. No aprendizado por reforço (RL), um agente de soware aprende através de tentava e erro, e quando realiza uma ação desejada, o modelo recebe uma recompensa. Com o tempo, o agente descobre como executar a tarefa para omizar sua recompensa. Esses algoritmos de recompensa são essenciais para o funcionamento do Eureka, pois eles permitem que o Eureka treine robôs para realizar tarefas complexas através do aprendizado por reforço. Além disso, Eureka também se autoavalia com base nos resultados do treinamento, instruindo mudanças nas funções de recompensa conforme achar adequado (FIELDING, 2023).
A ideia de robôs ensinando robôs está ganhando cada vez mais interesse e sucesso. Com o avanço da IA e da robóca, o papel dos humanos no mundo da robóca está diminuindo. Mas isso não é necessariamente uma coisa ruim. Pelo contrário, é um testemunho do incrível progresso que estamos fazendo na tecnologia.
Agora, imagine as possibilidades. Se um robô pode aprender a girar uma caneta, o que mais ele poderia fazer? Talvez um dia, veremos robôs realizando tarefas complexas com a mesma facilidade que os humanos. Eles poderiam ser usados em uma variedade de campos, desde a medicina até a exploração espacial. Imagine um robô realizando uma cirurgia delicada com precisão perfeita, ou um robô explorando os cantos mais distantes do universo onde os humanos não podem ir.
Então, da próxima vez que você pegar uma caneta para girar entre os dedos, lembre-se – há um robô por aí que pode fazer isso tão bem quanto você! E quem sabe? Talvez um dia, esse mesmo robô esteja fazendo muito mais do que apenas girar canetas. As possibilidades são infinitas e estamos apenas começando a arranhar a supercie do que é possível. Assustador não é?? E ao mesmo tempo empolgante!!
Referências
FIELDING, Sarah. NVIDIA’s latest AI model helps robots perform pen spinning tricks as well as humans. Engadget, 20 out. 2023. Disponível em:
hps://www.engadget.com/nvidias-latest-ai-model-helps-robots-perform-pen-spinning-tricks-as-well-as-humans-130004608.html Acesso em: 31 out. 2023.