
Um exemplo de navegação do Operator por um site de turismo. (Imagem: Reprodução/OpenAI)
A OpenAI, responsável pelo desenvolvimento do ChatGPT, lançou nesta quinta-feira (23) um novo serviço de inteligência artificial (IA) chamado Operator. Essa ferramenta inovadora é projetada para executar uma variedade de tarefas diretamente em um navegador.
O Operator é baseado no modelo de linguagem GPT-4o, considerado o mais avançado da companhia, que pode até argumentar com os usuários, dependendo dos comandos recebidos. Além disso, ele é acompanhado por um novo Computer-Using Agent (CUA), que permite interações com interfaces gráficas, como botões e menus de sites. Essa capacidade faz com que sua funcionalidade vá muito além de uma simples conversa ou busca na internet; o Operator age realmente como um assistente pessoal, realizando tarefas em seu nome.
Outras empresas, como a Anthropic, criadora do chatbot Claude, e a DeepMind, do Google, também estão desenvolvendo agentes de IA e iniciando testes públicos. Entretanto, a OpenAI afirma que seus experimentos mostraram que o Operator superou seus concorrentes em todas as atividades testadas.
Como o Operator Funciona?
Quando recebe um comando por texto, similar a outros chatbots, o Operator processa imagens da tela com grande precisão, analisando-as pixel a pixel para entender a interface do site em questão. Ele utiliza uma captura de tela para obter o contexto necessário e assim gerenciar tarefas de maneira multimodal, ou seja, não apenas através da linguagem escrita.
O funcionamento envolve o uso de um teclado e cursor virtuais, que permitem ao Operator navegar por sites, acessar links e preencher formulários com informações fornecidas pelo usuário. O processo ocorre sem a necessidade de autorizações de APIs, replicando a ação de um ser humano que acessa páginas da web.
Em uma demonstração, um funcionário da OpenAI requisitou ao Operator que pesquisasse uma receita específica em um site especializado e adicionasse vários ingredientes a um carrinho de compras em uma loja virtual. Todas as interações no navegador foram realizadas em tempo real, enquanto o usuário acompanhava a execução das tarefas.
Dentre as atividades exemplificadas, estão a reserva de mesas em restaurantes, compra de ingressos para shows, pedidos de comida por delivery e solicitações de transporte por aplicativo. Os comandos podem ser totalmente personalizados, permitindo que o usuário especifique detalhes como ingredientes que não devem estar presentes em uma receita ou os horários preferenciais para uma reserva.
O histórico de interações é mantido exclusivamente para uso pessoal, possibilitando que comandos similares sejam realizados novamente com apenas um clique nas sessões futuras. Por ser um modelo de linguagem mais avançado, o Operator se aprimora continuamente, aprendendo com as solicitações anteriores e melhorando seu desempenho, especialmente ao repetir tarefas em um mesmo website.
A intervenção do usuário é necessária apenas em situações específicas, como a autenticação de CAPTCHAs ou a inserção de logins e senhas, que são informações sensíveis e não capturadas pela IA.
Disponibilidade do Operator
Atualmente, o acesso ao Operator está restrito a usuários nos Estados Unidos que utilizam sites específicos. Apenas assinantes do plano ChatGPT Pro, a opção mais cara da oferta paga da empresa, irão ter acesso inicial ao serviço.
Entretanto, a OpenAI planeja expandir a disponibilidade do chatbot que navega em seu nome para outros países e também para assinantes de diferentes planos, como o Plus e o corporativo.
Além disso, a OpenAI prometeu liberar o CUA do Operator para que mais desenvolvedores possam criar seus próprios agentes de IA para realizar tarefas específicas em navegadores. A companhia continuará aprimorando a ferramenta, com a intenção de permitir que ela execute tarefas ainda mais complexas nas atualizações futuras.
Fonte: tecmundo
Acesse os portais:
Luz p’ra nós
É uma grande revolução tecnologica que estamos passando. Surpreende a cada dia que passa. Luz p’ra nós 🙏✨
Luz p’ra nós
Luz pra nós.
sempre uma novidade diferente, cada vez mais rápido, não vai demorar muito pra algumas profissões se extinguir…
Luz p’ra nós!
Luz p’ra nós!
O fato de o Operator conseguir acessar sites, preencher formulários e executar tarefas complexas sem depender de implementações extras representa um avanço significativo na utilidade e acessibilidade da inteligência artificial.
Luz para o reino🕯️
Será que as IA vão nos substituir?
Luz p’ra nós!
As Glórias vão ser grandes com o avanço da tecnologia, mas as sombras do contraste que precisarão ser posicionadas vão ser similares aos “milagres” em proporção, só o verbo irá constatar e separar oque é coerente de esquizofrenia, quando “tudo” for “resolvido em segundos” com a tecnologia!
Luz p’ra nós 🙏🏾⚛️✅
#luzpranos
Po ideia foda!! Luz pra nós!
Luz p’ra nós!
Daora.
Luz p’ra nós!