
A IA está prestes a esgotar todos os dados disponíveis na internet para seu treinamento, segundo Elon Musk, proprietário da X e CEO da xAI, entre outras empresas.
A solução proposta envolve cruzar um dos maiores desafios do treinamento de modelos: o uso de dados sintéticos – ou seja, permitir que a própria Inteligência Artificial gere os dados com os quais continuará aprendendo.
Por que isso é importante?
A escassez de dados para treinar modelos representa um ponto de inflexão no desenvolvimento da Inteligência Artificial. Esse cenário pode desacelerar o ritmo de avanço tecnológico, que nos últimos anos tem sido exponencial.
O contexto
Os grandes modelos de linguagem precisam de quantidades massivas de dados para aprimorar seu desempenho. Com o esgotamento dos dados reais disponíveis – aqueles gerados por nós de maneira tradicional –, a indústria é forçada a buscar alternativas viáveis para continuar avançando no desenvolvimento de produtos como chatbots e geradores de imagens.
Essa ideia não é nova e já foi aplicada em outros projetos de Inteligência Artificial. Segundo a Gartner, 60% dos dados utilizados em projetos de Inteligência Artificial em 2024 foram gerados sinteticamente. Empresas como Microsoft, OpenAI, Anthropic e Meta já adotam essa abordagem.
O Palmyra X 004, um modelo criado para aprimorar aplicações de Inteligências Artificiais já existentes, foi treinado com dados sintéticos e custou 700.000 dólares.
O custo estimado para treinar um modelo de tamanho semelhante da OpenAI é de 4,6 milhões de dólares.
Fonte: xataka.com.br
Portais:
Luz p’ra nós✝️
Ajudem compartilhando|comentando
Luz p’ra nós!
Luz pra nós.
Luz p’ra nós!
Em relação ao uso de dados sintéticos, embora possam acelerar o desenvolvimento, preocupa me o fato de que essas IAs possam acabar simplificando demais as situações ou de não capturar toda a variedade e riqueza das experiências humanas, o que pode levar a respostas imprecisas ou a certos preconceitos.
Luz p’ra nós 🕯️
Será verdade msm.
Luz p’ra nós!
Essa declaração de que as inteligências artificiais estão gerando 60% de dados sintéticos, não criaria conclusões e decisões fora da realidade observável dos próprios humanos? Isso exponencializa cada vez mais, visto que, existe uma IA para aprimorar aplicações de outras inteligências artificiais já existentes. É bem complexo tudo isso. Ou talvez não seja bem isso que entendi, sobre os “dados artificiais”. LPN
Luz p’ra nós!
Luz p’ra nós
esta se alimentando de nossas experiências…e depois oque virá ? #luzpranos
Eita!
Luz p´ra nós
Luz p’ra nós!