Próximo DeepSeek? Empresa chinesa revela novo método de treinamento de IA

Pesquisadores da empresa chinesa de fundos quantitativos Shanghai Goku Technologies publicaram um estudo no qual revelam uma nova técnica de treinamento de modelos de IA capaz de superar os métodos atuais. A informação é do jornal South China Morning Post.

  • Como usar os modelos de raciocínio de IA? Confira o guia
  • Testamos o DeepSeek: conheça os prós e contras da IA chinesa

Em paralelo com a publicação, a Goku criou uma nova subsidiária de IA chamada Shanghai AllMind Artificial Intelligence Technology. O movimento lembra um pouco o caminho traçado pelo DeepSeek, principal nome do mercado de inteligência artificial no país — a startup foi fundada por outra empresa de fundo quantitativo que decidiu concentrar pesquisas no setor.

DeepSeek atraiu atenções para o mercado chinês no desenvolvimento de IA (Imagem: Bruno De Blasi/Canaltech)

Novo método para treinar IAs de raciocínio

O artigo da Goku foi enviado para a Conferência de Sistemas de Processamento de Informação Neural, que será realizada em dezembro deste ano em San Diego, nos Estados Unidos. O evento, inclusive, é conhecido como as “Olimpíadas da IA” no segmento.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

O documento destaca limitações nos métodos mais comuns de treinamento de modelos de raciocínio de IA, como o ajuste fino supervisionado (SFT) e o aprendizado de reforço (RL), usados por empresas como o próprio DeepSeek e a OpenAI. 

A alternativa sugerida é um treinamento híbrido chamado SASR (os pesquisadores não informaram se é uma sigla ou apenas um nome próprio), inspirado na processo humano para raciocinar.

O artigo diz que o SASR é um método que se adapta a cada passo e pode unificar os conceitos do SFT e do RL. O ajuste fino poderia ser usado no treinamento inicial das habilidades básicas de lógica, enquanto o algoritmo se tornaria mais dinâmico e ajustável nas etapas seguintes.

Os pesquisadores informarm que o método superou outros modelos de treinamento nos testes internos, mas ainda não há exemplos práticos de IAs que foram desenvolvidas com a tecnologia.

Leia também:

  • DeepSeek, Qwen e mais: conheça 5 IAs chinesas
  • Com medo de errar, Brasil perde tempo na corrida pela inteligência artificial
  • O que é Flow? App do Google foca em produção de filmes com IA

VÍDEO: qual serviço de IA assinar?

 

Leia a matéria no Canaltech.

Adicionar aos favoritos o Link permanente.