Fim de uma era: novo GPT-4.5 marca adeus a modelos da OpenAI sem ‘reflexão’
Modelo tende a ser mais hábil em conversação, escrita e programação; Sam Altman disse que esse seria o último sem poder de computação adicional para ponderar sobre as consultas antes de responder
Fim de uma era: novo GPT-4.5 marca adeus a modelos da OpenAI sem ‘reflexão’ |Sam Altman, cofundador e CEO da OpenAI: avanços nos modelos de IA para conversação, escrita e programação (Foto: Nathan Laine/Bloomberg)(Bloomberg/Nathan Laine)
Bloomberg — A OpenAI anunciou ao mercado uma versão inicial de um novo modelo de Inteligência Artificial (IA) há muito aguardado, chamado GPT-4.5, para usuários selecionados, depois de enfrentar obstáculos no desenvolvimento do sistema de IA no ano ado.
A OpenAI espera que o novo modelo seja melhor em captar e responder a sinais sutis nos prompts escritos dos usuários e que seja particularmente mais hábil em conversação, escrita e programação. E também que “invente coisas” com menos frequência do que o software anterior.
PUBLICIDADE
Em um primeiro momento, a OpenAI oferece o modelo como uma “prévia de pesquisa” a um grupo limitado de desenvolvedores de software e usuários que pagam US$ 200 por mês por uma do ChatGPT Pro.
A OpenAI deu início a um frenesi em torno da IA generativa no fim de 2022 com o lançamento do ChatGPT, que foi originalmente alimentado por um modelo anterior chamado GPT-3.5.
PUBLICIDADE
Desde então, a empresa lançou uma série de sistemas cada vez mais sofisticados, incluindo várias opções que imitam o processo de raciocínio humano.
Nick Ryder, vice-presidente de pesquisa da OpenAI, disse à Bloomberg News que espera que o GPT-4.5 represente um salto tão grande em recursos em relação ao modelo GPT top de linha existente quanto a empresa avaliou que houve do GPT-3.5 para o GPT-4, lançado no início de 2023. No entanto construí-lo provou ser um desafio.
O modelo, conhecido como Orion dentro da empresa, não atingiu os benchmarks de desempenho desejados pela OpenAI no ano ado, segundo noticiou a Bloomberg News anteriormente.
PUBLICIDADE
No final do verão no hemisfério norte, por exemplo, o Orion não conseguiu responder a perguntas de codificação para as quais não havia sido treinado, de acordo com pessoas familiarizadas com o assunto.
Um problema que a OpenAI e outros desenvolvedores enfrentaram foi encontrar novas fontes inexploradas de dados de treinamento de alta qualidade para desenvolver sistemas de IA mais avançados.
A OpenAI se baseou em um processo chamado pós-treinamento, durante o qual incorpora humano para melhorar as respostas e refinar o tom de como o modelo deve interagir com os usuários, entre outras coisas.
A empresa liderada por Sam Altman também criou novas maneiras de treinar o modelo usando dados derivados das informações usadas para treinar seu modelo GPT-4.0 existente, disse Mia Glaese, também vice-presidente de pesquisa da empresa.
Fim de uma era
O lançamento do GPT-4.5 marcará o fim de uma espécie de era para a OpenAI.
Em uma postagem no X no início deste mês, o CEO da OpenAI, Sam Altman, disse que o modelo seria o último que a empresa apresentaria que não usaria poder de computação adicional para ponderar sobre as consultas antes de responder.
A OpenAI adotou essa abordagem de raciocínio com alguns de seus modelos mais recentes, incluindo o o1 e o o3. No futuro, a OpenAI combinará seus modelos GPT com outros mais recentes da série “o” para criar sistemas de IA que possam determinar automaticamente por quanto tempo devem “refletir” sobre uma consulta antes de dar uma resposta.
O objetivo, segundo Altman, é simplificar a experiência para que os usuários não sejam forçados a escolher entre uma lista de opções cada vez mais complicada.