Compass Investments

Crypto vs. Dollar

📌 A Google reduz a memória da IA mantendo a precisão – mas há um senão: transcrição

A Google Corp. disse que o seu algoritmo TurboQuant pode reduzir uma limitação de memória chave no domínio da IA em pelo menos seis vezes, sem afetar a precisão da saída. . Uma

– A Google Corp. disse que o seu algoritmo TurboQuant pode reduzir uma limitação de memória chave no domínio da IA em pelo menos seis vezes, sem afetar a precisão da saída.

As acções dos fabricantes de memória, incluindo a Micron, a Western Digital e a Seagate, caíram após a publicação do artigo.

O método proposto comprime a memória usada para inferência, não os pesos do modelo em si, e só foi testado em conjuntos de testes de pesquisa.

Na quarta-feira, a Google Research apresentou o TurboQuant, um algoritmo de compressão que reduz o estrangulamento da memória principal para computação em pelo menos 6 vezes, mantendo a precisão total.

O artigo será apresentado na conferência ICLR 2026, e a reação imediata na rede foi esmagadora.

O diretor da Cloudflare, Matthew Prince, comparou-o ao momento do DeepSeek da Google. No mesmo dia, os preços das acções de fabricantes de memórias como a Micron, a Western Digital e a Seagate caíram.

Será que isso é mesmo verdade?

Melhorar a eficiência da quantificação já é, por si só, uma conquista significativa. No entanto, a afirmação de “perda zero de precisão” requer uma maior compreensão.

TurboQuant está focado na cache KV, uma área da memória da GPU onde é armazenado tudo o que o modelo de linguagem precisa de recordar durante um diálogo.

À medida que as janelas de contexto se expandem para milhões de tokens, estas caches podem crescer para centenas de gigabytes por sessão. Este é o verdadeiro estrangulamento. Não é o poder de computação, mas o espaço de memória puro.

As abordagens comuns de compressão tentam reduzir essas caches arredondando os valores numéricos para baixo – por exemplo, passando de números de ponto flutuante de 32 bits para números de 16 bits, ou de inteiros de 8 bits para 4 bits. Para uma melhor analogia, imagine reduzir a resolução de uma imagem de 4K para Full HD, depois para 720p, e assim por diante. É fácil ver que se trata da mesma imagem, mas há mais pormenores em 4K.

O truque é que têm de armazenar constantes de quantificação adicionais juntamente com os dados comprimidos, para que o modelo não comece a falhar. Estas constantes acrescentam 1 a 2 bits por valor, compensando parcialmente as poupanças. A Google estabelece um prazo até 2029 para neutralizar a ameaça quântica – será isto um problema para a Bitcoin?

A Google deixou de tratar a computação quântica como um problema de um futuro distante. Na terça-feira, a empresa revelou um plano formal para fazer a transição de toda a sua infraestrutura para criptografia pós-quântica (PQC) até 2029, chamando a mudança de urgente e observando que as capacidades quânticas

“podem vir mais cedo do que parece.

“Como líder em tecnologia quântica e PQC, temos a responsabilidade de dar o exemplo e compartilhar nosso ambicioso cronograma, disse a publicação. “As máquinas quânticas representarão um sério desafio para os sistemas criptográficos existentes…

TurboQuant proclama a eliminação completa destes custos adicionais.

Para o conseguir, são utilizados dois algoritmos auxiliares. O PolarQuant separa a magnitude e a direção em vectores, enquanto o QJL (Quantised Johnson-Lindenstrauss) trata o pequeno erro residual, reduzindo-o a um único bit de sinal, positivo ou negativo, sem preservar quaisquer constantes.

O resultado, afirma a Google, é um resultado matematicamente não distorcido para as operações de atenção que estão na base do funcionamento dos modelos transformacionais.

Em testes efectuados com os modelos Gemma e Mistral, o TurboQuant demonstrou um desempenho ao nível da precisão total com uma compressão quatro vezes superior, incluindo uma precisão perfeita na procura de uma “agulha num palheiro, mesmo em contextos com até 104.000 tokens.

Bitcoin

Bitcoin

$70,934.96

BTC -0.78%

Ethereum

Ethereum

$2,188.52

ETH -0.77%

Binance Coin

Binance Coin

$597.32

BNB 0.30%

XRP

XRP

$1.33

XRP -0.48%

Dogecoin

Dogecoin

$0.09

DOGE -0.42%

Cardano

Cardano

$0.24

ADA -0.94%

Solana

Solana

$81.85

SOL -0.48%