25/03/2026 - Portal Comunica News

À medida que os Large Language Models (LLMs) expandem suas janelas de contexto para processar documentos massivos e conversas complexas, eles encontram uma realidade de hardware brutal conhecida como "gargalo de cache de valor-chave (KV)". Cada palavra que um modelo processa deve ser armazenada como um vetor de alta dimensão na memória de alta velocidade. Para tarefas de formato longo, essa "folha de dicas digital" aumenta rapidamente, devorando o sistema de memória de acesso aleatório de vídeo (VRAM) da unidade de processamento gráfico (GPU) usado durante a inferência e diminuindo rapidamente o desempenho do modelo ao longo do tempo. Mas não tenha medo, o Google Research está aqui: ontem, a unidade do gigante das buscas lançou seu conjunto de algoritmos TurboQuant — uma inovação exc...

O Governo do Estado de São Paulo inaugurou nesta quarta-feira (25) o segundo Centro de Cidadania da Pessoa com Deficiência na capital paulista. O novo equipamento, nomeado de unidade Parque Estadual Fontes do Ipiranga, está localizado na entrada do Centro de Treinamento Paralímpico Brasileiro (CTPB), na zona sul da cidade, e foi criado para ampliar a rede de serviços voltada à promoção da inclusão e autonomia das pessoas com deficiência. A unidade concentra importantes atendimentos especializados, como o posto do Polo de Empregabilidade Inclusiva (PEI) Capital, voltado à inserção de pessoas com deficiência no mercado de trabalho. O serviço, que anteriormente funcionava na sede da Secretaria de Estado dos Direitos da Pessoa com Deficiência (SEDPcD), junto ao Museu da Inclusão, na Barra F...

Dia: 25 de Março, 2026

O novo algoritmo TurboQuant do Google acelera a memória AI em 8x, reduzindo custos em 50% ou mais

São Paulo ganha novo equipamento de atendimento jurídico e empregabilidade para pessoas com deficiência