TL;DR: Google Chrome ha iniziato a installare silenziosamente i pesi di Gemma 3 e Gemma 4 sotto forma del file weights.bin da 4 GB, occupando RAM e VRAM senza chiedere all’utente. Il problema non è il modello in sé, ma l’arroganza di un’attivazione predefinita che può saturare la memoria durante videogiochi, sessioni di lavoro locali o altre attività pesanti, con rischi concreti di instabilità del sistema per chi non usa (e non vuole) queste feature.
Perché un file da 4 GB appare all’improvviso e consuma RAM invisibilmente
Il problema esplode sui sistemi con memoria limitata perché il caricamento del modello avviene a livello di sistema e compete per le stesse risorse usate dalle applicazioni attive. Chrome aggiorna i propri componenti in background; tra questi, l’infrastruttura dell’AI nascosta scarica ed estrae i pesi dei nuovi modelli. Il risultato è una pressione immediata su RAM e VRAM: anche se stai giocando o lavorando con app locali, Chrome può attivare il modello e bloccare fino a 4 GB di memoria video o di sistema, senza preavviso né finestre di dialogo.
Su hardware con 8 GB di VRAM o 16 GB di RAM di sistema, questo dettaglio non è teorico: può tradursi in cali di frame rate, crash di programmi pesanti o rallentamenti improvvisi. L’ottimizzazione promessa per l’edge AI richiede memoria per funzionare; quella memoria viene presa a chi la stava già usando.

Perché Google lo fa (e perché il “bloat” è una scelta calcolata)
La vera domanda, che i comunicati stampa di Google evitano accuratamente, è: perché un’azienda dovrebbe piazzare 4 GB di dati sull’hard disk (e in RAM) di miliardi di utenti senza chiedere il permesso? La risposta è la corsa disperata al monopolio dell’intelligenza artificiale locale.
Google sta preparando il terreno per un’assistente integrato a livello di sistema operativo (Gemini) direttamente nel browser. Per farlo, devono addestrare l’infrastruttura degli utenti *prima* ancora che questi decidano di usarla. Se scarichi il modello solo quando lo chiedi, c’è un fastidioso ritardo (latenza) la prima volta che interagisci. Scaricandolo in automatico, sotto forma di aggiornamento invisibile del browser, Google si assicura che la “feature” sia pronta all’uso prima ancora che tu ti accorga di averla. Hai letto bene: ti stanno occupando spazio e risorse per preparare un prodotto che magari non vuoi nemmeno usare.
Il concetto di “spazio” qui è fondamentale e spaventoso. Stiamo parlando di file da 4 GB. Su un SSD da 2 TB magari te ne fregi, ma su un portatile entry-level da 128 GB, o su una macchina dove ogni singolo gigabyte di VRAM conta per far girare i motori grafici, quei 4 GB non sono un dettaglio: sono un furto. Quando apri l’articolo che ti avverte di questo problema, spesso è già troppo tardi: l’aggiornamento silenzioso è già passato, il file è lì, e la tua RAM sta già venendo masticata in background.
Perché il “bloat” del browser diventa un rischio concreto durante task intensivi
La maggior parte degli articoli si ferma alla novità tecnologica, ma la vera criticità è l’impatto su chi usa attivamente la macchina per produrre o giocare. Quando Chrome ruba RAM senza permesso, altera l’equilibrio del sistema operativo: i driver grafici devono gestire improvvisamente un carico di inferenza extra, riducendo le risorse disponibili per la GPU. Il risultato è la competizione per la stessa memoria, con conseguenze visibili come scatti, crash o latenza improvvisa.
Il secondo effetto collaterale poco discusso è la stabilità dei modelli locali. Molti utenti mantengono attivi LLM eseguiti in locale per flussi di lavoro protetti; se Chrome “mangia” VRAM, questi flussi rallentano o si interrompono perché i pesi di Gemma 3 e Gemma 4 saturano lo spazio prima che il modello locale possa allocare ciò che gli serve. In questo scenario, non è più una questione di privacy o di “spazio su disco”: è un problema di affidabilità del sistema durante il lavoro reale.
Come disattivare Gemma su Chrome e recuperare RAM
È possibile intervenire senza disinstallare nulla. Inserisci nella barra degli indirizzi chrome://flags
cerca:
Enables optimization guide on device
, impostalo su Disabled e riavvia Chrome. Al riavvio il browser elimina automaticamente il file weights.bin e libera la memoria occupata. Se il file non viene rimosso in automatico, puoi cancellarlo manualmente dalla cartella dati utente di Chrome.
Per bloccare il ricaricamento futuro, vai in Impostazioni → Estensioni → Componenti aggiuntivi e disattiva i moduli collegati a Gemini e ai modelli Gemma. Questo impedisce a Chrome di mantenere il modello in memoria all’avvio, senza richiedere tool esterni o modifiche al registro di sistema.
Chi comanda il computer, tu o i server di Google?
Disabilitare il modello e rimuovere weights.bin non è solo una manovra tecnica per recuperare qualche giga: è un atto di riappropriazione. L’idea che un’azienda possa occupare risorse fisiche del tuo computer (RAM, VRAM, spazio su disco) per preparare dei servizi che tu magari non vuoi usare, viola il principio base di chiunque utilizzi uno strumento informatico: il controllo.
Farlo subito sui sistemi con RAM o VRAM limitate evita sovraccarichi improvvisi durante il lavoro o il gioco, ma soprattutto ci ricorda una verità scomoda: il “gratis” di Google si paga sempre. Si paga con i dati, con la privacy, e ora, letteralmente, con i nostri gigabyte di memoria. Tenere attiva questa funzione significa accettare di essere il nodo silente di un’infrastruttura che non abbiamo chiesto. Spegnerla restituisce il controllo sulla memoria, previene i cali di prestazioni non annunciati e, soprattutto, rimette il tuo computer nelle tue mani, non in quelle di un algoritmo che decide cosa farti scaricare senza chiederti il permesso.
Se invece hai la tentazione di usarlo ma non approvi il comportamento di Google una soluzione potrebbe essere Leo di Brave: l’AI gratis nel browser, con più modelli e zero dati condivisi.