Spedisci più velocemente, non più duramente: Consigli sulle prestazioni che evolvono realmente

📖 7 min read•1,241 words•Updated Apr 4, 2026

Tutti noi ci siamo passati. La tua applicazione funziona perfettamente in sviluppo, gestisce i tuoi dati di test come un campione e poi arrivano utenti reali. All’improvviso, tutto rallenta. I tempi di risposta schizzano alle stelle. La tua fattura cloud assomiglia a un numero di telefono. Ti dice qualcosa?

Ho trascorso anni a sistemare sistemi che dovevano gestire un carico serio, e gli schemi che contano tornano ancora e ancora. Non sono best practice teoriche estratte da un manuale. Sono gli elementi che fanno realmente la differenza quando il tuo sistema è sotto pressione.

Inizia da ciò che puoi misurare

Prima di ottimizzare qualcosa, devi sapere dove si trova realmente il collo di bottiglia. Indovinare è il modo più veloce per perdere una settimana a rifattorizzare un codice che non è mai stato il problema.

Prima di tutto, implementa l’osservabilità. Al minimo, vuoi tre cose: logging strutturato, tracciamento delle richieste e dashboard delle metriche. Strumenti come OpenTelemetry rendono tutto questo semplice nella maggior parte degli ecosistemi linguistici.

Ecco un esempio rapido di aggiunta di strumentazione di timing di base a una route Express:


app.use((req, res, next) => {
 const start = process.hrtime.bigint();
 res.on('finish', () => {
 const duration = Number(process.hrtime.bigint() - start) / 1e6;
 logger.info({ method: req.method, path: req.path, status: res.statusCode, durationMs: duration });
 });
 next();
});

Questo ti dirà da solo quali endpoint sono lenti e con quale frequenza vengono sollecitati. Rimarrai sorpreso di scoprire che il vero colpevole è una route a cui nessuno aveva pensato.

Le query del database sono quasi sempre il collo di bottiglia

Nove volte su dieci, le applicazioni lente lo sono a causa del layer del database. Non è il framework, non è il linguaggio, non è il server. Sono le query.

Ecco le correzioni ad alto impatto a cui torno costantemente:

Aggiungi indici basati sui modelli di query reali. Esegui EXPLAIN sulle tue query più lente. Cerca scansioni sequenziali su grandi tabelle. Un solo indice ben posizionato può trasformare una query da 3 secondi in una da 5 millisecondi.
Elimina le query N+1. Se utilizzi un ORM, attiva il logging delle query in sviluppo e monitora le query ripetute nei cicli. Usa il caricamento anticipato o il caricamento in batch invece.
Paginare tutto. Non restituire mai set di risultati illimitati. Utilizza la paginazione basata su cursori per grandi set di dati invece di OFFSET, che rallenta man mano che il numero di pagina aumenta.
Memorizza nella cache i dati letti frequentemente. Se il risultato di una query non cambia spesso, memorizzalo nella cache. Redis è una scelta solida. Anche un TTL di 60 secondi può ridurre notevolmente il carico del database durante i picchi di traffico.

Un semplice modello di caching in Python con Redis assomiglia a questo:


import redis, json

cache = redis.Redis(host='localhost', port=6379, db=0)

def get_product(product_id):
 cache_key = f"product:{product_id}"
 cached = cache.get(cache_key)
 if cached:
 return json.loads(cached)
 product = db.query("SELECT * FROM products WHERE id = %s", (product_id,))
 cache.setex(cache_key, 300, json.dumps(product))
 return product

Cinque righe di logica di caching. Potenzialmente migliaia di query al database evitate al minuto.

Scalabilità orizzontale, ma solo quando è necessario

La scalabilità orizzontale è potente, ma introduce complessità. Prima di creare più istanze, assicurati di aver estratto il massimo delle prestazioni da ciò che hai già.

La scalabilità verticale, dando al tuo server esistente più CPU e memoria, è sottovalutata. È più semplice, non ha la sovraccarico dei sistemi distribuiti e ti offre spesso più margine di manovra di quanto le persone si aspettino.

Quando devi espanderti, tieni a mente questi principi:

Rendi la tua applicazione stateless. I dati di sessione, i caricamenti di file e lo stato temporaneo devono risiedere in store esterni come Redis o uno storage di oggetti, e non nel filesystem locale.
Utilizza il connection pooling. Ogni nuova istanza che apre le proprie connessioni al database esaurirà rapidamente il tuo limite di connessioni. Usa un pooler come PgBouncer per PostgreSQL.
Fai load balancing intelligente. Il round-robin è accettabile per carichi di lavoro uniformi. Per tutto il resto, prendi in considerazione il routing verso le connessioni meno utilizzate o il routing ponderato.

La performance del frontend è quella visibile dall’utente

L’ottimizzazione del backend conta, ma gli utenti percepiscono direttamente la performance del frontend. Un tempo di risposta API di 200 ms non significa nulla se il browser impiega 4 secondi a renderizzare la pagina.

Guadagni rapidi che fanno una vera differenza:

Carica le immagini e i componenti pesanti in modo pigramente. Carica solo ciò che è visibile nella finestra di visualizzazione. L’API Intersection Observer rende questo chiaro ed efficiente.
Comprimi e servi formati moderni. Usa WebP o AVIF per le immagini. Attiva la compressione Brotli sul tuo server. Questi sono cambiamenti a bassa fatica e ad alta ricompensa.
Suddivisione dei bundle. Spedisci solo il JavaScript necessario per la pagina attuale. Le importazioni dinamiche in React o Vue rendono questo quasi banale.
Utilizza un CDN. Le risorse statiche devono essere servite da località di edge vicine ai tuoi utenti. Questo può ridurre notevolmente i tempi di caricamento per un pubblico globale.

Una nota sui Core Web Vitals

Google utilizza i Core Web Vitals come un segnale di ranking. Largest Contentful Paint, Cumulative Layout Shift e Interaction to Next Paint contano tutti per il SEO e l’esperienza utente. Esegui Lighthouse regolarmente e considera le regressioni come bug.

Elaborazione asincrona per compiti pesanti

Non tutto deve svolgersi nel ciclo di richiesta-risposta. Se un’azione dell’utente innesca qualcosa di costoso come l’invio di un’email, la generazione di un report o l’elaborazione di un caricamento, spingilo in una coda di fondo.

Le code di messaggi come RabbitMQ, Amazon SQS, o anche soluzioni basate su Redis come BullMQ ti consentono di decouplare il lavoro dalla risposta. L’utente riceve una conferma immediata, e l’elaborazione pesante avviene in background alla velocità che i tuoi lavoratori possono gestire.

Questo modello è anche un punto di scalabilità naturale. Hai bisogno di più throughput? Aggiungi più lavoratori. Nessun cambiamento necessario nella tua API.

Non ottimizzare ciò che puoi eliminare

Il codice più veloce è quello che non viene mai eseguito. Prima di ottimizzare un processo lento, chiediti se deve esistere affatto.

Calcoli qualcosa a ogni richiesta che potrebbe essere precalcolato?
Chiami un’API esterna quando un cache locale sarebbe sufficiente?
Esegui un job cron ogni minuto quando un’esecuzione ogni ora sarebbe sufficiente?

La semplificazione prevale quasi sempre sull’ottimizzazione. Meno pezzi mobili significano meno cose che possono rompersi, meno cose da monitorare e meno cose da scalare.

In sintesi

L’ottimizzazione delle performance non è un progetto una tantum. È un’abitudine. Misura prima, correggi il collo di bottiglia più grande, controlla il miglioramento e ripeti. Resisti alla tentazione di ottimizzare prematuramente elementi che non sono realmente lenti. Concentrati sulla tua energia dove i dati ti dicono che ha importanza.

I consigli qui coprono gli schemi che forniscono sistematicamente il massimo impatto in sistemi del mondo reale. Inizia con l’osservabilità, correggi le tue query, memorizza nella cache in modo aggressivo e sposta i lavori pesanti in background. Rimarrai sorpreso di vedere fino a dove ti porterà.

Se stai costruendo qualcosa che deve funzionare su larga scala, agntmax.com è il posto dove affrontiamo questi problemi ogni giorno. Rimani con noi, esplora i nostri altri articoli sulla progettazione di sistemi e architettura cloud, e facci sapere quali sfide di performance devi affrontare. Saremmo felici di aiutarti a risolverle.

Spedisci più velocemente, non più duramente: Consigli sulle prestazioni che evolvono realmente

Inizia da ciò che puoi misurare

Le query del database sono quasi sempre il collo di bottiglia

Scalabilità orizzontale, ma solo quando è necessario

La performance del frontend è quella visibile dall’utente

Una nota sui Core Web Vitals

Elaborazione asincrona per compiti pesanti

Non ottimizzare ciò che puoi eliminare

In sintesi

Articoli correlati

Related Articles

Inizia da ciò che puoi misurare

Le query del database sono quasi sempre il collo di bottiglia

Scalabilità orizzontale, ma solo quando è necessario

La performance del frontend è quella visibile dall’utente

Una nota sui Core Web Vitals

Elaborazione asincrona per compiti pesanti

Non ottimizzare ciò che puoi eliminare

In sintesi

Articoli correlati

You May Also Like

📚 You Might Also Like

Related Articles