Credo che la lettura sia fondamentale. Gli ingegneri dell’affidabilità del sito (SRE) devono avere una profonda conoscenza in una vasta gamma di argomenti e argomenti come codifica, sistemi operativi, reti di laptop, sistemi distribuiti su larga scala, SRE Finest Practicese altro ancora per avere successo nel loro lavoro. In questo articolo, discuto alcuni libri che aiuteranno le SRE a migliorare il loro lavoro.
1. Ingegneria dell’affidabilità del sito, dal staff di Google SRE
Google originariamente ha coniato il termine “ingegneria dell’affidabilità del sito”. Questo libro è assolutamente da leggere per chiunque sia interessato all’ingegneria dell’affidabilità del sito. Copre una vasta gamma di argomenti che le SRES si concentrano su tutti i giorni come SLO, eliminando la fatica, monitoraggio di sistemi distribuiti, gestione del rilascio, gestione degli incidenti, infrastrutture e altro ancora. Questo libri offre una panoramica dei diversi elementi su cui lavorano le SRE. Sebbene questo libro abbia molti argomenti specifici per Google, fornisce un buon framework e modello mentale su vari argomenti SRE. La versione on-line di questo libro è disponibile liberamente, quindi non ci sono scuse per non leggerlo. La versione on-line gratuita di questo libro è disponibile qui.
2. La cartella di lavoro di affidabilità del sito, dal staff di Google SRE
Dopo il successo del libro di ingegneria affidabile del sito originale, il staff di Google SRE ha pubblicato questo libro come continuazione per aggiungere ulteriori dettagli sull’implementazione agli argomenti nel primo libro. Uno dei miei capitoli preferiti nel libro è “introdurre la progettazione di sistemi su larga scala non astratta” e l’ho letto più volte. In modo simile al loro primo libro, questo libro è disponibile anche gratuitamente per leggere on-line. Puoi leggere questo libro gratuitamente qui.
3. Efficiency dei sistemi, Di Brendan Gregg
Sono stato presentato al lavoro di Brendan Gregg attraverso il suo famoso weblog “Linux Efficiency Evaluation in 60.000 millisecondi.“Questo libro mi ha introdotto il metodo di utilizzo, che è uno che può aiutare a risolvere rapidamente i problemi di prestazioni. utilizzo, saturazioneE errori. Questo libro copre argomenti come Kernel Linux interni, vari strumenti di osservabilità (per analizzare gli argomenti di CPU, memoria, disco, file system e rete) e prestazioni dell’applicazione. Il metodo di utilizzo mi ha aiutato advert applicare la risoluzione metodica dei problemi durante la risoluzione dei problemi di sistema distribuito complessi. Questo libro può aiutarti a ottenere una comprensione più approfondita dei problemi di prestazione di risoluzione dei problemi su un sistema operativo Linux. Ulteriori informazioni sul suo libro sono disponibili qui.
4. L’interfaccia di programmazione Linux, Di Michael Kerrisk
Avere una comprensione più profonda sui sistemi operativi può offrire un prezioso vantaggio per le SRE. Il più delle volte, le SRE tendono a utilizzare molti comandi per configurare e risolvere i vari problemi relativi al sistema operativo. Tuttavia, capire come funzionano internamente i sistemi operativi contribuiscono a semplificare la risoluzione dei problemi. Questo libro fornisce una comprensione più profonda del sistema operativo Linux e si concentra sull’interfaccia di chiamata di sistema del sistema operativo Linux.
La maggior parte dei staff e delle aziende utilizza Linux per gestire sistemi di produzione. Tuttavia, è possibile lavorare in staff in cui vengono utilizzati altri sistemi operativi come Home windows. In tal caso, vale la pena includere un libro specifico per il sistema operativo nella tua lista di lettura. Puoi dare un’occhiata al libro sopra menzionato qui.
5. TCP/IP Illustrated: i protocolli, quantity 1, Di Kevin Fall e Richard Stevens
Questo libro è ottimo per conoscere i protocolli di rete di base come IP (Web Protocol), ICMP (Web Management Message Protocol), ARP (Indirizzo Decision Protocol), UDP (Consumer Datagram Protocol) e TCP (Transmission Management Protocol). Avere una forte comprensione della suite del protocollo TCP/IP e come utilizzare vari strumenti per debug di problemi di networking è una delle competenze fondamentali per le SRE. Questi libri forniscono al lettore una forte comprensione di come funzionano i protocolli sotto il cofano. I dettagli sul libro si trovano qui.
6. La rete illustrata: come TCP/IP funziona in una rete moderna, Di Walter Goralski
Mentre TCP/IP illustrato Fornisce una spiegazione approfondita dei protocolli Core TCP/IP, questo libro si concentra sulla comprensione dei principi fondamentali e su come funzionano in un moderno contesto di networking. Questa è un’ottima aggiunta alla tua biblioteca insieme a TCP/IP Illustrated, che fornisce una comprensione più profonda e più ampia dei protocolli TCP/IP. Maggiori informazioni su questo libro sono disponibili qui.
7. Progettazione di applicazioni advert alta intensità di dati, Di Martin Kleppmann
Questo è un ottimo libro per capire come sistemi distribuiti Lavorare attraverso l’obiettivo dei sistemi orientati ai dati. Se stai lavorando su sistemi di database distribuiti, questo libro è assolutamente da leggere. Personalmente ho imparato molto con questo libro perché attualmente lavoro come SRE su CosmOSDB (un servizio di database distribuito a livello globale). Ciò che rende questo libro specificamente utile per le SRE è che si concentra sull’affidabilità, sulla scalabilità e sulla manutenzione delle applicazioni advert alta intensità di dati. Si immerge in profondità a concetti di database distribuiti come duplicate, partizionamento, transazioni e problemi con consenso distribuito. Puoi saperne di più su questo libro qui.
8. Costruire un sistema sicuro e affidabileS, dal staff di Google SRE
Questo libro estende i principi dell’ingegneria dell’affidabilità del sito per comprendere gli aspetti della sicurezza e sostiene che la sicurezza e l’affidabilità non sono preoccupazioni separate, ma piuttosto sono profondamente correlate e dovrebbero essere affrontate insieme. Sostiene l’integrazione di pratiche di sicurezza in ogni fase del ciclo di vita del sistema, dalla progettazione e sviluppo alla distribuzione e alle operazioni. Google ha reso questo libro disponibile gratuitamente qui.
9. Libri specifici del dominio
Spesso, le SRE lavorano in settori specifici come database, sistemi di comunicazione in tempo reale, sistemi ERP/CRM, sistemi AI/ML e altro ancora, e avere una comprensione generale di questi domini è importante essere efficaci nel tuo lavoro. Includere un libro nella tua lista di lettura che fornisce un’ampiezza di conoscenza dei domini è un’ottima concept.
Conclusione
Leggendo questi libri, puoi sviluppare una comprensione più profonda su vari argomenti come codifica, sistemi operativi, reti di laptop, sistemi distribuiti e principi SRE che ti aiuteranno a diventare un ingegnere di affidabilità del sito migliore. Personalmente, questi libri mi hanno aiutato advert ampliare la mia comprensione delle conoscenze essenziali per svolgere il mio lavoro come SRE in modo efficace, e mi hanno anche aiutato mentre perseguivo anche opportunità tra staff e organizzazioni. Buona lettura!