Analisi completa del codice di errore comune del minatore Antminer e metodi di risoluzione dei problemi

0
errore di antminer

Nel mining di Bitcoin, la stabilità operativa degli Antminer di Bitmain è direttamente correlata all'output di hashrate e ai ricavi. I codici di errore che compaiono durante il funzionamento delle macchine per il mining sono indicatori visivi dello stato dell'hardware, dell'adattamento ambientale o di problemi di configurazione. Questo articolo organizza sistematicamente i codici di errore più comuni per tipo di errore, descrivendone le cause e le soluzioni di risoluzione dei problemi a più livelli per aiutare i miner a identificare rapidamente i problemi e ridurre al minimo le perdite dovute a tempi di inattività.

1. Operazioni di base: ottenimento di informazioni sugli errori principali dai registri

Tutti i codici di errore vengono registrati nel log del kernel della macchina di mining, che funge da base principale per la risoluzione dei problemi. Per ottenere i log, segui questi passaggi:

  1. Accedere all'interfaccia di gestione del backend utilizzando l'indirizzo IP della macchina per il mining;
  2. Fare clic su "Sistema" e trovare "Kernel Log";
  3. Copia il testo del log e filtra le voci contenenti "ERRORE", dando priorità ai punti di errore più importanti (in caso di più errori, il primo errore è spesso la causa principale). Suggerimento chiave: non riavviare la macchina per il mining alla cieca: il riavvio forzato in caso di determinati errori (come cortocircuito, bassa temperatura) causerà danni irreversibili. È necessario innanzitutto individuare il tipo di problema tramite i log.

2. Codici di errore correlati alla temperatura: avvertenze chiave per l'adattamento ambientale

La temperatura è la linfa vitale di una macchina per il mining. Temperature eccessivamente alte o basse attivano i meccanismi di protezione. Questi codici di errore sono molto comuni in tutti i modelli di macchine per il mining.

1. ERROR_TEMP_TOO_HIGH (Protezione dalle alte temperature)

Codice Significato: La temperatura interna della macchina per il mining ha superato la soglia di sicurezza (solitamente ≥85 °C), attivando una protezione di spegnimento automatico. Questo è comune a tutte le serie di macchine per il mining, inclusi i modelli S19, S21 e KS5.

Registro tipico: Stringa di errore di sweep = P:1. ERROR_TEMP_TOO_HIGH: Temperatura superata il limite massimo.

Cause principali:

  • Canali di dissipazione del calore bloccati (polvere, amenti o insetti si accumulano sul dissipatore di calore);
  • Temperatura eccessiva dell'aria in ingresso nella sala apparecchiature (superiore al limite massimo consigliato di 35°C);
  • La ventola si blocca o la sua velocità è insufficiente, con conseguente riduzione dell'efficienza di raffreddamento.

Passaggi per la risoluzione dei problemi:

  • Spegnimento di emergenza: evitare che le temperature elevate continuino a bruciare il chip. Attendere che la macchina si raffreddi sotto i 40 °C prima di rimetterla in funzione.
  • Pulizia e ispezione della polvere: utilizzare aria compressa per pulire la polvere dal dissipatore di calore e dalle ventole, assicurandosi che le fessure di ventilazione siano libere.
  • Ottimizzazione ambientale: ridurre la temperatura dell'aria in ingresso nella sala macchine (se possibile, installare un impianto di aria condizionata industriale) e assicurarsi che i condotti di scarico non siano ostruiti.
  • Test della ventola: controllare il registro per ERROR_FAN_LOST (ventola persa). In tal caso, risolvere il problema della ventola (vedere di seguito).

2. ERROR_TEMP_TOO_LOW (protezione da bassa temperatura)

  • Codice Significato: La temperatura ambiente è inferiore alla soglia di avvio (solitamente ≤ -20 °C) e la macchina per il mining non può avviarsi normalmente. Questo accade spesso in inverno nelle sale macchine ad alta latitudine.
  • Registro tipico: Stringa di errore di sweep = P:2. ERROR_TEMP_TOO_LOW: temperatura troppo bassa!
  • Causa principale: La bassa temperatura provoca una conduttività anomala nel circuito del chip e l'avvio forzato può facilmente causare un cortocircuito.
  • Passaggi per la risoluzione dei problemi:
    1. Arresto/Avvio: non tentare di avviare la macchina a temperature inferiori a -20°C.
    2. Riscaldamento ambiente: aumentare la temperatura della sala macchine a oltre 0°C utilizzando un riscaldatore o un condizionatore.
    3. Preriscaldare il Miner: applicare calore localizzato alla macchina per garantire che i componenti principali raggiungano la temperatura specificata prima dell'avvio.

3. Codici di errore della scheda hash e del chip: la causa principale della perdita di hashrate

Le schede hash e i chip ASIC sono le unità di elaborazione principali delle macchine per il mining. Errori correlati causano direttamente cali di potenza di hash o arresti anomali e sono particolarmente comuni nei modelli di fascia alta come S19 e KS5.

1. Errori di chip mancanti (0 chip/chip basso)

  • Codice Significato: La macchina per il mining non ha rilevato il numero previsto di chip ASIC. Questo errore è classificato come "0 chip per l'intera macchina" o "Chip per scheda insufficienti".
  • Registri tipici:
    1. Chip 0 per l'intera macchina: la catena 0 ha trovato solo 0 ASIC, spegnerà la scheda hash 0;
    2. Chip bassi per scheda: la catena 0 ha trovato solo 6 ASIC, spegnerà la scheda hash 0 o la catena 1, ASIC 54, nonce 455 < 85% media 541.
  • Cause principali:
    1. Cortocircuito della scheda hash o cavo del segnale allentato;
    2. Alimentazione instabile (fluttuazioni di tensione che causano guasti nell'attivazione del chip);
    3.Danni al chip ASIC o interruzione della trasmissione del segnale (ad esempio, segnali RO/RX anomali).
  • Passaggi per la risoluzione dei problemi:
Tipo di guasto Fase 1 (Risoluzione dei problemi di base) Fase 2 (Test avanzati) Fase 3 (Gestione professionale)
0 chip nell'intera macchina Spegnere e controllare se la scheda madre è in cortocircuito (utilizzare un multimetro per verificare la continuità). Se non si verifica alcun cortocircuito, riavviare la macchina per il mining. In caso di cortocircuito, restituire la macchina per la riparazione. Restituire la scheda madre difettosa in fabbrica per sostituirla.
Chip mancanti su una singola scheda Riposizionare il cavo della scheda madre e sostituirlo per effettuare il test. Sostituire l'alimentatore e verificare la corretta messa a terra. Utilizzare un dispositivo di prova per controllare la tensione del segnale del chip e sostituire eventuali chip danneggiati.
Hashboard mancante Controllare che i cavi che collegano la scheda madre alla scheda di controllo siano collegati saldamente. Sostituire le hashboard in una connessione incrociata per escludere eventuali problemi con gli slot. Ritornare in fabbrica per ispezionare l'interfaccia del segnale della scheda di controllo.

2. HAS_BOARDS_INCOMPLETE (Hashboard incompleta)

  • Significato: Il miner ha rilevato meno hashboard rispetto al valore progettato (ad esempio, un S19 segnalerà un errore se manca una hashboard). Alcuni nuovi firmware forzeranno l'arresto.
  • Registro tipico: ha schede incomplete... in fase di spegnimento...
  • Causa principale: Cavi della scheda madre difettosi o danneggiati. Alcuni modelli di firmware limitano la possibilità di "funzionare con schede mancanti".
  • Passaggi per la risoluzione dei problemi:
    1. Dopo aver spento il dispositivo, ricollegare e ricollegare i cavi della scheda madre per assicurarsi che i connettori siano privi di ossidazione.
    2. Sostituire i cavi con cavi nuovi per escludere l'invecchiamento dei cavi.
    3. Se è necessario un funzionamento temporaneo, provare a flashare il firmware precedente (la compatibilità deve essere confermata), ma la scheda difettosa deve essere riparata il prima possibile.

4. Alimentazione e codici di errore dell'alimentazione: la garanzia di base per un funzionamento stabile

Le anomalie dell'alimentazione sono la causa principale dei guasti a cascata e i messaggi di errore variano tra i modelli raffreddati ad aria e quelli raffreddati a liquido.

1. ERROR_POWER_LOST (Perdita di potenza/Anomala)

  • Codice Significato: Fluttuazione della tensione di alimentazione, interruzione o stato anomalo. Le descrizioni dei registri differiscono tra i modelli raffreddati ad aria e quelli raffreddati a liquido.
  • Registri tipici:
    ◦ Modelli raffreddati ad aria: ERROR_POWER_LOST: Aumento o calo della tensione di alimentazione, controllare!
    ◦ Modelli raffreddati a liquido: il volume medio della catena è sceso dal 1990 al 2.45
  • Cause principali:
    ◦ Connettore di alimentazione allentato o cavo di alimentazione danneggiato;
    ◦ Contatto scadente dovuto a viti allentate sulla barra di rame dell'alimentatore;
    ◦ Un guasto nell'alimentatore stesso (ad esempio un trigger di protezione dell'alimentazione nella serie APW9/APW12).
  • Passaggi per la risoluzione dei problemi:
    1. Controllare il cavo di controllo dell'alimentazione e le viti della barra di rame per assicurarsi che siano fissati saldamente.
    2. Utilizzare un multimetro per testare la tensione di uscita dell'alimentatore e confrontarla con le specifiche del miner (ad esempio, l'S19 richiede un'uscita stabile da 12 V).
    3. Sostituire l'alimentatore di backup con uno dello stesso modello e ripetere il test. Se il guasto viene confermato, riparare o sostituire l'alimentatore.

5. Codici di errore del sistema di raffreddamento e della ventola: la chiave per l'equilibrio della temperatura

Un guasto alla ventola attiva direttamente la protezione dalle alte temperature e rappresenta un "segnale di guasto" per i componenti più vulnerabili di una macchina per il mining.

ERROR_FAN_LOST (Ventola persa/Velocità anomala)

  • Codice Significato: La ventola non funziona o la velocità è inferiore alla soglia (solitamente <1500 giri/min). Questo è comune nei modelli con più ventole (come il sistema a 3 ventole dell'S9).
  • Registro tipico: ERROR_FAN_LOST: velocità ventola 1 0 rpm.
  • Causa principale: Cavo della ventola allentato, motore danneggiato o interfaccia della scheda di controllo difettosa.
  • Passaggi per la risoluzione dei problemi:
    1. Verificare che il cavo della ventola sia collegato saldamente e che non sia rotto o abbia connettori ossidati.
    2. Sostituire la ventola con una con le stesse specifiche e testarla. Se il funzionamento normale viene ripristinato, la ventola è difettosa.
    3. Se l'errore persiste dopo aver sostituito la ventola, aggiornare il firmware o sostituire la scheda di controllo.
    4. Per i modelli multi-ventola, eseguire un ripristino delle impostazioni di fabbrica per eliminare i problemi di compatibilità del firmware.