Полный анализ распространенных кодов ошибок майнера Antminer и методы устранения неполадок

0
ошибка antminer

В майнинге биткоинов стабильная работа Antminer-устройств Bitmain напрямую связана с выходной мощностью хешрейта и доходностью. Коды ошибок, возникающие во время работы майнинг-оборудования, являются визуальными индикаторами состояния оборудования, адаптации к окружающей среде или проблем с конфигурацией. В этой статье систематизированы распространённые коды ошибок по типам с подробным описанием их причин и многоуровневыми решениями по устранению неполадок, которые помогают майнерам быстро выявлять проблемы и минимизировать потери от простоя.

1. Базовые операции: получение информации о неисправностях ядра из журналов

Все коды ошибок записываются в журнал ядра майнинг-машины, который служит основной основой для диагностики неполадок. Чтобы получить журналы, выполните следующие действия:

  1. Доступ к интерфейсу управления бэкэндом, используя IP-адрес майнинговой машины;
  2. Нажмите «Система» и найдите «Журнал ядра»;
  3. Скопируйте текст журнала и отфильтруйте записи, содержащие слово «ERROR», отдавая приоритет наиболее важным неисправностям (в случае нескольких неисправностей первая неисправность часто является основной причиной). Совет: не перезапускайте майнинг-машину бездумно — принудительный перезапуск при определённых неисправностях (например, коротком замыкании, низкой температуре) приведёт к необратимым повреждениям. Сначала необходимо определить тип проблемы по журналам.

2. Коды ошибок, связанных с температурой: основные предупреждения для адаптации к окружающей среде

Температура — жизненно важный фактор для майнингового оборудования. Чрезмерно высокие или низкие температуры приводят к срабатыванию защитных механизмов. Эти коды ошибок широко распространены для всех моделей майнингового оборудования.

1. ERROR_TEMP_TOO_HIGH (Защита от высокой температуры)

Код Значение: Температура ядра майнинг-машины превысила безопасный порог (обычно ≥85°C), что привело к срабатыванию автоматического отключения. Это характерно для всех серий майнинг-машин, включая S19, S21 и KS5.

Типичный журнал: Строка ошибки развертки = P:1. ERROR_TEMP_TOO_HIGH: Превышение максимальной температуры.

Основные причины:

  • Заблокированные каналы отвода тепла (на радиаторе скапливаются пыль, сережки или насекомые);
  • Чрезмерная температура воздуха на входе в аппаратное помещение (выше рекомендуемого верхнего предела 35°С);
  • Остановка вентилятора или недостаточная скорость, что приводит к снижению эффективности охлаждения.

Действия по устранению неполадок:

  • Аварийное отключение питания: предотвратите перегорание микросхемы из-за длительного воздействия высоких температур. Подождите, пока температура устройства не опустится ниже 40°C, прежде чем возобновить работу.
  • Очистка от пыли и осмотр: используйте сжатый воздух для очистки радиатора и вентиляторов от пыли, следя за тем, чтобы вентиляционные зазоры были чистыми.
  • Оптимизация окружающей среды: Уменьшите температуру воздуха на входе в аппаратную (по возможности установите промышленный кондиционер) и убедитесь, что вытяжные каналы свободны.
  • Тест вентилятора: проверьте наличие в журнале ошибки ERROR_FAN_LOST (потеря вентилятора). Если ошибка присутствует, устраните её (см. ниже).

2. ERROR_TEMP_TOO_LOW (защита от низкой температуры)

  • Код Значение: Температура окружающей среды ниже порога запуска (обычно ≤ -20°C), и майнинговая машина не может нормально запуститься. Это часто происходит зимой в машинных отделениях в высоких широтах.
  • Типичный журнал: Строка ошибки развертки = P:2. ERROR_TEMP_TOO_LOW: температура слишком низкая!
  • Основная причина: Низкая температура приводит к аномальной проводимости в цепи микросхемы, а принудительный запуск может легко вызвать короткое замыкание.
  • Действия по устранению неполадок:
    1. Стоп-старт: Не пытайтесь запустить машину при температуре ниже -20°C.
    2. Обогрев помещения: Поднимите температуру в машинном отделении до уровня выше 0°C с помощью обогревателя или кондиционера.
    3. Предварительный нагрев майнера: локально нагрейте машину, чтобы гарантировать, что основные компоненты достигнут заданной температуры перед запуском.

3. Коды ошибок хэш-платы и чипа: основная причина потери хэшрейта

Хэш-платы и микросхемы ASIC являются основными вычислительными блоками майнинговых машин. Связанные с ними ошибки напрямую приводят к падению вычислительной мощности или сбоям в работе и особенно часто встречаются в топовых моделях, таких как S19 и KS5.

1. Ошибки отсутствия чипа (0 чипов/малое количество чипов)

  • Код Значение: Майнинговая машина не обнаружила необходимое количество ASIC-чипов. Эта ошибка классифицируется как «0 чипов на всей машине» или «Мало чипов на плате».
  • Типичные журналы:
    1. Чип 0 для всей машины: цепочка 0 обнаружила только 0 ASIC, отключит хэш-плату 0;
    2. Низкое количество чипов на плату: цепочка 0 обнаружила только 6 ASIC, отключит хэш-плату 0 или цепочку 1, ASIC 54, nonce 455 < 85% в среднем 541.
  • Основные причины:
    1. Короткое замыкание на плате хэш-платы или неплотный обрыв сигнального кабеля;
    2.Нестабильное питание (колебания напряжения, приводящие к сбою активации микросхемы);
    3. Повреждение микросхемы ASIC или прерывание передачи сигнала (например, ненормальные сигналы RO/RX).
  • Шаги устранения неполадок:
Тип неисправности Шаг 1 (Основные методы устранения неполадок) Шаг 2 (Расширенное тестирование) Шаг 3 (Профессиональное обращение)
0 чипов во всей машине Выключите питание и проверьте плату на наличие короткого замыкания (используйте мультиметр для проверки целостности цепи). Если короткого замыкания не произошло, перезапустите майнинг-машину. Если короткое замыкание произошло, верните машину в ремонт. Вернитесь на завод для замены неисправной панели.
Отсутствующие чипы на одной плате Переподключите кабель хэшборда и замените его для проверки. Замените блок питания и проверьте надежность заземления. Используйте испытательное приспособление для проверки напряжения сигнала микросхемы и замените любые поврежденные микросхемы.
Отсутствует хэшборд Проверьте, надежно ли подключены кабели, соединяющие хэшборд с платой управления. Замените хэш-платы в кросс-подключении, чтобы исключить любые проблемы со слотами. Вернитесь на завод для проверки интерфейса сигнала платы управления.

2. HAS_BOARDS_INCOMPLETE (Хэшборд неполный)

  • Смысл: Майнер обнаружил меньше хеш-плат, чем предполагалось (например, S19 сообщит об ошибке, если отсутствует одна хеш-плата). Некоторые новые прошивки могут приводить к принудительному завершению работы.
  • Типичный журнал: имеет неполные доски… закрывается…
  • Основная причина: Некачественные или повреждённые кабели хэш-платы. Некоторые модели прошивок ограничивают работу с отсутствующими платами.
  • Шаги устранения неполадок:
    1. После выключения питания снова подключите и снова подсоедините кабели панели, чтобы убедиться в отсутствии окисления на разъемах.
    2. Замените кабели на новые, чтобы исключить старение кабелей.
    3. Если требуется временная работа, попробуйте прошить старую прошивку (совместимость должна быть подтверждена), но неисправную плату следует отремонтировать как можно скорее.

4. Блок питания и коды ошибок блока питания: залог стабильной работы

Основной причиной каскадных сбоев являются неполадки в электроснабжении, а сообщения об ошибках различаются для моделей с воздушным и жидкостным охлаждением.

1. ERROR_POWER_LOST (Потеря питания/Ненормальная работа)

  • Код Значение: Колебания напряжения питания, перебои в подаче или ненормальное состояние. Описания журналов различаются для моделей с воздушным и жидкостным охлаждением.
  • Типичные журналы:
    ◦ Модели с воздушным охлаждением: ERROR_POWER_LOST: Повышение или падение напряжения питания, проверьте!
    ◦ Модели с жидкостным охлаждением: средний объем цепи снизился с 1990 до 2.45
  • Основные причины:
    ◦ Ослабленный разъем питания или поврежденный шнур питания;
    ◦ Плохой контакт из-за ослабленных винтов на медной шине блока питания;
    ◦ Неисправность самого источника питания (например, срабатывание защиты по питанию в серии APW9/APW12).
  • Шаги устранения неполадок:
    1. Проверьте кабель управления питанием и винты медной шины, чтобы убедиться, что они надежно закреплены.
    2. С помощью мультиметра проверьте выходное напряжение блока питания и сравните его со спецификациями майнера (например, для S19 требуется стабильное выходное напряжение 12 В).
    3. Замените резервный блок питания той же модели и повторите проверку. Если неисправность подтвердится, отремонтируйте или замените блок питания.

5. Коды ошибок вентилятора и системы охлаждения: ключ к температурному балансу

Отказ вентилятора напрямую приводит к срабатыванию защиты от перегрева и является «сигналом о неисправности» для наиболее уязвимых компонентов горнодобывающей машины.

ERROR_FAN_LOST (потеря вентилятора/ненормальная скорость)

  • Код Значение: Вентилятор не работает или его скорость ниже порогового значения (обычно <1500 об/мин). Это часто встречается в моделях с несколькими вентиляторами (например, в системе с тремя вентиляторами S9).
  • Типичный журнал: ERROR_FAN_LOST: скорость вентилятора 1 0 об/мин.
  • Основная причина: Ослабленный кабель вентилятора, поврежденный двигатель или неисправный интерфейс платы управления.
  • Действия по устранению неполадок:
    1. Проверьте, что кабель вентилятора надежно подключен, не поврежден и не имеет окисленных разъемов.
    2. Замените вентилятор с такими же характеристиками и проверьте его. Если нормальная работа восстановится, вентилятор неисправен.
    3. Если ошибка сохраняется после замены вентилятора, обновите прошивку или замените плату управления.
    4. Для моделей с несколькими вентиляторами выполните сброс настроек к заводским, чтобы устранить проблемы совместимости прошивки.