นักขุดคริปโต

การวิเคราะห์รหัสข้อผิดพลาดทั่วไปของ Antminer miner และวิธีการแก้ไขปัญหาอย่างสมบูรณ์

ในการขุดบิตคอยน์ การทำงานที่เสถียรของเครื่อง Bitmain Antminer เกี่ยวข้องโดยตรงกับอัตราแฮชเอาต์พุตและผลตอบแทนจากรายได้ รหัสข้อผิดพลาดที่ปรากฏระหว่างการทำงานของเครื่องขุดเป็นตัวบ่งชี้สถานะฮาร์ดแวร์ การปรับตัวตามสภาพแวดล้อม หรือปัญหาการกำหนดค่า บทความนี้จะจัดเรียงรหัสข้อผิดพลาดทั่วไปตามประเภทข้อผิดพลาดอย่างเป็นระบบ พร้อมอธิบายสาเหตุและวิธีแก้ไขปัญหาแบบแบ่งระดับ เพื่อช่วยให้นักขุดสามารถระบุปัญหาได้อย่างรวดเร็วและลดการสูญเสียจากการหยุดทำงาน

1. การดำเนินการพื้นฐาน: การรับข้อมูลความผิดพลาดหลักจากบันทึก

รหัสข้อผิดพลาดทั้งหมดจะถูกบันทึกไว้ในบันทึกเคอร์เนลของเครื่องขุด ซึ่งใช้เป็นพื้นฐานหลักในการแก้ไขปัญหา หากต้องการรับบันทึก ให้ทำตามขั้นตอนเหล่านี้:

  1. เข้าถึงอินเทอร์เฟซการจัดการแบ็คเอนด์โดยใช้ที่อยู่ IP ของเครื่องขุด
  2. คลิก “ระบบ” และค้นหา “บันทึกเคอร์เนล”
  3. คัดลอกข้อความบันทึกและกรองรายการที่มีคำว่า "ERROR" โดยจัดลำดับความสำคัญของจุดบกพร่องที่มีลำดับความสำคัญสูงสุด (ในกรณีที่มีข้อผิดพลาดหลายจุด ข้อผิดพลาดแรกมักจะเป็นสาเหตุหลัก) เคล็ดลับสำคัญ: อย่ารีสตาร์ทเครื่องขุดแบบไร้สติ การบังคับให้รีสตาร์ทภายใต้ข้อผิดพลาดบางอย่าง (เช่น ไฟฟ้าลัดวงจร อุณหภูมิต่ำ) จะทำให้เกิดความเสียหายที่แก้ไขไม่ได้ คุณต้องระบุประเภทของปัญหาผ่านบันทึกเสียก่อน

2. รหัสข้อผิดพลาดที่เกี่ยวข้องกับอุณหภูมิ: คำเตือนสำคัญสำหรับการปรับตัวต่อสภาพแวดล้อม

อุณหภูมิคือหัวใจสำคัญของเครื่องขุด อุณหภูมิที่สูงหรือต่ำเกินไปจะกระตุ้นกลไกการป้องกัน รหัสข้อผิดพลาดเหล่านี้พบได้บ่อยในเครื่องขุดทุกรุ่น

1. ERROR_TEMP_TOO_HIGH (การป้องกันอุณหภูมิสูง)

ความหมายของรหัส:อุณหภูมิแกนของเครื่องขุดสูงเกินเกณฑ์ความปลอดภัย (โดยปกติ ≥85°C) ส่งผลให้ระบบหยุดทำงานอัตโนมัติ ซึ่งเป็นเรื่องปกติสำหรับเครื่องขุดทุกรุ่น รวมถึงรุ่น S19, S21 และ KS5

บันทึกทั่วไป: สตริงข้อผิดพลาดการกวาด = P:1 ERROR_TEMP_TOO_HIGH: อุณหภูมิเกินสูงสุด

สาเหตุหลัก:

  • ช่องระบายความร้อนถูกปิดกั้น (ฝุ่น เกสรดอกไม้ หรือแมลงสะสมบนแผงระบายความร้อน)
  • อุณหภูมิอากาศเข้าในห้องอุปกรณ์สูงเกินไป (เกินขีดจำกัดบนที่แนะนำที่ 35°C)
  • พัดลมหยุดทำงานหรือความเร็วลมไม่เพียงพอ ส่งผลให้ประสิทธิภาพในการทำความเย็นลดลง

ขั้นตอนการแก้ไขปัญหา:

  • ปิดเครื่องฉุกเฉิน: ป้องกันไม่ให้ชิปไหม้เนื่องจากอุณหภูมิสูงต่อเนื่อง รอจนกว่าเครื่องจะเย็นลงต่ำกว่า 40°C ก่อนใช้งานอีกครั้ง
  • การทำความสะอาดฝุ่นและการตรวจสอบ: ใช้ลมอัดเพื่อทำความสะอาดฝุ่นออกจากแผงระบายความร้อนและพัดลม ตรวจสอบให้แน่ใจว่าช่องว่างการระบายอากาศว่างเปล่า
  • การเพิ่มประสิทธิภาพด้านสิ่งแวดล้อม: ลดอุณหภูมิของทางเข้าอากาศในห้องอุปกรณ์ (ติดตั้งเครื่องปรับอากาศอุตสาหกรรม หากเป็นไปได้) และตรวจสอบให้แน่ใจว่าท่อระบายอากาศไม่มีสิ่งกีดขวาง
  • การทดสอบพัดลม: ตรวจสอบบันทึกสำหรับ ERROR_FAN_LOST (พัดลมหาย) หากพบปัญหา ให้แก้ไขปัญหาพัดลม (ดูด้านล่าง)

2. ERROR_TEMP_TOO_LOW (การป้องกันอุณหภูมิต่ำ)

  • ความหมายของรหัส:อุณหภูมิโดยรอบต่ำกว่าเกณฑ์เริ่มต้น (โดยปกติ ≤ -20°C) และเครื่องขุดไม่สามารถเริ่มทำงานได้ตามปกติ ซึ่งมักเกิดขึ้นในช่วงฤดูหนาวในห้องเครื่องที่อยู่ละติจูดสูง
  • บันทึกทั่วไป: สตริงข้อผิดพลาดการกวาด = P:2 ERROR_TEMP_TOO_LOW: อุณหภูมิต่ำเกินไป!
  • สาเหตุหลัก:อุณหภูมิต่ำทำให้เกิดการนำไฟฟ้าผิดปกติในวงจรชิป และการสตาร์ทแบบฝืนๆ อาจทำให้เกิดไฟฟ้าลัดวงจรได้ง่าย
  • ขั้นตอนการแก้ไขปัญหา:
    1. หยุดเริ่ม: อย่าพยายามสตาร์ทเครื่องที่อุณหภูมิต่ำกว่า -20°C
    2. ระบบทำความร้อนโดยรอบ: เพิ่มอุณหภูมิห้องเครื่องให้สูงกว่า 0°C โดยใช้เครื่องทำความร้อนหรือเครื่องปรับอากาศ
    3. อุ่นเครื่องขุดล่วงหน้า: ใช้ความร้อนเฉพาะจุดกับเครื่องเพื่อให้แน่ใจว่าส่วนประกอบหลักจะถึงอุณหภูมิที่กำหนดก่อนที่จะเริ่มต้น

3. รหัสข้อผิดพลาดของบอร์ดแฮชและชิป: สาเหตุหลักของการสูญเสียอัตราแฮช

บอร์ดแฮชและชิป ASIC เป็นหน่วยประมวลผลหลักของเครื่องขุด ข้อผิดพลาดที่เกี่ยวข้องมักนำไปสู่การลดลงของพลังงานแฮชหรือการปิดระบบโดยตรง และมักพบในรุ่นไฮเอนด์อย่าง S19 และ KS5

1. ข้อผิดพลาดชิปหายไป (ชิป 0/ชิปต่ำ)

  • ความหมายของรหัส:เครื่องขุดไม่ตรวจพบจำนวนชิป ASIC ตามที่ออกแบบไว้ ข้อผิดพลาดนี้จัดอยู่ในประเภท "0 ชิปสำหรับทั้งเครื่อง" หรือ "ชิปต่ำต่อบอร์ด"
  • บันทึกทั่วไป:
    1.ชิป 0 สำหรับเครื่องทั้งหมด: Chain 0 พบ ASIC เพียง 0 ตัว จะปิดบอร์ดแฮช 0
    2. ชิปต่ำต่อบอร์ด: Chain 0 พบ ASIC เพียง 6 ตัว จะปิดบอร์ดแฮช 0 หรือ Chain 1, ASIC 54, nonce 455 < ค่าเฉลี่ย 85% 541
  • สาเหตุหลัก:
    1. บอร์ดแฮชลัดวงจรหรือสายสัญญาณหลวม
    2.แหล่งจ่ายไฟไม่เสถียร (ความผันผวนของแรงดันไฟฟ้าทำให้การเปิดใช้งานชิปล้มเหลว)
    3.ชิป ASIC เสียหายหรือการหยุดชะงักในการส่งสัญญาณ (เช่น สัญญาณ RO/RX ผิดปกติ)
  • ขั้นตอนการแก้ไขปัญหา:
ประเภทความผิดพลาด ขั้นตอนที่ 1 (การแก้ไขปัญหาเบื้องต้น) ขั้นตอนที่ 2 (การทดสอบขั้นสูง) ขั้นตอนที่ 3 (การจัดการอย่างมืออาชีพ)
0 ชิปในเครื่องทั้งหมด ปิดเครื่องและตรวจสอบว่าแฮชบอร์ดลัดวงจรหรือไม่ (ใช้มัลติมิเตอร์เพื่อทดสอบความต่อเนื่อง) หากไม่เกิดไฟฟ้าลัดวงจร ให้รีสตาร์ทเครื่องขุด หากเกิดไฟฟ้าลัดวงจร ให้ส่งเครื่องกลับเข้าซ่อม กลับเข้าสู่โรงงานเพื่อเปลี่ยนแฮชบอร์ดที่ชำรุด
ชิปที่หายไปบนบอร์ดเดียว เสียบสายเคเบิลแฮชบอร์ดกลับเข้าที่และเปลี่ยนใหม่เพื่อทดสอบ เปลี่ยนแหล่งจ่ายไฟและตรวจสอบการต่อลงดินที่ถูกต้อง ใช้อุปกรณ์ทดสอบเพื่อตรวจสอบแรงดันสัญญาณชิปและเปลี่ยนชิปที่เสียหาย
แฮชบอร์ดหายไป ตรวจสอบว่าสายเคเบิลที่เชื่อมต่อแฮชบอร์ดกับแผงควบคุมเสียบแน่นดีแล้ว เปลี่ยนแฮชบอร์ดในการเชื่อมต่อแบบไขว้เพื่อตัดปัญหาที่อาจเกิดขึ้นกับสล็อต กลับโรงงานเพื่อตรวจสอบอินเทอร์เฟซสัญญาณแผงควบคุม

2. HAS_BOARDS_INCOMPLETE (แฮชบอร์ดไม่สมบูรณ์)

  • ความหมาย:นักขุดตรวจพบแฮชบอร์ดน้อยกว่าค่าที่ออกแบบไว้ (เช่น S19 จะรายงานข้อผิดพลาดหากแฮชบอร์ดหนึ่งหายไป) เฟิร์มแวร์ใหม่บางตัวจะบังคับให้ปิดระบบ
  • บันทึกทั่วไป: มีบอร์ดไม่สมบูรณ์… กำลังปิดระบบ…
  • สาเหตุหลัก:สายเคเบิลแฮชบอร์ดคุณภาพต่ำหรือเสียหาย เฟิร์มแวร์บางรุ่นจำกัด "การทำงานโดยไม่มีบอร์ดที่หายไป"
  • ขั้นตอนการแก้ไขปัญหา:
    1. เสียบปลั๊กและเชื่อมต่อสายเคเบิลแฮชบอร์ดอีกครั้งหลังจากปิดเครื่องเพื่อให้แน่ใจว่าขั้วต่อไม่มีการเกิดออกซิเดชัน
    2. เปลี่ยนสายเคเบิลด้วยสายเคเบิลใหม่เพื่อป้องกันสายเคเบิลเสื่อมสภาพ
    3. หากจำเป็นต้องใช้งานชั่วคราว ให้ลองแฟลชเฟิร์มแวร์รุ่นเก่า (ต้องยืนยันความเข้ากันได้) แต่จะต้องซ่อมแซมบอร์ดที่ชำรุดโดยเร็วที่สุด

4.แหล่งจ่ายไฟและรหัสข้อผิดพลาดของแหล่งจ่ายไฟ: การรับประกันพื้นฐานสำหรับการทำงานที่เสถียร

ความผิดปกติของแหล่งจ่ายไฟเป็นสาเหตุหลักของความล้มเหลวแบบเรียงซ้อน และข้อความแสดงข้อผิดพลาดจะแตกต่างกันไประหว่างรุ่นระบายความร้อนด้วยอากาศและระบายความร้อนด้วยของเหลว

1. ERROR_POWER_LOST (ไฟดับ/ผิดปกติ)

  • ความหมายของรหัส: ความผันผวนของแรงดันไฟฟ้า การหยุดชะงัก หรือสถานะผิดปกติ คำอธิบายบันทึกจะแตกต่างกันระหว่างรุ่นระบายความร้อนด้วยอากาศและรุ่นระบายความร้อนด้วยของเหลว
  • บันทึกทั่วไป:
    ◦ รุ่นระบายความร้อนด้วยอากาศ: ERROR_POWER_LOST: แรงดันไฟฟ้าเพิ่มขึ้นหรือลดลง โปรดตรวจสอบ!
    ◦ รุ่นระบายความร้อนด้วยของเหลว: ปริมาณเฉลี่ยของโซ่ลดลงจากปี 1990 เหลือ 2.45
  • สาเหตุหลัก:
    ◦ ขั้วต่อไฟฟ้าหลวมหรือสายไฟชำรุด
    ◦ การสัมผัสที่ไม่ดีเนื่องจากสกรูหลวมบนแท่งทองแดงของแหล่งจ่ายไฟ
    ◦ ความผิดพลาดในแหล่งจ่ายไฟ (เช่น ทริกเกอร์ป้องกันไฟในซีรีส์ APW9/APW12)
  • ขั้นตอนการแก้ไขปัญหา:
    1. ตรวจสอบสายควบคุมไฟฟ้าและสกรูแท่งทองแดงเพื่อให้แน่ใจว่ายึดแน่นดีแล้ว
    2. ใช้มัลติมิเตอร์ทดสอบแรงดันเอาต์พุตของแหล่งจ่ายไฟและเปรียบเทียบกับข้อกำหนดของนักขุด (เช่น S19 ต้องมีเอาต์พุต 12V ที่เสถียร)
    3. เปลี่ยนแหล่งจ่ายไฟสำรองรุ่นเดิมและทดสอบอีกครั้ง หากพบปัญหา ให้ซ่อมแซมหรือเปลี่ยนแหล่งจ่ายไฟใหม่

5. รหัสข้อผิดพลาดของพัดลมและระบบระบายความร้อน: กุญแจสำคัญสู่สมดุลอุณหภูมิ

ความล้มเหลวของพัดลมจะกระตุ้นการป้องกันอุณหภูมิสูงโดยตรงและถือเป็น "สัญญาณความผิดพลาด" สำหรับส่วนประกอบที่เปราะบางที่สุดในเครื่องขุด

ERROR_FAN_LOST (พัดลมหาย/ความเร็วผิดปกติ)

  • ความหมายของรหัส: พัดลมไม่ทำงานหรือความเร็วรอบต่ำกว่าเกณฑ์ (ปกติ <1500 รอบต่อนาที) อาการนี้มักเกิดขึ้นในรุ่นที่มีพัดลมหลายตัว (เช่น ระบบ 3 พัดลมของ S9)
  • บันทึกทั่วไป: ERROR_FAN_LOST: พัดลม 1 ความเร็ว 0 รอบต่อนาที
  • สาเหตุหลัก: สายพัดลมหลวม มอเตอร์เสียหาย หรืออินเทอร์เฟซแผงควบคุมผิดปกติ
  • ขั้นตอนการแก้ไขปัญหา:
    1. ตรวจสอบว่าสายพัดลมเสียบแน่นดีและไม่ขาดหรือมีขั้วต่อที่เป็นออกซิไดซ์
    2. เปลี่ยนพัดลมที่มีสเปคเดียวกันและทดสอบ หากพัดลมทำงานได้ตามปกติ แสดงว่าพัดลมมีปัญหา
    3. หากข้อผิดพลาดยังคงอยู่หลังจากเปลี่ยนพัดลมแล้ว ให้อัพเกรดเฟิร์มแวร์หรือเปลี่ยนแผงควบคุม
    4. สำหรับรุ่นที่มีพัดลมหลายตัว ให้รีเซ็ตเป็นค่าโรงงานเพื่อขจัดปัญหาความเข้ากันได้ของเฟิร์มแวร์

 

เขียนความเห็น