1 คะแนน โดย GN⁺ 2023-11-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ความผิดพลาดกับยานสำรวจดาวอังคารมูลค่า 500 ล้านดอลลาร์ของผม: เรื่องเล่าความล้มเหลว

  • ในเดือนกุมภาพันธ์ 2003 ค่ำคืนธรรมดาคืนหนึ่งเริ่มต้นขึ้นที่ Jet Propulsion Laboratory (JPL) ของ NASA

  • ตอนนั้นเหลือเวลาอีกสองสัปดาห์ก่อนที่ยานสำรวจดาวอังคาร Spirit จะถูกขนส่งไปยัง Cape Canaveral, Florida เพื่อเตรียมปล่อยขึ้นสู่อวกาศ

  • Spirit และ Opportunity เป็นหนึ่งในยานอวกาศที่ซับซ้อนที่สุดในยุคนั้น โดย NASA ลงทุนไปเกือบ 1 พันล้านดอลลาร์

  • บนยานสำรวจดาวอังคารมีมอเตอร์ 62 ตัว สำหรับการขับเคลื่อนและบังคับเลี้ยวล้อ การควบคุมแขนกล การเล็งกล้อง และการชี้เสาอากาศสื่อสารกลับมายังโลก

  • ยานสำรวจผ่านการทดสอบอย่างเข้มข้นเพื่อจำลองสภาพแวดล้อมอันโหดร้ายของดาวอังคาร

  • โดยเฉพาะเหตุการณ์ที่ใช้วัตถุระเบิด ซึ่งสำคัญมาก เพราะคลื่นกระแทกที่รุนแรงอาจทำลายชิ้นส่วนคาร์บอนที่เปราะบางภายในมอเตอร์ได้

  • สามารถตรวจสอบสภาพภายในของมอเตอร์ได้ด้วยการทดสอบสมรรถนะทางไฟฟ้า

  • การทดสอบนี้ทำหลายครั้ง และ Chris ซึ่งมีประสบการณ์สูง ก็เป็นคนที่เหมาะกับภารกิจนี้ เพราะเขารับผิดชอบการเชื่อมต่อมอเตอร์และการเขียนคำสั่งควบคุมสำหรับการทดสอบ

  • ระหว่างการทดสอบ Chris ทำพลาดโดยส่งไฟกระชากไปยังยานอวกาศแทนที่จะส่งไปยังยานสำรวจ

  • ความผิดพลาดนี้ทำให้เกิดสถานการณ์ที่ยานอวกาศมูลค่า 500 ล้านดอลลาร์อาจต้องถูกปลดระวาง

  • Chris รายงานเหตุการณ์นี้ทันที แต่พบว่า telemetry จากยานอวกาศหายไปทั้งหมด

  • Chris คิดว่าความผิดพลาดของตัวเองอาจทำให้ในรอบการปล่อยครั้งนั้นมีเพียงยานสำรวจลำเดียวที่ได้ออกเดินทาง

  • เขาเล่าเรื่องนี้ให้ภรรยาฟัง และมั่นใจว่าตัวเองจะตกงานในวันรุ่งขึ้น

  • วันถัดมา ทีมงานตรวจสอบเหตุการณ์อย่างละเอียด และประเมินว่าไฟกระชากน่าจะวิ่งเข้าไปยังวงจร H-bridge motor driver

  • พวกเขาตัดสินใจลองเปิดยานอวกาศอีกครั้ง และกลับมาทดสอบต่อ

  • telemetry ของยานอวกาศกลับมาใช้งานได้อีกครั้ง และพบว่า Spirit ไม่ได้ตาย

บทเรียน

  • Chris แบ่งปันเรื่องนี้เพื่อมอบบทเรียนอันมีคุณค่าให้ทั้งตัวเองและผู้อื่น

  • เรื่องเล่าความล้มเหลวของเขายังมีบทบาทสำคัญต่อวัฒนธรรมทีมและกระบวนการจ้างงาน

  • Chris สรุปบทเรียนจากประสบการณ์ของตัวเองไว้ว่า: "จงให้บาดแผลของคุณรับใช้คุณ; มันคือประสบการณ์การเรียนรู้อันล้ำค่า และเป็นการลงทุนในความสามารถและความยืดหยุ่นของคุณ"

  • ในช่วงเวลาวิกฤต เพื่อนร่วมงานคนหนึ่งเดินเข้ามาปลอบ Chris และแนะนำให้จดจำความรู้สึกนี้ไว้ เมื่อครั้งหน้าจะอนุมัติว่าบางอย่างปลอดภัยหรือไม่มีปัญหา

  • หลังเหตุการณ์นี้ Chris ได้กลายเป็น flight director ของ Spirit และ Opportunity และได้รับ NASA Exceptional Achievement Medal

  • ผู้จัดการโครงการตัดสินใจให้เขานำการทดสอบต่อไป เพราะเชื่อว่าเขาจะไม่ทำพลาดแบบเดิมอีก

  • หลังจากนั้น Chris ยังทำการทดสอบอีกมากมาย พร้อมปรับแก้ขั้นตอนอย่างระมัดระวัง เพื่อไม่ให้เกิดความผิดพลาดแบบเดิมซ้ำอีก

  • ทุกครั้งที่เขาต้องตัดสินใจเรื่องสำคัญ เขาจะนึกถึงช่วงเวลานั้น และมุ่งช่วยให้คนอื่นผ่านช่วงเวลาที่ท้าทายของตนเองไปได้

  • ในการสำรวจอวกาศ ความล้มเหลวไม่ใช่ทางเลือก แต่เป็นสิ่งที่ติดตั้งมาเป็นค่าเริ่มต้น และทุกความผิดพลาดคือก้าวหินไปสู่ความสำเร็จที่ยิ่งใหญ่กว่า

  • Chris อยากฟังและเรียนรู้จาก "เรื่องเล่าความล้มเหลว" ของคนอื่น ๆ ไม่ว่าจะเป็นผู้ประกอบการด้านอวกาศ วิศวกร นักวิทยาศาสตร์ หรือช่างเทคนิค

ความเห็นของ GN⁺

สิ่งสำคัญที่สุดของบทความนี้คือคุณค่าของการเรียนรู้และเติบโตผ่านความล้มเหลว เรื่องราวของ Chris แสดงให้เห็นว่าการยอมรับว่าความล้มเหลวเป็นส่วนหนึ่งที่หลีกเลี่ยงไม่ได้ และบทเรียนรวมถึงความมั่นใจที่ได้จากการก้าวข้ามมัน มีความสำคัญเพียงใด บทความนี้มอบแรงบันดาลใจโดยเฉพาะให้กับวิศวกรซอฟต์แวร์ระดับเริ่มต้น ว่าไม่ควรกลัวความล้มเหลว และสามารถเปลี่ยนมันให้เป็นโอกาสในการเติบโตได้ นอกจากนี้ ประสบการณ์ของ Chris ยังตอกย้ำความสำคัญของการทำงานเป็นทีมและภาวะผู้นำ พร้อมแสดงให้เห็นว่าวัฒนธรรมที่คอยสนับสนุนและเชื่อใจกันในช่วงเวลาที่ยากลำบากนั้นสำคัญเพียงใด เรื่องราวแบบนี้มีทั้งสาระ พลังบวก ความน่าสนใจ ความสนุก และเสน่ห์ จึงน่าจะดึงดูดความสนใจของผู้คนได้มากมาย

1 ความคิดเห็น

 
GN⁺ 2023-11-29
ความเห็นจาก Hacker News
  • ประสบการณ์ของวิศวกรเครื่องกล/อวกาศยาน

    ในฐานะผู้วิจารณ์ด้านความปลอดภัยที่ต้องรับผิดชอบต่อชีวิตผู้คน เขารู้สึกหวาดกลัวเมื่อพิจารณาภาพชิ้นส่วนที่เสียหายจากอุบัติเหตุ ว่าสาเหตุอาจมาจากความผิดพลาดในการคำนวณของตนเองหรือขั้นตอนการทดสอบที่ไม่เหมาะสม ประสบการณ์เช่นนี้สร้างภาระทางจิตใจคล้าย PTSD ให้กับบางคน

  • เรื่องความผิดพลาดของวิศวกรซอฟต์แวร์

    เมื่อ 10 ปีก่อน ในวันเปิดตัวเว็บเซอร์วิสเวอร์ชันใหม่ของลูกค้า ระหว่างกระบวนการ deploy แบบแมนนวลที่ซับซ้อน เขาเผลอลบฐานข้อมูล production ทิ้ง โชคดีที่ยังมีแบ็กอัปจึงกู้ข้อมูลส่วนใหญ่กลับมาได้ นับจากนั้นจึงระมัดระวังอย่างยิ่งเมื่อจัดการฐานข้อมูลและระบบ production

  • ความผิดพลาดของเด็กฝึกงานกับปัญหาเชิงกระบวนการ

    หากเด็กฝึกงานลบฐานข้อมูล production ปัญหานั้นไม่ใช่ความผิดของเด็กฝึกงาน แต่เป็นปัญหาของกระบวนการ แม้จะคาดหวังจากพนักงานประจำ (FTE) ได้มากกว่า แต่ก็ยอมรับถึงความสำคัญของความหวังที่จะลุกขึ้นใหม่ได้หลังจากความผิดพลาด

  • ความปลอดภัยของฐานข้อมูลและภัยคุกคามจากแฮกเกอร์

    เมื่อความผิดพลาดของคนเพียงคนเดียวสามารถทำให้ทั้งระบบล่มได้ ก็หมายความว่าแฮกเกอร์ก็มีความเสี่ยงแบบเดียวกันเช่นกัน มาตรการความปลอดภัยอย่างการแยกข้อมูลรับรอง การแยกการเข้าถึง และการห้ามใช้คำสั่งอันตรายจึงมีความสำคัญ

  • ประสบการณ์ของพนักงานควบคุมเทปในสถานีโทรทัศน์

    เขาได้เรียนรู้ความรอบคอบจากวิธีที่ผู้ฝึกสอนคอยเตือนเพื่อป้องกันไม่ให้หยิบเทปผิดระหว่างออกอากาศ แม้บทลงโทษจากความผิดพลาดจะเข้มงวด แต่ก็ช่วยให้เขาสร้างอาชีพมาได้โดยไม่ทำพลาด

  • คำคมของ Thomas J. Watson

    แทนที่จะไล่ออกพนักงานที่สร้างความเสียหายมหาศาลให้บริษัท เขากลับให้คุณค่ากับสิ่งที่เรียนรู้จากประสบการณ์นั้น

  • ความสำคัญของการเชื่อมโยงเหตุการณ์

    เมื่อเกิดเหตุการณ์ขึ้น การเปรียบเทียบ timestamp อย่างแม่นยำช่วยหลีกเลี่ยงความกังวลที่ไม่จำเป็นได้ และยังเน้นย้ำความสำคัญของการใช้ภาษาที่แม่นยำและการตรวจสอบความเชื่อมโยงระหว่างเหตุการณ์

  • อุบัติเหตุของดาวเทียม NOAA-N Prime

    มีการ 'ยืม' โบลต์ราคาแพงไปใช้กับอีกโปรเจกต์หนึ่งและไม่ได้ส่งคืน ทำให้เกิดอุบัติเหตุที่ดาวเทียมตกลงมา ค่าใช้จ่ายในการซ่อมแซมจากอุบัติเหตุครั้งนั้นสูงถึง 135 ล้านดอลลาร์

  • ความเหนื่อยล้าและโอกาสเกิดความผิดพลาด

    การอนุญาตให้ทำงาน 12 ชั่วโมงในงานสำคัญเป็นเรื่องไม่ถูกต้อง ต้องยอมรับว่าความผิดพลาดเกิดขึ้นได้ และการพึ่งพาเพียงความสามารถของมนุษย์นั้นมีความเสี่ยง

  • การออกแบบคอนเนกเตอร์ไฟฟ้าและความซับซ้อนของมอเตอร์คอนโทรลเลอร์

    ตระหนักถึงความสำคัญของการออกแบบที่ใช้คอนเนกเตอร์หลายขนาดและหลายรูปทรงเพื่อป้องกันการเชื่อมต่อผิด รวมถึงการรับรู้ถึงห่วงโซ่ความล้มเหลวที่ซับซ้อนและความจำเป็นในการออกแบบใหม่ที่ตามมา