3 คะแนน โดย GN⁺ 5 시간 전 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • งานวิจัย AI ระดับโลกไม่ได้ต่อยอดจากพรสวรรค์เพียงอย่างเดียว แต่ขึ้นอยู่กับ อุปนิสัย ที่ทนระยะยาวได้จากการอ่านและการลงมือสร้างซ้ำๆ
  • การเลือกหัวข้อควรเริ่มจากความเข้าใจ แนวคิดพื้นฐาน อย่างลึกซึ้ง เช่น cross-entropy, SVD, policy gradients มากกว่าตามคำฮิตที่อยู่ได้แค่ 6 เดือน
  • งานวิจัยที่ดีไม่ควรหยุดแค่การเพิ่มคะแนน benchmark เดิม แต่ต้องหาชุด ข้อมูล ที่จะทดสอบความสามารถที่วิธีใหม่เผยให้เห็นได้จริง
  • ผลการทดลองไม่ว่าจะดีหรือแย่ล้วนให้ข้อมูล แต่ผลที่ดูดีเกินไปยิ่งอาจเป็นบั๊กหรือการวัดที่ผิดได้ จึงต้องมี ความหวาดระแวงอย่างพอดี
  • coding agent ช่วยเพิ่มความเร็ว แต่ก็ทำให้เข้าใจระบบน้อยลงและเพิ่ม การสลับบริบท จึงต้องเข้าใจทั้งระบบที่สร้างผลลัพธ์นั้นด้วยตัวเอง

จุดเริ่มต้นของการเป็นนักวิจัย

  • งานวิจัย AI เริ่มจากการทำซ้ำระหว่าง การอ่านและการเรียนรู้ กับการลงมือสร้างอะไรบางอย่างด้วยตัวเอง
  • ถ้ามีแค่อย่างใดอย่างหนึ่งก็ไม่พอ นักวิจัยถูกหล่อหลอมขึ้นจากการสลับไปมาระหว่างสองกิจกรรมนี้
  • งานวิจัยคล้ายการทำสมาธิ ต่อให้เป็นวันที่มีอินไซต์ก็ต้องนั่ง และวันที่ไม่มีอินไซต์ก็ยังต้องนั่งต่อไป
  • อินไซต์ทางวิทยาศาสตร์มาแบบสุ่มๆ และในวันส่วนใหญ่มันจะไม่มา
  • เช่นเดียวกับดนตรี กีฬา หรือการขาย การจะไปถึงระดับโลกต้องใช้เวลา ความพยายาม และ ปริมาณการฝึกฝน อย่างมาก
  • ในงานวิจัย SwiGLU, Noam Shazeer เขียนไว้ว่า “ไม่ได้อธิบายว่าทำไมสถาปัตยกรรมนี้จึงทำงานได้ และขอยกความสำเร็จของมันให้เป็นเหมือนทุกสิ่งอื่น คือความเมตตาของพระเจ้า” ซึ่งสะท้อนความสุ่มของความสำเร็จของไอเดียวิจัย
  • การอ่านงานวิจัยมากเกินไปก็อาจเป็นปัญหาได้
    • วิธีที่พิสูจน์แล้วคือ ลองหาทางแก้ก่อน ติดขัดก่อน แก้เองก่อน แล้วค่อยไปค้นวรรณกรรมเมื่อไอเดียของตัวเองหมดจริงๆ

จะวิจัยอะไรดี

  • ถ้าเพิ่งเริ่มต้น หัวข้อวิจัยที่เป๊ะๆ ยังไม่สำคัญมากนัก
  • แต่ก็ควรหลีกเลี่ยงการเลือกหัวข้อที่เพิ่งเป็นกระแสได้ไม่ถึง 6 เดือน
    • AI เคลื่อนไหวเร็วก็จริง แต่ไอเดียแกนหลักแทบไม่ได้เปลี่ยนมากนักในช่วง 40 ปี
    • ไม่ควรเอาอาชีพไปผูกมากเกินกับแนวคิดอย่าง harnesses, agents, context engineering ในปี 2026
  • ถ้าอยากเรียนรู้ให้มากขึ้น ต้องกลับไปที่ พื้นฐาน
    • ต้องเรียนให้รู้ว่า cross-entropy คืออะไร และลองคำนวณด้วยมือกับการแจกแจงขนาดเล็ก
    • ต้องเข้าใจ SVD ลึกพอที่จะนึกภาพมันในหัวได้
    • อย่าดูแค่ RL สำหรับงานเขียนโค้ด แต่ให้เรียนรู้ไอเดีย ประโยชน์ และเหตุผลที่ policy gradients ได้รับความนิยมมาหลายทศวรรษ
  • ถ้าผลลัพธ์ที่ดีที่สุดของโปรเจกต์วิจัยคือการเพิ่มคะแนน benchmark เดิม งานนั้นก็ยังลึกไม่พอ
    • ชุดข้อมูลเดิมมักทดสอบความสามารถใหม่ๆ ที่น่าสนใจไม่ได้
    • Jason Wei มองว่าการหาชุดข้อมูลที่บังคับให้วิธีใหม่ได้แสดงความสามารถที่มันทำได้จริง เป็นทักษะที่ถูกประเมินต่ำเกินไปแต่ชี้เป็นชี้ตายในงานวิจัย AI
  • หัวข้อที่เฉพาะเจาะจงต้องหาเอง และควรลงลึก โฟกัสที่พื้นฐาน และไม่ติดอยู่กับการไล่ล่า benchmark

จิตเริ่มต้นและการตัดสินอย่างเปิดกว้าง

  • คำพูดของ Suzuki ที่ว่า “ในจิตของผู้เริ่มต้นมีความเป็นไปได้มากมาย แต่ในจิตของผู้เชี่ยวชาญมีน้อย” ใช้กับงานวิจัยได้เช่นกัน
  • ในงานวิจัย AI ยุคใหม่ มีคำพูดใน Silicon Valley อยู่บ่อยๆ ว่าประสบการณ์วิจัย AI แบบเดิมอาจกลับทำลายสัญชาตญาณการวิจัยที่ดี
  • นักวิจัยบางส่วนในยุคก่อน pre-scaling ยังสนใจออกแบบวิธีที่ทำงานได้ในสเกลเล็ก แต่พอขยายสเกลแล้วล้มเหลว
  • ที่ OpenAI คนจำนวนมากที่ขับเคลื่อนบริษัทในด้านเทคนิคมีอายุต่ำกว่า 35 ปี และผู้มีอำนาจตัดสินใจสำคัญหลายคนของ ChatGPT มีอายุต่ำกว่า 30 ปี
  • นี่เป็นสาขาที่เพิ่งเริ่มต้น โดยยังไม่ถึง 4 ปีนับจากการมาของ ChatGPT จึงไม่มีใครมีความได้เปรียบมหาศาลจากการทำงานมานานมากจริงๆ
  • การยึดติดกับไอเดียนานเกินไปอาจให้ผลเสีย จึงต้องเปิดใจและไม่ปล่อยให้อัตตาทำให้การตัดสินพร่าเลือน

แรงบันดาลใจมาจากนอกงานวิจัยได้

  • แรงบันดาลใจมาในจังหวะที่คาดไม่ถึง
  • การค้นพบโครงสร้างวงแหวน benzene มีชื่อเสียงว่าเกิดจากความฝัน
    • มันเป็นโครงสร้างที่ไม่เคยเห็นมาก่อน แต่ถูกจินตนาการเป็นภาพงูกินหางตัวเอง
  • Ozempic ก็เป็นอีกตัวอย่างหนึ่งที่มาจากกิ้งก่า
    • ฮอร์โมน GLP-1 ที่ Ozempic เลียนแบบ ถูกค้นพบครั้งแรกในพิษของ Gila monster กิ้งก่าทะเลทรายที่กินอาหารเพียงไม่กี่ครั้งต่อปี
    • การค้นพบนี้นำไปสู่กลไกที่ใช้ได้กับมนุษย์ด้วย
  • ถ้าอยากทำวิจัยที่ดี ต้องทำเรื่องที่ไม่ใช่งานวิจัยด้วย
  • ช่วงเวลา “อ๋อ” จำนวนมากไม่ได้เกิดขึ้นหน้าคีย์บอร์ด แต่เกิดขึ้นตอน เดิน โดยเฉพาะ
  • นักคิดอย่าง Darwin, Tesla, Feynman, Aristotle ต่างพูดถึงประโยชน์มหาศาลของการยืดเส้นยืดสายและเดินสักหน่อย

ท่าทีต่อผลการทดลอง

  • ต่อให้การนำไปใช้จริงได้สมบูรณ์แบบ ไอเดียก็อาจไม่จริงในระดับพื้นฐานอยู่ดี
  • เวลา分析การทดลอง ต้องมี ความสงบนิ่งเชิงทดลอง ที่ยอมรับได้ทั้งผลที่ดีและผลที่ไม่ดี
  • ทั้งสองแบบให้ข้อมูลในปริมาณเท่ากัน
    • บางครั้งเราอาจเรียนรู้จากผลลบต่อเนื่องหลายครั้งได้มากกว่าผลบวกหนึ่งครั้ง
  • ไม่ควรตื่นเต้นกับผลลัพธ์ที่ดีเกินไป
    • ผลดีจำนวนมากเกิดจากบั๊ก
    • หรืออาจไม่ใช่ผลที่ดีจริง แต่เป็นการวัดผิดและเราหลอกตัวเองไปแล้ว
  • การอยากให้ไอเดียของตัวเองเวิร์กเป็นเรื่องธรรมชาติ แต่นักวิจัยที่มีประสบการณ์มักมี ความกังขา ร่วมกันอย่างแรง โดยเฉพาะกับผลที่ดูดีเกินจริง
  • ผลที่ดูดีเกินไป แทบจะไม่ตรงกับความจริงเสมอ

การเปรียบเทียบ โชค และความลึก

  • งานวิจัยเป็นโลกที่ยึดผลลัพธ์อย่างมาก
  • โดยเฉพาะในแวดวงวิชาการ เรามักหวั่นไหวทางอารมณ์ได้ง่ายเมื่อเห็นคนอื่นประสบความสำเร็จกับงานตีพิมพ์
  • ผู้คนประสบความสำเร็จด้วยเหตุผลที่ต่างกัน
    • บางคนแค่โชคดี
    • กระบวนการรีวิวทางวิชาการไม่ได้สม่ำเสมอหรือยุติธรรมเสมอไป
  • เมื่อมีงานวิจัยใหม่ที่น่าทึ่งออกมาในสายของตัวเอง ควรถามว่า “เราได้ทำงานลึกพอจนสร้างอินไซต์นี้ขึ้นมาเองได้หรือไม่?”
    • ถ้าคำตอบคือ “ใช่” แปลว่ากระบวนการถูกต้องแล้ว แต่เราไปทำอย่างอื่นอยู่เลยไม่ได้ค้นพบมัน
    • ถ้าคำตอบคือ “ไม่” ก็ควรใช้มันเป็นแรงผลักให้ลงลึกกว่าเดิม

งานซ้ำๆ ที่มองไม่เห็น

  • เช่นเดียวกับคำกล่าวที่ว่าก่อนตรัสรู้ก็ผ่าฟืนหาบน้ำ หลังตรัสรู้ก็ยังผ่าฟืนหาบน้ำ งานวิจัยก็มีงานซ้ำๆ มากมาย
  • โปรเจกต์ที่ประสบความสำเร็จจำนวนมากมี งานจิปาถะ ซ่อนอยู่เบื้องหลังนับร้อยชั่วโมง
  • Andrej Karpathy เคย ติดป้ายกำกับด้วยมือ ให้กับส่วนใหญ่ของ ImageNet
  • ผู้สร้าง SWEBench ใช้เวลาหลายร้อยชั่วโมงคัดกรองข้อมูล GitHub อย่างพิถีพิถัน เพื่อสร้างชุด GitHub issue ขนาดเล็กที่จัดการได้และมีประโยชน์ต่อการประเมิน
  • ถ้ามองเส้นทางอาชีพของนักวิจัยชั้นยอด จะเห็นว่าก่อนความสำเร็จ พวกเขามักใช้เวลานานทำงานในส่วนที่ไม่มีใครเห็น
  • ยิ่งไอเดียทะเยอทะยานและมองไปข้างหน้ามากเท่าไร ก็อาจยิ่งต้องใช้แรงงานมากขึ้นในการทำ implementation และ evaluation อย่างละเอียด ซึ่งความยากนี้ไม่ใช่ข้อบกพร่อง แต่เป็นคุณลักษณะของมัน

นิสัยวิจัยที่สงสัยบั๊กไว้ก่อน

  • Collin Raffel มองว่าไอเดียจำนวนมากล้มเหลวไม่ใช่เพราะเป็นไอเดียแย่ แต่เพราะมี บั๊กในโค้ด ที่นักวิจัยหาไม่เจอ
  • ในโลกของ LLM ปัญหานี้ยิ่งยากเป็นพิเศษ
  • software stack ของ deep learning ยุคใหม่ซับซ้อนมาก และบั๊กอาจอยู่ได้ทุกที่
    • การฝึก
    • การอนุมาน
    • harness
    • ข้อมูล
  • ถ้ามีอะไรดูผิดปกติ อย่าปล่อยผ่าน
  • ควรล็อกเมตริกให้มาก และพยายามเข้าใจมันทั้งหมด
  • ถ้าบางเมตริกไม่ตรงกับที่คาด ต้องหาสาเหตุ เพราะอาจมีบางอย่างผิดจริงๆ
  • คุณลักษณะสำคัญอย่างหนึ่งของนักวิจัยคือ ความหวาดระแวงอย่างพอดี

ฟีดแบ็กที่รวดเร็วและการสลับบริบท

  • การทดลอง deep learning ส่วนใหญ่ใช้เวลานานเกินไป
    • การฝึกโมเดลอาจกินเวลาเป็นสัปดาห์หรือเป็นเดือน
    • แม้แต่การประเมินโมเดลกับงานเดียวก็อาจใช้เวลาหลายวัน
  • เวลาทำโค้ดด้วย agent เราอาจอยากรันการทดลองหลายชุดพร้อมกันและปล่อยให้มันทำงานเป็นรอบช้าๆ
  • การทำขนานแบบตรงไปตรงมาช่วยได้ระดับหนึ่ง แต่ การสลับบริบท เป็นรูปแบบที่เป็นโทษ
  • ต้องออกแบบ เวิร์กโฟลว์การวิจัยที่ยศาสตร์ดี เพื่อรองรับฟีดแบ็กจากการทดลองที่รวดเร็ว
    • ต้องลดเวลา cold start ของการฝึก
    • ต้องสร้างการประเมินขนาดเล็กที่คืนผลได้เร็ว
  • nanoGPT speedrun ของ Keller Jordan เป็นตัวอย่างที่แสดงว่าเราสามารถเรียนรู้ได้มากแค่ไหนจากรอบการวนซ้ำที่เร็ว
  • ผลลัพธ์บางอย่างสุดท้ายก็หลีกเลี่ยงไม่ได้ที่จะใช้เวลานาน
    • ความสามารถในการรักษาสถานะข้ามหลายวัน และเข้าใจการทดลองจากสัปดาห์ก่อนที่เพิ่งเสร็จวันนี้ มีประโยชน์มาก

ปัญหาที่ coding agent ทำให้หนักขึ้น

  • coding agent ทำให้เคลื่อนที่ได้เร็วขึ้น แต่ทำให้สองปัญหาหนักขึ้น
    • เข้าใจรายละเอียดพื้นฐานได้ยากขึ้น
    • การสลับบริบทเกิดบ่อยขึ้น
  • นักวิจัยที่ดีต้องทำงานเชิงรุกเพื่อต้านแรงทั้งสองนี้
  • Codex สามารถเขียนสคริปต์ฝึก รันมัน เฝ้าดูระหว่างรัน ตีความผลลัพธ์ และส่งอีเมลได้
  • แต่ข้อผิดพลาดเล็กๆ แบบนี้อาจเกิดขึ้นได้
    • พอเกิดข้อผิดพลาดก็ลด system prompt ลงโดยไม่ถาม
    • ลด sequence length เพื่อให้ evaluation รันเสร็จในเวลาที่ดูสมเหตุสมผล
    • รัน config ที่ผิดเพราะผู้ใช้ไม่ได้ระบุชัดเจน
  • จากมุมวิศวกรรม มันอาจเป็นข้อผิดพลาดเล็กๆ ที่แก้ได้ง่าย แต่จากมุมวิทยาศาสตร์มันร้ายแรง
    • การตกหล่นเพียงเล็กน้อยก็อาจเปลี่ยนผลสำคัญของงานวิจัยได้อย่างมีนัยสำคัญ
    • เพราะฉะนั้นจึงยอมรับไม่ได้
  • ต่อให้เราไม่ได้เขียนโค้ดเอง ถ้าอยากเข้าใจผลลัพธ์ ก็ต้องเข้าใจระบบที่สร้างผลลัพธ์นั้น
  • วิทยาศาสตร์ที่ดีต้องอาศัยการเรียนรู้ว่าระบบทั้งหมดทำงานอย่างไร เพื่อให้มั่นใจได้ว่าข้อสังเกตนั้นเป็นจริง

งานวิจัยที่อุปนิสัยเป็นตัวสร้าง

  • การจะเป็นนักวิจัยที่ประสบความสำเร็จ ไม่ได้ต้องการแค่พรสวรรค์
  • อุปนิสัย เป็นสิ่งที่ถูกประเมินต่ำเกินไปมาก
  • ต้องรักษาความอยากรู้อยากเห็นและความพากเพียรไว้ พร้อมคงความรอบคอบและความละเอียดถี่ถ้วน แล้วไอเดียจะค่อยๆ มา
  • งานวิจัยที่ดีที่สุดและงานสร้างผลิตภัณฑ์ที่ดีที่สุด มักมาจากคนที่อยู่กับปัญหานานพอจนเข้าใจมันจริงๆ
  • แรงกดดันให้ตีพิมพ์เร็วและวนซ้ำเร็วมีอยู่จริง แต่การสั่งสมเกิดขึ้นจาก ความลึก

2 ความคิดเห็น

 
GN⁺ 5 시간 전
ความคิดเห็นจาก Hacker News
  • Zen ที่ใช้กันในโลกตะวันตกกับ Seon (禪) ของเอเชียตะวันออกรู้สึกว่าแตกต่างกันพอสมควร
    Zen แบบตะวันตกน่าจะใกล้กับภาพจำที่มาจากหนังสือยุค 1970 Zen and the Art of Motorcycle Maintenance และโดยมากมีนัยถึงความสงบนิ่งกับจิตแบบผู้เริ่มต้น
    ในทางกลับกัน Seon ของเอเชียตะวันออกให้น้ำหนักกับ ความไร้จุดมุ่งหมาย หรือการไม่มีเป้าประสงค์มากกว่า
    Zen แบบตะวันตกดูคล้ายการฝึกตัวตนให้แข็งแกร่งขึ้น แต่ Seon ของเอเชียตะวันออกใกล้เคียงกับการดำเนินตามธรรมชาติ วางตัวตนลง และปล่อยให้สรรพสิ่งไหลไป
    ในการปฏิบัติ Seon จริง ๆ จะเน้นการตั้งคำถามกับตัวตน การปล่อยวางความยึดติด และตระหนักว่าความอยากบรรลุผล การเปรียบเทียบ และความปรารถนาจะควบคุม ล้วนเป็นสิ่งไม่จีรัง
    มีวลีที่มีชื่อเสียงคือ Banghajak (放下著) หมายถึง “จงวางลงทั้งหมด”
    กลับกันแล้ว ปรัชญาสโตอิกของโรมันโบราณดูเหมือนจะใกล้กับ Seon มากกว่า Zen แบบตะวันตกเสียอีก
    เพราะอย่างนั้นพอเห็นบทความนี้ ตอนแรกนึกว่าจะเป็นบทความว่าด้วยการละทิ้งความอยากประสบความสำเร็จ แต่กลับไปคนละทิศทางเลยจึงน่าสนใจมาก

    • คล้ายกันเลย สโตอิกนิยมที่พูดถึงกันในตะวันตกก็ดูเหมือนภายนอกจะเน้นไปที่การควบคุมหรือกดอารมณ์เป็นหลัก
      แต่สโตอิกนิยมที่น่าจะเรียกว่าแบบ “โรมัน” กลับใกล้เคียงกับ ระบบจริยธรรมแบบองค์รวม มากกว่า
    • วลี “To be done with doing” ในชุดนิยาย Earthsea ของ Ursula K. LeGuin ให้ความรู้สึกทรงพลังกับผมเสมอ
      มันอัดสภาวะทางใจหนึ่งไว้ในห้าคำ และผมก็จำได้ลาง ๆ ว่าเธอเคยบอกว่างานเขียนของเธอได้รับอิทธิพลจากปรัชญาตะวันออกมาก
    • ถ้าพูดในบริบทที่ว่า “Seon ของเอเชียตะวันออกให้น้ำหนักกับความไร้จุดมุ่งหมายหรือการไม่มีเป้าประสงค์มากกว่า” ก็อยากแนะนำ Idler magazine อย่างมาก
      เป็นแหล่งข้อมูลชั้นยอดว่าด้วยการดำรงอยู่อย่างไร้จุดหมายแบบสุขภาวะ
      https://www.idler.co.uk/article/leisure-principles/
      https://archive.is/nKJM2
    • ผมมองว่า Seon เกี่ยวกับ สมาธิ ที่ทำให้ความคิดสงบลงและได้สัมผัสกับขณะปัจจุบัน
      เมื่อเป็นเช่นนั้น สมองก็จะได้พักจากสภาวะที่ “วิ่งไล่ตามความคิด” และหลังหยุดนั่งสมาธิแล้วก็จะมีสมาธิดีขึ้นจนทำสิ่งต่าง ๆ ได้มากขึ้น
      นักปฏิบัติ Zen จำนวนมากในโลกตะวันตกคงค้นพบเรื่องนี้และใช้สมาธิเพื่อจุดประสงค์นั้นจริง ๆ
      ถ้านึกถึง Star Wars “พลัง” มักถูกวาดภาพว่าเป็นความสามารถในการยกยานอวกาศด้วยพลังแห่งสมาธิ แต่นั่นเป็นเพียงมายาคติ
      ตรงกันข้าม เมื่อเข้าถึงสภาวะจิตแบบ Seon ได้แล้ว เรื่องจะยกยานอวกาศนั้นขึ้นได้หรือไม่กลับสำคัญน้อยลง
      ในขนบตะวันออก Seon คือ จุดหมายในตัวมันเอง
      เลยสงสัยว่านี่ใกล้กับความหมายที่ผู้เขียนเดิมตั้งใจจะสื่อหรือเปล่า
  • ราวปี 2015 ผมต้องดูแลทั้งวิศวกรแบ็กเอนด์และวิศวกรแมชชีนเลิร์นนิงพร้อมกัน
    วิศวกรแบ็กเอนด์หลายคนอยากทำแมชชีนเลิร์นนิงมากขึ้น และเมื่อให้โอกาสก็มีบางคนทำได้ดี แต่บางคนก็อยากกลับไปทำแบ็กเอนด์อีกครั้งภายในไม่กี่เดือน
    พร้อมกันนั้น หนึ่งในหัวหน้าฝั่งแมชชีนเลิร์นนิงกลับอยากถอนตัวจากแมชชีนเลิร์นนิงไปทำแต่งานแบ็กเอนด์ที่คอยสนับสนุนแมชชีนเลิร์นนิงเท่านั้น
    พอเห็นแนวโน้มแบบนี้ก็เริ่มคิดว่าคนเราแต่ละคนมีความถี่ในการต้องการ สัญญาณแห่งความสำเร็จ ไม่เท่ากัน
    ด้วยลักษณะของผลิตภัณฑ์ การจะวัดประสิทธิภาพของโมเดลใหม่หรือโมเดลที่อัปเดตต้องรันในบริการจริงอย่างน้อยครบหนึ่งเดือน และตั้งแต่งานเริ่มต้นจนถึงการวิเคราะห์สุดท้ายก็มักใช้เวลามากกว่าสองเดือน
    ในทางกลับกัน งานแบ็กเอนด์จำนวนมากสามารถทำต้นแบบอย่างรวดเร็ว รันดูว่าใช้ได้ไหม แล้วไปต่อได้ทันที ทำให้มีสัญญาณตอบกลับเข้ามาตลอดทั้งวัน
    ความต่างของความถี่สัญญาณที่แต่ละคนต้องการส่งผลอย่างมากต่อการที่เขาชอบงานแมชชีนเลิร์นนิงหรือไม่
    มันเหมือน feature engineering ฉบับผู้จัดการอย่างหนึ่ง และผมได้เรียนรู้จากคนในทีมนั้นเยอะมาก

    • ผมก็เห็นปรากฏการณ์เดียวกันและสงสัยมาตลอดว่าจะบริหารมันอย่างมีประสิทธิภาพได้อย่างไร
      ทีมวิศวกรข้อมูลอยากทำงานสาย data science มากขึ้น ขณะที่ data scientist 2 คนกลับทั้งคู่บอกว่าอยากเป็นวิศวกรข้อมูล
      หนึ่งในนั้นถึงกับบอกว่าทุกคนอยากเป็น data scientist กันหมดจนแน่นเกินไป ดังนั้นเป็นวิศวกรข้อมูลน่าจะทำเงินได้มากกว่า
      อีกครั้งหนึ่ง เพื่อนคนหนึ่งบ่นว่าต้องหนีออกจากงานฟรอนต์เอนด์ล้วน ๆ เพราะมันเป็นอาชีพทางตัน แต่วันถัดมาในมื้อกลางวัน เพื่อนร่วมงานอีกคนกลับกำลังคิดจะย้ายสายเพราะบอกว่านักพัฒนาฟรอนต์เอนด์ได้เครดิตไปหมด
  • ประโยคที่ว่า “นั่งในวันที่เกิดความเข้าใจแจ่มแจ้ง และนั่งในวันที่ไม่เกิดความเข้าใจแจ่มแจ้ง” ทำให้นึกถึงคำตอบของ Ed Witten ในบทสัมภาษณ์ของ Brian Greene
    เมื่อ Greene ถามว่าชีวิตประจำวันของเขาที่ Institute for Advanced Study เป็นอย่างไร Witten ตอบว่า “ผมนั่งอยู่ที่โต๊ะทำงาน

  • อารมณ์หลักของบทความคือ “จงลงลึกให้มากขึ้น” แต่ผมคิดว่านี่เป็น ดาบสองคม
    เป็นความจริงที่เอนโทรปี เทนเซอร์ และกราเดียนต์สำคัญและแทบเป็นข้อกำหนดพื้นฐาน
    แต่ในช่วง 10 ปีที่ผ่านมา ความก้าวหน้าของดีปเลิร์นนิงส่วนใหญ่ผมมองว่าไม่ได้มาจากไอเดียระดับรากฐานเท่าไรนัก แต่มาจากแนวปฏิบัติที่ค่อยเป็นค่อยไปและผ่านการพิสูจน์ด้วยการทดลอง
    เราพอมีสัญชาตญาณที่ดีว่าทำไม ReLU ถึงดีกว่า sigmoid แต่ในงานต้นฉบับของ Hinton เหตุผลก็แทบจะเป็นแค่ว่า “ฝึกได้เร็วกว่า 3 เท่า”
    การกลับไปคิดเรื่องพื้นฐานใหม่อาจช่วยได้ แต่ความก้าวหน้าจริง ๆ ที่เกิดจากแนวคิดแบบ “มาเปลี่ยนรากฐานกันเถอะ” นั้นพบได้ไม่บ่อย
    แม้แต่งานสำคัญอย่าง AlexNet หรือ Attention Is All You Need ก็ยังเป็นการขัดเกลาไอเดียที่มีอยู่และแสดงให้เห็นว่ามันช่วยอย่างไร
    แมชชีนเลิร์นนิงเป็น วิทยาศาสตร์เชิงทดลอง และไอเดียที่ดูสวยงามทางคณิตศาสตร์จำนวนมากใช้ไม่ได้ผล ขณะที่ไอเดียเชิงวิศวกรรมกลับมักใช้ได้ดี
    คำแนะนำที่ว่า “คุณลักษณะที่สำคัญที่สุดอย่างหนึ่งของนักวิจัยคือความหวาดระแวงอย่างมีสุขภาวะ” ก็ทำให้ผมไม่แน่ใจว่าดีกว่าคำว่า “ภาวะซึมเศร้าดีต่อปราชญ์” มากแค่ไหน เพราะผมเห็นนักศึกษาปริญญาเอกหมดไฟไปอย่างสิ้นเชิงมากเกินไป
    ถ้าหมายถึงให้เป็นนักสำรวจที่มุ่งมั่นไม่ย่อท้อ ผมเห็นด้วย
    การยึดติดกับไอเดียนานเกินไปอาจให้ผลย้อนกลับได้ และผมก็เห็นด้วยกับข้อสรุปที่ว่าควรรักษาใจให้เปิดกว้างและอย่าให้อัตตาบดบังการตัดสินใจ

  • เป็นเรียงความที่ยอดเยี่ยมมากและอ่านเพลิน
    อย่างที่ผู้เขียนบอก ไม่ใช่แค่งานวิจัยเท่านั้น แต่ในอีกหลายสาขา ความสำเร็จหรือความก้าวหน้า ก็ขึ้นอยู่กับนิสัยพื้นฐานของคนอย่างมาก
    สุดท้ายแล้ว ทัศนคติที่ดี ความอดทน ความอยากรู้อยากเห็นโดยกำเนิด และความสามารถในการฟื้นตัวจากความล้มเหลวคือสิ่งสำคัญ
    ความสามารถที่ทำให้ใครสักคนเป็นนักวิจัยที่ดีสามารถถ่ายโอนไปสู่งานสาขาอื่นได้ดีมาก
    เพียงแต่ด้วยวัฒนธรรมที่ลดความสามารถในการทนต่อความไม่สบายให้เหลือแค่ความสะดวกสบายสูงสุด ความสามารถแบบนี้จึงยิ่งหายากและมีค่ามากขึ้น
    ผู้คนดูจะรอคอยหรือยอมรับความล้มเหลวได้ยากขึ้นเรื่อย ๆ

  • เกร็ดเสริมเกี่ยวกับรากศัพท์ของคำว่า Zen คือ Zen เป็นภาษาญี่ปุ่น มาจากภาษาจีน Chan และ Chan มาจากภาษาสันสกฤต Dhyana
    Dhyana แปลคร่าวๆ ได้ว่าความจดจ่อหรือการทำสมาธิ
    ลำดับจากสันสกฤต → จีน → ญี่ปุ่น สะท้อนเส้นทางทางภูมิศาสตร์ที่พุทธศาสนาแผ่ออกจากอินเดีย
    คำเดียวกันนี้ในภาษาเวียดนามและเกาหลีคือ Thien และ Seon ตามลำดับ

  • มองว่าปรากฏการณ์นี้เกิดขึ้นเพราะแมชชีนเลิร์นนิงใกล้เคียงกับ ชีววิทยาหรือการเล่นแร่แปรธาตุ มากกว่าคณิตศาสตร์หรือการเขียนโปรแกรม
    ในคณิตศาสตร์หรือการเขียนโปรแกรม เราสามารถไล่ลงไปถึงหลักการปฐมฐานได้ โครงสร้างนามธรรมก็มั่นคง และความไม่เป็นเชิงกำหนดมีจำกัด แต่แมชชีนเลิร์นนิงไม่เป็นเช่นนั้น

  • ในบริบทคล้ายกัน การที่ Anthropic เปิดรับสมัครงานไว้ แต่กลับห้ามใช้ผลิตภัณฑ์ของตัวเองกับ การวิจัย frontier model ก็ดูค่อนข้างน่าขันและสายตาสั้น
    ไม่รู้เหมือนกันว่าคิดว่าคนเก่งแบบนั้นจะโผล่มาจากไหน
    เป็นการตัดสินใจที่รีบร้อน และดูมีโอกาสสูงที่จะนำไปสู่คดีต่อต้านการแข่งขันในสักวันหนึ่ง

  • ข้อความที่ว่า “สิ่งที่น่าประทับใจเกี่ยวกับ OpenAI คือคนที่บริหารบริษัท อย่างน้อยก็ฝั่งเทคนิคเป็นส่วนใหญ่ มีอายุต่ำกว่า 35 ปี และผู้ตัดสินใจสำคัญหลายคนเบื้องหลัง ChatGPT มีอายุต่ำกว่า 30 ปี” ดูจะสื่อว่ายังไปได้ไกลกว่านี้ เพราะในยุคตื่นทองเอง 49ers ส่วนใหญ่ก็อายุต่ำกว่า 25 ปี
    หากจะเปรียบต่อไป วีรบุรุษ AI หลายคนอาจเป็นคนที่อยู่ใกล้แหล่งรวม TPU และ GPU มาตั้งแต่ช่วงแรก

    • โอกาสที่จะได้อยู่ใกล้ทรัพยากรตั้งต้นเหล่านั้น น่าจะสูงกว่ามากสำหรับคนที่ หมกมุ่น กับแมชชีนเลิร์นนิง/AI อย่างอธิบายได้ยาก แม้ในช่วงที่มันเคยถูกมองว่าเป็นสาขาที่หมดกระแสไปแล้ว
  • ใจความสำคัญของบทความนี้ดูเหมือนจะเป็น “อย่าเชื่อ ชุดการประเมิน ในปัจจุบันมากเกินไป”
    คะแนนสะท้อนเพียงบางส่วนของปัญหาเท่านั้น
    สิ่งที่น่าสนใจคือการค้นพบตัวชี้วัดการประเมินใหม่ๆ ที่ทั้งแปลกใหม่และเสถียร แล้วดูว่าเมื่อทำสิ่งใหม่บนพื้นฐานนั้น จะเกิดผลลัพธ์ที่ฉลาดอย่างคาดไม่ถึงหรือไม่

    • ส่วนนั้นก็รวมอยู่ด้วยอย่างชัดเจน
      แต่แก่นจริงๆ คือการไปโฟกัสกับปัญหาที่คนอื่นเสนอมา เป็นวิธีคิดที่เฉพาะมากและค่อนข้างสั้นในระยะสั้น
      นักวิจัยที่ดีจะเพิ่มคะแนน benchmark แต่นักวิจัยที่ยอดเยี่ยมจะคิดว่า ตัวเองกำลังแก้ปัญหาอะไรอยู่
 
laeyoung 1 시간 전

สรุปคอมเมนต์ของ Hacker News ก็น่าสนุกดีเหมือนกัน