- ในกระบวนการแก้ ปัญหาเออร์ดิช #367 มีรายงานว่า เครื่องมือ AI มีบทบาทสำคัญ และทำงานร่วมกับนักคณิตศาสตร์มนุษย์
- Wouter van Doorn ได้นำเสนอ ตัวอย่างหักล้างที่มนุษย์สร้างขึ้น สำหรับส่วนที่สองของปัญหา จากนั้น Gemini Deepthink ได้สร้างบทพิสูจน์สมบูรณ์ของคองกรูเอนซ์ที่เกี่ยวข้อง
- Terence Tao ได้นำ บทพิสูจน์ที่อาศัยทฤษฎีจำนวนเชิงพี-แอดิกเชิงพีชคณิต ของ Gemini มาแปลงและเผยแพร่ในรูปแบบที่ง่ายกว่า และต่อมาได้กล่าวถึง ความเป็นไปได้ในการทำ formalization ด้วย Lean
- Boris Alexeev ใช้ เครื่องมือ Aristotle ของ Harmonic เพื่อทำ Lean formalization จนเสร็จสมบูรณ์ และเพื่อป้องกันการใช้ AI ในทางที่ผิด จึงตรวจสอบข้อความสุดท้ายด้วยตนเองแบบแมนนวล
- ลำดับเหตุการณ์นี้แสดงให้เห็นว่า การใช้ AI เป็นผู้ช่วยในงานวิจัยคณิตศาสตร์กำลังค่อย ๆ กลายเป็นขั้นตอนมาตรฐาน
กรณีศึกษาความร่วมมือกับ AI ในปัญหาเออร์ดิช #367
- วันที่ 20 พฤศจิกายน Wouter van Doorn ได้นำเสนอตัวอย่างหักล้างสำหรับส่วนที่สองของปัญหา ซึ่งอาศัยสมมติฐานว่าคองกรูเอนซ์หนึ่งเป็นจริง
- เขาขอให้ผู้เข้าร่วมคนอื่นช่วยตรวจสอบความถูกต้องของคองกรูเอนซ์ดังกล่าว
- ไม่กี่ชั่วโมงต่อมา Terence Tao ได้นำปัญหานี้ไปให้ Gemini Deepthink และภายในเวลาประมาณ 10 นาที ก็ได้ทั้งบทพิสูจน์สมบูรณ์ของคองกรูเอนซ์และการยืนยันตรรกะทั้งหมด
- บทพิสูจน์ของ Gemini ใช้ ทฤษฎีจำนวนเชิงพี-แอดิกเชิงพีชคณิต และ Tao ได้นำมันมาแปลงเป็นบทพิสูจน์เชิงมูลฐานที่ง่ายกว่าแล้วโพสต์ลงเว็บไซต์
- Tao กล่าวว่าบทพิสูจน์นี้น่าจะสามารถทำ ‘vibe formalizing’ ใน Lean ได้
Lean formalization และการตรวจสอบ
- สองวันถัดมา Boris Alexeev ได้ใช้ เครื่องมือ Aristotle ของ Harmonic เพื่อทำ Lean formalization จนเสร็จ
- เพื่อป้องกันการใช้ AI ในทางที่ผิด ข้อความสุดท้ายจึงถูก formalize ด้วยมือโดยตรง
- กระบวนการทั้งหมดใช้เวลาประมาณ 2–3 ชั่วโมง และผลลัพธ์ถูกเผยแพร่ออนไลน์
- หลังจากนั้น Tao ได้ใช้ AI เพื่อทำ การค้นหาวรรณกรรม แต่แม้จะพบงานวิจัยที่เกี่ยวข้องอยู่บ้าง ก็ไม่พบสิ่งใดที่เกี่ยวข้องโดยตรงกับปัญหา #367
ปฏิกิริยาและการถกเถียงในชุมชน
- ผู้ใช้บางคนติดตามสถานการณ์ การใช้ AI ในคณิตศาสตร์เชิงวิชาการ ผ่านอัปเดตของ Tao อย่างสนใจ
- ผู้ใช้อีกบางคนแสดงมุมมองเชิงวิพากษ์ต่อ แนวทางแบบพิธีการของ Lean โดยชี้ว่าความเข้าใจทางคณิตศาสตร์คือการบีบอัด (compression) แต่ Lean กลับทำให้สิ่งนั้น แตกออกเป็นรายละเอียดระดับต่ำ (decompression)
- เอกสารที่เกี่ยวข้อง “Against Lean: Why Proof Assistants Formalize the Wrong Thing” โต้แย้งว่า Lean และผู้ช่วยพิสูจน์ที่คล้ายกันจับแก่นแท้ของคณิตศาสตร์ได้อย่างไม่ถูกต้อง
- ผู้ใช้อีกคนกล่าวถึงปัญหาความแม่นยำของการสนทนากับ AI โดยประเมินว่า ยังต้องปรับจูนอย่างละเอียด แต่ก็ใช้งานได้อย่างเพลิดเพลิน
1 ความคิดเห็น
ความเห็นจาก Hacker News
เป็นประสบการณ์ที่น่าทึ่งมากที่สามารถโยนบทความวิจัย MLที่เน้นคณิตศาสตร์ให้ AI assistant แล้วรับคำอธิบายแบบง่ายหรือ pseudocode กลับมาได้
สำหรับคนอย่างฉันที่ไม่เคยได้ใช้สิ่งที่เรียนในมหาวิทยาลัยมาเกิน 25 ปี นี่ช่วยได้มากจริง ๆ
สามารถใส่งานวิจัยเข้าไปใน Claude แล้วรับภาพรวมก่อน จากนั้นค่อยถามต่อได้
แม้แต่ในสาขาอย่างชีววิทยาที่ผมไม่เคยเรียนตอนปริญญาตรีหรือโท ก็ยังขุดลึกได้เหมือนกำลังคุยกับติวเตอร์ที่มีความรู้
หวังว่านักวิจัยและบริษัทต่าง ๆ จะได้ประสิทธิภาพการทำงานที่ดีขึ้นจากงานวิจัยทางวิทยาศาสตร์
ต่อให้เป็น assistant ที่ยังไม่สมบูรณ์ ก็ยังเพิ่มแรงทดได้มากพอ
ว่ากันว่าเป็นสตาร์ตอัปที่ก่อตั้งโดย CEO ของ Robin Hood
“Vibe formalizing” ให้ความรู้สึกเหมือนเป็นส่วนขยายเชิงตรรกะของ “vibe engineering” และ “vibe coding”
เวลาที่ชิ้นส่วนของปัญหาต่อกันไม่ลงตัว แนวทางแบบ “Move 37 as a Service” ที่ผสมวิธีไม่เป็นทางการเข้ากับความเข้มงวดทางคณิตศาสตร์ก็น่าสนใจ
แน่นอนว่ามีส่วนที่ผิดอยู่บ้าง แต่เพราะมันสะท้อนความสับสนของผมและคุยต่อยอดได้ จึงช่วยให้เข้าใจลึกขึ้น
AI เก่งเป็นพิเศษในการจับจุดที่ผู้ใช้กำลังสับสน
เคยได้ยินเรื่องการออกเสียงชื่อนักคณิตศาสตร์ชาวฮังการี Erdős
ภาษาฮังการีโดยทั่วไปสะกดกับออกเสียงแทบจะตรงกัน แต่ในชื่อคนมีข้อยกเว้นอยู่
ถ้าออกเสียงแบบอังกฤษจะฟังคล้าย ๆ “airdish”
เช่น Görgey, Széchényi, Lánczos
ลำดับชื่อของฮังการีก็เหมือนญี่ปุ่น คือเรียงแบบนามสกุล-ชื่อ (big endian) เช่น “Erdős Pál”, “Neumann János”
น่าสนใจที่ในคอมเมนต์มีปฏิกิริยาแนวanti-Lean อยู่ด้วย
มันเป็นแค่การโปรโมตแนวทางอื่น หรือเป็นการคัดค้าน Lean ในเชิงปรัชญากันแน่
ผลลัพธ์จากการใช้ AI ในคณิตศาสตร์เชิงวิจัยออกมาแบบคละกันไป
บางทีก็เติมข้อโต้แย้งที่ไม่ trivial ให้เองได้ แต่ในบางเรื่องก็หลงทางไปเลย
ตอนนี้ผมยังคิดว่า AI มีประโยชน์ในฐานะเครื่องมือช่วยมากกว่าจะมาแทนนักคณิตศาสตร์
ในงานเขียนโค้ดมันก็เคยจับบั๊กเล็ก ๆ ไม่ได้เหมือนกัน แต่พอเป็นงานซับซ้อนกลับช่วยได้มาก
สุดท้ายแล้วเครื่องมือพวกนี้ยังห่างไกลจากการแทนผู้เชี่ยวชาญ และการโฆษณาเกินจริงยิ่งอาจทำลายความน่าเชื่อถือ
เหมือนคำที่ว่า “ถ้าสัญญาว่าจะให้ดวงจันทร์ ก็ต้องให้ดวงจันทร์” ดังนั้นการตั้งความคาดหวังที่สมจริงจึงสำคัญ
ไม่น่าเชื่อว่าในช่วงชีวิตของผมจะได้เห็นยุคแบบในStar Trek ที่เราพูดว่า “Computer, ช่วยวาด proof ของโจทย์คณิตข้อนี้ให้หน่อย” ได้
อยากให้ “Beam me up Scotty” เป็นจริงได้ด้วยเหมือนกัน
คืนนี้ระหว่างขับรถ ผมคุยกับ ChatGPT เรื่องรายละเอียดโครงสร้างของLLVM และ GCC pipeline scheduler
มันช่วยเพิ่มประสิทธิภาพการทำงานของผมมาก และยังจัดระเบียบบันทึกเกี่ยวกับคอมไพเลอร์ที่กำลังทดลองอยู่ให้โดยอัตโนมัติ
เป็นเรื่องที่เมื่อก่อนนึกไม่ถึงเลย
แน่นอนว่าผลลัพธ์ของแต่ละคนอาจต่างกัน
ถ้าตั้งชื่อ AI ว่า Erdos ก็ดูเหมือน Erdos number ของพวกเราทุกคนจะกลายเป็น 1
น่าประทับใจที่เขาใช้เครื่องมือ frontierที่มีอยู่ได้ดีและสร้างสภาพแวดล้อมการวิจัยคณิตศาสตร์แบบร่วมมือกันขึ้นมา
ด้วยเหตุนี้ผมจึงคิดว่าคณิตศาสตร์ยังคงเป็นศาสตร์หายากที่ค่อนข้างปลอดจากอิทธิพลแบบลวงโลก