- ปัญหาระยะหน่วย คือปัญหาของ Erdős จากปี 1946 ที่ถามว่าคู่จุดที่อยู่ห่างกัน 1 หน่วยมากที่สุดระหว่างจุด n จุดบนระนาบมีได้กี่คู่ และข้อคาดเดาหลักที่มีมายาวนานถูกหักล้างแล้ว
- โมเดลการให้เหตุผลอเนกประสงค์ ของ OpenAI ได้สร้างตระกูลตัวอย่างอนันต์ที่ล้มความเชื่อว่าตระกูลโครงสร้างแบบตารางสี่เหลี่ยมเป็นวิธีที่ดีที่สุดโดยพื้นฐาน พร้อมนำเสนอการปรับปรุงในระดับพหุนาม
- โครงสร้างใหม่นี้สร้างคู่จุดระยะหน่วยได้มากกว่า
n^{1+δ}สำหรับค่า n อนันต์จำนวนมาก และการปรับปรุงโดย Will Sawin แสดงให้เห็นว่าδ = 0.014เป็นไปได้ - การพิสูจน์นำเครื่องมือจากทฤษฎีจำนวนเชิงพีชคณิต เช่น infinite class field tower และ ทฤษฎี Golod–Shafarevich มาใช้กับปัญหาเรขาคณิต โดยก้าวข้าม Gaussian integers
- ผลลัพธ์นี้แสดงให้เห็นว่า AI สามารถมีส่วนต่อ การค้นพบทางคณิตศาสตร์ที่สร้างสรรค์ ในปัญหาเปิดที่มีมายาวนาน และความเชี่ยวชาญของมนุษย์ยิ่งสำคัญขึ้นในด้านการเลือกปัญหาและการตีความ
ความก้าวหน้าในปัญหาระยะหน่วย
- ปัญหาระยะหน่วย เป็นปัญหาในเรขาคณิตเชิงจัดหมู่ที่ถามว่า ในบรรดาจุด n จุดบนระนาบ จะสร้างคู่จุดที่มีระยะห่างเท่ากับ 1 ได้มากที่สุดกี่คู่
- Paul Erdős ตั้งปัญหานี้ไว้ในปี 1946 และหนังสือ Research Problems in Discrete Geometry ของ Brass, Moser และ Pach ในปี 2005 อธิบายว่าปัญหานี้ “อาจเป็นปัญหาที่เป็นที่รู้จักมากที่สุดและอธิบายได้ง่ายที่สุดในเรขาคณิตเชิงจัดหมู่”
- นักคณิตศาสตร์เชิงจัดหมู่จาก Princeton อย่าง Noga Alon แนะนำว่านี่เป็นหนึ่งในปัญหาที่ Erdős ชอบเป็นพิเศษ และ Erdős ยังตั้งเงินรางวัลสำหรับการแก้ปัญหานี้ด้วย
- เป็นเวลานานที่เชื่อกันว่าโครงสร้างตระกูล ตารางสี่เหลี่ยม ให้จำนวนคู่จุดระยะหน่วยได้เกือบมากที่สุดเท่าที่จะเป็นไปได้
- โมเดลภายในของ OpenAI ได้สร้างตระกูลตัวอย่างอนันต์ที่หักล้างข้อคาดเดาเก่าแก่นี้ และให้การปรับปรุงในระดับพหุนาม
- การพิสูจน์นี้ได้รับการตรวจทานจากกลุ่มนักคณิตศาสตร์ภายนอก และนักคณิตศาสตร์เหล่านั้นยังได้เขียนบทความประกอบที่กล่าวถึงเหตุผล ภูมิหลัง และความหมายของผลลัพธ์
- ดูต้นฉบับการพิสูจน์ได้ที่ unit-distance-proof.pdf, บทความประกอบที่ unit-distance-remarks.pdf, และฉบับย่อของ chain of thought ของโมเดลที่ unit-distance-cot.pdf
วิธีที่ AI ค้นพบ
- การพิสูจน์นี้มาจากระบบที่ฝึกเพื่อคณิตศาสตร์โดยเฉพาะ สแคฟโฟลด์สำหรับค้นหากลยุทธ์การพิสูจน์ และ โมเดลการให้เหตุผลอเนกประสงค์ ไม่ใช่ระบบที่สร้างขึ้นเฉพาะสำหรับปัญหาระยะหน่วย
- มีการประเมินจากชุดปัญหาของ Erdős ในฐานะส่วนหนึ่งของงานที่กว้างกว่านี้ เพื่อดูว่าโมเดลขั้นสูงสามารถมีส่วนร่วมกับงานวิจัยแนวหน้าได้หรือไม่ และในปัญหานี้ก็ได้สร้างการพิสูจน์ที่แก้ปัญหาเปิดสำเร็จ
- คณิตศาสตร์เป็นขอบเขตที่ชัดเจนสำหรับการทดสอบความสามารถในการให้เหตุผล เพราะปัญหามีความแม่นยำ ตรวจสอบการพิสูจน์ที่เสนอได้ และเหตุผลที่ยาวต้องคงความสอดคล้องตั้งแต่ต้นจนจบ
- การพิสูจน์นี้นำแนวคิดจาก ทฤษฎีจำนวนเชิงพีชคณิต ที่คาดไม่ถึงและซับซ้อน มาใช้กับปัญหาเรขาคณิตที่ดูเหมือนเป็นปัญหาเบื้องต้น
- Tim Gowers เรียกผลลัพธ์นี้ในบทความประกอบว่าเป็น “หลักไมล์ของคณิตศาสตร์ AI”
- นักทฤษฎีจำนวน Arul Shankar ประเมินว่านี่แสดงให้เห็นว่าโมเดล AI ปัจจุบันก้าวพ้นการเป็นเพียงผู้ช่วยของนักคณิตศาสตร์มนุษย์ และสามารถเสนอแนวคิดที่สร้างสรรค์ ซับซ้อน และดำเนินการจนจบได้
เนื้อหาทางคณิตศาสตร์ของปัญหาระยะหน่วย
- u(n) นิยามให้เป็นจำนวนสูงสุดของ คู่จุดระยะหน่วย ที่เป็นไปได้ระหว่างจุด n จุดบนระนาบ
- โครงสร้างอย่างง่ายคือวางจุด n จุดบนเส้นตรงเส้นเดียว ซึ่งให้ได้ n−1 คู่ ส่วนตารางสี่เหลี่ยมให้ได้ประมาณ 2n คู่
- โครงสร้างที่ดีที่สุดก่อนหน้านี้มาจากตารางสี่เหลี่ยมที่ปรับสเกลแล้ว และให้คู่จุดระยะหน่วยจำนวน
n^{1 + C / log log(n)}สำหรับค่าคงที่ C - เนื่องจาก
log log(n)เพิ่มขึ้นเมื่อ n ใหญ่ขึ้น พจน์เพิ่มเติมของเลขชี้กำลังจึงเข้าใกล้ 0 ทำให้อัตราการเติบโตของโครงสร้างนี้เร็วกว่าเชิงเส้นเพียงเล็กน้อย - ตลอดหลายสิบปีที่ผ่านมา อัตราส่วนนี้ถูกเชื่ออย่างกว้างขวางว่าเกือบดีที่สุดแล้ว และ Erdős คาดเดาในเชิงเทคนิคว่ามีขอบบนแบบ
n^{1+o(1)} - ผลลัพธ์ใหม่หักล้างข้อคาดเดานี้ โดยสร้างโครงสร้างของจุด n จุดที่มีคู่จุดระยะหน่วยอย่างน้อย
n^{1+δ}สำหรับค่า n อนันต์จำนวนมาก โดยมีเลขชี้กำลังคงที่บางค่าδ > 0 - เดิมทีการพิสูจน์ของ AI ไม่ได้ให้ค่า δ ที่ชัดเจน แต่การปรับปรุงภายหลังโดยศาสตราจารย์คณิตศาสตร์จาก Princeton อย่าง Will Sawin แสดงให้เห็นว่าสามารถเลือก
δ = 0.014ได้
ทำไมผลลัพธ์นี้จึงน่าประหลาดใจ
- นับตั้งแต่โครงสร้างดั้งเดิมของ Erdős ในปี 1946 ขอบล่างที่ดีที่สุดที่รู้จักแทบไม่เปลี่ยนแปลงอย่างมีนัยสำคัญ
- ขอบบนที่ดีที่สุดที่รู้จักคือ
O(n^{4/3})จากงานของ Spencer, Szemerédi และ Trotter ในปี 1984 และยังคงอยู่โดยพื้นฐานแม้จะมีการปรับปรุงและการศึกษาโครงสร้างที่เกี่ยวข้องภายหลังโดย Székely, Katz และ Silier, Pach, Raz, Solymosi เป็นต้น - Matoušek และ Alon-Bucić-Sauermann ศึกษาปัญหานี้ภายใต้ระยะทางแบบไม่ใช่ยูคลิดบนระนาบ และนำเสนอผลลัพธ์ที่สนับสนุนข้อคาดเดา โดยแสดงว่าในความหมายหนึ่ง ระยะทางแบบไม่ใช่ยูคลิด “ส่วนใหญ่” เป็นไปตามข้อคาดเดาของ Erdős
- สิ่งที่น่าประหลาดใจเป็นพิเศษคือวัตถุดิบสำคัญของโครงสร้างใหม่มาจาก ทฤษฎีจำนวนเชิงพีชคณิต ซึ่งดูเหมือนห่างไกลจากเรขาคณิตและระยะทาง
- ทฤษฎีจำนวนเชิงพีชคณิตเป็นสาขาที่ศึกษามโนทัศน์อย่างการแยกตัวประกอบ ภายในส่วนขยายของจำนวนเต็มที่เรียกว่าฟิลด์จำนวนเชิงพีชคณิต
เทคนิคใหม่จากทฤษฎีจำนวนเชิงพีชคณิต
- การพิสูจน์ใหม่นี้เริ่มจากแนวคิดเรขาคณิตที่คุ้นเคย แล้วขยายออกไปในทิศทางที่คาดไม่ถึง
- ขอบล่างดั้งเดิมของ Erdős สามารถเข้าใจได้ผ่าน Gaussian integers ในรูป
a + bi - ที่นี่ a และ b เป็นจำนวนเต็ม และ i คือรากที่สองของ −1
- Gaussian integers เป็นส่วนขยายของจำนวนเต็มปกติ และมีสมบัติบางอย่างเหมือนจำนวนเต็ม เช่น การแยกตัวประกอบเฉพาะแบบเอกฐาน
- ส่วนขยายของจำนวนเต็มหรือจำนวนตรรกยะแบบนี้เรียกว่า ฟิลด์จำนวนเชิงพีชคณิต
- เหตุผลใหม่แทนที่ Gaussian integers ด้วยการเหมารวมที่ซับซ้อนกว่าจากทฤษฎีจำนวนเชิงพีชคณิต ซึ่งมีสมมาตรที่สมบูรณ์ยิ่งกว่าและช่วยสร้างผลต่างที่มีความยาวหน่วยได้มากขึ้น
- เหตุผลโดยละเอียดใช้เครื่องมืออย่าง infinite class field tower และ ทฤษฎี Golod–Shafarevich เพื่อแสดงว่าฟิลด์จำนวนที่ต้องการนั้นมีอยู่จริง
- แม้แนวคิดเหล่านี้จะเป็นที่รู้จักดีในหมู่นักทฤษฎีจำนวนเชิงพีชคณิต แต่การที่มันมีผลต่อปัญหาเรขาคณิตบนระนาบแบบยูคลิดถือเป็นเรื่องน่าประหลาดใจอย่างมาก
ความหมายต่อวงการคณิตศาสตร์
- นี่เป็นช่วงเวลาสำคัญต่อปฏิสัมพันธ์ระหว่าง AI กับคณิตศาสตร์ เพราะเป็นครั้งที่ระบบ AI แก้ปัญหาเปิดเก่าแก่ที่อยู่ใจกลางของสาขาวิจัยที่ยังเคลื่อนไหวอยู่อย่างอัตโนมัติ
- งานประกอบจากนักคณิตศาสตร์ภายนอกช่วยให้เห็นภาพที่สมบูรณ์และลึกซึ้งกว่าที่ปรากฏจากวิธีแก้เดิมเพียงอย่างเดียว
- Thomas Bloom เขียนในบทความประกอบว่า เมื่อประเมินความสำคัญของการพิสูจน์ที่ AI สร้างขึ้น เขาจะถามว่าการพิสูจน์นั้นสอนสิ่งใหม่เกี่ยวกับปัญหาหรือไม่ และทำให้เราเข้าใจเรขาคณิตเชิงไม่ต่อเนื่องได้ดีขึ้นหรือไม่
- Bloom ประเมินว่าผลลัพธ์นี้แสดงให้เห็นว่าโครงสร้างเชิงทฤษฎีจำนวนสามารถบอกอะไรเกี่ยวกับคำถามแบบนี้ได้มากกว่าที่คาดไว้มาก และทฤษฎีจำนวนที่ต้องใช้อาจลึกซึ้งอย่างยิ่ง
- Bloom คาดว่าในช่วงไม่กี่เดือนข้างหน้า นักทฤษฎีจำนวนเชิงพีชคณิตจำนวนมากจะเริ่มพิจารณาปัญหาเปิดอื่น ๆ ในเรขาคณิตเชิงไม่ต่อเนื่องอย่างใกล้ชิด
- ความเชื่อมโยงที่ไม่คาดคิดระหว่างทฤษฎีจำนวนเชิงพีชคณิตกับเรขาคณิตเชิงไม่ต่อเนื่อง ไม่ได้เพียงแก้ข้อคาดเดาเฉพาะเรื่องหนึ่ง แต่ยังเป็น สะพาน สำหรับการสำรวจปัญหาที่เกี่ยวข้องต่อไป
- ผลลัพธ์นี้แสดงว่า AI สามารถมีส่วนต่อ การค้นพบทางคณิตศาสตร์ ไม่ใช่แค่การหาคำตอบ และความหมายของมันจะยิ่งชัดเจนและสมบูรณ์ขึ้นผ่านความเข้าใจของมนุษย์ในภายหลัง
ทำไมเรื่องนี้จึงสำคัญ
- ความสามารถในการให้เหตุผลทางคณิตศาสตร์ที่ดีขึ้นสามารถทำให้ AI เป็น พาร์ตเนอร์ด้านการวิจัย ที่ทรงพลังยิ่งขึ้น
- มันสามารถรักษากระบวนการคิดที่ยากให้สอดคล้องกัน เชื่อมโยงแนวคิดระหว่างขอบเขตความรู้ที่ห่างไกลกัน และเปิดเผยเส้นทางที่มีศักยภาพซึ่งผู้เชี่ยวชาญอาจไม่ได้จัดลำดับความสำคัญไว้ก่อน
- สิ่งนี้อาจช่วยให้นักวิจัยสร้างความก้าวหน้าในปัญหาที่ซับซ้อนเกินไปหรือใช้เวลามากเกินไปจนจัดการได้ยาก
- ความสามารถเช่นนี้มีประโยชน์เกินกว่าคณิตศาสตร์ ไปสู่ชีววิทยา ฟิสิกส์ วัสดุศาสตร์ วิศวกรรม และการแพทย์
- หาก AI สามารถรักษาเหตุผลที่ซับซ้อนให้สอดคล้อง เชื่อมโยงขอบเขตความรู้ที่ห่างกัน และสร้างผลลัพธ์ที่ผ่านการตรวจทานจากผู้เชี่ยวชาญได้ ก็จะเป็นส่วนหนึ่งของเส้นทางระยะยาวไปสู่ระบบวิจัยที่ทำงานอัตโนมัติได้มากขึ้น
- มีการเสนอว่า AI กำลังเริ่มรับบทบาทอย่างจริงจังในส่วนที่สร้างสรรค์ของงานวิจัย โดยเฉพาะในการวิจัย AI เอง
- ความก้าวหน้าแบบนี้ยิ่งตอกย้ำความเร่งด่วนในการทำความเข้าใจปัญหาการจัดแนวของระบบที่มีความฉลาดสูงมาก ขั้นต่อไปของการพัฒนา AI และอนาคตของความร่วมมือระหว่างมนุษย์กับ AI
- อนาคตนั้นยังคงขึ้นอยู่กับ วิจารณญาณของมนุษย์
- ความเชี่ยวชาญไม่ได้มีความสำคัญลดลง แต่กลับมีคุณค่ามากขึ้น
- AI สามารถช่วยสำรวจ เสนอ และตรวจสอบได้ แต่การเลือกปัญหาสำคัญ การตีความผลลัพธ์ และการตัดสินว่าควรไล่ตามคำถามใดต่อไป ยังเป็นหน้าที่ของมนุษย์
1 ความคิดเห็น
ความเห็นจาก Hacker News
เธรด HN นี้ทำให้รู้สึกหดหู่ และผมก็ยังคิดอยู่ว่าทำไมถึงเป็นแบบนั้น
ถ้าปัดคำชื่นชมแบบข่าวประชาสัมพันธ์ของ OpenAI ออกไป ก็จะเห็นว่ามีคำถามที่น่าสนใจและละเอียดอ่อนมากมายเกี่ยวกับ บทบาทของ LLM ในงานวิจัยคณิตศาสตร์
ขอแนะนำให้อ่านความเห็นของนักคณิตศาสตร์ที่แนบมากับผลลัพธ์ โดยเฉพาะคำพูดของ Tim Gowers
แต่ส่วนคอมเมนต์กลับกลายเป็นสนามรบของการถกเถียงเรื่อง LLM การโต้แย้ง และการโต้กลับด้วยความโกรธที่วนซ้ำมาตั้งแต่ปี 2023
น่าเศร้าที่เรายังสู้เรื่องเดิมบน แนวรบที่ขีดไว้เมื่อ 3 ปีก่อน และก็สงสัยว่าอีก 2 ปีข้างหน้าจะยังเป็นแบบนี้อยู่ไหม
ถ้าจำคำกล่าวดังของ Nietzsche ไว้ในใจ ชีวิตอาจดีขึ้นได้: “ข้าพเจ้าไม่อยากทำสงครามกับความน่าเกลียด ข้าพเจ้าไม่อยากกล่าวโทษ และไม่อยากกล่าวโทษแม้กระทั่งผู้ที่กล่าวโทษ การหันสายตาไปทางอื่น ควรเป็นการปฏิเสธเพียงอย่างเดียวของข้าพเจ้า”
ยิ่ง AI พิสูจน์ความสามารถได้มากเท่าไร ก็ยิ่งเอียงไปในทิศทางที่ทำให้ทุกคนที่ไม่ได้มีความมั่นคงในการจ้างงานสูงมากรู้สึกไม่สบายใจ
คงต้องใช้เวลาให้คนยอมรับว่า AI มีชุดความสามารถที่ต่างจากสติปัญญามนุษย์มาก และจริง ๆ แล้วเสริมกันได้ค่อนข้างดี
โอกาสที่มันจะเหนือกว่าสติปัญญามนุษย์ในวงกว้างมีไม่มาก และบริษัทที่เดิมพันกับสิ่งนั้นจะตามหลัง
ผมอยากคุยเรื่องพวกนี้อย่างจริงจัง แต่ทุกคนเชื่อว่าความจริงของตัวเองเท่านั้นที่จริง และความจริงที่ตรงข้ามเป็นของปลอม เลยยิ่งทวีความรุนแรงต่อเนื่อง
บางครั้งก็รู้ตัวว่ามา HN เพื่อโกรธอย่างเดียว เลยพักยาว
ไม่รู้ว่าทำไมเราถึงทำแบบนี้กับตัวเอง ทั้งที่ลึก ๆ แล้วผมว่าเราส่วนใหญ่ต้องการสิ่งเดียวกัน
ถึงฝั่งที่บอกว่า “LLM แค่ทำ interpolation จากข้อมูลฝึก”: Ayer และ Wittgenstein ยุคต้น แม้จะต่างกันในรายละเอียด แต่ต่างก็มองว่าความจริงทางคณิตศาสตร์ไม่ได้รายงานข้อเท็จจริงใหม่เกี่ยวกับโลก
แนวคิดที่ว่าบทพิสูจน์เป็นเพียงการคลี่สิ่งที่แฝงอยู่แล้วในสัจพจน์ คำนิยาม สัญลักษณ์ และกฎออกมา เป็นสิ่งที่น่าสนใจอย่างลึกซึ้ง และก็ไม่ได้มีปัญหาอะไรกับการให้เครดิตนักคณิตศาสตร์ในฐานะผู้ค้นพบ
ดังนั้น การนำวัสดุเดิมมาจัดเรียงใหม่ จะไม่ใช่เหตุให้ขาดคุณสมบัติ ไม่เช่นนั้นก็คงต้องคืนเหรียญ Fields Medal กันไปหลายคน
มนุษย์เองก็ไม่ได้สร้างนวัตกรรมแบบข้ามมิติใหม่ได้ทุกปีในทุกสาขา
จะบอกว่า LLM แค่ recombine ก็ได้ แต่ผมก็ยังสงสัยว่า LLM ที่เรียนวรรณกรรมพีชคณิต เรขาคณิต และตรีโกณมิติทั้งหมดก่อน Newton/Leibniz จะคิดแคลคูลัสขึ้นมาได้ไหม
ถึงอย่างนั้น นี่ก็เป็นนวัตกรรมชนิดที่ LLM ทำได้ดี และไม่ได้แปลว่ามนุษย์ไม่จำเป็นต้องเก่งนวัตกรรมแบบจัดองค์ประกอบใหม่อีกต่อไป
ในแง่ของการสังเคราะห์ไอเดียใหม่ ๆ ยังดูเหมือนมีอีกมากที่มนุษย์ทำได้แต่ LLM ทำไม่ได้
ถ้าวาดเปลือกนูนขนาดใหญ่ล้อมทุกจุดเหล่านั้นไว้ LLM ก็เรียนอยู่ภายในนั้น จึงอาจทำ interpolation ระหว่างจุดเดิมเพื่อไปถึงจุดใหม่ที่ยังอยู่ในเปลือกนั้นได้
ส่วน LLM จะไปถึงจุดนอกเปลือกได้หรือไม่ยังเป็นเรื่องถกเถียง
แค่ไปถึงจุดใหม่ที่อยู่ในเปลือกก็มีประโยชน์มากแล้ว
การค้นพบและบทพิสูจน์ใหม่จำนวนมาก หรืออาจจะส่วนใหญ่ของที่มีประโยชน์ ล้วนเป็นจุดแบบนี้ที่ไปถึงได้โดยเริ่มจากสิ่งที่เรามีอยู่แล้ว
หลายอย่างยังไม่ถูกค้นพบเพียงเพราะยังไม่มีใครลงเวลาและแรงพอ และ LLM อาจเร่งสิ่งนี้ได้มาก
ในทางกลับกัน ก็มีจุดนอกเปลือกที่ไปไม่ถึงด้วยการ extrapolation หรือ interpolation จากจุดเดิม ต้องอาศัยการกระโดดแบบใหม่จริง ๆ
การก้าวจากฟิสิกส์แบบ Newton ไปสู่ ทฤษฎีสัมพัทธภาพทั่วไป น่าจะเป็นตัวอย่างหนึ่ง
Demis Hassabis เคยพูดถึงการใช้ AI ที่เรียนฟิสิกส์แค่ถึงก่อนปี 1915 แล้วให้ดูวงโคจรของ Mercury เพื่อดูว่ามันจะไปถึงทฤษฎีสัมพัทธภาพทั่วไปได้เองหรือไม่ เป็นเกณฑ์ประเมิน AGI
ผมยังสงสัยว่า LLM ปัจจุบันจะกระโดดแบบนั้นได้ไหม และมนุษย์ส่วนใหญ่ก็ทำไม่ได้เหมือนกัน
ที่เราเรียก Einstein ว่าอัจฉริยะก็เพราะเขากระโดดไปถึงทฤษฎีสัมพัทธภาพทั่วไปได้ด้วยตัวเอง ซึ่งสำหรับมนุษย์เรามีตัวอย่างยืนยันแล้วว่าเกิดขึ้นได้ แต่กับ AI คงต้องรอดูต่อไป
คนอย่าง Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan, Galois ปฏิบัติต่อคณิตศาสตร์คล้ายศิลปะมากกว่าวิทยาศาสตร์
ตัวอย่างเช่น หลายคนมองว่าการแก้ Riemann Hypothesis น่าจะต้องอาศัยคณิตศาสตร์แบบใหม่ และไม่น่าเป็นไปได้ที่ LLM จะประดิษฐ์สิ่งนั้นขึ้นมาได้แบบฉับพลัน
มันไร้ความหมายและไม่ค่อยเกี่ยวข้อง
ตอน Deep Blue ชนะ Kasparov โลกไม่ได้เปลี่ยนไปทั้งหมด และสัตว์กับเครื่องจักรก็ “ดีกว่า” มนุษย์ในบางมิติมาโดยตลอด
แต่แรกก็ไม่มีไม้บรรทัดเดียวอยู่แล้ว และถึงมีก็ไม่ใช่แบบหนึ่งมิติหรือเชิงเส้น โดยแต่ละคนก็เปลี่ยนไม้บรรทัดกับปลายทั้งสองตามกาลเวลา
นี่ก็ไม่ได้แปลว่าจะยกชัยชนะให้พวกคลั่ง AI
LLM เป็นเครื่องมือที่มีประโยชน์มากและจะดีขึ้นอย่างมากต่อไป แต่จะไม่เหนือกว่ามนุษย์ในทุกมิติที่มนุษย์บางคนเห็นว่าสำคัญ
จะไม่มีช่วงเวลาที่ AI แค่ข้ามเส้นในรายการตัวชี้วัดเชิงปริมาณแล้วทุกคนยอมรับโดยสากลว่ามันเหนือกว่ามนุษย์
เพราะสิ่งที่ “สำคัญ” นั้นเป็นเรื่องอัตวิสัย
คำกล่าวว่า “แฝงอยู่แล้วโดยนัย” จะจริงได้ก็ต่อเมื่อคณิตศาสตร์เป็นระบบปิด แต่เราพิสูจน์แล้วว่าไม่ใช่
เราใช้คณิตศาสตร์หลุดออกจากคณิตศาสตร์ได้ จึงต้องมี หมุดยึดเชิงสัจพจน์ หลายแบบอย่าง Zermelo-Fraenkel และอื่น ๆ
ที่จริงแล้วเราเข้าใจไม่มากเลยว่าความกว้างใหญ่ของสิ่งที่พอจะเรียกว่า “คณิตศาสตร์” อย่างเป็นวัตถุนั้นแค่ไหน และก็เป็นไปได้ว่าคณิตศาสตร์ที่เรารับรู้อยู่อาจเป็นเพียงส่วนหนึ่งของคณิตศาสตร์ที่ใหญ่กว่า หรืออาจผิดอย่างหนักก็ได้
เราไม่รู้ว่าคณิตศาสตร์ที่ใหญ่กว่านั้นจะมีคุณสมบัติแบบระบบปิดเหมือนกันหรือไม่
สำหรับคนที่ใช้ LLM เขียนโค้ดเยอะ เรื่องนี้ก็ไม่ค่อยน่าแปลกใจ และเป็นแค่เรื่องของเวลา
นักคณิตศาสตร์สร้างและใช้เครื่องมือทางคณิตศาสตร์ในวิธีใหม่ ๆ เพื่อค้นพบสิ่งใหม่
มันคือการทำงานซ้ำมหาศาลตามสัญชาตญาณและสำรวจความเชื่อมโยงต่าง ๆ
LLM ไม่มีสัญชาตญาณว่าคำว่า “ค้นพบ” หมายถึงอะไร จึงยากจะบอกว่ามันค้นพบอย่างแท้จริง แต่สามารถลองใช้เครื่องมือทางคณิตศาสตร์ทั้งหมดแบบ Monte Carlo ไปยังเป้าหมายแคบ ๆ เพื่อหาว่าอะไรใช้ได้ แล้วค่อยต่อยอดหรือรวมการปรับปรุงต่าง ๆ เข้าด้วยกัน
ถ้าอ่านบทความนี้จะเห็นว่าการค้นพบครั้งนี้ก็ดูเป็นแบบนั้นพอดี และ LLM ใช้ ความเชื่อมโยงที่น่าประหลาดใจ เพื่อไปไกลกว่าผลลัพธ์ที่คาดไว้
แต่ถ้าไม่มีเป้าหมายที่มนุษย์ตั้งไว้ ไม่มีความเข้าใจของมนุษย์ที่มองเห็นคุณค่าของเส้นทางใหม่ที่ AI ใช้ และไม่มีภาษาคณิตศาสตร์ที่มนุษย์สร้างขึ้นเพื่อให้สำรวจแนวคิดเหล่านี้ได้ ผลลัพธ์นี้ก็ไม่มีความหมาย
ทำไมความเข้าใจถึงใช้ได้เฉพาะตอนที่มนุษย์เป็นผู้เข้าใจ
ทำไมความรู้ต้องมีไว้เพื่อมนุษย์เท่านั้น
ถ้าสิ่งมีชีวิตอีกสายพันธุ์หนึ่งแก้ความขัดแย้งระหว่างแรงโน้มถ่วงกับกลศาสตร์ควอนตัมได้ มันจะไม่มีความหมายจนกว่าจะมาอธิบายให้เราฟังและเราจะเข้าใจงั้นหรือ
สิ่งที่น่าสนใจคือบทพิสูจน์นี้ หรือให้แม่นกว่านั้นคือการหักล้างนี้ พบ ตัวอย่างโต้แย้ง ต่อข้อคาดเดาเดิมของ Erdős ด้วยวิธีนั้น
เหมือนปฏิกิริยาของนักคณิตศาสตร์คนหนึ่งใน PDF ที่ลิงก์ไว้ ผมมองว่ามันน่าสนใจน้อยกว่าการพิสูจน์ว่าข้อคาดเดานั้นจริงอยู่บ้าง
ถ้าจะพิสูจน์ว่าข้อคาดเดาเป็นจริง จะต้องมีการสร้างทฤษฎีมากกว่านี้
คุณต้องอธิบายว่าทำไมข้อคาดเดาถึงถูกต้องโดยอิงกับทฤษฎีที่ใหญ่กว่า แต่ในกรณีตัวอย่างโต้แย้ง โมเดลแค่ต้องหาโครงสร้างที่ถูกต้องให้เจอด้วยการค้นหารูปแบบที่ซับซ้อนขึ้น
แน่นอนว่าการค้นหานี้ไม่ง่ายและน่าประทับใจมาก และยังต้องมีหลายขั้นตอนเพื่อพิสูจน์ความเชื่อมโยงกับตัวอย่างโต้แย้งนั้น
ถึงอย่างนั้น ผมก็ยังมองว่ามันใกล้เคียงกับการเชื่อมแนวคิดเดิม ๆ มากกว่าการพัฒนาคณิตศาสตร์ใหม่ที่ลึกซึ้ง
ไม่ได้จะลดทอนความสำเร็จมหาศาลนี้นะ ผมคิดว่ามันไปถึงอะไรบางอย่างจริง ๆ
เป็นเพียงความรู้สึกล้วน ๆ แต่ผมคิดว่าโมเดลน่าจะไม่ไกลจากการสร้างทฤษฎีได้พอจะพิสูจน์ข้อคาดเดาที่ซับซ้อนกว่านี้ซึ่งต้องอาศัยการพัฒนาคณิตศาสตร์ใหม่ และมันน่าจะเป็นปัญหาเรื่องการทำงานบนกรอบเวลาที่ยาวขึ้น
ส่วนใหญ่คุณจะค่อย ๆ แทะขอบเขตลงมาเพื่อลดความซับซ้อนของปัญหา
เช่น ถ้าจะพิสูจน์ว่าบางอย่างเป็นไปไม่ได้ คุณอาจเริ่มจากแสดงว่ามีเพียง 5 ตระกูลของกรณีที่เป็นไปได้ แล้วพิสูจน์ได้ว่า 4 ตระกูลในนั้นเป็นไปไม่ได้
แบบนั้นก็ถือว่าแก้ปัญหาไปแล้ว 80% และถ้ากำลังหาตัวอย่างโต้แย้ง พื้นที่ค้นหาก็ลดลง 80% เช่นกัน
ในกรณีตัวอย่างโต้แย้ง คุณสามารถเดาและกระโดดได้ ถ้าถูกก็ใช้ได้ แต่ในบทพิสูจน์ คุณทำแบบนั้นไม่ได้
อีกด้านหนึ่ง พอหาตัวอย่างโต้แย้งเจอแล้ว ทางตันที่ลองแล้วทิ้งไปก็มักถูกซ่อนไว้
ให้มันผสมของที่มีในข้อมูลฝึกนานแค่ไหนก็เหมือนเดิม
อย่างที่เคยพูดไว้ AI จะได้ Fields Medal ก่อนที่จะบริหาร McDonald's ได้
ส่วนที่ยากคือการสร้างกระดานหมากรุกให้คณิตศาสตร์เล่นได้ หรือก็คือสภาพแวดล้อมแบบ Lean และตอนนี้ที่เหลือคือการรู้จำรูปแบบกับการคำนวณ
LLM เป็นแค่จุดเริ่มต้น และอีกไม่นานเราจะได้เห็น AI คณิตศาสตร์ที่เฉพาะทางมากขึ้น คล้าย Stockfish
ทั้งหมดเกิดขึ้นด้วยอินพุตและเอาต์พุตภาษาธรรมชาติล้วน ๆ และในหลายแง่ผมว่ามันเป็นเดโมที่น่าสนใจมากซึ่งชี้ไปในทิศทางตรงกันข้ามเสียด้วยซ้ำ
การตรวจสอบจะเข้ามาเมื่อคุณอยากให้คอมพิวเตอร์รับช่วงไปจนถึงขั้นเช็กบทพิสูจน์
ปัจจุบันบทพิสูจน์นี้ถูกตรวจด้วยมือโดยกลุ่มนักคณิตศาสตร์ในสาขานั้น
ในระบบนั้นมีระบบอัตโนมัติแบบ “reverse centaur” อยู่มากมาย
Manna มีรายการสิ่งที่ต้องทำในแต่ละขณะ และเมื่อมีออเดอร์เข้าที่เคาน์เตอร์ มันก็สั่งพนักงานให้เตรียมอาหารนั้น
มันติดตามงานหลายร้อยอย่าง เช่น ทำความสะอาดห้องน้ำ ถูพื้น เช็ดโต๊ะ กวาดทางเดิน ละลายขนมปัง หมุนเวียนสต็อก เช็ดหน้าต่าง แล้วมอบหมายให้พนักงานทีละอย่าง
พอหมดกะ Manna จะพูดเสมอว่า “วันนี้เสร็จเรียบร้อยแล้ว ขอบคุณสำหรับความช่วยเหลือ” แล้วคุณก็ถอดเฮดเซ็ตไปวางที่แท่นชาร์จ
หลังจากมีเสียงในหัวคอยบอกอย่างละเอียดมากว่าต้องทำอะไรตลอด 6–8 ชั่วโมง ช่วงสองสามนาทีแรกหลังถอดเฮดเซ็ตจะสับสนเสมอ และต้องเปิดสมองใหม่ถึงจะเดินออกจากร้านได้
[0] https://en.wikipedia.org/wiki/Manna_(novel)
ส่วน Fields Medal จะตามมาอีกนานหลังจากนั้น
ถ้าจะตรวจว่ามันไม่ใช่เรื่องเหลวไหล ก็ต้องอาศัย การตรวจสอบโดยผู้เชี่ยวชาญมนุษย์
Lean ไม่ได้พิเศษอะไรในที่นี้ มันแทบจะเป็นแค่กระแสหมู่
และเราก็ไม่รู้ด้วยว่าการฝึกด้วย Lean ช่วยโมเดลนี้โดยเฉพาะมากแค่ไหน
บทพิสูจน์นี้นำ ทฤษฎีจำนวนเชิงพีชคณิต ที่คาดไม่ถึงและซับซ้อนมาใช้กับคำถามเรขาคณิตระดับพื้นฐาน
ยิ่งอ่านความสำเร็จแบบนี้ ก็ยิ่งรู้สึกว่าพลังส่วนใหญ่ของโมเดลมาจากการมีความรู้ล่วงหน้าแทบทุกสาขาที่เป็นไปได้ และไม่มีปัญหาในการถ่ายโอนไปยังโดเมนใหม่
ความงามที่อาจเกิดขึ้นของเครื่องมือเหล่านี้คือ มันอาจช่วยทะลุกำแพงของการทำงานแบบเฉพาะทางสุดขั้วที่มนุษย์เจอในวิทยาศาสตร์ปัจจุบัน
การเฉพาะทางสุดขั้วนั้นสำคัญในด้านหนึ่ง แต่ในอีกด้านก็จำกัดเครื่องมือและแรงบันดาลใจที่คนเข้าถึงได้
ยิ่งเรา เฉพาะทางสุดขั้ว มากเท่าไร LLM ก็ยิ่งเป็นเครื่องมือมีค่าสำหรับการเชื่อมขอบฟ้าคนละด้านเข้าด้วยกัน
เมื่อก่อนต้นทุนการเข้าถึงมันสูง แต่ตอนนี้ไม่ใช่อีกแล้ว
สิ่งที่เจ๋งคือ เมื่อใครสักคนมีส่วนเพิ่มบางอย่างให้กับปัญญาร่วมหมู่นั้น มันก็สามารถถูกนำไปใช้กับปัญหาใดก็ตามที่คนอื่นกำลังทำอยู่ได้ทันที
บางที LLM อาจช่วยพัฒนา ความเข้าใจแบบแนวนอน ต่อสาขาต่าง ๆ ได้
แต่นี่คือโมเดลทั่วไป จึงมีความรู้ระดับสูงกว่าปริญญาเอกในฟิสิกส์ ชีววิทยา ประวัติศาสตร์ และอีกมาก
ผมไม่คิดว่าเราจะเข้าใจดีพอแล้วว่าหนึ่ง “จิต” ที่บรรจุความรู้จากหลายโดเมนขนาดนี้จะทำอะไรได้มากแค่ไหน
ตอน OpenAI บอกว่าโมเดลจะมี “สติปัญญาระดับปริญญาเอก” ทุกคนหัวเราะ แต่ตอนนี้กลับย้ายเกณฑ์ไปเป็น สร้างคณิตศาสตร์ใหม่ได้ไหม ซึ่งก็น่าสนใจ
เหมือนกำลังเรียกร้องไม่ใช่ระดับปริญญาเอก แต่ระดับ Leibniz, Euler, Galois
สรุปกระบวนการคิดของงานชิ้นนี้ที่ลิงก์จากโพสต์บล็อกยาว 125 หน้า
มันคือ สเกลการให้เหตุผล ระดับเหลือเชื่อ คล้ายมากกับสิ่งที่ Anthropic เคยส่งสัญญาณไว้กับ Mythos
สงสัยว่าทำไมถึงได้ยินแต่เรื่องแก้ปัญหาของ Erdős
ทั้งที่ในคณิตศาสตร์ก็น่าจะมีปัญหาที่ยังไม่แก้อีกมากมาย แต่ “ความก้าวหน้าทางคณิตศาสตร์” ของ ChatGPT ที่เห็นใน r/singularity กับ r/accelerate กลับเป็น ปัญหาของ Erdős ทั้งหมด
มันดังพอที่คนจะสนใจ แต่ก็ไม่ได้น่าสนใจพอให้คนจำนวนมากทุ่มแรงมหาศาลลงไป
การแก้ปัญหาที่มีคนตั้งไว้แล้วเป็นกิจกรรมเฉพาะกลุ่มในงานวิจัยคณิตศาสตร์
ที่พบบ่อยกว่าคือศึกษาวัตถุที่น่าสนใจ ตั้งกรอบมันในแบบที่เครื่องมือที่เรามีแก้ได้ แล้วพยายามหาคำตอบ
ในกรณีอุดมคติ ทั้ง การตั้งปัญหาและวิธีแก้ จะน่าสนใจในตัวมันเอง
คล้ายกับ ปัญหาของ Hilbert เมื่อศตวรรษก่อน
มันน่าประทับใจแน่นอน
แต่ถ้าเราไม่รู้ว่าโมเดลนี้ถูกฝึกด้วยอะไร ก็ยากมากที่จะตัดสินว่ามันไปถึงสิ่งนี้ได้ “ด้วยตัวเอง” มากแค่ไหน
วงการ AI ทั้งวงการจ่ายเงินให้ผู้เชี่ยวชาญหลายสาขาจำนวนมากเพื่อช่วยกันสร้าง ข้อมูลฝึกใหม่ ปริมาณมหาศาล
มันเป็นข้อมูลฝึกใหม่ที่หาไม่ได้จากที่อื่น บริษัทต่าง ๆ ก็เก็บมันสะสมไว้ และในนั้นอาจมีไอเดียที่เป็นต้นฉบับจริง ๆ อยู่ก็ได้
โอกาสที่มีใครแก้ปัญหานี้ไว้แล้วแล้วใส่ลงไปตรง ๆ ในข้อมูลฝึกอาจต่ำ แต่พูดตามตรง ถ้าเป็น OpenAI ผมก็พูดไม่ได้เต็มปากว่าไม่มีทางทำ
ที่น่าสนใจกว่าคือเป็นไปได้ว่าพวกเขาอาจสร้างข้อมูลฝึกที่แตะประเด็นแกนหลักส่วนใหญ่หรือทั้งหมดที่ดู “ต้นฉบับ” ในบทพิสูจน์นี้ไปแล้ว
แน่นอน เราไม่รู้
แต่คำถามนี้จะคงอยู่เสมอจนกว่าสิ่งเหล่านี้จะถูกสร้างขึ้นในแบบที่ ไม่ลับ ๆ ล่อ ๆ