โมเดลของ OpenAI หักล้างข้อคาดเดาหลักในเรขาคณิตเชิงไม่ต่อเนื่อง

(openai.com)

1 คะแนน โดย GN⁺ 1 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ปัญหาระยะหน่วย คือปัญหาของ Erdős จากปี 1946 ที่ถามว่าคู่จุดที่อยู่ห่างกัน 1 หน่วยมากที่สุดระหว่างจุด n จุดบนระนาบมีได้กี่คู่ และข้อคาดเดาหลักที่มีมายาวนานถูกหักล้างแล้ว
โมเดลการให้เหตุผลอเนกประสงค์ ของ OpenAI ได้สร้างตระกูลตัวอย่างอนันต์ที่ล้มความเชื่อว่าตระกูลโครงสร้างแบบตารางสี่เหลี่ยมเป็นวิธีที่ดีที่สุดโดยพื้นฐาน พร้อมนำเสนอการปรับปรุงในระดับพหุนาม
โครงสร้างใหม่นี้สร้างคู่จุดระยะหน่วยได้มากกว่า n^{1+δ} สำหรับค่า n อนันต์จำนวนมาก และการปรับปรุงโดย Will Sawin แสดงให้เห็นว่า δ = 0.014 เป็นไปได้
การพิสูจน์นำเครื่องมือจากทฤษฎีจำนวนเชิงพีชคณิต เช่น infinite class field tower และ ทฤษฎี Golod–Shafarevich มาใช้กับปัญหาเรขาคณิต โดยก้าวข้าม Gaussian integers
ผลลัพธ์นี้แสดงให้เห็นว่า AI สามารถมีส่วนต่อ การค้นพบทางคณิตศาสตร์ที่สร้างสรรค์ ในปัญหาเปิดที่มีมายาวนาน และความเชี่ยวชาญของมนุษย์ยิ่งสำคัญขึ้นในด้านการเลือกปัญหาและการตีความ

ความก้าวหน้าในปัญหาระยะหน่วย

ปัญหาระยะหน่วย เป็นปัญหาในเรขาคณิตเชิงจัดหมู่ที่ถามว่า ในบรรดาจุด n จุดบนระนาบ จะสร้างคู่จุดที่มีระยะห่างเท่ากับ 1 ได้มากที่สุดกี่คู่
Paul Erdős ตั้งปัญหานี้ไว้ในปี 1946 และหนังสือ Research Problems in Discrete Geometry ของ Brass, Moser และ Pach ในปี 2005 อธิบายว่าปัญหานี้ “อาจเป็นปัญหาที่เป็นที่รู้จักมากที่สุดและอธิบายได้ง่ายที่สุดในเรขาคณิตเชิงจัดหมู่”
นักคณิตศาสตร์เชิงจัดหมู่จาก Princeton อย่าง Noga Alon แนะนำว่านี่เป็นหนึ่งในปัญหาที่ Erdős ชอบเป็นพิเศษ และ Erdős ยังตั้งเงินรางวัลสำหรับการแก้ปัญหานี้ด้วย
เป็นเวลานานที่เชื่อกันว่าโครงสร้างตระกูล ตารางสี่เหลี่ยม ให้จำนวนคู่จุดระยะหน่วยได้เกือบมากที่สุดเท่าที่จะเป็นไปได้
โมเดลภายในของ OpenAI ได้สร้างตระกูลตัวอย่างอนันต์ที่หักล้างข้อคาดเดาเก่าแก่นี้ และให้การปรับปรุงในระดับพหุนาม
การพิสูจน์นี้ได้รับการตรวจทานจากกลุ่มนักคณิตศาสตร์ภายนอก และนักคณิตศาสตร์เหล่านั้นยังได้เขียนบทความประกอบที่กล่าวถึงเหตุผล ภูมิหลัง และความหมายของผลลัพธ์
ดูต้นฉบับการพิสูจน์ได้ที่ unit-distance-proof.pdf, บทความประกอบที่ unit-distance-remarks.pdf, และฉบับย่อของ chain of thought ของโมเดลที่ unit-distance-cot.pdf

วิธีที่ AI ค้นพบ

การพิสูจน์นี้มาจากระบบที่ฝึกเพื่อคณิตศาสตร์โดยเฉพาะ สแคฟโฟลด์สำหรับค้นหากลยุทธ์การพิสูจน์ และ โมเดลการให้เหตุผลอเนกประสงค์ ไม่ใช่ระบบที่สร้างขึ้นเฉพาะสำหรับปัญหาระยะหน่วย
มีการประเมินจากชุดปัญหาของ Erdős ในฐานะส่วนหนึ่งของงานที่กว้างกว่านี้ เพื่อดูว่าโมเดลขั้นสูงสามารถมีส่วนร่วมกับงานวิจัยแนวหน้าได้หรือไม่ และในปัญหานี้ก็ได้สร้างการพิสูจน์ที่แก้ปัญหาเปิดสำเร็จ
คณิตศาสตร์เป็นขอบเขตที่ชัดเจนสำหรับการทดสอบความสามารถในการให้เหตุผล เพราะปัญหามีความแม่นยำ ตรวจสอบการพิสูจน์ที่เสนอได้ และเหตุผลที่ยาวต้องคงความสอดคล้องตั้งแต่ต้นจนจบ
การพิสูจน์นี้นำแนวคิดจาก ทฤษฎีจำนวนเชิงพีชคณิต ที่คาดไม่ถึงและซับซ้อน มาใช้กับปัญหาเรขาคณิตที่ดูเหมือนเป็นปัญหาเบื้องต้น
Tim Gowers เรียกผลลัพธ์นี้ในบทความประกอบว่าเป็น “หลักไมล์ของคณิตศาสตร์ AI”
นักทฤษฎีจำนวน Arul Shankar ประเมินว่านี่แสดงให้เห็นว่าโมเดล AI ปัจจุบันก้าวพ้นการเป็นเพียงผู้ช่วยของนักคณิตศาสตร์มนุษย์ และสามารถเสนอแนวคิดที่สร้างสรรค์ ซับซ้อน และดำเนินการจนจบได้

เนื้อหาทางคณิตศาสตร์ของปัญหาระยะหน่วย

u(n) นิยามให้เป็นจำนวนสูงสุดของ คู่จุดระยะหน่วย ที่เป็นไปได้ระหว่างจุด n จุดบนระนาบ
โครงสร้างอย่างง่ายคือวางจุด n จุดบนเส้นตรงเส้นเดียว ซึ่งให้ได้ n−1 คู่ ส่วนตารางสี่เหลี่ยมให้ได้ประมาณ 2n คู่
โครงสร้างที่ดีที่สุดก่อนหน้านี้มาจากตารางสี่เหลี่ยมที่ปรับสเกลแล้ว และให้คู่จุดระยะหน่วยจำนวน n^{1 + C / log log(n)} สำหรับค่าคงที่ C
เนื่องจาก log log(n) เพิ่มขึ้นเมื่อ n ใหญ่ขึ้น พจน์เพิ่มเติมของเลขชี้กำลังจึงเข้าใกล้ 0 ทำให้อัตราการเติบโตของโครงสร้างนี้เร็วกว่าเชิงเส้นเพียงเล็กน้อย
ตลอดหลายสิบปีที่ผ่านมา อัตราส่วนนี้ถูกเชื่ออย่างกว้างขวางว่าเกือบดีที่สุดแล้ว และ Erdős คาดเดาในเชิงเทคนิคว่ามีขอบบนแบบ n^{1+o(1)}
ผลลัพธ์ใหม่หักล้างข้อคาดเดานี้ โดยสร้างโครงสร้างของจุด n จุดที่มีคู่จุดระยะหน่วยอย่างน้อย n^{1+δ} สำหรับค่า n อนันต์จำนวนมาก โดยมีเลขชี้กำลังคงที่บางค่า δ > 0
เดิมทีการพิสูจน์ของ AI ไม่ได้ให้ค่า δ ที่ชัดเจน แต่การปรับปรุงภายหลังโดยศาสตราจารย์คณิตศาสตร์จาก Princeton อย่าง Will Sawin แสดงให้เห็นว่าสามารถเลือก δ = 0.014 ได้

ทำไมผลลัพธ์นี้จึงน่าประหลาดใจ

นับตั้งแต่โครงสร้างดั้งเดิมของ Erdős ในปี 1946 ขอบล่างที่ดีที่สุดที่รู้จักแทบไม่เปลี่ยนแปลงอย่างมีนัยสำคัญ
ขอบบนที่ดีที่สุดที่รู้จักคือ O(n^{4/3}) จากงานของ Spencer, Szemerédi และ Trotter ในปี 1984 และยังคงอยู่โดยพื้นฐานแม้จะมีการปรับปรุงและการศึกษาโครงสร้างที่เกี่ยวข้องภายหลังโดย Székely, Katz และ Silier, Pach, Raz, Solymosi เป็นต้น
Matoušek และ Alon-Bucić-Sauermann ศึกษาปัญหานี้ภายใต้ระยะทางแบบไม่ใช่ยูคลิดบนระนาบ และนำเสนอผลลัพธ์ที่สนับสนุนข้อคาดเดา โดยแสดงว่าในความหมายหนึ่ง ระยะทางแบบไม่ใช่ยูคลิด “ส่วนใหญ่” เป็นไปตามข้อคาดเดาของ Erdős
สิ่งที่น่าประหลาดใจเป็นพิเศษคือวัตถุดิบสำคัญของโครงสร้างใหม่มาจาก ทฤษฎีจำนวนเชิงพีชคณิต ซึ่งดูเหมือนห่างไกลจากเรขาคณิตและระยะทาง
ทฤษฎีจำนวนเชิงพีชคณิตเป็นสาขาที่ศึกษามโนทัศน์อย่างการแยกตัวประกอบ ภายในส่วนขยายของจำนวนเต็มที่เรียกว่าฟิลด์จำนวนเชิงพีชคณิต

เทคนิคใหม่จากทฤษฎีจำนวนเชิงพีชคณิต

การพิสูจน์ใหม่นี้เริ่มจากแนวคิดเรขาคณิตที่คุ้นเคย แล้วขยายออกไปในทิศทางที่คาดไม่ถึง
ขอบล่างดั้งเดิมของ Erdős สามารถเข้าใจได้ผ่าน Gaussian integers ในรูป a + bi
ที่นี่ a และ b เป็นจำนวนเต็ม และ i คือรากที่สองของ −1
Gaussian integers เป็นส่วนขยายของจำนวนเต็มปกติ และมีสมบัติบางอย่างเหมือนจำนวนเต็ม เช่น การแยกตัวประกอบเฉพาะแบบเอกฐาน
ส่วนขยายของจำนวนเต็มหรือจำนวนตรรกยะแบบนี้เรียกว่า ฟิลด์จำนวนเชิงพีชคณิต
เหตุผลใหม่แทนที่ Gaussian integers ด้วยการเหมารวมที่ซับซ้อนกว่าจากทฤษฎีจำนวนเชิงพีชคณิต ซึ่งมีสมมาตรที่สมบูรณ์ยิ่งกว่าและช่วยสร้างผลต่างที่มีความยาวหน่วยได้มากขึ้น
เหตุผลโดยละเอียดใช้เครื่องมืออย่าง infinite class field tower และ ทฤษฎี Golod–Shafarevich เพื่อแสดงว่าฟิลด์จำนวนที่ต้องการนั้นมีอยู่จริง
แม้แนวคิดเหล่านี้จะเป็นที่รู้จักดีในหมู่นักทฤษฎีจำนวนเชิงพีชคณิต แต่การที่มันมีผลต่อปัญหาเรขาคณิตบนระนาบแบบยูคลิดถือเป็นเรื่องน่าประหลาดใจอย่างมาก

ความหมายต่อวงการคณิตศาสตร์

นี่เป็นช่วงเวลาสำคัญต่อปฏิสัมพันธ์ระหว่าง AI กับคณิตศาสตร์ เพราะเป็นครั้งที่ระบบ AI แก้ปัญหาเปิดเก่าแก่ที่อยู่ใจกลางของสาขาวิจัยที่ยังเคลื่อนไหวอยู่อย่างอัตโนมัติ
งานประกอบจากนักคณิตศาสตร์ภายนอกช่วยให้เห็นภาพที่สมบูรณ์และลึกซึ้งกว่าที่ปรากฏจากวิธีแก้เดิมเพียงอย่างเดียว
Thomas Bloom เขียนในบทความประกอบว่า เมื่อประเมินความสำคัญของการพิสูจน์ที่ AI สร้างขึ้น เขาจะถามว่าการพิสูจน์นั้นสอนสิ่งใหม่เกี่ยวกับปัญหาหรือไม่ และทำให้เราเข้าใจเรขาคณิตเชิงไม่ต่อเนื่องได้ดีขึ้นหรือไม่
Bloom ประเมินว่าผลลัพธ์นี้แสดงให้เห็นว่าโครงสร้างเชิงทฤษฎีจำนวนสามารถบอกอะไรเกี่ยวกับคำถามแบบนี้ได้มากกว่าที่คาดไว้มาก และทฤษฎีจำนวนที่ต้องใช้อาจลึกซึ้งอย่างยิ่ง
Bloom คาดว่าในช่วงไม่กี่เดือนข้างหน้า นักทฤษฎีจำนวนเชิงพีชคณิตจำนวนมากจะเริ่มพิจารณาปัญหาเปิดอื่น ๆ ในเรขาคณิตเชิงไม่ต่อเนื่องอย่างใกล้ชิด
ความเชื่อมโยงที่ไม่คาดคิดระหว่างทฤษฎีจำนวนเชิงพีชคณิตกับเรขาคณิตเชิงไม่ต่อเนื่อง ไม่ได้เพียงแก้ข้อคาดเดาเฉพาะเรื่องหนึ่ง แต่ยังเป็น สะพาน สำหรับการสำรวจปัญหาที่เกี่ยวข้องต่อไป
ผลลัพธ์นี้แสดงว่า AI สามารถมีส่วนต่อ การค้นพบทางคณิตศาสตร์ ไม่ใช่แค่การหาคำตอบ และความหมายของมันจะยิ่งชัดเจนและสมบูรณ์ขึ้นผ่านความเข้าใจของมนุษย์ในภายหลัง

ทำไมเรื่องนี้จึงสำคัญ

ความสามารถในการให้เหตุผลทางคณิตศาสตร์ที่ดีขึ้นสามารถทำให้ AI เป็น พาร์ตเนอร์ด้านการวิจัย ที่ทรงพลังยิ่งขึ้น
มันสามารถรักษากระบวนการคิดที่ยากให้สอดคล้องกัน เชื่อมโยงแนวคิดระหว่างขอบเขตความรู้ที่ห่างไกลกัน และเปิดเผยเส้นทางที่มีศักยภาพซึ่งผู้เชี่ยวชาญอาจไม่ได้จัดลำดับความสำคัญไว้ก่อน
สิ่งนี้อาจช่วยให้นักวิจัยสร้างความก้าวหน้าในปัญหาที่ซับซ้อนเกินไปหรือใช้เวลามากเกินไปจนจัดการได้ยาก
ความสามารถเช่นนี้มีประโยชน์เกินกว่าคณิตศาสตร์ ไปสู่ชีววิทยา ฟิสิกส์ วัสดุศาสตร์ วิศวกรรม และการแพทย์
หาก AI สามารถรักษาเหตุผลที่ซับซ้อนให้สอดคล้อง เชื่อมโยงขอบเขตความรู้ที่ห่างกัน และสร้างผลลัพธ์ที่ผ่านการตรวจทานจากผู้เชี่ยวชาญได้ ก็จะเป็นส่วนหนึ่งของเส้นทางระยะยาวไปสู่ระบบวิจัยที่ทำงานอัตโนมัติได้มากขึ้น
มีการเสนอว่า AI กำลังเริ่มรับบทบาทอย่างจริงจังในส่วนที่สร้างสรรค์ของงานวิจัย โดยเฉพาะในการวิจัย AI เอง
ความก้าวหน้าแบบนี้ยิ่งตอกย้ำความเร่งด่วนในการทำความเข้าใจปัญหาการจัดแนวของระบบที่มีความฉลาดสูงมาก ขั้นต่อไปของการพัฒนา AI และอนาคตของความร่วมมือระหว่างมนุษย์กับ AI
อนาคตนั้นยังคงขึ้นอยู่กับ วิจารณญาณของมนุษย์
ความเชี่ยวชาญไม่ได้มีความสำคัญลดลง แต่กลับมีคุณค่ามากขึ้น
AI สามารถช่วยสำรวจ เสนอ และตรวจสอบได้ แต่การเลือกปัญหาสำคัญ การตีความผลลัพธ์ และการตัดสินว่าควรไล่ตามคำถามใดต่อไป ยังเป็นหน้าที่ของมนุษย์

1 ความคิดเห็น

GN⁺ 1 시간 전

ความเห็นจาก Hacker News

เธรด HN นี้ทำให้รู้สึกหดหู่ และผมก็ยังคิดอยู่ว่าทำไมถึงเป็นแบบนั้น
ถ้าปัดคำชื่นชมแบบข่าวประชาสัมพันธ์ของ OpenAI ออกไป ก็จะเห็นว่ามีคำถามที่น่าสนใจและละเอียดอ่อนมากมายเกี่ยวกับ บทบาทของ LLM ในงานวิจัยคณิตศาสตร์
ขอแนะนำให้อ่านความเห็นของนักคณิตศาสตร์ที่แนบมากับผลลัพธ์ โดยเฉพาะคำพูดของ Tim Gowers
แต่ส่วนคอมเมนต์กลับกลายเป็นสนามรบของการถกเถียงเรื่อง LLM การโต้แย้ง และการโต้กลับด้วยความโกรธที่วนซ้ำมาตั้งแต่ปี 2023
น่าเศร้าที่เรายังสู้เรื่องเดิมบน แนวรบที่ขีดไว้เมื่อ 3 ปีก่อน และก็สงสัยว่าอีก 2 ปีข้างหน้าจะยังเป็นแบบนี้อยู่ไหม
- อีก 2 ปีจากนี้ ที่นี่และทุกฟอรัมบนอินเทอร์เน็ตก็จะยังเป็นแบบนี้ต่อไป
  ถ้าจำคำกล่าวดังของ Nietzsche ไว้ในใจ ชีวิตอาจดีขึ้นได้: “ข้าพเจ้าไม่อยากทำสงครามกับความน่าเกลียด ข้าพเจ้าไม่อยากกล่าวโทษ และไม่อยากกล่าวโทษแม้กระทั่งผู้ที่กล่าวโทษ การหันสายตาไปทางอื่น ควรเป็นการปฏิเสธเพียงอย่างเดียวของข้าพเจ้า”
- ผู้คนกำลังกังวลเรื่อง ปากท้อง ของตัวเอง จึงเป็นปฏิกิริยาที่เข้าใจได้
- ก็เข้าใจได้ คนจำนวนมากประเมินความฉลาดของมนุษย์กับ AI แบบ การแข่งขันผลรวมศูนย์ และนายจ้างก็มักเข้าใจแบบนั้น รวมถึงผู้ให้บริการโมเดลภาษาก็โฆษณาแบบนั้นด้วย
  ยิ่ง AI พิสูจน์ความสามารถได้มากเท่าไร ก็ยิ่งเอียงไปในทิศทางที่ทำให้ทุกคนที่ไม่ได้มีความมั่นคงในการจ้างงานสูงมากรู้สึกไม่สบายใจ
  คงต้องใช้เวลาให้คนยอมรับว่า AI มีชุดความสามารถที่ต่างจากสติปัญญามนุษย์มาก และจริง ๆ แล้วเสริมกันได้ค่อนข้างดี
  โอกาสที่มันจะเหนือกว่าสติปัญญามนุษย์ในวงกว้างมีไม่มาก และบริษัทที่เดิมพันกับสิ่งนั้นจะตามหลัง
- พอฝ่ายหนึ่งเริ่มขว้างก้อนหิน เนื้อหาของบทความก็ไม่สำคัญอีกต่อไป แล้วจะกลายเป็นการสู้กันว่าบทความนี้ดีหรือขยะ
  ผมอยากคุยเรื่องพวกนี้อย่างจริงจัง แต่ทุกคนเชื่อว่าความจริงของตัวเองเท่านั้นที่จริง และความจริงที่ตรงข้ามเป็นของปลอม เลยยิ่งทวีความรุนแรงต่อเนื่อง
  บางครั้งก็รู้ตัวว่ามา HN เพื่อโกรธอย่างเดียว เลยพักยาว
  ไม่รู้ว่าทำไมเราถึงทำแบบนี้กับตัวเอง ทั้งที่ลึก ๆ แล้วผมว่าเราส่วนใหญ่ต้องการสิ่งเดียวกัน
- อีก 2 ปีจะไม่เป็นแบบนั้นหรอก เพราะถึงตอนนั้น ฝ่ายผม จะชนะแล้ว
ถึงฝั่งที่บอกว่า “LLM แค่ทำ interpolation จากข้อมูลฝึก”: Ayer และ Wittgenstein ยุคต้น แม้จะต่างกันในรายละเอียด แต่ต่างก็มองว่าความจริงทางคณิตศาสตร์ไม่ได้รายงานข้อเท็จจริงใหม่เกี่ยวกับโลก
แนวคิดที่ว่าบทพิสูจน์เป็นเพียงการคลี่สิ่งที่แฝงอยู่แล้วในสัจพจน์ คำนิยาม สัญลักษณ์ และกฎออกมา เป็นสิ่งที่น่าสนใจอย่างลึกซึ้ง และก็ไม่ได้มีปัญหาอะไรกับการให้เครดิตนักคณิตศาสตร์ในฐานะผู้ค้นพบ
ดังนั้น การนำวัสดุเดิมมาจัดเรียงใหม่ จะไม่ใช่เหตุให้ขาดคุณสมบัติ ไม่เช่นนั้นก็คงต้องคืนเหรียญ Fields Medal กันไปหลายคน
- ผมว่าแทบทุกคนที่เป็นผู้ใหญ่และใช้งานได้ตามปกติเข้าใจว่า Fields Medal และ “รางวัล” ประจำปีแทบทั้งหมด มอบให้ทั้งนวัตกรรมแบบ จัดองค์ประกอบใหม่ และนวัตกรรมแบบ “คิดข้ามมิติเดิม”
  มนุษย์เองก็ไม่ได้สร้างนวัตกรรมแบบข้ามมิติใหม่ได้ทุกปีในทุกสาขา
  จะบอกว่า LLM แค่ recombine ก็ได้ แต่ผมก็ยังสงสัยว่า LLM ที่เรียนวรรณกรรมพีชคณิต เรขาคณิต และตรีโกณมิติทั้งหมดก่อน Newton/Leibniz จะคิดแคลคูลัสขึ้นมาได้ไหม
  ถึงอย่างนั้น นี่ก็เป็นนวัตกรรมชนิดที่ LLM ทำได้ดี และไม่ได้แปลว่ามนุษย์ไม่จำเป็นต้องเก่งนวัตกรรมแบบจัดองค์ประกอบใหม่อีกต่อไป
  ในแง่ของการสังเคราะห์ไอเดียใหม่ ๆ ยังดูเหมือนมีอีกมากที่มนุษย์ทำได้แต่ LLM ทำไม่ได้
- เราอาจจินตนาการได้ว่าเศษเสี้ยวทั้งหมดของความรู้มนุษย์คือจุดไม่ต่อเนื่องใน ปริภูมิความรู้ ความหนาแน่นสูงมิติสูงขนาดมหึมา
  ถ้าวาดเปลือกนูนขนาดใหญ่ล้อมทุกจุดเหล่านั้นไว้ LLM ก็เรียนอยู่ภายในนั้น จึงอาจทำ interpolation ระหว่างจุดเดิมเพื่อไปถึงจุดใหม่ที่ยังอยู่ในเปลือกนั้นได้
  ส่วน LLM จะไปถึงจุดนอกเปลือกได้หรือไม่ยังเป็นเรื่องถกเถียง
  แค่ไปถึงจุดใหม่ที่อยู่ในเปลือกก็มีประโยชน์มากแล้ว
  การค้นพบและบทพิสูจน์ใหม่จำนวนมาก หรืออาจจะส่วนใหญ่ของที่มีประโยชน์ ล้วนเป็นจุดแบบนี้ที่ไปถึงได้โดยเริ่มจากสิ่งที่เรามีอยู่แล้ว
  หลายอย่างยังไม่ถูกค้นพบเพียงเพราะยังไม่มีใครลงเวลาและแรงพอ และ LLM อาจเร่งสิ่งนี้ได้มาก
  ในทางกลับกัน ก็มีจุดนอกเปลือกที่ไปไม่ถึงด้วยการ extrapolation หรือ interpolation จากจุดเดิม ต้องอาศัยการกระโดดแบบใหม่จริง ๆ
  การก้าวจากฟิสิกส์แบบ Newton ไปสู่ ทฤษฎีสัมพัทธภาพทั่วไป น่าจะเป็นตัวอย่างหนึ่ง
  Demis Hassabis เคยพูดถึงการใช้ AI ที่เรียนฟิสิกส์แค่ถึงก่อนปี 1915 แล้วให้ดูวงโคจรของ Mercury เพื่อดูว่ามันจะไปถึงทฤษฎีสัมพัทธภาพทั่วไปได้เองหรือไม่ เป็นเกณฑ์ประเมิน AGI
  ผมยังสงสัยว่า LLM ปัจจุบันจะกระโดดแบบนั้นได้ไหม และมนุษย์ส่วนใหญ่ก็ทำไม่ได้เหมือนกัน
  ที่เราเรียก Einstein ว่าอัจฉริยะก็เพราะเขากระโดดไปถึงทฤษฎีสัมพัทธภาพทั่วไปได้ด้วยตัวเอง ซึ่งสำหรับมนุษย์เรามีตัวอย่างยืนยันแล้วว่าเกิดขึ้นได้ แต่กับ AI คงต้องรอดูต่อไป
- การค้นพบส่วนใหญ่ในความเป็นจริงเป็นสิ่งที่ตามมาจากสัจพจน์ แต่บางครั้งก็มีช่วงเวลาที่พอจะพูดได้ว่าเกิด การสร้างคณิตศาสตร์ใหม่ ขึ้นมา ถ้าจะใช้คำที่ดีกว่านี้ไม่ได้
  คนอย่าง Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan, Galois ปฏิบัติต่อคณิตศาสตร์คล้ายศิลปะมากกว่าวิทยาศาสตร์
  ตัวอย่างเช่น หลายคนมองว่าการแก้ Riemann Hypothesis น่าจะต้องอาศัยคณิตศาสตร์แบบใหม่ และไม่น่าเป็นไปได้ที่ LLM จะประดิษฐ์สิ่งนั้นขึ้นมาได้แบบฉับพลัน
- หวังว่าเราเกือบจะพ้นช่วงที่ต้องประเมินความสามารถของ LLM ด้วยไม้บรรทัดหนึ่งมิติแบบตามใจที่ปลายด้านหนึ่งเขียนว่า “ไม่ใช่มนุษย์” และอีกด้านเขียนว่า “เหนือมนุษย์”
  มันไร้ความหมายและไม่ค่อยเกี่ยวข้อง
  ตอน Deep Blue ชนะ Kasparov โลกไม่ได้เปลี่ยนไปทั้งหมด และสัตว์กับเครื่องจักรก็ “ดีกว่า” มนุษย์ในบางมิติมาโดยตลอด
  แต่แรกก็ไม่มีไม้บรรทัดเดียวอยู่แล้ว และถึงมีก็ไม่ใช่แบบหนึ่งมิติหรือเชิงเส้น โดยแต่ละคนก็เปลี่ยนไม้บรรทัดกับปลายทั้งสองตามกาลเวลา
  นี่ก็ไม่ได้แปลว่าจะยกชัยชนะให้พวกคลั่ง AI
  LLM เป็นเครื่องมือที่มีประโยชน์มากและจะดีขึ้นอย่างมากต่อไป แต่จะไม่เหนือกว่ามนุษย์ในทุกมิติที่มนุษย์บางคนเห็นว่าสำคัญ
  จะไม่มีช่วงเวลาที่ AI แค่ข้ามเส้นในรายการตัวชี้วัดเชิงปริมาณแล้วทุกคนยอมรับโดยสากลว่ามันเหนือกว่ามนุษย์
  เพราะสิ่งที่ “สำคัญ” นั้นเป็นเรื่องอัตวิสัย
- ประเด็นเรื่องความเร็วของการค้นพบทางคณิตศาสตร์ของมนุษย์ก็ดีอยู่ แต่ Ayer มั่ว และ Wittgenstein ช่วงหลังก็หักล้าง Wittgenstein ช่วงต้นไปแล้ว
  คำกล่าวว่า “แฝงอยู่แล้วโดยนัย” จะจริงได้ก็ต่อเมื่อคณิตศาสตร์เป็นระบบปิด แต่เราพิสูจน์แล้วว่าไม่ใช่
  เราใช้คณิตศาสตร์หลุดออกจากคณิตศาสตร์ได้ จึงต้องมี หมุดยึดเชิงสัจพจน์ หลายแบบอย่าง Zermelo-Fraenkel และอื่น ๆ
  ที่จริงแล้วเราเข้าใจไม่มากเลยว่าความกว้างใหญ่ของสิ่งที่พอจะเรียกว่า “คณิตศาสตร์” อย่างเป็นวัตถุนั้นแค่ไหน และก็เป็นไปได้ว่าคณิตศาสตร์ที่เรารับรู้อยู่อาจเป็นเพียงส่วนหนึ่งของคณิตศาสตร์ที่ใหญ่กว่า หรืออาจผิดอย่างหนักก็ได้
  เราไม่รู้ว่าคณิตศาสตร์ที่ใหญ่กว่านั้นจะมีคุณสมบัติแบบระบบปิดเหมือนกันหรือไม่
สำหรับคนที่ใช้ LLM เขียนโค้ดเยอะ เรื่องนี้ก็ไม่ค่อยน่าแปลกใจ และเป็นแค่เรื่องของเวลา
นักคณิตศาสตร์สร้างและใช้เครื่องมือทางคณิตศาสตร์ในวิธีใหม่ ๆ เพื่อค้นพบสิ่งใหม่
มันคือการทำงานซ้ำมหาศาลตามสัญชาตญาณและสำรวจความเชื่อมโยงต่าง ๆ
LLM ไม่มีสัญชาตญาณว่าคำว่า “ค้นพบ” หมายถึงอะไร จึงยากจะบอกว่ามันค้นพบอย่างแท้จริง แต่สามารถลองใช้เครื่องมือทางคณิตศาสตร์ทั้งหมดแบบ Monte Carlo ไปยังเป้าหมายแคบ ๆ เพื่อหาว่าอะไรใช้ได้ แล้วค่อยต่อยอดหรือรวมการปรับปรุงต่าง ๆ เข้าด้วยกัน
ถ้าอ่านบทความนี้จะเห็นว่าการค้นพบครั้งนี้ก็ดูเป็นแบบนั้นพอดี และ LLM ใช้ ความเชื่อมโยงที่น่าประหลาดใจ เพื่อไปไกลกว่าผลลัพธ์ที่คาดไว้
แต่ถ้าไม่มีเป้าหมายที่มนุษย์ตั้งไว้ ไม่มีความเข้าใจของมนุษย์ที่มองเห็นคุณค่าของเส้นทางใหม่ที่ AI ใช้ และไม่มีภาษาคณิตศาสตร์ที่มนุษย์สร้างขึ้นเพื่อให้สำรวจแนวคิดเหล่านี้ได้ ผลลัพธ์นี้ก็ไม่มีความหมาย
- การบอกว่า “ถ้าไม่มีเจตนาและความเข้าใจของมนุษย์ก็ไม่มีความหมาย” ฟังดูเป็น มนุษย์เป็นศูนย์กลาง ไปหน่อยไหม
  ทำไมความเข้าใจถึงใช้ได้เฉพาะตอนที่มนุษย์เป็นผู้เข้าใจ
  ทำไมความรู้ต้องมีไว้เพื่อมนุษย์เท่านั้น
  ถ้าสิ่งมีชีวิตอีกสายพันธุ์หนึ่งแก้ความขัดแย้งระหว่างแรงโน้มถ่วงกับกลศาสตร์ควอนตัมได้ มันจะไม่มีความหมายจนกว่าจะมาอธิบายให้เราฟังและเราจะเข้าใจงั้นหรือ
- มีบทความยาวและน่าสนใจล่าสุดจากนักคณิตศาสตร์คนหนึ่งเกี่ยวกับหัวข้อนี้: https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
- ไม่ใช่แค่ไม่น่าแปลกใจ แต่มันเป็นสิ่งที่คาดกันมาตลอดด้วยซ้ำ ระหว่าง โปรแกรมกับบทพิสูจน์ ไม่มีความต่างกัน ทั้งสองคือสิ่งเดียวกัน
สิ่งที่น่าสนใจคือบทพิสูจน์นี้ หรือให้แม่นกว่านั้นคือการหักล้างนี้ พบ ตัวอย่างโต้แย้ง ต่อข้อคาดเดาเดิมของ Erdős ด้วยวิธีนั้น
เหมือนปฏิกิริยาของนักคณิตศาสตร์คนหนึ่งใน PDF ที่ลิงก์ไว้ ผมมองว่ามันน่าสนใจน้อยกว่าการพิสูจน์ว่าข้อคาดเดานั้นจริงอยู่บ้าง
ถ้าจะพิสูจน์ว่าข้อคาดเดาเป็นจริง จะต้องมีการสร้างทฤษฎีมากกว่านี้
คุณต้องอธิบายว่าทำไมข้อคาดเดาถึงถูกต้องโดยอิงกับทฤษฎีที่ใหญ่กว่า แต่ในกรณีตัวอย่างโต้แย้ง โมเดลแค่ต้องหาโครงสร้างที่ถูกต้องให้เจอด้วยการค้นหารูปแบบที่ซับซ้อนขึ้น
แน่นอนว่าการค้นหานี้ไม่ง่ายและน่าประทับใจมาก และยังต้องมีหลายขั้นตอนเพื่อพิสูจน์ความเชื่อมโยงกับตัวอย่างโต้แย้งนั้น
ถึงอย่างนั้น ผมก็ยังมองว่ามันใกล้เคียงกับการเชื่อมแนวคิดเดิม ๆ มากกว่าการพัฒนาคณิตศาสตร์ใหม่ที่ลึกซึ้ง
ไม่ได้จะลดทอนความสำเร็จมหาศาลนี้นะ ผมคิดว่ามันไปถึงอะไรบางอย่างจริง ๆ
เป็นเพียงความรู้สึกล้วน ๆ แต่ผมคิดว่าโมเดลน่าจะไม่ไกลจากการสร้างทฤษฎีได้พอจะพิสูจน์ข้อคาดเดาที่ซับซ้อนกว่านี้ซึ่งต้องอาศัยการพัฒนาคณิตศาสตร์ใหม่ และมันน่าจะเป็นปัญหาเรื่องการทำงานบนกรอบเวลาที่ยาวขึ้น
- การค้นหาบทพิสูจน์กับการค้นหาตัวอย่างโต้แย้ง บางทีก็ไม่ได้ต่างกันมาก
  ส่วนใหญ่คุณจะค่อย ๆ แทะขอบเขตลงมาเพื่อลดความซับซ้อนของปัญหา
  เช่น ถ้าจะพิสูจน์ว่าบางอย่างเป็นไปไม่ได้ คุณอาจเริ่มจากแสดงว่ามีเพียง 5 ตระกูลของกรณีที่เป็นไปได้ แล้วพิสูจน์ได้ว่า 4 ตระกูลในนั้นเป็นไปไม่ได้
  แบบนั้นก็ถือว่าแก้ปัญหาไปแล้ว 80% และถ้ากำลังหาตัวอย่างโต้แย้ง พื้นที่ค้นหาก็ลดลง 80% เช่นกัน
  ในกรณีตัวอย่างโต้แย้ง คุณสามารถเดาและกระโดดได้ ถ้าถูกก็ใช้ได้ แต่ในบทพิสูจน์ คุณทำแบบนั้นไม่ได้
  อีกด้านหนึ่ง พอหาตัวอย่างโต้แย้งเจอแล้ว ทางตันที่ลองแล้วทิ้งไปก็มักถูกซ่อนไว้
- ต่อให้ให้เวลานานขึ้น LLM ก็จะไม่เริ่มทำคณิตศาสตร์แบบมนุษย์ที่ สร้างจำนวนเชิงซ้อน หรือแม้แต่จำนวนทั่วไปขึ้นมาจากความว่างเปล่า
  ให้มันผสมของที่มีในข้อมูลฝึกนานแค่ไหนก็เหมือนเดิม
อย่างที่เคยพูดไว้ AI จะได้ Fields Medal ก่อนที่จะบริหาร McDonald's ได้
ส่วนที่ยากคือการสร้างกระดานหมากรุกให้คณิตศาสตร์เล่นได้ หรือก็คือสภาพแวดล้อมแบบ Lean และตอนนี้ที่เหลือคือการรู้จำรูปแบบกับการคำนวณ
LLM เป็นแค่จุดเริ่มต้น และอีกไม่นานเราจะได้เห็น AI คณิตศาสตร์ที่เฉพาะทางมากขึ้น คล้าย Stockfish
- แต่นี่ไม่ได้ถูกตรวจสอบด้วย Lean
  ทั้งหมดเกิดขึ้นด้วยอินพุตและเอาต์พุตภาษาธรรมชาติล้วน ๆ และในหลายแง่ผมว่ามันเป็นเดโมที่น่าสนใจมากซึ่งชี้ไปในทิศทางตรงกันข้ามเสียด้วยซ้ำ
  การตรวจสอบจะเข้ามาเมื่อคุณอยากให้คอมพิวเตอร์รับช่วงไปจนถึงขั้นเช็กบทพิสูจน์
  ปัจจุบันบทพิสูจน์นี้ถูกตรวจด้วยมือโดยกลุ่มนักคณิตศาสตร์ในสาขานั้น
- พอพูดถึงการบริหาร McDonald's ก็ให้บรรยากาศ ดิสโทเปีย แบบระบบจัดการ “Manna” สมมติที่ใช้ในแฟรนไชส์เบอร์เกอร์ [0]
  ในระบบนั้นมีระบบอัตโนมัติแบบ “reverse centaur” อยู่มากมาย
  Manna มีรายการสิ่งที่ต้องทำในแต่ละขณะ และเมื่อมีออเดอร์เข้าที่เคาน์เตอร์ มันก็สั่งพนักงานให้เตรียมอาหารนั้น
  มันติดตามงานหลายร้อยอย่าง เช่น ทำความสะอาดห้องน้ำ ถูพื้น เช็ดโต๊ะ กวาดทางเดิน ละลายขนมปัง หมุนเวียนสต็อก เช็ดหน้าต่าง แล้วมอบหมายให้พนักงานทีละอย่าง
  พอหมดกะ Manna จะพูดเสมอว่า “วันนี้เสร็จเรียบร้อยแล้ว ขอบคุณสำหรับความช่วยเหลือ” แล้วคุณก็ถอดเฮดเซ็ตไปวางที่แท่นชาร์จ
  หลังจากมีเสียงในหัวคอยบอกอย่างละเอียดมากว่าต้องทำอะไรตลอด 6–8 ชั่วโมง ช่วงสองสามนาทีแรกหลังถอดเฮดเซ็ตจะสับสนเสมอ และต้องเปิดสมองใหม่ถึงจะเดินออกจากร้านได้
  [0] https://en.wikipedia.org/wiki/Manna_(novel)
- ผมไม่เห็นด้วย AI อาจทำงานระดับ Fields Medal ได้ก่อนบริหาร McDonald's แต่ผมคิดว่ามันจะ บริหาร McDonald's ได้ดี ก่อนจะทำได้ทั้งสองอย่างเสียอีก
  ส่วน Fields Medal จะตามมาอีกนานหลังจากนั้น
- บทพิสูจน์นี้ไม่ได้เขียนด้วย Lean แต่เขียนเป็นภาษาอังกฤษ
  ถ้าจะตรวจว่ามันไม่ใช่เรื่องเหลวไหล ก็ต้องอาศัย การตรวจสอบโดยผู้เชี่ยวชาญมนุษย์
- “กระดานหมากรุก” สำหรับคณิตศาสตร์มีมานานกว่า 40 ปีแล้ว
  Lean ไม่ได้พิเศษอะไรในที่นี้ มันแทบจะเป็นแค่กระแสหมู่
  และเราก็ไม่รู้ด้วยว่าการฝึกด้วย Lean ช่วยโมเดลนี้โดยเฉพาะมากแค่ไหน
บทพิสูจน์นี้นำ ทฤษฎีจำนวนเชิงพีชคณิต ที่คาดไม่ถึงและซับซ้อนมาใช้กับคำถามเรขาคณิตระดับพื้นฐาน
ยิ่งอ่านความสำเร็จแบบนี้ ก็ยิ่งรู้สึกว่าพลังส่วนใหญ่ของโมเดลมาจากการมีความรู้ล่วงหน้าแทบทุกสาขาที่เป็นไปได้ และไม่มีปัญหาในการถ่ายโอนไปยังโดเมนใหม่
ความงามที่อาจเกิดขึ้นของเครื่องมือเหล่านี้คือ มันอาจช่วยทะลุกำแพงของการทำงานแบบเฉพาะทางสุดขั้วที่มนุษย์เจอในวิทยาศาสตร์ปัจจุบัน
การเฉพาะทางสุดขั้วนั้นสำคัญในด้านหนึ่ง แต่ในอีกด้านก็จำกัดเครื่องมือและแรงบันดาลใจที่คนเข้าถึงได้
- ชี้ได้ตรงมากและอธิบายได้ดี
  ยิ่งเรา เฉพาะทางสุดขั้ว มากเท่าไร LLM ก็ยิ่งเป็นเครื่องมือมีค่าสำหรับการเชื่อมขอบฟ้าคนละด้านเข้าด้วยกัน
- ดูเหมือนว่าความรู้ทั้งหมดของมนุษย์จะเป็น ปัญญาร่วมหมู่ รูปแบบหนึ่ง
  เมื่อก่อนต้นทุนการเข้าถึงมันสูง แต่ตอนนี้ไม่ใช่อีกแล้ว
  สิ่งที่เจ๋งคือ เมื่อใครสักคนมีส่วนเพิ่มบางอย่างให้กับปัญญาร่วมหมู่นั้น มันก็สามารถถูกนำไปใช้กับปัญหาใดก็ตามที่คนอื่นกำลังทำอยู่ได้ทันที
- ผมเคยสงสัยบทบาทของ LLM ในคณิตศาสตร์มาตลอด แต่ข้อโต้แย้งนี้เพิ่งเคยเห็นครั้งแรก และรู้สึกว่าน่าเชื่อถือมากทีเดียว
  บางที LLM อาจช่วยพัฒนา ความเข้าใจแบบแนวนอน ต่อสาขาต่าง ๆ ได้
- ใช่ คนเราน่าจะโฟกัสแต่ความลึกมากกว่าความกว้าง เพราะขอบเขตการมองเห็นมีจำกัด
  แต่นี่คือโมเดลทั่วไป จึงมีความรู้ระดับสูงกว่าปริญญาเอกในฟิสิกส์ ชีววิทยา ประวัติศาสตร์ และอีกมาก
  ผมไม่คิดว่าเราจะเข้าใจดีพอแล้วว่าหนึ่ง “จิต” ที่บรรจุความรู้จากหลายโดเมนขนาดนี้จะทำอะไรได้มากแค่ไหน
ตอน OpenAI บอกว่าโมเดลจะมี “สติปัญญาระดับปริญญาเอก” ทุกคนหัวเราะ แต่ตอนนี้กลับย้ายเกณฑ์ไปเป็น สร้างคณิตศาสตร์ใหม่ได้ไหม ซึ่งก็น่าสนใจ
เหมือนกำลังเรียกร้องไม่ใช่ระดับปริญญาเอก แต่ระดับ Leibniz, Euler, Galois
- ถึงอย่างนั้นเวลาเขียนโค้ดก็ดูเหมือน นักพัฒนาจูเนียร์ ที่ท่อง Stack Overflow มาทั้งหมด
สรุปกระบวนการคิดของงานชิ้นนี้ที่ลิงก์จากโพสต์บล็อกยาว 125 หน้า
มันคือ สเกลการให้เหตุผล ระดับเหลือเชื่อ คล้ายมากกับสิ่งที่ Anthropic เคยส่งสัญญาณไว้กับ Mythos
- สำหรับคนที่อยากดู ลิงก์อยู่ตรงนี้: https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925d...
- วันนี้ผมให้โมเดล SQL สร้างข้อความยาว เท่าสองเล่มของ LOTR แค่เพื่อแก้แถวที่หายไป 3 แถวแล้วเปิด PR หนึ่งอัน ดังนั้น +1
สงสัยว่าทำไมถึงได้ยินแต่เรื่องแก้ปัญหาของ Erdős
ทั้งที่ในคณิตศาสตร์ก็น่าจะมีปัญหาที่ยังไม่แก้อีกมากมาย แต่ “ความก้าวหน้าทางคณิตศาสตร์” ของ ChatGPT ที่เห็นใน r/singularity กับ r/accelerate กลับเป็น ปัญหาของ Erdős ทั้งหมด
- ปัญหาของ Erdős กินสัดส่วนไม่น้อยในบรรดาปัญหาคณิตศาสตร์ที่ถูกตั้งไว้อย่างชัดเจนแต่ยังแก้ไม่ได้
  มันดังพอที่คนจะสนใจ แต่ก็ไม่ได้น่าสนใจพอให้คนจำนวนมากทุ่มแรงมหาศาลลงไป
  การแก้ปัญหาที่มีคนตั้งไว้แล้วเป็นกิจกรรมเฉพาะกลุ่มในงานวิจัยคณิตศาสตร์
  ที่พบบ่อยกว่าคือศึกษาวัตถุที่น่าสนใจ ตั้งกรอบมันในแบบที่เครื่องมือที่เรามีแก้ได้ แล้วพยายามหาคำตอบ
  ในกรณีอุดมคติ ทั้ง การตั้งปัญหาและวิธีแก้ จะน่าสนใจในตัวมันเอง
- ปัญหาของ Erdős อธิบายได้ง่าย เลยเป็น benchmark ชั้นดีสำหรับ ปีแรกของ AI ด้านคณิตศาสตร์
- เท่าที่ผมรู้ก็เพราะรอบ ๆ มันมีทั้งชุมชนและฐานข้อมูลอยู่แล้ว
- ไม่ใช่มีแต่ปัญหาของ Erdős: https://news.ycombinator.com/item?id=48213189
- ที่มันดังเพราะ Erdős เป็นนักคณิตศาสตร์ผู้ยิ่งใหญ่
  คล้ายกับ ปัญหาของ Hilbert เมื่อศตวรรษก่อน
มันน่าประทับใจแน่นอน
แต่ถ้าเราไม่รู้ว่าโมเดลนี้ถูกฝึกด้วยอะไร ก็ยากมากที่จะตัดสินว่ามันไปถึงสิ่งนี้ได้ “ด้วยตัวเอง” มากแค่ไหน
วงการ AI ทั้งวงการจ่ายเงินให้ผู้เชี่ยวชาญหลายสาขาจำนวนมากเพื่อช่วยกันสร้าง ข้อมูลฝึกใหม่ ปริมาณมหาศาล
มันเป็นข้อมูลฝึกใหม่ที่หาไม่ได้จากที่อื่น บริษัทต่าง ๆ ก็เก็บมันสะสมไว้ และในนั้นอาจมีไอเดียที่เป็นต้นฉบับจริง ๆ อยู่ก็ได้
โอกาสที่มีใครแก้ปัญหานี้ไว้แล้วแล้วใส่ลงไปตรง ๆ ในข้อมูลฝึกอาจต่ำ แต่พูดตามตรง ถ้าเป็น OpenAI ผมก็พูดไม่ได้เต็มปากว่าไม่มีทางทำ
ที่น่าสนใจกว่าคือเป็นไปได้ว่าพวกเขาอาจสร้างข้อมูลฝึกที่แตะประเด็นแกนหลักส่วนใหญ่หรือทั้งหมดที่ดู “ต้นฉบับ” ในบทพิสูจน์นี้ไปแล้ว
แน่นอน เราไม่รู้
แต่คำถามนี้จะคงอยู่เสมอจนกว่าสิ่งเหล่านี้จะถูกสร้างขึ้นในแบบที่ ไม่ลับ ๆ ล่อ ๆ
- ฟังดูเป็นการตีความแบบ ทฤษฎีสมคบคิด พอตัว

โมเดลของ OpenAI หักล้างข้อคาดเดาหลักในเรขาคณิตเชิงไม่ต่อเนื่อง

ความก้าวหน้าในปัญหาระยะหน่วย

วิธีที่ AI ค้นพบ

เนื้อหาทางคณิตศาสตร์ของปัญหาระยะหน่วย

ทำไมผลลัพธ์นี้จึงน่าประหลาดใจ

เทคนิคใหม่จากทฤษฎีจำนวนเชิงพีชคณิต

ความหมายต่อวงการคณิตศาสตร์

ทำไมเรื่องนี้จึงสำคัญ

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความเห็นจาก Hacker News