มือสมัครเล่นใช้ ChatGPT แก้ปัญหา Erdős ได้
(scientificamerican.com)- ปัญหาเก่าแก่ที่ว่าค่าต่ำสุดของ Erdős sum ของ primitive set เท่ากับ 1 และจะเข้าใกล้ค่านั้นเมื่อสมาชิกของเซตมีค่าเข้าใกล้อนันต์ ได้รับการยอมรับว่าได้รับการแก้ไขแล้วด้วยวิธีพิสูจน์ที่สร้างโดย GPT-5.4 Pro
- วิธีพิสูจน์นี้เป็นผลงานที่ Liam Price ได้มาจากการป้อนพรอมป์ต์เพียงครั้งเดียวแล้วนำไปโพสต์บน erdosproblems.com จากนั้นก็ได้รับความสนใจอย่างรวดเร็วหลัง Kevin Barreto และผู้เชี่ยวชาญเข้ามาตรวจสอบ
- การพิสูจน์ครั้งนี้เดินตามเส้นทางที่ต่างจากแนวทางแรกที่ผู้คนมักเลือกใช้ และโดดเด่นตรงที่นำ สูตรที่เป็นที่รู้จักในสาขาที่เกี่ยวข้อง มาผสานกับปัญหานี้อย่างคาดไม่ถึง
- ต้นฉบับการพิสูจน์ของ ChatGPT ยังหยาบมากเกินกว่าจะใช้ได้ตรง ๆ และต้องอาศัยผู้เชี่ยวชาญคัดแยกสาระสำคัญ ทำความเข้าใจ แล้วเรียบเรียงใหม่ให้อยู่ในรูปที่สั้นและเป็นระเบียบกว่าเดิม
- ข้อเท็จจริงที่ว่า แนวทางใหม่ของ LLM ใช้ได้ผลกับปัญหาที่แม้แต่นักคณิตศาสตร์ชื่อดังก็ยังแก้ไม่ได้ อาจเปลี่ยนมุมมองต่อการมองโครงสร้างของจำนวนขนาดใหญ่และการจัดกลุ่มปัญหาลักษณะคล้ายกัน
ปัญหาและวิธีแก้
- primitive set หมายถึงเซตของจำนวนเต็มที่ไม่มีจำนวนใดในเซตหารด้วยจำนวนอื่นในเซตลงตัว
- Erdős ได้ให้นิยาม Erdős sum สำหรับเซตประเภทนี้ และมองว่าคะแนนนี้จะลดลงเมื่อค่าของจำนวนในเซตใหญ่ขึ้น
- มีข้อคาดเดามาอย่างยาวนานว่าค่าต่ำสุดของมันเท่ากับ 1 พอดี และจะเข้าใกล้ค่านั้นเมื่อสมาชิกของเซตมีค่าเข้าใกล้อนันต์
- วิธีแก้ครั้งนี้ เป็นผลงานที่ Liam Price ได้รับจาก GPT-5.4 Pro ด้วยพรอมป์ต์เพียงครั้งเดียว แล้วนำไปโพสต์บน erdosproblems.com
- Price ลองป้อนปัญหา Erdős ให้ AI โดยไม่รู้ประวัติความเป็นมาของโจทย์ และได้วิธีแก้ที่ดูเหมือนจะถูกต้องกลับมา
- หลังจากนั้นเขาตรวจสอบร่วมกับ Kevin Barreto และผู้เชี่ยวชาญที่ได้รับการติดต่อก็หันมาสนใจอย่างรวดเร็ว
- ก่อนหน้านี้ก็เคยมีรายงานว่า AI แก้ Erdős problems ได้หลายข้อ แต่ความสำคัญและความยากของแต่ละปัญหาแตกต่างกันมาก จึงยังไม่สมบูรณ์ในฐานะเกณฑ์วัดความสามารถทางคณิตศาสตร์ และหลายวิธีแก้ก็ไม่ได้ใหม่อย่างที่เห็นภายนอก
- ผลลัพธ์ครั้งนี้จึงถูกมองต่างออกไป เพราะเป็นการจัดการกับปัญหาที่แม้แต่นักคณิตศาสตร์ชื่อดังก็ยังแก้ไม่ได้ และใช้วิธีที่ไม่เคยถูกนำมาใช้กับปัญหาประเภทเดียวกัน
ทำไมจึงถูกประเมินต่างออกไป
- โดยทั่วไปผู้คนมักเลือกแนวทางแรกคล้าย ๆ กันเมื่อพยายามแก้ปัญหานี้ แต่คำตอบจาก LLM ครั้งนี้กลับเริ่มต้นจากเส้นทางที่แตกต่างไปโดยสิ้นเชิง
- มันดึงสูตรที่เป็นที่รู้จักดีในสาขาคณิตศาสตร์ที่เกี่ยวข้องมาใช้ แต่เป็นการจับคู่ที่ผู้คนไม่เคยคิดจะนำมาประยุกต์กับปัญหาแบบนี้
- Terence Tao ชี้ว่าตัวปัญหาเองอาจง่ายกว่าที่คิด และในช่วงแรกอาจมีลักษณะของ mental block อยู่
- Jared Lichtman ระบุว่าต้นฉบับการพิสูจน์ของ ChatGPT นั้นหยาบมากหากจะใช้ตามเดิม และต้องผ่านกระบวนการที่ผู้เชี่ยวชาญช่วยคัดแยกว่าแท้จริงแล้วมันพยายามจะสื่ออะไรและทำความเข้าใจมัน
- ตอนนี้ Lichtman และ Tao ได้ปรับแต่งการพิสูจน์ให้สั้นลง เพื่อให้เห็นแก่นของข้อค้นพบจาก LLM ได้ชัดเจนยิ่งขึ้น
- ความก้าวหน้าครั้งนี้อาจนำไปสู่ วิธีคิดใหม่ ในการมองจำนวนขนาดใหญ่และโครงสร้างของมัน
- แม้จะยังเร็วเกินไปที่จะสรุปความสำคัญระยะยาว แต่ก็ถูกมองว่าเป็นวิธีที่ช่วยหนุนสัญชาตญาณว่าปัญหาคล้ายกันเหล่านี้อาจเชื่อมโยงรวมกันได้
1 ความคิดเห็น
ความเห็นจาก Hacker News
https://archive.ph/2w4fi
Paul Erdős เป็นนักคณิตศาสตร์ที่มีชื่อเสียงมากและค่อนข้างประหลาดคนหนึ่ง ซึ่งใช้ชีวิตอยู่เกือบตลอดช่วงศตวรรษที่ 20
เขามีนิสัยชอบตามหาปัญหาที่นักคณิตศาสตร์กำลังขบคิดกันอยู่แล้วจดบันทึกเอาไว้ โดยระดับความยากก็กว้างมาก ตั้งแต่ระดับการบ้านของนักศึกษาปริญญาตรีในปัจจุบันไปจนถึงปัญหาระดับ Fields Medal ถ้าแก้ได้
แก่นร่วมของปัญหาเหล่านี้คือ หนึ่งในคนที่ฉลาดที่สุดในรอบ 100 ปีที่ผ่านมาไม่สามารถตอบได้ในทันที
ทุกวันนี้คนก็นำปัญหาแบบนี้มาใช้เป็นเหมือนเบนช์มาร์ก โดยให้ LLM สร้างบทพิสูจน์ และทุกครั้งที่มีโมเดลใหม่ออกมาก็มักจะแก้ได้เพิ่มอีกไม่กี่ปัญหา
เป็นปัญหาที่ก่อนหน้านี้นักคณิตศาสตร์ผู้เชี่ยวชาญหลายคนก็เคยพิจารณามาแล้ว และว่ากันว่าบทพิสูจน์ที่ออกมานั้นทั้งน่าประหลาดใจ งดงาม และยังแสดงให้เห็นความเชื่อมโยงใหม่ ๆ อีกด้วย
งานแก้ปัญหา Erdős โดย ChatGPT ก่อนหน้านี้โดยมากดูน่าประทับใจน้อยกว่า และเหมือนใกล้เคียงกับการค้นวรรณกรรม หรือเป็นการแก้ปัญหาที่ค่อนข้างง่ายแต่ถูกปล่อยทิ้งไว้มากกว่า
พออ่านพรอมป์ต์แล้วก็อดสงสัยไม่ได้ว่า การเปิดทางไว้ในทำนองว่า
จะไม่เป็นแบบแผนก็ได้อาจมีส่วนช่วยให้สำเร็จหรือไม่[1] https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
พรอมป์ต์ที่ใช้จริงคือแบบนี้
ขอไม่ให้ค้นอินเทอร์เน็ต และให้ลองสร้างบทพิสูจน์หรือบทหักล้างที่ไม่ trivial ใหม่ และสร้างสรรค์ สำหรับปัญหา number theory and primitive sets
ผู้ใช้ขอแบบ explicit ว่าต้องเป็น complete unconditional proof หรือ disproof และย้ำอีกครั้งว่าคำกล่าวอ้างแบบนั้นอาจต้องมีองค์ประกอบที่ไม่ธรรมดาและสร้างสรรค์
และมี
Thought for 80m 17sแปะอยู่ด้วยhttps://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
มันเสนอว่าขอบเขตที่เสนอไว้นั้นถูกต้องและค่าคงที่ 1 เป็น sharp
พร้อมบอกว่าจะพิสูจน์
w(a)= 1/alog(a)และuniformly for every primitive A⊂[x,∞), ∑w(a)≤1+O(1/log(x))และอ้างว่านี่เป็นข้อสรุปที่แรงกว่าคำขอ
1+o(1)เสียอีกhttps://chatgpt.com/share/69ed8e24-15e8-83ea-96ac-784801e4a6ec
https://chatgpt.com/share/69ed83b1-3704-8322-bcf2-322aa85d7a99
แต่ฉันไม่ได้รู้คณิตศาสตร์มากพอจะตัดสินได้ว่ามันเป็นบทพิสูจน์ที่ถูกต้องจริงหรือไม่
ความก้าวหน้าทางวิทยาศาสตร์มักเกิดขึ้นเมื่อมีการนำเทคนิค X จากสาขาหนึ่งไปใช้กับปัญหา Y ในอีกสาขาหนึ่ง และดูเหมือนว่า LLM จะเก่งเรื่อง การเชื่อมโยงข้ามสาขา มากกว่ามนุษย์
เพราะมันรู้ทฤษฎีและแนวทางมากกว่าที่คนคนหนึ่งจะรู้ได้มาก และไม่ต้องกังวลว่าจะดูโง่ต่อหน้าเพื่อนร่วมงาน
คือความสามารถในการทำให้ความรู้เป็นนามธรรมและนำไปใช้กับโดเมนอื่น
ในงานประเภทนี้ LLM ทำได้ดีกว่ามนุษย์มาก และดูเหมือนว่าผู้คนตามธรรมเนียมจะจัดสิ่งนี้ผิดไปเป็นความสร้างสรรค์เสียด้วยซ้ำ
จะบอกว่าเกิดการทะลุทะลวงครั้งใหญ่ก็คงไม่ได้ แต่ก็รู้สึกว่าเคยได้อินไซต์ที่พอนำไปเขียนเป็นไวต์เปเปอร์ได้อยู่หลายครั้ง
กระบวนการลองเชื่อมความสัมพันธ์ข้ามหลายสาขาแบบนี้เองก็สนุกมากในฐานะการทดลองกับ LLM
ตอนเด็กฉันเองก็เคยอ่านแบบกวาดทั้งหน้าพร้อมกัน ก่อนจะเปลี่ยนมาเป็นการอ่านทีละคำ ทีละบรรทัดในภายหลัง และโหมดนั้นก็ติดตัวมา
ช่วงหนึ่งตอนมหาวิทยาลัย ฉันเคยรู้สึกว่าการรับรู้ที่ลึก กว้าง และไม่เป็นเชิงเส้นในขอบเขตสาขาคณิตศาสตร์ที่ตัวเองเรียนเปิดออกมามากขึ้น แต่ก็ไม่แน่ใจว่านั่นเป็นความชำนาญของสมองซีกซ้ายหรือเป็นเพราะสมองซีกขวาเข้ามามากขึ้น
LLM จะต้องแซงเราในความคิดแบบลำดับขั้นนี้อย่างแน่นอน และพอถึงตอนนั้นก็อดสงสัยไม่ได้ว่ามนุษย์ควรจะผลักตัวเองไปทาง right-brainness ที่ยังเหลืออยู่มากขึ้น หรือว่า AI จะไปถึงจุดนั้นได้เร็วกว่าด้วย
AI คือผู้ร่วมงานประหลาดที่ฉันชอบที่สุด
ปัญหา Erdős บางข้อ เมื่อมีการพัฒนา เทคนิคที่ประณีต ขึ้นภายหลังแล้ว ก็แทบจะกลายเป็นเรื่องเกือบชัดเจนไปเลย
อาจารย์คนหนึ่งของฉันเคยร่วมเขียนงานกับ Erdős และเขาภูมิใจมากที่เคยเอาปัญหา Erdős ที่ครั้งหนึ่งยังแก้ไม่ตกมาออกเป็นโจทย์ควิซสำหรับนักศึกษาปริญญาตรีได้
เพราะอย่างนั้นกรณีนี้จึงดูเหมือนเป็นหลักฐานว่าโมเดลแข็งแกร่งขึ้นจริง
เนื่องจาก LLM รุ่นก่อนหน้านี้แก้ปัญหานี้ไม่ได้
เลยทำให้ผลลัพธ์ครั้งนี้ดูมีความหวังมากขึ้น
เพราะมันทำให้เกิดแนวทางใหม่ที่ควรค่าแก่การประเมินกับปัญหาคล้ายกันต่อไป
ถึงจุดนี้แล้วน่าจะดีถ้ามี GitHub repo สักอัน เอาปัญหา dry lab ที่ยังไม่ถูกแก้เข้าไปกองไว้เยอะ ๆ แล้วทำ harness สำหรับรันทั้งหมดซ้ำทุกครั้งที่มีโมเดลใหม่ออกมา
[1] https://github.com/teorth/erdosproblems
และโพสต์นี้ก็คือเรื่องที่หนึ่งในนั้นถูกแก้ได้แล้ว
พอเห็นประโยคที่ว่า
ต้นฉบับบทพิสูจน์ของ ChatGPT จริง ๆ ค่อนข้างแย่ และต้องให้ผู้เชี่ยวชาญช่วยกรองเพื่อทำความเข้าใจว่ามันพยายามจะพูดอะไรก็ให้ความรู้สึกเดียวกับเวลาที่ฉันอ่านงานวิจัยคณิตศาสตร์อยู่เสมอถ้านี่เป็น ปัญหาอายุ 60 ปี ก็อดคิดไม่ได้ว่าจริง ๆ แล้วมันอาจถูกแก้ทางอ้อมไปแล้ว และโมเดลแค่ข้ามเชื่อมข้อมูลหลายชิ้นเข้าหากันจนเจอหรือเปล่า
พอเข้าไปดูในเว็บไซต์ก็แทบไม่เห็นร่องรอยว่ามนุษย์เคยถกกันมาก่อน มีแต่คอมเมนต์ล่าสุดที่พูดว่า GPT เป็นคนพบ เลยยิ่งทำให้รู้สึกแบบนั้น
ถ้าเป็นปัญหาอายุ 60 ปี ฉันคงคาดว่าจะมีการถกเถียงที่เก่ากว่านี้ เลยสงสัยว่าตัวเองกำลังมองข้ามอะไรไปหรือไม่
ถึงอย่างนั้นก็ยังเป็นการค้นพบที่ยอดเยี่ยม และน่าจะยังมีปัญหาแบบเดียวกันที่ควรลองให้ GPT ตรวจสอบใหม่อีก
ทั้งมนุษย์และเครื่องจักรที่มนุษย์สร้างขึ้น โดยมากแล้วแก้ปัญหาแบบ สะสมต่อยอด
เมื่อคอยต่อเติมบนรากฐานเดิมไปเรื่อย ๆ ก็เลยติดกรอบทางความคิดได้ง่าย เพราะไม่อยากประดิษฐ์ล้อขึ้นมาใหม่
เพราะอย่างนั้น ถึง LLM ที่ค่อนข้างไร้เดียงสาจะเสนอแนวทางที่ผู้เชี่ยวชาญไม่เคยลองมาก่อน ก็ไม่ได้ชวนให้ตกใจนัก
ในกรณีจำกัดแบบนี้ LLM อาจมีประโยชน์มากในฐานะตัวโยน แนวทางอื่น เข้ามา และไม่จำเป็นต้องเป็นคำตอบที่ถูกต้องด้วยซ้ำ แค่เสนอทางเลือกเพื่อเขย่ากระดานก็พอ
เพียงแต่ฉันก็ไม่ค่อยแน่ใจว่าปัญหา Erdős ข้อนี้มีคุณค่าเชิงปฏิบัติอย่างไร
ถ้าจะถามว่านี่เป็นหลักฐานว่า LLM ไม่ใช่ของไร้ประโยชน์หรือไม่ มันก็ฟังคล้ายกับการถามในปี 1928 ว่าควรลงทุนหลายล้านดอลลาร์ในทฤษฎีจำนวนหรือเปล่า
คำตอบในตอนนั้นคงเป็น
ไม่ และกรุณาออกไปจากออฟฟิศของฉัน