แนะนำ mathstodon.xyz
- mathstodon.xyz เป็นอินสแตนซ์สำหรับผู้ใช้ที่เกี่ยวข้องกับคณิตศาสตร์ ซึ่งเป็นส่วนหนึ่งของเครือข่ายสังคมแบบกระจายศูนย์ที่ใช้ Mastodon
- รองรับการเรนเดอร์ LaTeX บนเว็บอินเทอร์เฟซ
- ผู้ดูแลระบบ: Christian Lawson-Perfect (@christianp)
- สถิติเซิร์ฟเวอร์: ผู้ใช้ที่ใช้งานอยู่ 3K คน
การทดลอง GPT-o1 ของ Terence Tao
- GPT-o1: GPT เวอร์ชันใหม่ของ OpenAI ที่ทำขั้นตอนการให้เหตุผลเบื้องต้นก่อนรัน LLM
- การทดลอง 1: ในการตอบคำถามคณิตศาสตร์ที่กำกวม โมเดลสามารถระบุ Cramer's theorem ได้อย่างถูกต้องและให้คำตอบที่น่าพอใจ
- ในเวอร์ชันก่อนหน้า แม้จะกล่าวถึงแนวคิดที่เกี่ยวข้อง แต่รายละเอียดผิดพลาด
- การทดลอง 2: เมื่อต้องรับมือกับโจทย์วิเคราะห์เชิงซ้อนที่ซับซ้อน โมเดลสามารถนำไปสู่คำตอบที่ถูกต้องได้ด้วยคำใบ้และการชี้นำจำนวนมาก แต่ไม่สามารถสร้างแนวคิดเชิงมโนทัศน์หลักได้ด้วยตนเอง และยังมีข้อผิดพลาดอยู่บ้าง
- ดีขึ้นจากโมเดลก่อนหน้า แต่ก็ยังไม่เพียงพอ
- หากมีการปรับปรุงอีกไม่กี่รอบ ก็มีโอกาสที่จะเป็นประโยชน์กับงานระดับวิจัยได้
- การทดลอง 3: ในงานทำผลลัพธ์ให้เป็นรูปแบบทางการใน Lean โมเดลเข้าใจปัญหาได้ดีและแยกย่อยขั้นต้นได้ดี แต่เนื่องจากขาดข้อมูล Lean รุ่นล่าสุด จึงมีข้อผิดพลาดหลายจุดในโค้ด
- อาจมีประโยชน์มากเมื่อใช้ใน IDE ที่ผสานโมเดลเฉพาะทางสำหรับ Lean และ Mathlib
การอภิปรายเพิ่มเติม
- พัฒนาการของเครื่องมือ AI: คาดหวังการเกิดขึ้นของระบบนิเวศเครื่องมือ AI ที่สามารถรับมือกับงานวิจัยได้หลากหลายประเภท
- ปัจจุบัน LLM ขนาดใหญ่แบบอเนกประสงค์ได้รับความสนใจมาก แต่ก็คาดว่าโมเดลโอเพนซอร์สน้ำหนักเบาที่ปรับให้เหมาะกับการใช้งานเฉพาะด้านจะมีบทบาทสำคัญเช่นกัน
- การเปรียบเทียบ AI กับนักศึกษาปริญญาโท/เอก: มีการถกเถียงกันว่าเครื่องมือ AI จะสามารถสร้างผลงานในระดับเดียวกับนักศึกษาระดับบัณฑิตศึกษาได้หรือไม่
- ปัจจุบันยังต้องใช้ความพยายามมากกว่านักศึกษาบัณฑิตศึกษา แต่มีความเป็นไปได้ว่าในอีกไม่กี่ปีข้างหน้า อัตราส่วนนั้นอาจลดลงเหลือ 1 หรือต่ำกว่า
# สรุปของ GN⁺
- Terence Tao ได้ทดสอบโมเดล GPT-o1 ใหม่ของ OpenAI เพื่อประเมินความสามารถในการแก้ปัญหาทางคณิตศาสตร์
- GPT-o1 ดีขึ้นจากเวอร์ชันก่อนหน้า แต่ก็ยังมีข้อจำกัดบางประการ
- หากมีการปรับปรุงอีกไม่กี่รอบ ก็มีโอกาสที่จะเป็นประโยชน์กับงานระดับวิจัยได้
- คาดหวังการเกิดขึ้นของระบบนิเวศของเครื่องมือ AI ที่สามารถสนับสนุนงานวิจัยได้
- ปัจจุบัน LLM ขนาดใหญ่แบบอเนกประสงค์ได้รับความสนใจมาก แต่ก็คาดว่าโมเดลโอเพนซอร์สน้ำหนักเบาที่ปรับให้เหมาะกับการใช้งานเฉพาะด้านจะมีบทบาทสำคัญเช่นกัน
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
มีความคาดหวังว่า หาก GPT ถูกปรับจูนใน Lean (เครื่องมือช่วยพิสูจน์) ได้เหมือนกับ Python มันจะมีประโยชน์กับคณิตศาสตร์ระดับวิจัยมากขึ้น
ลองจินตนาการว่าย้อนกลับไปปี 2019 แล้วได้อ่านข้อความที่บอกว่าประสบการณ์ในการโต้ตอบกับ Alexa "คล้ายกับการให้คำปรึกษานักศึกษาปริญญาโทที่ธรรมดา ๆ แต่ก็ไม่ได้ไร้ความสามารถไปเสียทีเดียว"
โมเดล o1 น่าทึ่งมาก
ประสบการณ์กับโมเดล O1 แตกต่างกันมาก
สิ่งใหม่คือ LLM ในหลายหัวข้อนั้น "คล้ายกับการให้คำปรึกษานักศึกษาปริญญาโทที่ธรรมดา ๆ แต่ก็ไม่ได้ไร้ความสามารถไปเสียทีเดียว"
มนุษย์เองก็อาจได้ประโยชน์จากการให้เหตุผลแบบ "chain of thought"
เห็นด้วยกับความเห็นของ Terence Tao
รู้สึกตื่นเต้นที่จะกลับไปเรียนคณิตศาสตร์อีกครั้งในฐานะงานอดิเรกอิสระ
ความเห็นของ Terence Tao น่าประหลาดใจ
Daniel Litt ประทับใจกับ o1-preview แต่ยังไม่ค่อยมีโชคกับการใช้มันแก้ปัญหาคณิตศาสตร์ที่น่าสนใจ