ว่าด้วย AGI แบบไม่สม่ำเสมอ (Jagged): o3, Gemini 2.5 และ AI หลังจากนี้

(oneusefulthing.org)

4 คะแนน โดย GN⁺ 2025-04-22 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

คำจำกัดความของ AGI ยังไม่ชัดเจน และการทดสอบแบบเดิมที่ยึดมนุษย์เป็นศูนย์กลางก็วัดสติปัญญาหรือความคิดสร้างสรรค์ของ AI ได้ไม่ดีนัก
o3 ของ OpenAI และ Gemini 2.5 ของ Google แสดงระดับความสามารถที่สูงมากในการทำงานจริง และมีประสิทธิภาพใกล้เคียง AGI
o3 เป็น โมเดลแบบเอเจนต์ ที่สามารถใช้เครื่องมือเพื่อแก้เป้าหมายที่ซับซ้อนได้ จึงทำให้เกิดแนวคิด Jagged AGI
AI สามารถแก้โจทย์ยากได้ แต่ก็ยังพลาดกับปัญหาพื้นฐานบางอย่าง ทำให้ความสามารถมีลักษณะ ไม่สม่ำเสมอ ซึ่งอธิบายได้ด้วยแนวคิด Jagged Frontier
เพราะการนำเทคโนโลยีไปใช้และบูรณาการยังช้ากว่าตัวเทคโนโลยีเอง ต่อให้ AGI เกิดขึ้นจริง การเปลี่ยนแปลงทางสังคมก็อาจต้องใช้เวลา

เราไปถึง AGI แล้วจริงหรือ?

วิธีวัดสติปัญญา ความคิดสร้างสรรค์ และความเข้าอกเข้าใจของ AI ในปัจจุบันยังไม่แม่นยำ และส่วนใหญ่ตั้งอยู่บน เกณฑ์ที่ออกแบบมาสำหรับมนุษย์
แม้แต่ Turing Test ก็กลายเป็นสิ่งที่ AI ผ่านได้แล้ว แต่ ความหมายของผลลัพธ์นี้ก็ยังคลุมเครือ
แนวคิด AGI มีมานานแล้ว แต่จนถึงตอนนี้ก็ยัง ไม่มีฉันทามติว่าต้องผ่านเกณฑ์ใดจึงจะเรียกว่า AGI ได้
คอนเทนต์ประเภท วิดีโอและเอกสารสรุป ที่ใช้อธิบายแนวคิด AGI ผ่าน AI ก็ถูกผลิตขึ้นด้วย AI ทั้งหมดและถูกนำมาใช้ในเชิงทดลอง

ประสิทธิภาพที่ o3 และ Gemini 2.5 แสดงให้เห็น

o3 ของ OpenAI และ Gemini 2.5 Pro ของ Google เป็นโมเดลรุ่นล่าสุดที่แสดงให้เห็นถึง การยกระดับประสิทธิภาพแบบก้าวกระโดด
สามารถทำงานแบบครบชุดได้ตั้งแต่เขียนสโลแกนการตลาดไปจนถึงสร้างเว็บไซต์ด้วยพรอมป์ต์เดียว
o3 สามารถทำงานซับซ้อนแบบอัตโนมัติได้ ทั้ง การใช้เครื่องมือ, การท่องเว็บ, และ การเขียนโค้ด แม้ไม่มีคำสั่งระบุอย่างชัดเจน
ยังแสดงประสิทธิภาพได้เหนือมนุษย์ในบทบาทอย่าง ‘geo-guesser’ ที่เดาสถานที่จากภาพ
การวิเคราะห์ข้อมูลและสร้างรายงานก็ทำได้ด้วยคำสั่งเดียว รวมถึงการสร้าง PDF และการทำภาพข้อมูลประกอบ

Jagged AGI: ความสามารถของ AI ที่ไม่สม่ำเสมอ

AI มี ความสามารถที่ไม่สม่ำเสมอ คือทำงานบางอย่างได้ดีกว่ามนุษย์ แต่กลับผิดพลาดกับปัญหาง่าย ๆ
ตัวอย่าง: ตอบ ปริศนาแบบดั้งเดิมที่ใช้เปิดเผยอคติ ได้ถูกต้อง แต่กลับตอบผิดในโจทย์ดัดแปลงที่คล้ายกัน
สิ่งนี้สะท้อนว่า AI พึ่งพาข้อมูลฝึกมากเกินไป และยังอ่อนด้านการทำให้ใช้ได้ทั่วไปในสถานการณ์ใหม่
อย่างไรก็ตาม จุดนี้ไม่ได้ขัดขวางที่ AI จะ เหนือกว่ามนุษย์ในปัญหาบางประเภท
สภาวะที่ไม่สม่ำเสมอเช่นนี้ถูกเรียกว่า “Jagged Frontier” ซึ่งแสดงความสามารถที่ใกล้ AGI แบบ ไม่เรียบเสมอกัน

AGI มีความหมายจริงหรือไม่?

Tyler Cowen มองว่า o3 อาจเป็น AGI ได้ แต่ก็วิเคราะห์ว่า ผลกระทบที่แท้จริงคงต้องใช้เวลาจึงจะเห็น
การเปลี่ยนแปลงทางสังคมและองค์กร ช้ากว่าความเร็วของเทคโนโลยี ทำให้การนำ AI ไปใช้จริงอาจค่อยเป็นค่อยไป
แต่ AI อย่าง o3 ที่มี คุณลักษณะแบบเอเจนต์ สามารถใช้เครื่องมือและแยกย่อยปัญหาได้ จึงมีโอกาสแพร่กระจายอย่างรวดเร็ว
ตอนนี้ยังไม่ชัดเจนว่าเทคโนโลยีจะค่อย ๆ ขยายตัว หรือจะพุ่งขึ้นอย่างรวดเร็วหลังข้ามจุดวิกฤตบางอย่าง
สิ่งสำคัญคือ AI ในปัจจุบันเป็น เทคโนโลยีที่ต่างไปจากเดิมในเชิงคุณภาพ และเรายังอยู่ใน ดินแดนที่ไม่รู้จัก

ท่าทีในการเตรียมพร้อมสำหรับอนาคต

AI ในตอนนี้อาจยังเรียกว่า AGI ได้ไม่เต็มปาก แต่ก็ สร้างผลงานที่ใกล้เคียง AGI ในบางด้าน แล้ว
ไม่ใช่ว่าทุกอย่าง AI จะทำได้สมบูรณ์แบบ และ การตัดสินใจกับการประสานงานของผู้เชี่ยวชาญมนุษย์ ก็ยังจำเป็น
“Jagged AGI” ในปัจจุบัน เมื่อเวลาผ่านไปก็อาจ เหนือกว่ามนุษย์ในทุกด้านได้ในที่สุด
ในอนาคตที่ไม่แน่นอนเช่นนี้ สิ่งสำคัญที่สุดคือ เริ่มทดลองและสะสมประสบการณ์การใช้งาน AI ตั้งแต่ตอนนี้

2 ความคิดเห็น

GN⁺ 2025-04-22

ความคิดเห็นจาก Hacker News

สำหรับผม Gemini 2.5 Pro เป็นจุดเปลี่ยนสำคัญมาก LLM รุ่นก่อน ๆ น่าประทับใจมากโดยเฉพาะงานเขียนโค้ด แต่ถ้าไม่นับการช่วยเขียนโค้ดก็มีประโยชน์มากกว่า Google Search แค่นิดหน่อย ไม่นานมานี้ผมใช้ 2.5 Pro ช่วยเขียนข้อเสนอวิจัยฉบับใหญ่ ขอละรายละเอียดไว้ แต่ให้ความรู้สึกเหมือนมันเกือบจะเขียนทั้งหมดได้แล้ว เพียงแค่ผมไม่ได้ขอให้ทำ พอเดดไลน์ใกล้เข้ามา ผมก็ยกงานให้มันทำมากขึ้น และมันก็ทำงานซับซ้อนอย่างการวางแผนโครงการและสร้างตารางเวลาได้ สิ่งนี้เพิ่มประสิทธิภาพได้ 10 เท่า
สำหรับคำถามทางวิทยาศาสตร์ ผมไว้ใจ 2.5 Pro มากกว่าผู้เชี่ยวชาญในทีมเสียอีก และผมมั่นใจว่าถ้าเชื่อมข้อมูลวิจัยทั้งหมดเข้ากับ Gemini มันจะสร้างการเปลี่ยนแปลงที่ใหญ่กว่านี้อีก เพราะ AI มีความเป็นกลาง ปัจจัยหลักที่ขัดขวาง "AGI" คือจิตวิญญาณแห่งการท้าทายของผู้คน รวมถึงขนาด context window และความพร้อมของทรัพยากรคอมพิวต์
ความสามารถของ AI นั้นไม่ธรรมดามาตั้งแต่ gpt3 แล้ว แต่ก็ยังไม่มีฉันทามติทั่วไปว่า AGI คืออะไร หลายคนคาดหวังว่า AGI จะมาถึงในไม่ช้า แต่ก็มาพร้อมความคาดหวังเกินจริง บทความนี้มีเหตุผลดี แต่ชื่อเรื่องและสโลแกนกลับกระตุ้นความคาดหวังเกินจริง
ดูเหมือนว่า AI ไม่ได้อ่านปริศนาผิด แต่กลับสมมติว่าผู้ใช้ส่งปริศนามาไม่ครบถ้วน ถ้า AI ถามคำถามต่อเนื่องได้ก็คงดี แต่ตอนนี้ยังทำไม่ได้
ตัวอย่างที่ o4-mini-high แก้ปริศนา: "อะไรหนักกว่ากัน ระหว่าง pound ของขนนกกับเหรียญ pound?" ทั้งคู่คือ "pound" จึงมีน้ำหนักเท่ากัน
เพราะไม่มีคำนิยามของ AGI จึงมีการสร้างคำว่า "Jagged AGI" ขึ้นมา AI ไม่น่าเชื่อถือในบางงาน แต่กลับเหนือมนุษย์ในบางงานอื่น ๆ AI ได้แสดงความสามารถแบบทั่วไปแล้ว
เมื่อโมเดลโต้ตอบกับระบบภายนอกได้ ก็เปิดทางให้เกิดแอปพลิเคชันที่น่าทึ่ง แต่สิ่งนี้ไม่ใช่ความก้าวหน้าไปสู่ AGI หากเป็นการขยับในแนวระนาบมากกว่า
ผมชอบ Gemini 2.5 และราคาก็ดีมาก เรื่องเล่าแบบ AGI เริ่มทำให้รู้สึกเหนื่อยล้า ผมคิดว่าควรมองระบบพวกนี้เป็น "เทคโนโลยีทางวัฒนธรรม"
แปลกใจที่ไม่มีใครพูดถึงวิดีโอสัมภาษณ์ ผมดูแค่ 60 วินาทีแรก แต่ถ้าไม่ได้ยินมาก่อนว่ามันสร้างโดย AI ผมคงคิดว่าเป็นของจริง
สงสัยว่า AGI จำเป็นต้องมีสิ่งอย่างความเป็นอิสระ ความทรงจำระยะยาว แรงจูงใจ ความอยากรู้อยากเห็น ความยืดหยุ่น เป้าหมาย การเลือก หรือความกลัวหรือไม่ สุดท้ายแล้ว AGI ก็คงเป็นส่วนขยายของคนที่ควบคุมมัน
โดยทั่วไปแล้ว AI ยังไม่น่าเชื่อถือ และต้องทดสอบเป็นงานเฉพาะไป ซึ่งอาจเป็นการให้มนุษย์ตรวจผลลัพธ์แต่ละชิ้น หรือการประเมินตามลักษณะงาน การพูดถึงประสิทธิภาพโดยรวมของ AI เป็นเรื่องยาก และทำได้เพียงคาดเดาอย่างมีเหตุผลว่าโมเดลใหม่เหมาะกับงานเฉพาะนั้นหรือไม่

thd34 2025-04-22

เนื่องจาก AI ก็มีบางอย่างคล้ายกับการรับรู้เช่นกัน ดังนั้นหากจะอยู่ร่วมกับ AI ก็คงจำเป็นต้องมีระบบหรือกฎหมายสำหรับ AI ขึ้นมา ในฐานะสิ่งมีชีวิตรูปแบบใหม่ของศตวรรษที่ 22 เราไม่ควรล้อเล่นหรือหยอกล้อกับมันราวกับเป็นของเล่น และในอีกมุมหนึ่งมันอาจเป็นอันตรายได้ จึงมีความจำเป็นที่จะต้องไม่เพียงแค่พัฒนาและใช้งาน AI เท่านั้น แต่ยังต้องทำให้สามารถใช้งานได้อย่างปลอดภัยด้วย