บทสัมภาษณ์ Sam Altman ซีอีโอ OpenAI ว่าด้วย Sora, พลังงาน และการสร้างจักรวรรดิ AI
(a16z.substack.com)- ในพอดแคสต์ a16z เขาอธิบายวิสัยทัศน์ของ OpenAI ว่าเป็น การบูรณาการบริการสมัครสมาชิก AI ส่วนบุคคล, การสร้างโครงสร้างพื้นฐานขนาดมหาศาล, และการวิจัย AGI โดยเน้นว่าทั้งสามองค์ประกอบนี้เชื่อมต่อกันเป็นสแตกเดียวในแนวดิ่ง
- เป้าหมายของ OpenAI คือ ‘บริการสมัครสมาชิก AI ส่วนบุคคล’ ที่บูรณาการงานวิจัย โครงสร้างพื้นฐาน และผลิตภัณฑ์ผู้บริโภคในแนวดิ่ง เพื่อขับเคลื่อนทั้งการพัฒนา AGI และการใช้งานจริงไปพร้อมกัน
- เจตนาทางกลยุทธ์ของการเปิดตัว Sora ไม่ได้มีแค่การออกผลิตภัณฑ์สร้างวิดีโอ แต่ยังเพื่อให้สังคมเตรียมพร้อมต่อการมาถึงของโมเดลวิดีโออันทรงพลัง และเพื่อผลักดันการวิจัย AGI ผ่านการพัฒนา world model
- ผ่าน GPT-5 ยุคของนักวิทยาศาสตร์ AI กำลังมาถึง และเริ่มมีกรณีตัวอย่างแรก ๆ ที่โมเดล ทำการค้นพบทางวิทยาศาสตร์ได้จริง โดยคาดว่าในอีก 2 ปีข้างหน้า จะมี การค้นพบทางวิทยาศาสตร์ที่สำคัญ เกิดขึ้น
- เขานำเสนอ มุมมองเชิงบวก เกี่ยวกับ การบรรจบกันของพลังงานและ AI, ความเป็นไปได้ของการใช้หลัก fair use กับลิขสิทธิ์ และแนวคิดว่า AGI จะมาถึงอย่างค่อยเป็นค่อยไปมากกว่าที่คาด ทำให้สังคมมีเวลาปรับตัว พร้อมประเมินว่ายุคที่ AI เร่งความก้าวหน้าทางวิทยาศาสตร์ ได้เริ่มต้นขึ้นแล้ว
วิสัยทัศน์และโครงสร้างของ OpenAI
- OpenAI ประกอบด้วยสามแกนหลักคือ บริการสมัครสมาชิก AI สำหรับผู้บริโภค, โครงสร้างพื้นฐานขนาดใหญ่, และ ห้องวิจัย
- เป้าหมายคือการมอบ บริการแบบสมัครสมาชิกที่ทำหน้าที่เป็นผู้ช่วยส่วนตัวอย่างแท้จริง ผ่าน AI ที่เข้าใจบริบทของผู้ใช้และปรับให้เหมาะกับแต่ละบุคคล
- คาดว่าคนส่วนใหญ่จะมี AI ส่วนตัวแบบสมัครสมาชิกหนึ่งตัว และบางคนอาจใช้หลายตัว
- ผู้ใช้จะล็อกอินเข้ากับบริการต่าง ๆ และใช้งาน AI ผ่านอุปกรณ์เฉพาะ
- เป้าหมายคือให้ AI ค่อย ๆ รู้จักผู้ใช้มากขึ้นและกลายเป็นเครื่องมือที่มีประโยชน์มาก
- โครงสร้างพื้นฐานคือองค์ประกอบจำเป็นเพื่อรองรับการพัฒนา AGI และการให้บริการ
- ตอนนี้ยังไม่มีแผนขายเป็นโครงสร้างพื้นฐานดิบให้บริษัทอื่น
- แต่ก็เปิดความเป็นไปได้ไว้ว่าอาจต้องพิจารณาการใช้งานแบบอื่น เพราะสเกลมีขนาดใหญ่มหาศาลมาก
- กำลังก่อสร้างศูนย์ข้อมูลที่ใหญ่ที่สุดในประวัติศาสตร์มนุษยชาติ หรือพูดให้แม่นยำกว่านั้นคือโครงการโครงสร้างพื้นฐานที่ใหญ่ที่สุด
- เดิมทีเขาเคยสงสัยในแนวทางบูรณาการแนวดิ่ง แต่ตอนนี้เปลี่ยนจุดยืนเป็นว่า “หากไม่มีการบูรณาการแนวดิ่ง ก็ไม่สามารถทำ AGI ให้เป็นจริงได้”
- เขาได้ผ่านการเปลี่ยนมุมมองจากนักลงทุนสู่ผู้ปฏิบัติการ
- ทฤษฎีที่ว่าระบบเศรษฐกิจมีประสิทธิภาพและบริษัทควรเก่งเพียงเรื่องเดียว ใช้ไม่ได้กับกรณีของ OpenAI
- เรื่องราวของ OpenAI กลายเป็นว่าต้องทำหลายอย่างมากกว่าที่คาดไว้เพื่อให้บรรลุภารกิจ
- เขาประเมินว่า iPhone คือผลิตภัณฑ์ที่น่าทึ่งที่สุดที่อุตสาหกรรมเทคโนโลยีเคยสร้างขึ้น และยกเป็นตัวอย่างของการบูรณาการแนวดิ่งอย่างสุดขั้ว
- จำเป็นต้องมี โครงสร้างสแตกแนวดิ่ง ที่ทำให้งานวิจัยสร้างผลิตภัณฑ์ที่ยอดเยี่ยมได้ และทำให้โครงสร้างพื้นฐานรองรับงานวิจัยได้
เจตนาทางกลยุทธ์ของการเปิดตัว Sora
- แม้เผิน ๆ แล้ว Sora จะดูไม่เกี่ยวกับ AGI แต่คาดว่า การสร้าง world model มีความสำคัญต่อ AGI
- เช่นเดียวกับที่ ChatGPT ช่วยให้สังคมเตรียมพร้อมต่อ AGI, Sora ก็ช่วยให้สังคม ปรับตัวต่อผลกระทบในโลกจริงของวิดีโอที่สร้างโดย AI
- วิดีโอมี พลังสะท้อนทางอารมณ์มากกว่าข้อความอย่างมาก ดังนั้นจึงสำคัญที่สังคมจะต้องเข้าใจเรื่องนี้
- ในไม่ช้าจะมีทั้ง deepfake และโมเดลวิดีโอที่น่าทึ่งซึ่งสามารถแสดงอะไรก็ได้ตามต้องการ
- AI ไม่ควรถูกทำให้มีแต่ประสิทธิภาพเท่านั้น แต่ควรมอบความสนุกและความเพลิดเพลินด้วย
- แม้จะไม่ได้ทุ่มทรัพยากรคอมพิวต์ส่วนใหญ่ทั้งหมดลงไป แต่ในแง่ขนาดสัมบูรณ์ก็ยังถือว่าใช้ทรัพยากรจำนวนมาก
- Sora รุ่นใหม่ เพิ่มฟีเจอร์โซเชียลเน็ตเวิร์ก และกำลังพัฒนาไปในทิศทางที่น่าสนใจ
- เขาย้ำว่า “สังคมและเทคโนโลยีต้องวิวัฒน์ไปด้วยกัน” พร้อมเน้นความสำคัญของการทดลองล่วงหน้าและการปรับตัวก่อนที่ AI จะมาถึงเต็มรูปแบบ
การมาถึงของนักวิทยาศาสตร์ AI
- ผ่าน GPT-5 ได้เริ่มมีตัวอย่างแรก ๆ ที่ AI ทำการค้นพบทางวิทยาศาสตร์
- ทั้งการค้นพบทางคณิตศาสตร์ใหม่ ๆ และกรณีการมีส่วนร่วมเล็ก ๆ ในงานวิจัยด้านฟิสิกส์และชีววิทยา
- คาดว่าในอีก 2 ปีข้างหน้า โมเดลจะทำงานวิทยาศาสตร์ในสเกลที่ใหญ่ขึ้นและสร้างการค้นพบที่สำคัญได้
- Sam Altman มองว่าสิ่งที่คล้ายกับ Turing test จริง ๆ คือ ความสามารถของ AI ในการทำวิทยาศาสตร์
- นี่จะสร้างความเปลี่ยนแปลงที่แท้จริงให้กับโลก
- ความก้าวหน้าทางวิทยาศาสตร์คือปัจจัยสำคัญที่สุดที่ทำให้โลกดีขึ้นในระยะยาว
- Turing test ถูกผ่านไปแล้ว แต่โลกก็ไม่ได้เปลี่ยนแปลงอย่างมหาศาลจนเป็นไปไม่ได้
- AGI ก็น่าจะมาถึงในลักษณะคล้ายกัน แต่ ภาวะ singularity จะไม่เกิดขึ้นจริง และการเปลี่ยนแปลงจะค่อยเป็นค่อยไปมากกว่าที่คาด
- เขามองว่าแม้จะเร่งทำวิจัยอย่างบ้าคลั่ง สังคมก็จะเรียนรู้ได้เร็วกว่าที่หลายคนคิด
- มนุษย์และสังคมมีความสามารถในการปรับตัวสูงกว่าที่คิดมาก
- เราจะอัปเดตความเข้าใจว่า AGI กำลังมา ยอมรับมัน และหาความสงบกับมันได้
- ทุกอย่างจะต่อเนื่องกว่าที่คาดไว้มาก
วิวัฒนาการของอินเทอร์เฟซ AI-มนุษย์
- ตอนนี้โมเดลได้ไปถึงระดับที่ เก่งมากแล้วในแง่ของการสนทนาแบบแชตบอตพื้นฐาน
- แต่คำขออย่าง “ช่วยรักษามะเร็งให้หน่อย” ยังทำไม่ได้
- รูปแบบอินเทอร์เฟซแบบข้อความยังพัฒนาได้อีกมาก
- โลกจะขยายไปสู่ อินเทอร์เฟซที่เป็นวิดีโอเรนเดอร์แบบเรียลไทม์
- AI จะรับรู้สภาพแวดล้อมรอบตัวและแสดงข้อมูลเฉพาะในช่วงเวลาที่จำเป็น ผ่าน อุปกรณ์รับรู้ตลอดเวลา (ambient device)
- แทนที่จะส่งการแจ้งเตือนข้อความแบบพร่ำเพรื่อ ก็จะเข้าใจบริบทและให้ข้อมูลในจังหวะที่เหมาะสม
- ในระยะยาว อินเทอร์เฟซจะพัฒนาไปสู่ “AI ที่เข้าใจผู้ใช้และเป็นฝ่ายกำหนดรูปแบบการสนทนาเฉพาะบุคคลก่อน”
- ความสำคัญของการปรับให้เหมาะกับผู้ใช้แต่ละคน
- การที่คนนับพันล้านคุยกับสมองเดียวกันเป็นเรื่องแปลก
- ผู้ใช้แต่ละคนต้องการให้ AI แสดงพฤติกรรมต่างกันมาก
- ChatGPT จะพัฒนาไปในทิศทางที่สัมภาษณ์ผู้ใช้ เรียนรู้ความชอบ และปรับตัวให้อัตโนมัติ
โครงสร้างพื้นฐาน ความร่วมมือ และพลังงาน
- OpenAI กำลังผลักดันการขยายโครงสร้างพื้นฐานขนาดใหญ่ร่วมกับ AMD·NVIDIA·Oracle และพันธมิตรอื่น ๆ
- เหตุผลการมีอยู่ของ OpenAI คือการสร้าง AGI ดังนั้นงานวิจัยจึงมีความสำคัญสูงสุด ทำให้ จัดสรร GPU ให้งานวิจัยก่อนผลิตภัณฑ์
- จะยกเว้นเฉพาะกรณีพิเศษ เช่น ตอนที่ฟีเจอร์ใหม่แพร่กระจายแบบไวรัล
- เป้าหมายของการสร้างความจุขนาดใหญ่คือเพื่อไม่ต้องตัดสินใจแบบเจ็บปวดเช่นนี้อีก
- วัฒนธรรมการวิจัยที่ดีคล้ายกับการบริหารบริษัทลงทุนระยะเริ่มต้น
- คือการลงเดิมพันกับผู้ก่อตั้งและให้การสนับสนุนพวกเขา
- เป็นวิธีคิดที่ต่างจากการบริหารบริษัทผลิตภัณฑ์
- ในเรื่องพลังงาน เขาเน้นว่า “พลังงานที่อุดมสมบูรณ์และราคาถูกคือหัวใจสำคัญในการยกระดับคุณภาพชีวิตของมนุษย์”
- ระยะสั้นคาดว่า ก๊าซธรรมชาติ จะมีบทบาทหลัก และระยะยาว พลังงานแสงอาทิตย์+ระบบกักเก็บ และนิวเคลียร์ขั้นสูง (SMR·ฟิวชัน) จะกลายเป็นกระแสหลัก
- เขาอธิบายว่าการผ่อนคลายกฎระเบียบนิวเคลียร์เป็นสิ่งจำเป็น และหากต้นทุนลดลงอย่างมาก การเปลี่ยนผ่านก็จะเกิดขึ้นเร็วมาก
การประเมินความสามารถของโมเดล
- คะแนน benchmark แบบคงที่กำลังสูญเสียความน่าสนใจ และถูก game อย่างหนัก
- การค้นพบทางวิทยาศาสตร์จะกลายเป็นตัวชี้วัดการประเมินที่ใช้ได้ในระยะยาว
- รายได้ก็ถูกมองเป็นตัวชี้วัดการประเมินที่น่าสนใจ เช่นกัน
มุมมองต่อความปลอดภัยของ AI และกฎระเบียบ
- การที่เทคโนโลยียังไม่ได้สร้างความเสี่ยงขนาดใหญ่ที่น่ากลัวจริง ๆ ไม่ได้หมายความว่าในอนาคตจะไม่เกิดขึ้น
- คาดว่าจะมีบางช่วงเวลาที่แปลกประหลาดหรือน่ากลัวจริง ๆ
- เช่นเดียวกับเทคโนโลยีก่อนหน้า ย่อมจะมีบางสิ่งที่เลวร้ายเกิดขึ้นจริง
- เขายอมรับว่า “เทคโนโลยี AI จะต้องเผชิญช่วงเวลาที่อันตรายอย่างหลีกเลี่ยงไม่ได้” และจำเป็นต้องสร้างกลไกความปลอดภัยทางสังคม
- เนื่องจาก กฎระเบียบส่วนใหญ่อาจมีข้อเสียมากมาย เขาจึงเสนอให้ ใช้กฎระเบียบอย่างจำกัดเฉพาะกับโมเดลที่มีสมรรถนะสูงมากเป็นพิเศษเท่านั้น
- เมื่อโมเดลมีความสามารถเหนือมนุษย์อย่างสุดขั้วจริง ๆ โมเดลเหล่านั้นและมีเพียงโมเดลเหล่านั้นเท่านั้นที่ควรได้รับการทดสอบความปลอดภัยอย่างเข้มงวดมาก
- เขาหวังว่าจะไม่ไปวางภาระด้านกฎระเบียบบนสิ่งดี ๆ ทั้งหมดที่โมเดลซึ่งมีความสามารถต่ำกว่ายังทำได้
- การกวาดล้างแบบยุโรปจะเลวร้ายมาก
- เพราะจีนจะไม่ได้มีข้อจำกัดเช่นนั้น และหากสหรัฐฯ ตามหลังใน AI จะเป็นอันตรายต่อโลกอย่างมาก
- กฎระเบียบที่มากเกินไปอาจยิ่งเพิ่มความเสี่ยงระดับโลก
ลิขสิทธิ์ โอเพนซอร์ส และอนาคตของคอนเทนต์
- สำหรับข้อมูลฝึก เขาคาดว่า “การเรียนรู้ถือเป็น fair use” มีแนวโน้มจะถูกยอมรับ
- แต่การสร้างคอนเทนต์ที่อิงกับตัวละคร สไตล์ หรือ IP จะต้องมีโมเดลธุรกิจแบบใหม่
- คล้ายกับที่นักเขียนมนุษย์อ่านนิยายแล้วได้รับแรงบันดาลใจได้ แต่ไม่สามารถคัดลอกนิยายได้
- ผู้ถือสิทธิบางรายถึงกับร้องเรียนว่า “ตัวละครของฉันออกมาไม่มากพอ” สะท้อนว่า โครงสร้างความร่วมมือด้านคอนเทนต์กำลังถูกจัดระเบียบใหม่
- โมเดลโอเพนซอร์ส gpt-oss ได้รับการประเมินในเชิงบวก และยังมีการกล่าวถึง ความจำเป็นในการสกัดกั้นการครอบงำของโมเดลจากจีน
การบรรจบกันของพลังงานและ AI
- สองความสนใจหลักอย่าง AI และพลังงานกำลังบรรจบกันเป็นสิ่งเดียวกัน
- เมื่อมองย้อนประวัติศาสตร์ สิ่งที่ส่งผลมากที่สุดต่อการยกระดับคุณภาพชีวิตของผู้คนคือพลังงานที่ถูกลงและอุดมสมบูรณ์ขึ้น
- การผลักดันด้านพลังงานให้มากขึ้นอย่างมากจึงเป็นความคิดที่ดี
- ในระยะสั้น ก๊าซธรรมชาติจะเป็นพลังงานฐานโหลดใหม่สุทธิส่วนใหญ่ของสหรัฐฯ
- ในระยะยาว พลังงานแสงอาทิตย์+อุปกรณ์กักเก็บ และพลังงานนิวเคลียร์จะเป็นแหล่งพลังงานหลัก
- รวมถึงนิวเคลียร์ขั้นสูงอย่าง SMR และฟิวชัน
- หากพลังงานนิวเคลียร์มีต้นทุนถูกกว่าทุกอย่างแบบทิ้งขาด การเปลี่ยนผ่านจะเกิดขึ้นอย่างรวดเร็ว
- ในอดีต เมื่อมีการเปลี่ยนไปใช้แหล่งพลังงานที่ถูกกว่ามาก โลกจะขยับตามอย่างรวดเร็วมาก
- พลังงานนิวเคลียร์ควรเป็นรูปแบบพลังงานที่ถูกที่สุดบนโลกหรือที่ใดก็ตาม
การหารายได้และความเชื่อมั่นของผู้ใช้
- ต้นทุนการสร้างวิดีโอของ Sora สูง จึงต้องมีโมเดลหารายได้แบบใหม่
- มีรูปแบบการใช้งานที่ไม่คาดคิด เช่น ผู้คนสร้างมีมตลกของตัวเองและเพื่อนในแชตกลุ่ม
- จำเป็นต้องมีวิธีหารายได้แบบอื่นสำหรับคนที่ใช้งานวันละหลายร้อยครั้ง
- ต้นทุน GPU สูง ทำให้ โมเดลจ่ายตามการสร้าง (pay-per-generation) น่าจะจำเป็น
- สมมติฐานแบบเดิมเกี่ยวกับการสร้างคอนเทนต์กำลังเปลี่ยนไป
- โมเดลดั้งเดิมคือ 1% สร้างคอนเทนต์, 10% คอมเมนต์, 100% รับชม
- แต่จริง ๆ แล้วมีผู้คนจำนวนมากกว่านั้นที่อยากสร้างคอนเทนต์ เพียงแต่ที่ผ่านมาเป็นเรื่องยาก
- เปิดรับเรื่องโฆษณา แต่หัวใจสำคัญคือการรักษาความเชื่อมั่น
- “ทำได้เท่าที่ไม่ทำลายความเชื่อมั่นของผู้ใช้”
- โฆษณาบน Instagram เป็นตัวอย่างที่ดีของการเพิ่มคุณค่าทางสุทธิ เช่น ทำให้เจอสินค้าที่ไม่เคยรู้จักมาก่อน
- ต้องไม่ทำลายความสัมพันธ์ที่มีความเชื่อใจสูงระหว่าง ChatGPT กับผู้ใช้
- หากมีคนถามว่า “ควรซื้อเครื่องชงกาแฟแบบไหนดี?” แล้วแนะนำสินค้าที่ไม่ใช่ตัวเลือกที่ดีที่สุดเพียงเพราะได้รับค่าตอบแทน ก็จะทำให้ความเชื่อมั่นพังทลาย
ย้อนมอง OpenAI ในช่วงแรก
- OpenAI ในช่วงแรก เน้นงานวิจัยมากกว่าธุรกิจ แต่ในฐานะซีอีโอ สิ่งที่เปลี่ยนแปลงมากที่สุดคือ “การได้เรียนรู้เรื่องการดำเนินงานและความซับซ้อนเชิงจิตวิทยาขององค์กร”
- ช่วงไม่กี่ปีแรกคือช่วงเวลาการทำงานที่สนุกที่สุด ได้บริหารห้องวิจัยร่วมกับคนที่ฉลาดที่สุดและทำงานที่มีความสำคัญทางประวัติศาสตร์
- หลังการเปิดตัว ChatGPT ชีวิตก็เปลี่ยนไปอย่างสิ้นเชิง ผ่านมาเกือบ 3 ปีแล้ว และแม้เวลาจะยิ่งทำให้ทุกอย่างดูบ้าคลั่งขึ้นทีละน้อย แต่ก็เริ่มชิน
- การเปลี่ยนจากนักลงทุนมาเป็นซีอีโอ
- เดิมไม่ได้มีความเหมาะสมตามธรรมชาติในการบริหารบริษัท
- จากความคิดแบบนักลงทุนที่คอยให้คำแนะนำบริษัท กลายมาเข้าใจว่าต้องเป็นคนลงมือบริหารบริษัทจริง ๆ
- เมื่อเวลาผ่านไป เขาได้เรียนรู้อีกมากเกี่ยวกับสิ่งที่จำเป็นในการบริหารกิจการ
คำแนะนำสำหรับอนาคต
> “บริษัทยักษ์ใหญ่รุ่นถัดไปจะไม่ได้เกิดจากการเลียนแบบ OpenAI แต่จะเกิดขึ้นใหม่บนฐานเทคโนโลยีที่ OpenAI สร้างไว้”
> “ความพยายามส่วนใหญ่ในการทำนายอุตสาหกรรมแห่งอนาคตมักผิดพลาด และคำตอบที่แท้จริงมีเพียงการลงมือสร้าง ทดลอง และเรียนรู้ด้วยตัวเอง”
- เรียนรู้ความถ่อมตัวอย่างลึกซึ้ง: การคาดการณ์มักผิดเสมอ
- หากนั่งวิเคราะห์อยู่ข้างสนามแบบ armchair quarterback ก็อาจฟังดูฉลาด แต่สุดท้ายก็แทบไม่ต่างจากสิ่งที่คนอื่นพูด
- การได้มาซึ่งความเชื่อมั่นที่ถูกต้องเป็นเรื่องยากมากจริง ๆ
- วิธีเดียวที่รู้ได้คือการอยู่ลึกในแนวหน้าของการสำรวจไอเดีย
- พูดคุยกับผู้คนจำนวนมาก สร้างสิ่งของ ลองเล่นกับเทคโนโลยี และออกไปอยู่ในโลกจริง
- ความเต็มใจของนักลงทุนที่จะสนับสนุนสิ่งแบบนี้ต่ำจนน่าผิดหวัง
- บริษัทส่วนใหญ่มักแค่ไล่ตามเทรนด์ปัจจุบัน
- เขาหวังว่าผู้คนจะลองทำสิ่งใหม่ ๆ มากขึ้น
วิสัยทัศน์ต่อโลกหลัง AGI
- Altman ให้นิยามว่า “AI คือ แรงขับเคลื่อนหลักของความก้าวหน้าอย่างต่อเนื่องในด้านวิทยาศาสตร์ พลังงาน และเศรษฐกิจโดยรวม”
- AI จะหลงใหลในการวิจัยและสังเกตทุกสิ่งทุกอย่าง : คาดว่าจะสนใจทั้งอัลกอริทึมของมนุษย์โดยรวม
- หาก OpenAI บรรลุภารกิจ AGI ขนาดใหญ่จะมีต้นทุนใกล้ศูนย์หรือแทบฟรี
- แม้การคาดการณ์แบบเฉพาะเจาะจงจะทำได้ยาก แต่เราจำเป็นต้อง ค้นพบมันผ่านการลองเล่นกับเทคโนโลยี การพูดคุยกับผู้คน และการออกไปอยู่ในโลกจริง
- AGI จะไม่ได้แทรกซึมสู่สังคมในรูปแบบการเปลี่ยนแปลงแบบระเบิด แต่จะเป็น กระบวนการวิวัฒน์อย่างต่อเนื่อง และมนุษยชาติกำลังก้าวเข้าสู่ “ยุคแห่งการเรียนรู้ร่วมกันอย่างต่อเนื่อง” ไปพร้อมกับ AI
ยังไม่มีความคิดเห็น