- เจนเซน หวง CEO ของ Nvidia ไปออกรายการพอดแคสต์ All-In และพูดคุยในวงกว้างเกี่ยวกับ การเข้าซื้อ Groq, การระเบิดของงาน inference, Physical AI, agent computing, วิกฤต PR ของอุตสาหกรรม AI และอีกหลายประเด็น
- Nvidia ได้วิวัฒน์จากบริษัท GPU ไปเป็น บริษัท AI factory และเพิ่ม Groq LPU, BlueField, CPU และโปรเซสเซอร์เครือข่ายเข้าในสถาปัตยกรรมคอมพิวติ้งแบบ heterogeneous สำหรับการประมวลผลเอเจนต์
- เขาประเมิน Open Claw ว่าเป็น พิมพ์เขียวของระบบปฏิบัติการสำหรับ AI computing ยุคใหม่ และนิยามว่าเป็นคอมพิวเตอร์ AI ส่วนบุคคลเครื่องแรกที่มีระบบหน่วยความจำ, skill, scheduling และ IO subsystem
- Physical AI เป็น ตลาดมูลค่า 50 ล้านล้านดอลลาร์ ที่อุตสาหกรรมเทคโนโลยีได้เข้ามาจัดการเป็นครั้งแรก และกำลังเติบโตแบบทวีคูณจากธุรกิจที่ปัจจุบันมีขนาดใกล้เคียง 1 หมื่นล้านดอลลาร์ต่อปี
- เขาเตือนเรื่อง วิกฤต PR ของอุตสาหกรรม AI ว่าคำพูดแบบสุดโต่งหรือแนวหายนะจากผู้นำเทคโนโลยีกำลังส่งผลลบต่อผู้กำหนดนโยบายและสาธารณะ และเรียกร้องให้มี การสื่อสารที่ยับยั้งชั่งใจและสมดุลมากขึ้น
การเข้าซื้อ Groq และการระเบิดของ inference
- เทคโนโลยีหลักของระบบปฏิบัติการ AI factory Dynamo ที่เขาเปิดตัวเมื่อ 2 ปีกว่าก่อนคือ disaggregated inference ซึ่งเป็นวิธีแยก pipeline ของงาน inference ออกไปให้รันบน GPU ที่ต่างกัน
- แนวคิด disaggregated computing นี้นำไปสู่การเข้าซื้อ Mellanox และปัจจุบันระบบคอมพิวติ้งของ Nvidia กระจายอยู่ทั่วทั้ง GPU, CPU, สวิตช์, สวิตช์ scale-up/scale-out และโปรเซสเซอร์เครือข่าย
- จากนั้นจึงเพิ่ม Groq เข้าไปเพื่อวาง workload ที่เหมาะสมลงบนชิปที่เหมาะสม
- เมื่อโลกเปลี่ยนเข้าสู่ยุคของการประมวลผลเอเจนต์ ความต้องการด้าน working memory, long-term memory, การใช้เครื่องมือ และ storage ก็เพิ่มขึ้นอย่างมาก
- ทั้งโมเดลขนาดใหญ่ โมเดลขนาดเล็ก diffusion model และ autoregressive model ต่างอยู่ร่วมกันในดาต้าเซ็นเตอร์เดียวกัน
- Vera Rubin คือระบบที่ออกแบบมาเพื่อรัน workload ที่หลากหลายอย่างยิ่งเหล่านี้
- จากเดิมที่เป็นคอนฟิก 1 แร็ก ได้เพิ่มอีก 4 แร็ก ทำให้ TAM ของ Nvidia เพิ่มขึ้นราว 33~50%
- ส่วนที่เพิ่มมาประกอบด้วยโปรเซสเซอร์ด้าน storage (BlueField), โปรเซสเซอร์ของ Groq, CPU และโปรเซสเซอร์เครือข่าย
- อย่านำราคาดาต้าเซ็นเตอร์ไปเทียบตรงๆ กับต้นทุนต่อโทเค็น
- โรงงานมูลค่า 5 หมื่นล้านดอลลาร์ สามารถผลิตโทเค็นที่มีต้นทุนต่ำที่สุดได้ เพราะมี ประสิทธิภาพ throughput สูงกว่า 10 เท่า
- จาก 2 หมื่นล้านดอลลาร์นั้นเป็นค่าที่ดิน พลังงาน และโครงสร้างอาคาร ขณะที่ storage, networking, CPU, server และ cooling ยังจำเป็นต้องมีอยู่แล้ว
- ความต่างระหว่างราคา GPU ที่ 1x กับ 0.5x จึงเป็นเพียงระดับ 5 หมื่นล้านเทียบกับ 4 หมื่นล้าน ซึ่งไม่ได้มากเมื่อเทียบกับ throughput ที่สูงกว่า 10 เท่า
- ปีที่แล้วเขาบอกว่า inference จะเพิ่มขึ้น 1,000 เท่า แต่ตอนนี้มองว่าจะไปถึงระดับ 1 ล้านเท่า หรือ 1 พันล้านเท่า
- ในเวลานั้นโลกยังโฟกัสกับ pre-scaling และ training แต่ตอนนี้ inference เพิ่มขึ้นแบบระเบิดจนอยู่ในภาวะ inference constrained
การตัดสินใจของบริษัทที่มีมูลค่าสูงที่สุดในโลก
- หน้าที่ของ CEO คือ กำหนดวิสัยทัศน์และกลยุทธ์ และใช้ข้อมูลจากนักวิทยาการคอมพิวเตอร์และวิศวกรชั้นยอดเพื่อกำหนดอนาคต
- เกณฑ์หลักคือ งานนั้น ยากแบบบ้าคลั่งหรือไม่, เป็นสิ่งที่ไม่เคยมีใครทำสำเร็จมาก่อนหรือไม่, และสอดคล้องกับ ซูเปอร์พาวเวอร์เฉพาะตัว ของ Nvidia หรือไม่
- ถ้าเป็นเรื่องง่ายก็จะมีคู่แข่งมาก จึงควรหลีกเลี่ยง
- งานที่ยากมากย่อมมาพร้อมความเจ็บปวด จึงต้อง สนุกกับกระบวนการนั้นให้ได้
ตลาด Physical AI มูลค่า 50 ล้านล้านดอลลาร์ และ Open Claw
- Physical AI คือโอกาสครั้งแรกที่อุตสาหกรรมเทคโนโลยีจะเข้าไปแตะอุตสาหกรรมมูลค่า 50 ล้านล้านดอลลาร์
- เริ่มต้นเมื่อ 10 ปีก่อน และปัจจุบันกำลังเติบโตแบบทวีคูณจนเข้าใกล้ รายได้ราว 1 หมื่นล้านดอลลาร์ต่อปี
- แบ่งระบบคอมพิวติ้งออกเป็น 3 แบบ
- แบบแรก: คอมพิวเตอร์สำหรับฝึกและพัฒนาโมเดล AI
- แบบที่สอง: คอมพิวเตอร์สำหรับการประเมินผล — ใช้ประเมินหุ่นยนต์และรถยนต์ในสภาพแวดล้อมเสมือนที่เป็นไปตามกฎฟิสิกส์ (Omniverse)
- แบบที่สาม: คอมพิวเตอร์หุ่นยนต์ที่ขอบเครือข่าย — เช่น รถยนต์ไร้คนขับ หุ่นยนต์ และตุ๊กตาหมี
- Nvidia กำลังเปลี่ยนสถานีฐานโทรคมนาคมให้เป็น ส่วนหนึ่งของโครงสร้างพื้นฐาน AI
- อุตสาหกรรมโทรคมนาคมมูลค่า 2 ล้านล้านดอลลาร์จะกลายเป็นส่วนขยายของโครงสร้างพื้นฐาน AI
- ดิจิทัลชีววิทยา กำลังเข้าใกล้ช่วง ChatGPT moment
- ภายใน 2~5 ปี เราจะสามารถเข้าใจการแสดงออกและพลวัตของยีน โปรตีน และเซลล์ได้
- ภายใน 5 ปี ดิจิทัลชีววิทยาจะไปถึงจุดเปลี่ยนสำคัญในอุตสาหกรรมเฮลท์แคร์
- Open Claw คือจุดเปลี่ยนลำดับที่สามในช่วง 2 ปีที่ผ่านมา
- จุดแรก: ChatGPT — ดึง generative AI เข้าสู่การรับรู้ของคนทั่วไป
- จุดที่สอง: o1/o3 — ทำให้โมเดลเศรษฐกิจเปลี่ยนผ่านด้วย reasoning และข้อมูลที่มีหลักฐานรองรับ
- จุดที่สาม: Claude Code — เป็นระบบเอเจนต์ที่ใช้งานได้จริงระบบแรก แต่ยังจำกัดในระดับองค์กร ขณะที่ Open Claw ทำให้แนวคิดเรื่อง AI agent ติดอยู่ในความรับรู้ของสาธารณะ
- โครงสร้างโมเดลการคอมพิวต์ของ Open Claw
- ระบบหน่วยความจำ: scratchpad (หน่วยความจำระยะสั้น), file system
- skill: รันแอปพลิเคชันหลายประเภทผ่าน API
- การจัดการทรัพยากรและ scheduling: cron job, การ spawn agent, การแยก task
- IO subsystem: input/output, การเชื่อมต่อ WhatsApp เป็นต้น
- องค์ประกอบทั้ง 4 นี้คือสิ่งที่นิยาม คอมพิวเตอร์ ในระดับพื้นฐาน → จึงเป็น คอมพิวเตอร์ AI ส่วนบุคคลแบบโอเพนซอร์สเครื่องแรก
- การมีส่วนร่วมด้าน governance และ security ของซอฟต์แวร์เอเจนต์
- มีนโยบายไม่อนุญาตทั้งสามอย่างพร้อมกัน ได้แก่ การเข้าถึงข้อมูลอ่อนไหว การรันโค้ด และการสื่อสารภายนอก
- Peter Steinberger และวิศวกรของ Nvidia มีส่วนช่วยเสริมความปลอดภัย
วิกฤต PR ของ AI และปัญหาการสื่อสารของ Anthropic
- AI คือ ซอฟต์แวร์คอมพิวเตอร์ ไม่ใช่สิ่งมีชีวิต ไม่ใช่มนุษย์ต่างดาว และไม่มีจิตสำนึก
- คำพูดที่ว่า “เราไม่เข้าใจมันเลย” ไม่เป็นความจริง เพราะเรามีความเข้าใจเกี่ยวกับเทคโนโลยีนี้อยู่มาก
- ต้อง ให้ข้อมูล กับผู้กำหนดนโยบายอย่างต่อเนื่อง และต้องไม่ปล่อยให้ แนวคิดหายนะและความสุดโต่ง ส่งอิทธิพลต่อการตัดสินใจเชิงนโยบาย
- ในขณะเดียวกัน เทคโนโลยีเคลื่อนไหวเร็วมาก จึง ไม่ควรให้นโยบายวิ่งนำหน้าเทคโนโลยีมากเกินไป
- ความกังวลด้านความมั่นคงแห่งชาติสูงสุด ของสหรัฐคือ ขณะที่ประเทศอื่นกำลังนำ AI ไปใช้ สหรัฐกลับ โกรธ กลัว หรือหวาดระแวง จนไม่สามารถนำมันมาใช้ได้
- เกี่ยวกับ Anthropic: เขามองว่าเทคโนโลยีดีมาก และชื่นชมการให้ความสำคัญกับ security และ safety
- แต่แม้การ เตือนถึงความเสี่ยง จะเป็นเรื่องดี การ ทำให้คนหวาดกลัว กลับไม่ดีเท่าไร
- หากพูดอะไรที่สุดโต่งและหายนะ โดยไม่มีหลักฐาน ก็อาจเป็นอันตรายมากกว่าที่หลายคนคิด
- ในฐานะผู้นำเทคโนโลยี ต้องตระหนักถึง น้ำหนักของคำพูด และควร ยับยั้งชั่งใจ สุขุม สมดุล และรอบคอบ มากกว่านี้
- ความนิยมของ AI ในสหรัฐอยู่ที่เพียง 17% และเสี่ยงจะเดินซ้ำรอยอุตสาหกรรมนิวเคลียร์ที่ถูก shutdown
- ขณะที่จีนกำลังก่อสร้างเครื่องปฏิกรณ์นิวเคลียร์ฟิชชัน 100 แห่ง สหรัฐมีอยู่ 0 แห่ง
- ตอนนี้ยังมีเสียงเรียกร้องเรื่อง moratorium สำหรับดาต้าเซ็นเตอร์ด้วย
ความสามารถในการสร้างรายได้ การจัดสรรโทเค็นให้พนักงาน และอนาคตของเอเจนต์
- อันดับการใช้งานโมเดล AI: อันดับ 1 OpenAI, อันดับ 2 โอเพนซอร์ส (ทิ้งห่างมาก), อันดับ 3 Anthropic
- ความต้องการคอมพิวต์เพิ่มขึ้น
- จาก generative → reasoning: ประมาณ 100 เท่า
- จาก reasoning → agent: ประมาณ 100 เท่า
- ภายใน 2 ปี คอมพิวต์เพิ่มขึ้น 10,000 เท่า
- ผู้คนยอมจ่ายเงินเพื่อข้อมูล แต่ ยอมจ่ายมากกว่าสำหรับงาน (work)
- ระบบเอเจนต์ทำงานแทนได้ → การใช้งานตอนนี้เพิ่มขึ้นราว 100 เท่า ทั้งที่การสเกลยังแทบไม่เริ่มต้น
- จากพนักงาน Nvidia 43,000 คน มีประมาณ 38,000 คนเป็นวิศวกร
- ถ้าวิศวกรเงินเดือน 500,000 ดอลลาร์ใช้โทเค็นเพียง 5,000 ดอลลาร์ต่อปี นั่นคือปัญหาใหญ่
- เขาคาดหวังว่าควรใช้โทเค็นอย่างน้อย 250,000 ดอลลาร์ ขึ้นไป
- มันก็เหมือนนักออกแบบชิปที่บอกว่า “ฉันจะใช้แค่กระดาษกับดินสอ ไม่ต้องใช้เครื่องมือ CAD”
- กรณีของ Auto Research
- งานวิจัยที่ทำบนเดสก์ท็อปใน 30 นาที โดยทั่วไปมีระดับเทียบเท่า วิทยานิพนธ์ปริญญาเอกที่ใช้เวลา 7 ปี
- ดาวน์โหลดจาก GitHub แล้วรันในเครื่องได้ พร้อมผลลัพธ์ระดับวารสารวิทยาศาสตร์
- เป็นเครื่องมือที่มีโค้ด 600 บรรทัด และถูกปล่อยออกมาในช่วงสุดสัปดาห์
- รูปแบบการทำงานในอนาคต: แทนที่จะเขียนโค้ดเอง จะหันไป เขียนไอเดีย สถาปัตยกรรม และสเปก จัดทีม และกำหนดเกณฑ์การประเมิน
- วิศวกรทุกคนจะมี เอเจนต์ 100 ตัว
อนาคตของซอฟต์แวร์องค์กร
- เขาโต้แย้งมุมมองที่ว่าอุตสาหกรรมซอฟต์แวร์ Enterprise IT จะถูกทำลาย
- ซอฟต์แวร์องค์กรถูกจำกัดมานานด้วย จำนวนคนและจำนวนที่นั่งใช้งาน (butts and seats)
- ในไม่ช้า จะมี เอเจนต์มากขึ้น 100 เท่า ที่ใช้เครื่องมือเดิมอย่าง SQL, vector database, Blender, Photoshop เป็นต้น
- เครื่องมือเดิมเหล่านี้ยังทำงานได้ดี และเป็นช่องทางให้ผลลัพธ์สุดท้ายถูก แสดงออกมาในรูปแบบที่ผู้ใช้ควบคุมได้
โอเพนซอร์ส การขยายตัวทั่วโลก และซัพพลายเชนของอิหร่าน/ไต้หวัน
- โมเดลคือ เทคโนโลยี ไม่ใช่ผลิตภัณฑ์ และไม่ใช่บริการ
- ทั้งโมเดล proprietary และโมเดลโอเพนซอร์ส ต่างก็จำเป็นในระดับพื้นฐาน (ไม่ใช่ A or B แต่เป็น A and B)
- ผู้บริโภคทั่วไปชอบปัญญาเอนกประสงค์ในเลเยอร์แนวนอนอย่าง ChatGPT, Claude, Gemini เป็นต้น
- ความเชี่ยวชาญเชิงโดเมนและการปรับแต่งเฉพาะอุตสาหกรรมจะเกิดขึ้นได้ เฉพาะบนโมเดลแบบเปิด
- โมเดลโอเพนซอร์ส เข้าใกล้ frontier มากแล้ว และแม้จะไปถึง frontier โมเดลแบบบริการก็ยังจะรุ่งเรืองต่อไป
- สถานะของ การขยายตัวทั่วโลก
- กฎการขยายตัวในยุค Biden เป็นนโยบาย การขยาย AI ที่ต่อต้านอเมริกา
- ประธานาธิบดี Trump ต้องการให้อุตสาหกรรมเทคโนโลยีสหรัฐเป็นผู้นำโลกและผลักดันการขยายเทคโนโลยี
- Nvidia เคย ยอมทิ้งส่วนแบ่งตลาด 95% ในจีนซึ่งเป็นตลาดใหญ่อันดับ 2 ของโลก และตอนนี้เหลือ 0%
- ตอนนี้บริษัทได้รับใบอนุญาตที่ได้รับอนุมัติจาก Secretary Lutnik แล้ว และกำลังได้รับคำสั่งซื้อจากบริษัทจีนพร้อมเดินเครื่องซัพพลายเชนอีกครั้ง
- มุมมองด้าน ความมั่นคงแห่งชาติ
- หากควบคุมมอเตอร์ขนาดเล็ก แร่หายาก เครือข่ายสื่อสาร และพลังงานยั่งยืนไม่ได้ ความมั่นคงของชาติก็จะอ่อนแอลง
- อุตสาหกรรม AI ต้องไม่ลงเอยเหมือนโซลาร์ แร่หายาก แม่เหล็ก มอเตอร์ และโทรคมนาคม
- เป็นเรื่องพึงประสงค์ที่เทคโนโลยีสแตกของสหรัฐ (ตั้งแต่ชิป ระบบคอมพิวต์ ไปจนถึงแพลตฟอร์ม) จะครอง 90% ของโลก
- ไต้หวัน: สหรัฐต้องเร่ง reindustrialization ให้เร็วที่สุด และทำให้มั่นใจว่ามี ความเป็นหุ้นส่วนเชิงกลยุทธ์และมิตรภาพ กับซัพพลายเชนของไต้หวัน เพื่อเร่งการผลิตใน Arizona, Texas และ California
- ยังต้อง กระจายซัพพลายเชน ไปยังเกาหลี ญี่ปุ่น และยุโรป
- ระหว่างสร้างความหลากหลายและความยืดหยุ่น จำเป็นต้องมี ความอดทนและการยับยั้งชั่งใจ
- ฮีเลียม: อาจเป็นปัญหาได้ แต่มีแนวโน้มว่าซัพพลายเชนจะมี buffer เพียงพอ
แพลตฟอร์มรถขับเคลื่อนอัตโนมัติและการแข่งขัน
- “ทุกสิ่งที่เคลื่อนไหวได้ สักวันหนึ่งจะเป็นอัตโนมัติทั้งหมดหรือบางส่วน”
- Nvidia ไม่ได้สร้างรถไร้คนขับเอง แต่ ช่วยให้บริษัทรถยนต์ทุกแห่งสร้างได้
- สร้างครบทั้ง 3 ส่วน: คอมพิวเตอร์ฝึก, คอมพิวเตอร์จำลอง/ประเมิน และคอมพิวเตอร์ในรถ
- เป็น รถขับเคลื่อนอัตโนมัติแบบ reasoning รุ่นแรกของโลก — ระบบ Alpommyo ที่สำรวจสถานการณ์ซับซ้อนด้วยการแยกเป็นสถานการณ์ย่อยที่ง่ายกว่า
- Tesla ซื้อเฉพาะคอมพิวเตอร์ฝึก ขณะที่บริษัทอื่นใช้ทั้งสแตก เป็น โมเดลความร่วมมือที่ยืดหยุ่น
- ในสถานการณ์ที่ลูกค้ากลายเป็นคู่แข่ง เช่น Google TPU และ Amazon Inferentia/Tranium
- ความมั่นใจของ Nvidia คือ ตราบใดที่ยังแข่งขันด้วยเทคโนโลยีที่ดีที่สุดและวิ่งให้เร็วพอ การซื้อจาก Nvidia จะคุ้มค่าที่สุดในเชิงเศรษฐศาสตร์
- เป็น สถาปัตยกรรมเดียวที่มีอยู่ในทุกคลาวด์ — จากคลาวด์ไปสู่ออนพรีเมส ในรถ ทุกภูมิภาค ไปจนถึงอวกาศ
- ราว 40% ของธุรกิจ ไม่สามารถถูกใช้งานโดยลูกค้าได้ หากไม่มีฟูลสแตกที่สร้าง AI factory ได้ทั้งชุด
- เหตุผลที่ ส่วนแบ่งตลาดเพิ่มขึ้น
- Anthropic ย้ายมาที่ Nvidia, Meta ก็ย้ายมาที่ Nvidia และการเติบโตของโมเดลเปิดก็ล้วนอยู่บน Nvidia
- การเติบโตจากภาคธุรกิจ อุตสาหกรรม และ edge นอกเหนือจากคลาวด์
- AWS ประกาศจะซื้อชิป 1 ล้านตัว ในช่วงไม่กี่ปีข้างหน้า
- ต่อคำทำนายของนักวิเคราะห์เรื่อง การชะลอตัวของการเติบโต (ปีหน้า 30%, ปีถัดไป 20%, ปี 2029 เหลือ 7%)
- เขามองว่านั่นเป็นเพราะ ยังไม่เข้าใจขนาดและขอบเขตของ AI
- คนส่วนใหญ่ยังคิดว่า AI มีอยู่แค่ใน 5 hyperscaler รายใหญ่ แต่จริงๆ แล้วกว้างขวางกว่านั้นมาก
ดาต้าเซ็นเตอร์ในอวกาศ AI เฮลท์แคร์ และหุ่นยนต์
- ดาต้าเซ็นเตอร์ในอวกาศ
- Nvidia เข้าไปอยู่ในอวกาศแล้ว — CUDA ที่ผ่านการทำ radiation hardening ถูกใช้ประมวลผลภาพและ AI image processing บนดาวเทียมทั่วโลกอยู่แล้ว
- แทนที่จะส่งข้อมูลทั้งหมดกลับมายังโลก การประมวลผลภาพ ในอวกาศโดยตรง มีเหตุผลมากกว่า
- ในอวกาศมีพลังงานอุดมสมบูรณ์ แต่ไม่สามารถใช้การนำความร้อนหรือการพาความร้อนเพื่อระบายความร้อนได้ → ทำได้แค่การแผ่รังสี จึงต้องใช้พื้นที่ผิวขนาดใหญ่มาก
- คาดว่าจะต้องใช้เวลาหลายปีในการสำรวจสถาปัตยกรรมดาต้าเซ็นเตอร์ในอวกาศ
- AI เฮลท์แคร์ 3 ด้าน
- AI biology: ใช้ AI แทนและคาดการณ์พฤติกรรมทางชีววิทยา → การค้นหายา
- AI agent: เช่น ตัวช่วยด้านการวินิจฉัย — มีตัวอย่างอย่าง Open Evidence และ Hypocratic
- Physical AI: AI ที่เข้าใจกฎฟิสิกส์ → เช่น หุ่นยนต์ผ่าตัด
- ในอนาคต เครื่องมือทุกชิ้นในโรงพยาบาลอย่างอัลตราซาวนด์และ CT จะ กลายเป็นเอเจนต์ — มี Open Claw เวอร์ชันปลอดภัยฝังอยู่ในทุกอุปกรณ์
- Robotics
- สหรัฐเป็นผู้คิดค้นอุตสาหกรรมนี้เกือบทั้งหมด แต่กลับ หมดแรงไปประมาณ 5 ปีก่อนที่เทคโนโลยีหลัก (สมอง = AI) จะมาถึง
- จากการพิสูจน์การมีอยู่จริงที่ทำงานได้ ไปสู่ผลิตภัณฑ์ที่สมเหตุสมผล เทคโนโลยีมักใช้เวลาไม่เกิน 2~3 ไซเคิล (3~5 ปี)
- จีนเก่งที่สุดในโลกด้าน ไมโครอิเล็กทรอนิกส์ มอเตอร์ แร่หายาก และแม่เหล็ก → ทำให้อุตสาหกรรมหุ่นยนต์โลกพึ่งพาระบบนิเวศและซัพพลายเชนของจีนอย่างมาก
- หุ่นยนต์จะทำให้คนสามารถทำสิ่งที่ทำคนเดียวไม่ได้ และจะเป็น ตัวปลดล็อกสูงสุดของ mobility ทางเศรษฐกิจและความมั่งคั่ง
- ตอนนี้สหรัฐขาดแคลนแรงงาน หลายล้านคน จึงต้องการ robotics อย่างมาก
- หุ่นยนต์ยังเป็นกุญแจสำคัญของ virtual presence ผ่านหุ่นยนต์ การเคลื่อนที่ด้วยความเร็วแสง และการตั้งอาณานิคมบนดวงจันทร์กับดาวอังคาร
ศักยภาพรายได้ของ OpenAI/Anthropic และ moat ในยุค AI
- Dario Amodei คาดว่าภายในปี 2027~28 รายได้ AI ที่ไม่รวมโครงสร้างพื้นฐานจะอยู่ที่ระดับ หลายแสนล้านดอลลาร์ และภายในปี 2030 จะถึง 1 ล้านล้านดอลลาร์
- Jensen มองว่านี่เป็นตัวเลขที่ อนุรักษ์นิยมมาก และคาดว่า Anthropic จะทำได้ดีกว่านั้นมาก
- ส่วนที่ยังไม่ถูกนับรวมคือ บริษัทซอฟต์แวร์องค์กรทุกแห่งจะกลายเป็นผู้ขายต่อมูลค่าเพิ่มของโทเค็นจาก Anthropic และ OpenAI
- ช่องทาง go-to-market มีแนวโน้มจะ ขยายแบบลอการิทึม
- moat ในยุค AI คือ ความเชี่ยวชาญเชิงลึก (deep specialization)
- โมเดลทั่วไปจะเชื่อมเข้ากับระบบเอเจนต์ และหลายโมเดลจะเป็น sub-agent เฉพาะทาง ที่องค์กรฝึกเอง
- ข้อความถึงผู้ประกอบการคือ: ต้องรู้จัก vertical ของตัวเองลึกกว่าใคร และเมื่อเครื่องมือพัฒนาขึ้นก็ให้ใส่ความรู้นั้นลงไป
- ยิ่งเชื่อมเอเจนต์เข้ากับลูกค้าได้เร็วเท่าไร flywheel ก็ยิ่งทำงานและทำให้เอเจนต์ดีขึ้น
- แทนที่จะเป็นแพลตฟอร์มแนวนอนแบบทุกวันนี้ นี่คือโอกาสที่บริษัทแพลตฟอร์มจะกลายเป็น ผู้เชี่ยวชาญและผู้เชี่ยวชาญโดเมนแนวตั้ง
คำแนะนำสำหรับคนรุ่นใหม่ในยุค AI
- เขาแนะนำให้เรียน วิทยาศาสตร์เชิงลึก คณิตศาสตร์เชิงลึก และทักษะภาษา
- เพราะภาษาคือภาษาการเขียนโปรแกรมของ AI ดังนั้น คนจบวรรณคดีอังกฤษอาจประสบความสำเร็จที่สุดก็ได้
- ไม่ว่าจะได้รับการศึกษาแบบใด ก็ต้องกลายเป็น ผู้เชี่ยวชาญด้านการใช้ AI อย่างลึกซึ้ง
- การไม่กำหนดมากเกินไป (overprescribe) และเปิดพื้นที่ให้ AI สร้างสรรค์นวัตกรรม พร้อมทั้งพามันไปสู่ผลลัพธ์ที่ต้องการ คือ ศิลปะอย่างหนึ่ง
- กรณีของ รังสีแพทย์
- เมื่อ 10 ปีก่อนมีการคาดการณ์ว่า computer vision จะมาแทนรังสีแพทย์ทั้งหมด → ตอนนี้ computer vision ถูกผสานเข้าไป 100% แล้ว
- แต่จำนวนรังสีแพทย์กลับ เพิ่มขึ้น เพราะความต้องการเพิ่มสูงมาก
- การสแกนเร็วขึ้นทำให้ตรวจได้มากขึ้น → รองรับผู้ป่วยได้มากขึ้น → รายได้โรงพยาบาลเพิ่มขึ้น
- งานย่อย (task) ของอาชีพอาจเปลี่ยน แต่ เป้าหมาย (purpose) ของอาชีพยังคงอยู่
- เมื่อ productivity เพิ่มขึ้น ประเทศก็จะ มั่งคั่งขึ้น และสามารถเพิ่มจำนวนครูในห้องเรียน พร้อมมอบ หลักสูตรเฉพาะบุคคล ให้กับนักเรียนทุกคนได้
- การเปลี่ยนผ่านของงานเป็นสิ่งหลีกเลี่ยงไม่ได้ แต่การขับเคลื่อนอัตโนมัติจะทำให้งานขับรถ 10~15 ล้านตำแหน่ง เปลี่ยนไป
- คนขับอาจพัฒนาไปเป็น mobility assistant — ทำงานหลากหลายให้ผู้โดยสารขณะที่รถขับตัวเอง
- คล้ายกับที่ระบบออโตไพลอตของเครื่องบินกลับทำให้มี นักบินมากขึ้น
5 ความคิดเห็น
ตั้งแต่นาที 24:28 เป็นต้นไปน่าประทับใจมากนะ
ลองทำ thought experiment แบบนี้กันดู
สมมติว่ามีวิศวกรซอฟต์แวร์หรือ AI researcher ที่ได้รับเงินเดือนปีละ 500,000 ดอลลาร์ กรณีแบบนี้พบได้บ่อยสำหรับพวกเรา
ปลายปีผมจะถามวิศวกรเงินเดือน 500,000 ดอลลาร์คนนั้นว่า
“ปีนี้คุณใช้ token ไปเท่าไร?”
แต่ถ้าคนนั้นตอบว่า “ใช้ไป 5,000 ดอลลาร์ครับ” ผมนี่อึ้งไปเลยจริงๆ
ถ้าวิศวกรเงินเดือน 500,000 ดอลลาร์คนนั้นยังใช้ token ไม่ถึงอย่างน้อย 250,000 ดอลลาร์ ผมจะมองว่าเป็นเรื่องที่จริงจังมาก
มันไม่ต่างอะไรจากการที่ชิปดีไซเนอร์คนหนึ่งของเราพูดว่า
“ผมจะใช้แค่กระดาษกับดินสอก็พอ คิดว่าคงไม่ต้องใช้ CAD tool”
นี่หมายความว่ามุมมองต่อการมองหาคนเก่งที่สุดกำลังเปลี่ยนไปอย่างสิ้นเชิงแล้ว
มันคล้ายกับสิ่งที่เราได้เรียนรู้ตอนที่ LeBron James เริ่มใช้เงินปีละ 1 ล้านดอลลาร์เพื่อดูแลร่างกายและรักษาสภาพความพร้อมของตัวเองใน NBA
แล้วทำไมเราจะไม่มอบความสามารถระดับเหนือมนุษย์ให้กับแรงงานความรู้ที่ยอดเยี่ยมแบบนี้ล่ะ?
ถ้าอย่างนั้นเมื่อมองไปอีก 2~3 ปีข้างหน้า
บุคลากรระดับท็อปคนหนึ่งของ Nvidia จะทำงานได้มีประสิทธิภาพแค่ไหนกัน?
แล้วจะทำอะไรได้ไกลถึงระดับไหนกันแน่?
อย่างแรกเลย ความคิดที่ว่า “ว้าว นี่ยากเกินไป” จะหายไป
ความคิดที่ว่า “อันนี้ใช้เวลานานเกินไป” ก็จะหายไป
ความคิดที่ว่า “ต้องใช้คนเยอะ” ก็จะหายไป
ใหญ่เกินไป หนักเกินไป ใช้เวลานานเกินไป
ความคิดเหล่านี้จะหายไปทั้งหมด
สุดท้ายสิ่งที่เหลืออยู่คือความคิดสร้างสรรค์
จะเหลือเพียงแค่ว่าคุณจะคิดอะไรออกมาได้บ้าง
ดังนั้นคำถามต่อจากนี้คือ
เราจะทำงานร่วมกับ agent เหล่านี้อย่างไร?
ท้ายที่สุดแล้ว นี่คือวิธีใหม่ของการทำ computer programming
ในอดีตเราเป็นคนเขียนโค้ดเอง
ต่อจากนี้เราจะเขียนไอเดีย เขียน architecture และเขียน specification
เราจะจัดทีม
กำหนดว่าจะประเมินผลลัพธ์ที่ดีและผลลัพธ์ที่แย่อย่างไร
กำหนดว่าอะไรคือผลลัพธ์ที่ยอดเยี่ยม
กำหนดว่าจะ iterative ปรับปรุงร่วมกันอย่างไร
และจะ brainstorm กันอย่างไร
สิ่งที่สำคัญจริงๆ คือเรื่องเหล่านั้น
และในความเห็นของผม
ต่อจากนี้วิศวกรทุกคนจะมี agent อยู่ใต้การดูแล 100 ตัว
เข้าใจว่ามันหมายถึงอะไรอยู่หรอก แต่การประเมินวิศวกรจากจำนวนบรรทัดโค้ดก็เป็นเรื่องโง่มาตั้งแต่แรกอยู่แล้วนะครับ ดูเหมือนว่าการหาเมตริกที่ดีจริง ๆ จะเป็นเรื่องยากมาก
แทนที่จะถามวิศวกรที่มีเงินเดือนปีละ 500,000 ดอลลาร์ว่า "ใช้โทเค็นไปเท่าไหร่?"
เราไม่ควรถามว่า "ปีนี้คุณพัฒนาอะไรไปบ้าง และสิ่งนั้นมีส่วนช่วยกำไรจากการดำเนินงานของบริษัทอย่างไร?" เหรอ?
ประเด็นไม่ใช่การถามว่าใช้โทเคนไปเท่าไร แต่เป็นการถามว่าใช้งานมันได้ดีหรือไม่
การบอกว่าใช้ไปแค่ 5,000 ดอลลาร์ ก็น่าจะมองได้ว่าเป็นเกณฑ์ที่บ่งบอกว่าใช้น้อยเกินไป
มันแทบไม่ต่างจากการพูดว่า
“ผมจะใช้แค่กระดาษกับดินสอก็พอ คิดว่าไม่จำเป็นต้องมีเครื่องมือ CAD”
เลยครับ
ถ้ายกตัวอย่างอีกแบบ ก็อาจคิดได้ประมาณว่า “มีพนักงานที่ใช้ Excel แค่สูตร SUM อยู่ในหมู่พนักงานไหม?”