บทเรียนขมขื่นของผู้ก่อตั้ง AI (Bitter Lesson)

xguru · 2025-02-10T11:06:01+09:00

สรุปรวมบทความชุด 4 ตอนของ Lukas Petersson ผู้ก่อตั้ง Andon Labs สตาร์ตอัปด้าน AI Safety (YC w24) ไว้เป็นเรื่องเดียว ในเชิงประวัติศาสตร์ วงการ AI นั้นแนวทางแบบทั่วไปมักเป็นฝ่ายชนะเสมอ ผู้ก่อตั้งในสายแอปพลิเคชัน AI ปัจจุบันกำลังทำซ้ำความผิดพลาดที่นักวิจัย AI ในอดีตเคยทำ โมเดล AI ที่ดีขึ้นจะทำให้แอปพลิเคชัน AI แบบอเนกประสงค์เป็นไปได้ และในขณะเดียวกันก็จะลดมูลค่าเพิ่มของซอฟต์แวร์ที่เกี่ยวข้องกับโมเดล AI ลง บทที่ 1: ประวัติศาสตร์ซ้ำรอย บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน บทที่ 3: รอยเท้าของประวัติศาสตร์ บทที่ 4: คุณคือพ่อมด บทที่ 1: ประวัติศาสตร์ซ้ำรอย (History Repeats Itself) tl;dr: ความก้าวหน้าของ AI ในช่วงหลังทำให้เกิดผลิตภัณฑ์ใหม่ที่แก้ปัญหาได้หลากหลาย แต่ผลิตภัณฑ์ส่วนใหญ่ยังทำงานอยู่ภายในขีดจำกัดของโมเดลปัจจุบัน และยังไม่สามารถใช้ประโยชน์จากความยืดหยุ่นซึ่งเป็นพลังแท้จริงของ AI ได้ ประวัติศาสตร์ของ AI แสดงให้เห็นซ้ำแล้วซ้ำเล่าว่าแนวทางแบบทั่วไปเป็นฝ่ายชนะเสมอ ซึ่ง Richard Sutton เน้นไว้ใน "The Bitter Lesson" ผู้ก่อตั้ง AI ในปัจจุบันมีแนวโน้มจะทำซ้ำความผิดพลาดแบบเดียวกับที่นักวิจัย AI ในอดีตเคยเผชิญ สรุปบทความของ Richard Sutton: The Bitter Lesson (ฉบับแปลเกาหลี) บทความนี้เสนอข้อเรียนรู้ดังต่อไปนี้: นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์ วิธีนี้ได้ผลในระยะสั้นและให้ความรู้สึกน่าพอใจ แต่ในระยะยาว ความก้าวหน้าจะหยุดชะงัก และยิ่งไปกว่านั้นยังขัดขวางความคืบหน้า ในท้ายที่สุด จุดเปลี่ยนกลับเกิดจากการขยายขนาดของการคำนวณที่ตั้งอยู่บนแนวทางตรงกันข้าม เตือนว่ารูปแบบนี้ถูกพบซ้ำแล้วซ้ำเล่าในการวิจัย AI และจนถึงตอนนี้ก็ยังไม่สิ้นสุด ผลิตภัณฑ์ AI และ The Bitter Lesson โดยทั่วไปผลิตภัณฑ์ AI ประกอบด้วยโมเดล AI และซอฟต์แวร์ที่ล้อมรอบมัน มี 2 วิธีในการปรับปรุงประสิทธิภาพ: งานวิศวกรรมที่ใส่ข้อจำกัดให้ซอฟต์แวร์เพื่อลดข้อผิดพลาด รอจนกว่าโมเดลที่ดีกว่าจะออกมา ยิ่งโมเดลพัฒนาไปมากเท่าไร มูลค่าของงานวิศวกรรมก็ยิ่งลดลง กรณีที่มูลค่าของ prompt engineering ลดลงหลัง OpenAI เปิดตัวโมเดลใหม่ เป็นตัวอย่างที่แสดงเรื่องนี้ ประเภทของข้อจำกัดและผลิตภัณฑ์ AI องค์ประกอบที่เป็นข้อจำกัดของผลิตภัณฑ์ AI สามารถแบ่งได้เป็น 2 ประเภท: ความเฉพาะทาง: ซอฟต์แวร์ที่มุ่งเน้นปัญหาเฉพาะอย่าง (โซลูชันแนวตั้ง) ความเป็นอัตโนมัติ: ความสามารถที่ AI จะลงมือทำงานได้ด้วยตัวเอง จากกรอบนี้สามารถจัดหมวดหมู่ผลิตภัณฑ์ AI ได้ตามความเฉพาะทาง (Vertical vs. Horizontal) และความเป็นอัตโนมัติ (Workflow vs. Agent) Vertical Workflow ระบบที่ทำงานตามลำดับตายตัวเพื่อแก้ปัญหาเฉพาะ Harvey เป็นตัวอย่างเด่น เป็นระบบ workflow ที่ออกแบบมาเพื่อจัดการปัญหาในขอบเขตแคบ เช่น งานด้านกฎหมายเฉพาะทาง Vertical Agent ระบบที่ทำงานได้อย่างอัตโนมัติในขอบเขตงานเฉพาะ และตัดสินใจเองระหว่างกระบวนการทำงาน Devin เป็นตัวอย่างเด่น โดยใช้เครื่องมือและข้อมูลที่จำกัดเพื่อทำงานซ้ำ ๆ และปรับขั้นตอนการทำงานตามความจำเป็น Horizontal Workflow ระบบ workflow แบบทั่วไปที่สามารถแก้ปัญหาได้หลากหลาย ChatGPT เป็นตัวอย่างเด่น โดยตอบสนองต่ออินพุตหลายประเภทตามขั้นตอนที่กำหนดไว้ล่วงหน้า แต่ยังไม่มีความเป็นอัตโนมัติเต็มรูปแบบ Horizontal Agent ระบบอัตโนมัติเต็มรูปแบบที่สามารถจัดการปัญหาได้หลากหลาย Claude computer-use เป็นตัวอย่างเด่น โดยใช้ซอฟต์แวร์มาตรฐานของบริษัทเพื่อทำงานตามคำสั่งของผู้ใช้และแก้ปัญหาในลักษณะคล้ายมนุษย์ ความเชื่อมโยงระหว่าง Vertical Workflow กับ The Bitter Lesson ผลิตภัณฑ์ส่วนใหญ่ที่นำเสนอใน Demo Day จัดอยู่ในรูปแบบ Vertical Workflow เนื่องจากความน่าเชื่อถือของโมเดลปัจจุบันยังไม่เพียงพอ จึงยากที่จะใช้แนวทางอื่น มีแนวโน้มจะจำกัดแม้แต่ปัญหาที่ซับซ้อนให้อยู่ในรูป Vertical Workflow เพื่อให้ได้ประสิทธิภาพที่ยอมรับได้ แม้จะปรับปรุงโซลูชันเหล่านี้ได้ด้วยงานวิศวกรรม แต่ก็มีข้อจำกัด ปัญหาที่โมเดลปัจจุบันยังแก้ไม่ได้ การรอโมเดลที่ก้าวหน้ากว่าน่าจะเป็นกลยุทธ์ที่ดีกว่า ข้อสังเกตของ Leopold Aschenbrenner: เวลาที่ต้องรอโมเดลที่ดีกว่าอาจสั้นกว่าการทำงานวิศวกรรม ความสัมพันธ์ระหว่าง The Bitter Lesson กับผลิตภัณฑ์ AI ปัจจุบัน นักวิจัย AI เคยออกแบบโซลูชันที่อาศัยความรู้เพื่อให้ได้ “ประสิทธิภาพที่ยอมรับได้” แต่ท้ายที่สุดโซลูชันแบบทั่วไปที่ใช้ทรัพยากรคอมพิวต์มากกว่าก็แซงหน้า วิธีพัฒนาผลิตภัณฑ์ AI ในปัจจุบันก็คล้ายกับรูปแบบนี้ การนำข้อสังเกต 4 ข้อของ Bitter Lesson ไปใช้กับประเภทของข้อจำกัด ข้อสังเกตสำคัญ 4 ข้อที่กล่าวถึงใน Bitter Lesson สะท้อนให้เห็นอย่างชัดเจนในข้อจำกัดด้านความเป็นอัตโนมัติและความเฉพาะทางของผลิตภัณฑ์ AI เช่นกัน เมื่ออธิบายแยกตามข้อจำกัดแต่ละประเภท จะได้ดังนี้: ข้อสังเกตข้อแรก: นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์ ข้อจำกัดด้านความเป็นอัตโนมัติ: นักพัฒนาทดลองใช้เอเจนต์อัตโนมัติ แต่ความน่าเชื่อถือยังต่ำ ดังนั้นจึง hardcode ขั้นตอนงานให้อยู่ในรูป workflow เพื่อให้ทำตามกระบวนการเดียวกับที่มนุษย์ใช้แก้ปัญหา ข้อจำกัดด้านความเฉพาะทาง: นักพัฒนาต้องการสร้างระบบวิเคราะห์เอกสารแบบทั่วไป แต่ติดปัญหาเรื่องความน่าเชื่อถือ จึงหันไปโฟกัสที่เอกสารบางประเภท เช่น งบการเงิน และ hardcode metric เฉพาะกับกฎการตรวจสอบลงไป ข้อสังเกตข้อที่สอง: ในระยะสั้น วิธีนี้ได้ผลและทำให้นักวิจัยรู้สึกพอใจ ข้อจำกัดด้านความเป็นอัตโนมัติ: การ hardcode workflow ช่วยเพิ่มความเสถียร ข้อจำกัดด้านความเฉพาะทาง: การทำให้เชี่ยวชาญเฉพาะเอกสารและ metric ช่วงแคบช่วยเพิ่มความแม่นยำ ข้อสังเกตข้อที่สาม: ในระยะยาว ความก้าวหน้าจะชะงักและยิ่งไปกว่านั้นยังกลายเป็นอุปสรรค ข้อจำกัดด้านความเป็นอัตโนมัติ: workflow ที่ hardcode ไว้ไม่สามารถรับมือสถานการณ์ใหม่ได้ จึงนำไปสู่ผลลัพธ์ที่ไม่แม่นยำ ข้อจำกัดด้านความเฉพาะทาง: ระบบที่จัดการได้เฉพาะปัญหาบางอย่าง ไม่สามารถรองรับงานที่เกี่ยวข้อง เช่น เอกสารที่รวมหลายประเภทหรือการวิเคราะห์ผลประกอบการ แต่ละงานจึงต้องมีระบบเฉพาะทางแยกกัน ข้อสังเกตข้อที่สี่: จุดเปลี่ยนเกิดขึ้นจากการขยายทรัพยากรคอมพิวต์ ข้อจำกัดด้านความเป็นอัตโนมัติ: โมเดลรุ่นใหม่สามารถค้นหาแนวทางที่เหมาะสมได้แบบไดนามิก แก้ข้อผิดพลาดได้เมื่อจำเป็น และทำให้เกิดเอเจนต์อัตโนมัติที่เชื่อถือได้ ข้อจำกัดด้านความเฉพาะทาง: โมเดลรุ่นใหม่สามารถเข้าใจเอกสารธุรกิจทั้งหมดได้อย่างครอบคลุมและดึงข้อมูลที่เกี่ยวข้องออกมาได้ ทำให้ไม่จำเป็นต้องมีระบบเฉพาะทางอีกต่อไป ในปัญหาที่ต้องการความเป็นอัตโนมัติ ผลิตภัณฑ์ที่อัตโนมัติมากกว่าจะทำผลงานได้ดีกว่า เมื่อต้องรับมือกับอินพุตที่ซับซ้อนและมีขอบเขตกว้าง ผลิตภัณฑ์ที่เฉพาะทางน้อยกว่าจะให้ผลลัพธ์ดีกว่า สรุปส่งท้าย: AI สตาร์ตอัปกับ The Bitter Lesson บทความนี้เป็นตอนแรกของซีรีส์ 4 ตอนที่สำรวจบทบาทของสตาร์ตอัปในโลก AI โดยเน้นย้ำรูปแบบทางประวัติศาสตร์ที่โมเดล AI ซึ่งอาศัยความรู้เชิงโดเมนถูกแทนที่อย่างต่อเนื่องด้วยโมเดลที่ใช้ทรัพยากรคอมพิวต์ ผลิตภัณฑ์ AI ในปัจจุบันมีลักษณะคล้ายกับรูปแบบนี้อย่างน่าทึ่ง การพัฒนาซอฟต์แวร์เพื่อชดเชยข้อจำกัดของโมเดลปัจจุบัน เป็นกลยุทธ์ที่มีโอกาสล้มเหลวสูง โดยเฉพาะในสถานการณ์ที่โมเดลพัฒนาอย่างรวดเร็ว ข้อสังเกตของ Jarred พาร์ตเนอร์จาก YC: แอป LLM แบบ vertical workflow รุ่นแรก ๆ ถูกแทนที่โดยโมเดล GPT รุ่นถัดไป คำแนะนำของ Sam Altman: สิ่งสำคัญคือการสร้างสตาร์ตอัปที่ไม่กลัวการมาของโมเดลที่ดีกว่า และกลับคาดหวังได้ด้วยซ้ำ ผู้ก่อตั้งจำนวนมากในเลเยอร์แอปพลิเคชัน AI ตื่นเต้นกับการเปิดตัวโมเดลใหม่ แต่สิ่งนี้อาจเป็นสัญญาณอันตราย หากมีโมเดลที่ดีกว่าออกมา อาจทำให้ความได้เปรียบในการแข่งขันในปัจจุบันลดลงอย่างมาก โดยเฉพาะเมื่อมองในแง่ประสิทธิภาพของผลิตภัณฑ์ในการแก้ปัญหาที่ยากขึ้นได้ดีกว่า ความเสี่ยงนี้จะยิ่งชัดเจน บทความถัดไปจะสำรวจอีกมิติหนึ่งคือการยอมรับของตลาด และอภิปรายว่าประสิทธิภาพที่ดีกว่าไม่ได้รับประกันความสำเร็จในตลาดเสมอไป บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน (No Powers) tl;dr: ในประวัติศาสตร์ของ AI แนวทางที่พยายามชดเชยข้อจำกัดของโมเดลด้วยความรู้เฉพาะโดเมน มักถูกแซงในท้ายที่สุดโดยแนวทางที่ใช้ทรัพยากรคอมพิวต์เพื่อทำให้เป็นวิธีการแบบทั่วไป vertical AI เข้าสู่ตลาดก่อนด้วยวิธีเพิ่มความแม่นยำผ่านการกำหนด task flow เฉพาะล่วงหน้าเพื่อชดเชยข้อจำกัดของโมเดลในปัจจุบัน horizontal AI เป็นแนวทางที่ใช้โมเดลอเนกประสงค์อย่าง ChatGPT และพัฒนาต่อเนื่อง ซึ่งมีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าในหลายสาขาทุกครั้งที่โมเดลได้รับการปรับปรุง ในระยะยาว horizontal AI มีแนวโน้มได้เปรียบเหนือ vertical AI ที่มีข้อจำกัดหลายอย่าง เพราะมีทั้งประสิทธิภาพและความยืดหยุ่นสูงกว่า ความยากของปัญหาและเส้นโค้งประสิทธิภาพ Figure 1 เป็นตัวอย่างอย่างง่ายที่แสดงว่า vertical AI เข้าสู่ตลาดก่อน แต่ท้ายที่สุด horizontal AI ที่โมเดลได้รับการปรับปรุงแล้วจะไล่แซงด้านประสิทธิภาพ ในกรณีที่ปัญหามีความยากสูง (Figure 2) vertical AI อาจไปไม่ถึงระดับประสิทธิภาพที่เพียงพอเลย และต้องรอให้ horizontal AI พัฒนาขึ้นก่อนจึงจะเริ่มแก้ปัญหาได้ ปัญหาที่ vertical AI นำไปใช้ได้ในตอนนี้ค่อนข้างเป็น “ปัญหาความยากต่ำ” ดังนั้นแม้จะได้ประโยชน์จากการเข้าตลาดก่อนในหมวดนี้ แต่ความสามารถในการแข่งขันระยะยาวยังไม่แน่นอน แนวคิด “ผู้ร่วมงานทางไกล” ที่ horizontal AI มอบให้ ในอนาคต horizontal AI อาจพัฒนาไปเป็นรูปแบบคล้ายพนักงานทางไกล ที่ได้รับคอมพิวเตอร์และบัญชีผู้ใช้ แล้วสามารถค้นหาและใช้ข้อมูลที่จำเป็นได้ด้วยตนเอง UI ที่ผู้ใช้จำนวนมากคุ้นเคยอยู่แล้ว เช่น ChatGPT อาจค่อย ๆ ถูกเสริมความสามารถ จนเอื้อต่อการนำไปใช้ในองค์กรได้อย่างรวดเร็ว เนื่องจาก horizontal AI สามารถดูดซับความสามารถใหม่ ๆ ได้ทันทีทุกครั้งที่โมเดลพัฒนา จึงรักษาความได้เปรียบในการแข่งขันได้ง่ายกว่า vertical AI กรณีก่อนหน้า: ประสบการณ์กับ AcademicGPT ในช่วง GPT-3.5 ผู้เขียนเปิดตัว AcademicGPT เพื่อก้าวข้ามข้อจำกัดด้านอินพุตยาว แต่เมื่อ GPT-4 รองรับอินพุตยาวเป็นพื้นฐานแล้ว โซลูชันเดิมก็ถูกแทนที่อย่างรวดเร็ว อย่างที่ Jared พาร์ตเนอร์ของ YC กล่าวไว้ว่า “แอป LLM รุ่นแรกส่วนใหญ่แพ้ให้กับโมเดลรุ่นถัดไป” vertical AI ที่รวมหลายความสามารถไว้พร้อมกันก็เสี่ยงจะเจอกระบวนการเดียวกัน เมื่อประสิทธิภาพของโมเดลพัฒนาไปอีก การวิเคราะห์ 7 Powers ของ Helmer ในส่วนนี้จะพิจารณาว่า vertical AI สามารถแข่งขันกับ horizontal AI ได้หรือไม่ ผ่านกรอบความได้เปรียบทางการแข่งขัน 7 ประการของ Hamilton Helmer (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource) Switching Cost (ต้นทุนการเปลี่ยน) แม้ผู้ใช้จะคุ้นเคยกับ UI หรือ workflow ของโซลูชัน vertical AI บางรายแล้ว แต่ horizontal AI สามารถนำไปใช้ได้ง่ายในลักษณะ “จ้างพนักงานใหม่” แล้ว onboard เข้ามา ปัจจุบันมีองค์กรเพิ่มขึ้นที่นำโซลูชัน horizontal AI อย่าง ChatGPT มาใช้แล้ว จึงมีแนวโน้มว่ากระบวนการเปลี่ยนผ่านจะไม่ยาก ในด้านราคา horizontal AI ก็มีแนวโน้มช่วยลดต้นทุน เพราะสามารถรวมหลายโซลูชันแบบ vertical เข้าไว้ด้วยกันได้ Counter Positioning (การวางตำแหน่งสวนกลับ) vertical AI อาจมอบคุณค่าเฉพาะทางด้วยโซลูชันที่ออกแบบมาสำหรับตลาดหนึ่งโดยเฉพาะ แต่เมื่อโมเดลค่อย ๆ ดีขึ้น horizontal AI ก็มีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าโดยรวม vertical AI เผชิญภาวะกลืนไม่เข้าคายไม่ออก คือทุกครั้งที่นำโมเดลใหม่เข้ามาใช้ ก็อาจสูญเสียความแตกต่างเพราะ “ข้อจำกัด” เดิม หรือถ้าปลดข้อจำกัดเหล่านั้น ก็จะยิ่งคล้ายโมเดลแนวนอนมากขึ้นในที่สุด Scale Economy (เศรษฐศาสตร์จากขนาด) vertical AI ก็เหมือน SaaS ตรงที่ลดต้นทุนได้ตามขนาด แต่ horizontal AI เองก็มีข้อได้เปรียบจากการรวมหลายสาขาเข้าด้วยกันและกระจายต้นทุนได้เช่นกัน การนำโมเดลแนวนอนที่พัฒนาด้วยการลงทุน R&D ขนาดใหญ่มาใช้ในหลายกรณี จะยิ่งเร่งการลดต้นทุนได้ Network Economy (อานิสงส์เครือข่าย) ทั้ง vertical AI และ horizontal AI ต่างมีโอกาสพัฒนาจากข้อมูลผู้ใช้ได้ แต่ horizontal AI ได้เปรียบมากกว่าเพราะรับฟีดแบ็กจากฐานผู้ใช้ที่กว้างกว่า และยกระดับประสิทธิภาพโดยรวมของโมเดลได้ เนื่องจากใช้ข้อมูลที่สะสมจากหลายสาขาเพื่อพัฒนาโมเดลทั้งระบบ จึงอาจก้าวหน้าได้เร็วเกินกว่าที่ vertical AI จะตามทัน Brand Power (พลังของแบรนด์) พลังของแบรนด์เป็นความได้เปรียบที่แทบสร้างไม่ได้ในช่วงที่ยังเป็นสตาร์ทอัปขนาดเล็ก บริษัทอย่าง OpenAI หรือ Google ที่มีอิทธิพลด้านแบรนด์อยู่แล้วเป็นข้อยกเว้น แต่สตาร์ทอัป vertical AI ส่วนใหญ่ยากจะใช้แบรนด์เป็นอาวุธหลัก Process Power (พลังของกระบวนการ) พลังของกระบวนการก็เป็นความได้เปรียบที่มักเกิดจากระบบปฏิบัติการภายในที่องค์กรขนาดใหญ่ขัดเกลามาเป็นเวลานาน สำหรับสตาร์ทอัประยะเริ่มต้น สิ่งนี้แทบไม่ใช่หมวดที่เกี่ยวข้อง Cornered Resource (ทรัพยากรผูกขาด) ทรัพยากรผูกขาดจะกลายเป็นความได้เปรียบที่สำคัญก็ต่อเมื่อมีเพียงบริษัทเดียวที่ถือครองข้อมูลหรือทรัพยากรนั้น และทรัพยากรดังกล่าวจำเป็นอย่างแท้จริงต่อสาขานั้น สตาร์ทอัป AI จำนวนมากอ้างว่าตนมี “ข้อมูลผูกขาด” แต่ในความเป็นจริง ข้อมูลนั้นมักไม่ได้ผูกขาดอย่างแท้จริง หรือถึงไม่มีข้อมูลนั้น โมเดลก็ยังเรียนรู้ได้เพียงพอ ในทางกลับกัน บริษัทที่ครอบครองทรัพยากรผูกขาดอย่างแท้จริงอาจยังคงรักษาความสามารถในการแข่งขันไว้ได้ แม้ horizontal AI จะพัฒนาไปมากก็ตาม บทสรุป สุดท้ายแล้ว แม้จะเป็นสถานการณ์ที่ vertical AI ได้ประโยชน์จากการเข้าตลาดก่อน หาก horizontal AI มีประสิทธิภาพสูงกว่า vertical AI ส่วนใหญ่ก็จะอยู่รอดได้ยาก ในบรรดา 7 Powers ของ Helmer มีเพียงกรณีที่ครอบครอง “Cornered Resource” อย่างแท้จริงเท่านั้น ที่ vertical AI อาจรักษาโมเมนตัมระยะยาวไว้ได้ เช่นเดียวกับกรณีของ AcademicGPT ที่ล่มสลายอย่างรวดเร็วหลัง GPT-4 เปิดตัว vertical AI ที่เสริมฟังก์ชันหลายอย่างเข้าไปก็อาจเผชิญเส้นทางคล้ายกันเมื่อโมเดลพัฒนาขึ้น ในบทถัดไป (บทที่ 3) จะคาดการณ์ว่า horizontal AI ในรูปแบบ “ผู้ร่วมงานทางไกล” จะเกิดขึ้นจริงเมื่อใดและอย่างไร พร้อมเจาะลึกอุปสรรคด้านเทคนิค กฎระเบียบ ความน่าเชื่อถือ และเศรษฐศาสตร์ที่ขัดขวางสิ่งนี้อยู่ บทที่ 3: ร่องรอยเชิงอรรถในประวัติศาสตร์ (A Footnote in History) มีการเผยแพร่บทสัมภาษณ์ที่ CEO ของ Anthropic อธิบายแนวคิด “virtual collaborator” แนวคิดนี้คล้ายกับสิ่งที่ผู้เขียนเรียกในซีรีส์นี้ว่า “horizontal AI product” คาดว่า OpenAI จะประกาศ “Operator” ในเร็ว ๆ นี้ และตามเบนช์มาร์กที่หลุดออกมา ประสิทธิภาพนำหน้า Claude อย่างมาก (บน OSWorld benchmark Claude ได้ 22%, Operator ได้ 38%) การเพิ่มขึ้นของประสิทธิภาพนี้ยังอยู่ในกรอบที่คาดไว้ และผู้เขียนยังคงยืนตามการคาดการณ์เมื่อ 3 เดือนก่อน ในบทก่อนหน้าได้อธิบายแล้วว่าทำไมแอปพลิเคชัน vertical AI จึงรักษาความสามารถในการแข่งขันได้ยาก ช่องว่างด้านประสิทธิภาพกับโซลูชัน AI ทั่วไปกำลังแคบลง เมื่อผลิตภัณฑ์ horizontal AI แข่งขันได้แล้ว ผลิตภัณฑ์ vertical AI ก็แทบไม่มีวิธีป้องกันตัว คำถามสำคัญคือ: “การเปลี่ยนผ่านจาก vertical AI ไปสู่ horizontal AI จะเกิดขึ้นเมื่อไร?” หากอีก 10 ปีค่อยเกิดขึ้น การพัฒนา vertical AI ตอนนี้ก็อาจยังมีความหมาย แต่หากความเปลี่ยนแปลงมาถึงภายใน 1–2 ปี ก็จำเป็นต้องใช้กลยุทธ์ที่ต่างออกไปโดยสิ้นเชิง การเปลี่ยนผ่านจาก vertical AI ไปเป็น horizontal AI จะไม่ได้เกิดขึ้นพร้อมกันในทุกอุตสาหกรรม อย่างไรก็ตาม ตลาดที่สตาร์ทอัป AI ส่วนใหญ่กำลังมุ่งเน้นอยู่ในตอนนี้เป็นสาขาที่ค่อนข้างเรียบง่าย จึงคาดว่าการเปลี่ยนแปลงจะเกิดขึ้นในช่วงเวลาใกล้เคียงกันในอุตสาหกรรมหลักต่าง ๆ มีการคาดการณ์ว่าภายในปี 2027 ผลิตภัณฑ์ vertical AI จะอยู่รอดได้ยากในอุตสาหกรรมส่วนใหญ่ “adoption” หมายถึง เมื่อผู้ใช้ต้องแก้ปัญหาใหม่หรือเปลี่ยนวิธีแก้ปัญหาเดิม พวกเขาเลือกผลิตภัณฑ์ใด การวิเคราะห์นี้ไม่พิจารณาปัจจัยต่อไปนี้ ส่วนแบ่งตลาด: อาจได้รับผลจากสัญญาเดิมหรือปัจจัยอื่น ขนาดสัมบูรณ์: แม้ตลาดจะขยายตัวเพราะ AI เปิดกรณีใช้งานใหม่ ๆ แต่การวิเคราะห์นี้พิจารณาเฉพาะการเปลี่ยนแปลงเชิงสัมพัทธ์ มูลค่าแฝงในอนาคต: การประเมินนี้ดูว่าผู้คนเลือกโซลูชันใด ณ เวลาปัจจุบัน โดยไม่นับรวมความเป็นไปได้ในการพัฒนาในอนาคต ตัวอย่างเช่น หากกระแสย้ายจาก A ไป B นั่นหมายความว่าในอดีต A เคยเป็นตัวเลือกที่ได้รับความนิยม แต่ตอนนี้ B ถูกมองว่าเป็นทางเลือกที่ดีกว่าแล้ว แนวคิด AI แนวตั้ง/แนวนอน และ workflow/agent "AI แนวตั้ง (vertical)" และ "AI แนวนอน (horizontal)" หมายถึงประเภทของผลิตภัณฑ์ AI ที่แตกต่างกัน "เวิร์กโฟลว์ (workflow)" และ "เอเจนต์ (agent)" ก็เป็นแนวคิดที่ใช้จัดประเภทผลิตภัณฑ์ AI เช่นกัน ในเอกสารนี้ จะอธิบายแนวคิดเรื่องเวิร์กโฟลว์และเอเจนต์รวมกันภายในผลิตภัณฑ์ AI แนวนอน มีความเป็นไปได้สูงว่าบริษัทเดียวกันจะพัฒนาผลิตภัณฑ์ที่มีทั้งสองความสามารถรวมอยู่ด้วย ตัวอย่างเช่น ChatGPT อาจเพิ่มความสามารถแบบเอเจนต์เข้าไป ขณะเดียวกันก็ยังคงฐานแบบเวิร์กโฟลว์เดิมไว้ อดีต (1) ช่วงก่อน ChatGPT เป็นสถานการณ์ที่ซอฟต์แวร์แบบดั้งเดิมครองตลาด (2) การเปิดตัว ChatGPT ทำให้เกิดผลิตภัณฑ์ AI แนวนอนที่มีความหมายเป็นครั้งแรก (3) หลังการมาถึงของ GPT-3.5 API ผลิตภัณฑ์แนวตั้งจำนวนมากที่ออกแบบมาสำหรับ AI โดยเฉพาะก็เริ่มเปิดตัวเป็นครั้งแรก ปีนี้ (4) มีการคาดการณ์ว่าในปี 2025 ประสิทธิภาพของโมเดลจะมีเสถียรภาพเพียงพอสำหรับการใช้งานเป็นเอเจนต์ที่ใช้งานได้จริง เอเจนต์ที่จนถึงตอนนี้ถูกใช้เพียงในโครงการวิจัยหรือการทดสอบแบบจำกัด คาดว่าจะเริ่มถูกนำมาใช้อย่างจริงจัง ผลิตภัณฑ์เวิร์กโฟลว์แนวตั้งเดิมก็มีโอกาสเปลี่ยนรูปแบบไปเป็น AI agent เช่นกัน (5) แม้เอเจนต์จะเริ่มปรากฏขึ้น แต่คาดว่าจนถึงปี 2025 เวิร์กโฟลว์แนวตั้งจะยังคงรักษาตำแหน่งที่ครองตลาดไว้ นิสัยของผู้ใช้ที่ไม่อยากเปลี่ยนเครื่องมือที่ใช้อยู่แล้ว และแรงเฉื่อยของนักพัฒนาที่ต้องการใช้ประโยชน์จากทรัพยากรทางวิศวกรรมที่สร้างไว้ต่อไป จะยังคงมีผล (6) คาดว่าผลิตภัณฑ์ AI แนวนอนหลักอย่าง ChatGPT, Claude และ Gemini จะขยายความสามารถและครอบคลุมโดเมนแนวตั้งได้มากขึ้น มีความเป็นไปได้ที่ความสามารถเฉพาะทางเดิมของผลิตภัณฑ์ AI แนวตั้งจะถูกดูดซับเข้าไปในผลิตภัณฑ์ AI แนวนอนอย่างรวดเร็ว ตอนนี้ ChatGPT เริ่มเชื่อมต่อกับแอปเดสก์ท็อปแล้ว อนาคตอันใกล้ (7) คาดว่าช่องว่างด้านความสามารถระหว่าง AI agent แนวนอนกับแรงงานมนุษย์จะค่อย ๆ แคบลง แม้จะยังไม่ถึงระดับผู้เชี่ยวชาญ แต่ก็คาดว่าจะมีประสิทธิภาพพอสำหรับการทำงานอัตโนมัติกับงานสำนักงานทั่วไปได้อย่างมาก ด้วยเหตุนี้ เหตุผลในการมีอยู่ของโซลูชัน AI แนวตั้งอาจลดลง ตัวอย่างที่เป็นรูปธรรม: ผู้ใช้รายบุคคลอาจมอบหมายงานซับซ้อน เช่น การยื่นภาษีหรือการเตรียมหางาน ให้เอเจนต์แนวนอนจัดการ บริษัทอาจแทนที่หรือลดจำนวนพนักงานระดับจูเนียร์ลงได้อย่างมาก อาจเกิดกรณีที่คนเพียงคนเดียวสามารถสร้างมูลค่าระดับยูนิคอร์นได้ (8) คาดว่าซอฟต์แวร์แบบดั้งเดิมจะยังคงมีคุณค่าในฐานะอินเทอร์เฟซที่เอเจนต์สามารถใช้งานได้ การให้เอเจนต์ใช้ซอฟต์แวร์ที่มีอยู่เดิมอาจคุ้มค่ากว่าการให้มันสร้างซอฟต์แวร์ใหม่ทั้งหมดขึ้นมาเองโดยตรง โดยเฉพาะซอฟต์แวร์อเนกประสงค์และซอฟต์แวร์แนวนอน มีแนวโน้มสูงกว่าจะอยู่รอด (9) ผลิตภัณฑ์ AI แนวตั้งที่จะอยู่รอดได้น่าจะมีเพียงส่วนน้อยที่ครอบครองทรัพยากรเชิงป้องกันซึ่งกล่าวถึงในบทที่ 2 (เช่น ข้อมูลผูกขาด สิทธิบัตร เป็นต้น) พวกเขาอาจสามารถขายทรัพยากรเหล่านั้นได้ในมูลค่าสูง 2024 - การพัฒนาหยุดชะงักหรือไม่? มีการประเมินว่าคำกล่าวอ้างว่าโมเดล AI หยุดนิ่งในปี 2024 นั้นไม่น่าเชื่อถือมากนัก ตั้งแต่ก่อนการเปิดตัว o3 ประสิทธิภาพของโมเดลในหลายด้าน เช่น GPT-4, Claude และ Open Weight model ก็พัฒนาขึ้นอย่างต่อเนื่อง คะแนนเบนช์มาร์กอย่าง ARC-AGI และ GPQA Diamond ก็ปรับตัวดีขึ้นอย่างก้าวกระโดดมาโดยตลอด Anthropic พัฒนาอย่างรวดเร็วจาก Claude 2 ไปสู่ Claude 3 และต่อด้วย Claude 3.5 Sonnet และมีการคาดเดาว่าบริษัทได้นำอัปเกรดที่ยังไม่เปิดเผยมาใช้ภายในองค์กร ด้วยเหตุนี้ จึงมีมุมมองว่าคำกล่าวอ้างว่าปี 2024 เป็นปีที่การปรับปรุงโมเดล AI หยุดลงนั้นขาดหลักฐานรองรับ อุปสรรคที่อาจเกิดขึ้น Model Stagnation: แม้ปี 2024 จะไม่มีภาวะชะงักงัน แต่ก็มีความกังวลว่าหลังปี 2025 การพัฒนาโมเดลอาจหยุดนิ่ง Ilya Sutskever กล่าวถึงข้อจำกัดของวิธี Pre-training แบบดั้งเดิมในงาน NeurIPS แต่ก็เสนอพร้อมกันว่ายังมีเส้นทางอื่น เช่น Test-time compute สถาบันวิจัย AI และบริษัทใหญ่ ๆ ยังคงลงทุนอย่างจริงจังในทรัพยากรคอมพิวต์ขนาดมหาศาล Regulation: หากมีกฎระเบียบที่ไม่คาดคิดเกิดขึ้น ก็อาจทำให้การพัฒนา AI ถูกจำกัด Trust Barriers: ผู้ใช้ยังมีความกังวลเรื่องความเสถียรและความน่าเชื่อถือของเอเจนต์ มีการคาดการณ์ว่าเมื่อเวลาผ่านไป เรื่องนี้จะถูกเอาชนะได้ โดยยกตัวอย่างกรณีในอดีตที่ความกลัวต่อระบบลิฟต์อัตโนมัติสุดท้ายก็หายไป AI Labs Hesitate: Anthropic หรือ OpenAI อาจมีกรณีที่แม้จะมีศักยภาพทางเทคนิคจริง แต่ก็ยังคงจำกัดปฏิสัมพันธ์ของผู้ใช้ไว้บางส่วน Expensive Inference: เช่นกรณีของ o3 การทำ inference ประสิทธิภาพสูงอาจต้องใช้ต้นทุนที่สูงมาก แต่ต้นทุน inference ก็กำลังลดลงเรื่อย ๆ ตามเวลา และก็มีความเป็นไปได้สูงที่เอเจนต์จะไม่ใช้การอนุมานประสิทธิภาพสูงในระดับเดียวกันกับทุกงาน เมื่อพิจารณาปัจจัยทั้งหมดข้างต้น แม้การคาดการณ์ความก้าวหน้าทางเทคโนโลยีจะทำได้ยาก แต่คาดว่าสตาร์ทอัพ AI แนวตั้งจะเหลือเวลาไม่มากนัก มีการเสนอกราฟมูลค่าแบบรูปตัว U ที่ชี้ว่า เมื่อโมเดล AI มีความก้าวหน้ามากขึ้น มูลค่าที่อิงกับวิศวกรรมแบบเดิมอาจสลายไปอย่างรวดเร็ว ข้อสังเกตเพิ่มเติม มีคำอธิบายว่าการขยาย Test-time compute ที่เห็นใน o3 เป็นผลลัพธ์ที่มีการคาดการณ์ไว้แล้วจากงานวิจัยเดิม เช่นเดียวกับกรณีของ AlphaZero มีข้อสังเกตว่าในสภาพแวดล้อมที่สามารถตรวจสอบผลลัพธ์ได้ ประสิทธิภาพสามารถพัฒนาไปถึงระดับเหนือมนุษย์ได้อย่างรวดเร็ว มีการวิเคราะห์ว่า o3 แม้จะโดดเด่นในด้านอย่างการเขียนโค้ดและคณิตศาสตร์ แต่ในด้านอื่น เช่น การเขียนเชิงสร้างสรรค์ ก็ไม่ได้แตกต่างจาก o1 มากนัก มีนัยว่าการไปในทิศทางอื่นที่เกี่ยวข้องกับทรัพยากรที่กว้างขวางกว่าหรือผูกขาดมากกว่า อาจเป็นทางเลือกที่ดีกว่าสำหรับผู้ก่อตั้ง มากกว่าการพัฒนา AI แนวตั้งใหม่ขึ้นมาอีก บทที่ 4: คุณคือพ่อมด (You’re a wizard Harry) ผู้ก่อตั้งก็เหมือนพ่อมด มีความสามารถในการสร้างสิ่งที่ไม่เคยมีให้เกิดขึ้น การเริ่มต้นบริษัทใหม่ต้องอาศัยความคิดที่แปลกใหม่ คำพูดของ Paul Graham (PG): "ไอเดียต้องไม่เพียงแค่ถูกต้อง แต่ต้องแปลกใหม่ด้วย คุณไม่ควรเริ่มทำสิ่งที่ทุกคนต่างเห็นพ้องว่าเป็นความคิดที่ดี" ผู้ก่อตั้งจำนวนมากกำลังสูญเสียความคิดที่เป็นอิสระ เพราะมัวตื่นตากับการเติบโตของรายได้ที่น่าประทับใจของเพื่อนร่วมวงการ เมื่อทุกคนกำลังทำสิ่งเดียวกันและมันดูเหมือนจะได้ผล การคิดอย่างอิสระยิ่งเป็นเรื่องยาก ผู้เขียนพยายามคิดอย่างอิสระ และหวังว่าแนวคิดเหล่านี้จะฟังดูเป็นความคิดที่ไม่ดี อนาคตของเอเจนต์แนวนอนและการแข่งขัน คาดว่าเอเจนต์แนวนอนที่จะครองชั้นแอปพลิเคชัน AI จะถูกพัฒนาโดย AI lab แม้ประสิทธิภาพของโมเดลอาจแตกต่างจนเกิดผู้ชนะเพียงรายเดียวได้ แต่การแข่งขันที่ดุเดือดระหว่าง Anthropic, OpenAI, GDM และ xAI มีแนวโน้มเป็นไปได้มากกว่า สิ่งนี้จะก่อให้เกิดการแข่งขันด้านราคาที่เป็นประโยชน์ต่อผู้ใช้ปลายทางในระยะสั้น แม้ AI lab อาจยังไม่สามารถเก็บเกี่ยวมูลค่าทางการเงินได้มากนักในระยะสั้น แต่ก็ยังคาดว่าจะครองตำแหน่งที่ทรงพลังอย่างยิ่ง ดังนั้นจึงสมเหตุสมผลที่ผู้ก่อตั้งจะมองสตาร์ทอัพของตนในบริบทของความสัมพันธ์กับห้องแล็บเหล่านี้ การเข้าหาในฐานะลูกค้า ตามที่กล่าวไว้ในบทที่ 2 การสร้างผลิตภัณฑ์ AI แนวตั้งที่ใช้ LLM API นั้นเป็นไปได้ แต่จะเป็นไปได้ก็ต่อเมื่อมีสิทธิ์เข้าถึงทรัพยากรสำคัญแบบผูกขาด หากต้องการสร้างผลิตภัณฑ์ AI แนวตั้ง ก็จำเป็นต้องทุ่มเทความพยายามอย่างมหาศาลเพื่อค้นหาทรัพยากรประเภทนั้น แนวทางในฐานะคู่แข่ง หากเอเจนต์แนวนอนคืออนาคต ทำไมไม่สร้างมันขึ้นมาเสียเอง? พิจารณาแนวทางอยู่สามแบบ การช่วงชิงตลาดก่อน แล็บ AI จะเข้ามาแข่งขันกับเวิร์กโฟลว์แนวตั้งอย่างจริงจังก็ต่อเมื่อโมเดลมีความน่าเชื่อถือมากพอที่จะสร้างเอเจนต์แนวนอนได้ด้วยความพยายามด้านวิศวกรรมเพียงเล็กน้อย ในทางทฤษฎี เราอาจนำความพยายามด้านวิศวกรรมไปใช้กับโมเดลรุ่นก่อนหน้าและเข้าสู่ตลาดก่อนแล็บได้ แต่ก็ไม่แน่นอน Leopold Aschenbrenner มองว่าความพยายามนี้อาจใช้เวลานานกว่าการสร้างโมเดลรุ่นถัดไปเสียอีก: "อาจต้องใช้เวลาพอสมควรกว่าที่พนักงานทางไกลจะทำงานจำนวนมากให้เป็นอัตโนมัติได้ และในระหว่างนั้น โมเดลระดับกลางอาจยังไม่ได้ถูกใช้งานและบูรณาการอย่างเต็มที่" ไม่ว่าใครจะเข้าตลาดก่อน ก็คาดว่าความได้เปรียบนี้จะอยู่ได้ไม่นาน ตัวหุ้ม API ของเอเจนต์ เพื่อนร่วมห้องถามว่า "บนโลกนี้ไม่มีใครมีทักษะด้าน UI เลยหรือ?" นี่ชี้ให้เห็นปัญหาสองอย่าง: 1) ต้นทุน API ทำให้มาร์จินไม่ยั่งยืน 2) แล็บไม่เปิดเผยโมเดลที่ดีที่สุดออกมา (ChatGPT ใช้โมเดลเฉพาะภายในสำหรับการค้นหา การท่องเว็บ ฯลฯ) ปัจจุบันไม่มีใครใช้ GPT API เพื่อแข่งขันกับ ChatGPT โดยตรง และคาดว่าแพตเทิร์นนี้จะเกิดซ้ำกับเอเจนต์แนวนอน โมเดลโอเพนซอร์ส โมเดลโอเพนซอร์สอาจเป็นอีกเส้นทางหนึ่ง Perplexity แสดงให้เห็นว่าสามารถแข่งขันกับแล็บในผลิตภัณฑ์แนวนอนได้ อย่างไรก็ตาม โมเดลโอเพนซอร์สมักทำได้ดีในการวัดผลแบบ benchmark ที่เรียบง่าย แต่กลับลำบากกับงานเอเจนต์ที่ซับซ้อน Llama-3.1-405b ตามหลังโมเดลชั้นนำอย่างมากใน MLE-bench ที่ Andon Labs เชี่ยวชาญ benchmark ประเภทนี้ และสิ่งนั้นก็สอดคล้องกับสิ่งที่เราเห็น Deepseek V3 และ R1 เปิดตัวพร้อมผลลัพธ์ที่น่าประทับใจมาก แต่ o3 ก็เช่นกัน และมีรายงานว่า Anthropic มีเวอร์ชันที่ดีกว่านี้อยู่ภายใน โมเดลโอเพนซอร์สอาจเข้าใกล้ระดับแนวหน้าได้ แต่ก็น่าสงสัยว่าจะเหนือกว่าได้ ถึงอย่างนั้น มันก็อาจดีพอสำหรับการแข่งขันในเกมแนวนอน ต้นทุนการอนุมานยังคงสูงมากอยู่ดี แนวทางในฐานะซัพพลายเออร์ หากแล็บ AI ทรงพลังได้ถึงระดับนั้นจริง การเป็นซัพพลายเออร์ให้พวกเขาถือเป็นตำแหน่งที่ยอดเยี่ยม พวกเขาจะต้องการพลังประมวลผลและพลังงานจำนวนมากอย่างแน่นอน หากการวิเคราะห์ของ Leo ถูกต้อง พวกเขาอาจต้องการมากกว่าที่คาดไว้เสียอีก โอกาสนี้ต้องอาศัยความเชี่ยวชาญเชิงอุตสาหกรรม ซึ่งอาจไม่ใช่สิ่งที่เป็นธรรมชาติสำหรับผู้ก่อตั้งที่อยู่ในชั้นแอปพลิเคชัน AI ตอนนี้ แต่อย่าลืมว่าคุณเป็นพ่อมด แล็บยังซื้อข้อมูลจากบุคคลที่สามด้วย Scale AI กำลังพิสูจน์ว่านี่คือธุรกิจที่ยอดเยี่ยม อย่างไรก็ตาม ยังน่าสงสัยว่าแล็บ AI จะทำให้ "การเรียนรู้ด้วยตนเอง" ใช้งานได้จริงหรือไม่ AlphaZero ถูกฝึกโดยไม่มีข้อมูลภายนอก และสิ่งนี้ถูกมองว่าเป็นจอกศักดิ์สิทธิ์ของโมเดล AI ในอนาคต หากพวกเขาทำให้การเรียนรู้ด้วยตนเองใช้ไม่ได้จริง ทางเลือกก็คือการรวมชุดข้อมูลสำหรับการฝึกขั้นต่อเนื่องหลายชุดเข้าด้วยกัน ในโลกแบบนั้น การขายข้อมูลน่าจะเป็นทางเลือกที่ดี แนวทางในฐานะผู้มีส่วนร่วมในระบบนิเวศ สิ่งสุดท้ายที่ควรพิจารณาในความสัมพันธ์กับแล็บ AI คือการเป็นผู้มีส่วนร่วมในระบบนิเวศ นั่นหมายถึงการสร้างเครื่องมือที่ช่วยเอเจนต์แนวนอน แต่สิ่งสำคัญคือต้องแยกออกจากตัวเอเจนต์เอง ดังที่แสดงไว้ในบทที่ 3 ซอฟต์แวร์แบบดั้งเดิมจะยังคงอยู่ต่อไป เพราะเอเจนต์ต้องการอินเทอร์เฟซที่มีประสิทธิภาพ เอเจนต์อาจเขียนซอฟต์แวร์ของตัวเองได้ แต่ต้นทุนการอนุมานอาจทำให้สิ่งนี้ไม่คุ้มในทางปฏิบัติ อย่างไรก็ตาม ผู้เล่นในระบบนิเวศมีความเสี่ยงที่จะกลายเป็นสินค้าโภคภัณฑ์ และมูลค่าส่วนใหญ่อาจถูกเก็บเกี่ยวไปที่อื่น เรื่องนี้จะขึ้นอยู่กับว่าต้นทุนการอนุมาน (inference cost) สำหรับการรันเอเจนต์แนวนอนนั้นสูงเพียงใด หากต้นทุนการอนุมานต่ำ ก็จะยิ่งพบเห็นการที่เอเจนต์สร้างซอฟต์แวร์ที่ตัวเองต้องการขึ้นมาเองได้ทั่วไปมากขึ้น หากเอเจนต์ AI แนวนอนมาช้ากว่าที่คาดล่ะ? กรอบเวลา (timeline) มีความสำคัญมาก หากเอเจนต์แนวนอนจะมีความสามารถในการแข่งขันได้จริง อีก 10 ปีข้างหน้า การสร้างเวิร์กโฟลว์ AI แนวตั้งในตอนนี้ก็น่าจะเป็นความคิดที่ยอดเยี่ยม เวลาระดับนี้เพียงพอที่จะ สร้างบริษัทที่ใหญ่และแข็งแกร่งได้ แต่เมื่อดูจากความเร็วของความก้าวหน้าในแล็บ AI แล้ว 10 ปีดูไม่สมจริง ถ้าอย่างนั้น อีก 4 ปีล่ะ? 4 ปีอาจไม่พอสำหรับการสร้างบริษัทยักษ์ใหญ่ แต่ก็ให้โอกาสสำหรับการทำซ้ำปรับปรุง (iteration) ได้มากพอ การเริ่มจากชั้นแอปพลิเคชัน AI อาจช่วยให้เปลี่ยนไปเป็นผู้ขายหรือผู้เล่นในระบบนิเวศได้ง่ายขึ้นในภายหลัง บทส่งท้าย: นี่คือความผิดพลาดของ YC(Y Combinator) หรือไม่? เมื่อมองผิวเผิน อาจดูเหมือนว่า YC กำลังตัดสินใจผิดพลาด ตอนนี้ YC กำลังทุ่มการลงทุนส่วนใหญ่ไปที่ ผลิตภัณฑ์ AI แนวตั้ง แต่ ตลาดนี้มีโอกาสสูงที่จะหายไปในไม่ช้า อย่างไรก็ตาม ผู้เขียน ไม่ได้มีความเชี่ยวชาญด้าน VC(venture capital) มากพอ จึงไม่อาจสรุปอย่างมั่นใจได้ เพียงแค่ กำลังสับสนและแบ่งปันความกังวลเท่านั้น YC อ้างว่าตนใช้กลยุทธ์การลงทุนที่ ค่อนข้างเป็นกลาง ลงทุนในคนที่ฉลาด แล้วหวังให้พวกเขาค้นหาไอเดียที่ดีที่สุด นี่เป็นกลยุทธ์ที่ยอดเยี่ยม และ ผู้ก่อตั้งหลายร้อยคนอาจคาดการณ์อนาคตได้ดีกว่าพาร์ตเนอร์ YC 14 คน แต่ผู้เขียน กังวลว่าระบบ batch ของ YC อาจผลักดันให้เกิดการคิดระยะสั้น ใน YC การ ตั้งเป้าหมายรายสัปดาห์ เป็นเรื่องสำคัญมาก และการเดินหน้าไปพร้อมกับ กลุ่มขนาดใหญ่ ก็ช่วยสร้างแรงจูงใจได้ดี แต่หาก ความหลากหลายของไอเดียมีไม่มากพอ ก็อาจกระตุ้นการคิดระยะสั้นได้ การสร้างผลิตภัณฑ์ AI แนวตั้งสามารถทำให้แตะ MRR 5,000 ดอลลาร์ได้อย่างรวดเร็ว แต่ นี่คือวิธีสร้างธุรกิจที่ยั่งยืนจริงหรือ? หากผู้เขียนอยู่ใน batch ของ YC ตอนนี้ ก็คงรู้สึก ถูกล่อลวงให้อยากสร้างผลิตภัณฑ์ AI แนวตั้ง ยิ่งไปกว่านั้น ในพอดแคสต์ของ YC อย่าง "The Light Cone" ก็มีเนื้อหาจำนวนมากที่สนับสนุนผลิตภัณฑ์ AI แนวตั้ง

(lukaspetersson.com)

30 คะแนน โดย xguru 2025-02-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

สรุปรวมบทความชุด 4 ตอนของ Lukas Petersson ผู้ก่อตั้ง Andon Labs สตาร์ตอัปด้าน AI Safety (YC w24) ไว้เป็นเรื่องเดียว
- ในเชิงประวัติศาสตร์ วงการ AI นั้นแนวทางแบบทั่วไปมักเป็นฝ่ายชนะเสมอ
- ผู้ก่อตั้งในสายแอปพลิเคชัน AI ปัจจุบันกำลังทำซ้ำความผิดพลาดที่นักวิจัย AI ในอดีตเคยทำ
- โมเดล AI ที่ดีขึ้นจะทำให้แอปพลิเคชัน AI แบบอเนกประสงค์เป็นไปได้ และในขณะเดียวกันก็จะลดมูลค่าเพิ่มของซอฟต์แวร์ที่เกี่ยวข้องกับโมเดล AI ลง
บทที่ 1: ประวัติศาสตร์ซ้ำรอย
บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน
บทที่ 3: รอยเท้าของประวัติศาสตร์
บทที่ 4: คุณคือพ่อมด

บทที่ 1: ประวัติศาสตร์ซ้ำรอย (History Repeats Itself)

tl;dr:

ความก้าวหน้าของ AI ในช่วงหลังทำให้เกิดผลิตภัณฑ์ใหม่ที่แก้ปัญหาได้หลากหลาย
แต่ผลิตภัณฑ์ส่วนใหญ่ยังทำงานอยู่ภายในขีดจำกัดของโมเดลปัจจุบัน และยังไม่สามารถใช้ประโยชน์จากความยืดหยุ่นซึ่งเป็นพลังแท้จริงของ AI ได้
ประวัติศาสตร์ของ AI แสดงให้เห็นซ้ำแล้วซ้ำเล่าว่าแนวทางแบบทั่วไปเป็นฝ่ายชนะเสมอ ซึ่ง Richard Sutton เน้นไว้ใน "The Bitter Lesson"
ผู้ก่อตั้ง AI ในปัจจุบันมีแนวโน้มจะทำซ้ำความผิดพลาดแบบเดียวกับที่นักวิจัย AI ในอดีตเคยเผชิญ

สรุปบทความของ Richard Sutton: The Bitter Lesson (ฉบับแปลเกาหลี)

บทความนี้เสนอข้อเรียนรู้ดังต่อไปนี้:
- นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์
- วิธีนี้ได้ผลในระยะสั้นและให้ความรู้สึกน่าพอใจ
- แต่ในระยะยาว ความก้าวหน้าจะหยุดชะงัก และยิ่งไปกว่านั้นยังขัดขวางความคืบหน้า
- ในท้ายที่สุด จุดเปลี่ยนกลับเกิดจากการขยายขนาดของการคำนวณที่ตั้งอยู่บนแนวทางตรงกันข้าม
เตือนว่ารูปแบบนี้ถูกพบซ้ำแล้วซ้ำเล่าในการวิจัย AI และจนถึงตอนนี้ก็ยังไม่สิ้นสุด

ผลิตภัณฑ์ AI และ The Bitter Lesson

โดยทั่วไปผลิตภัณฑ์ AI ประกอบด้วยโมเดล AI และซอฟต์แวร์ที่ล้อมรอบมัน
มี 2 วิธีในการปรับปรุงประสิทธิภาพ:
1. งานวิศวกรรมที่ใส่ข้อจำกัดให้ซอฟต์แวร์เพื่อลดข้อผิดพลาด
2. รอจนกว่าโมเดลที่ดีกว่าจะออกมา
ยิ่งโมเดลพัฒนาไปมากเท่าไร มูลค่าของงานวิศวกรรมก็ยิ่งลดลง
กรณีที่มูลค่าของ prompt engineering ลดลงหลัง OpenAI เปิดตัวโมเดลใหม่ เป็นตัวอย่างที่แสดงเรื่องนี้

ประเภทของข้อจำกัดและผลิตภัณฑ์ AI

องค์ประกอบที่เป็นข้อจำกัดของผลิตภัณฑ์ AI สามารถแบ่งได้เป็น 2 ประเภท:
- ความเฉพาะทาง: ซอฟต์แวร์ที่มุ่งเน้นปัญหาเฉพาะอย่าง (โซลูชันแนวตั้ง)
- ความเป็นอัตโนมัติ: ความสามารถที่ AI จะลงมือทำงานได้ด้วยตัวเอง
จากกรอบนี้สามารถจัดหมวดหมู่ผลิตภัณฑ์ AI ได้ตามความเฉพาะทาง (Vertical vs. Horizontal) และความเป็นอัตโนมัติ (Workflow vs. Agent)
- Vertical Workflow
  - ระบบที่ทำงานตามลำดับตายตัวเพื่อแก้ปัญหาเฉพาะ
  - Harvey เป็นตัวอย่างเด่น เป็นระบบ workflow ที่ออกแบบมาเพื่อจัดการปัญหาในขอบเขตแคบ เช่น งานด้านกฎหมายเฉพาะทาง
- Vertical Agent
  - ระบบที่ทำงานได้อย่างอัตโนมัติในขอบเขตงานเฉพาะ และตัดสินใจเองระหว่างกระบวนการทำงาน
  - Devin เป็นตัวอย่างเด่น โดยใช้เครื่องมือและข้อมูลที่จำกัดเพื่อทำงานซ้ำ ๆ และปรับขั้นตอนการทำงานตามความจำเป็น
- Horizontal Workflow
  - ระบบ workflow แบบทั่วไปที่สามารถแก้ปัญหาได้หลากหลาย
  - ChatGPT เป็นตัวอย่างเด่น โดยตอบสนองต่ออินพุตหลายประเภทตามขั้นตอนที่กำหนดไว้ล่วงหน้า แต่ยังไม่มีความเป็นอัตโนมัติเต็มรูปแบบ
- Horizontal Agent
  - ระบบอัตโนมัติเต็มรูปแบบที่สามารถจัดการปัญหาได้หลากหลาย
  - Claude computer-use เป็นตัวอย่างเด่น โดยใช้ซอฟต์แวร์มาตรฐานของบริษัทเพื่อทำงานตามคำสั่งของผู้ใช้และแก้ปัญหาในลักษณะคล้ายมนุษย์

ความเชื่อมโยงระหว่าง Vertical Workflow กับ The Bitter Lesson

ผลิตภัณฑ์ส่วนใหญ่ที่นำเสนอใน Demo Day จัดอยู่ในรูปแบบ Vertical Workflow
- เนื่องจากความน่าเชื่อถือของโมเดลปัจจุบันยังไม่เพียงพอ จึงยากที่จะใช้แนวทางอื่น
- มีแนวโน้มจะจำกัดแม้แต่ปัญหาที่ซับซ้อนให้อยู่ในรูป Vertical Workflow เพื่อให้ได้ประสิทธิภาพที่ยอมรับได้
แม้จะปรับปรุงโซลูชันเหล่านี้ได้ด้วยงานวิศวกรรม แต่ก็มีข้อจำกัด
- ปัญหาที่โมเดลปัจจุบันยังแก้ไม่ได้ การรอโมเดลที่ก้าวหน้ากว่าน่าจะเป็นกลยุทธ์ที่ดีกว่า
- ข้อสังเกตของ Leopold Aschenbrenner: เวลาที่ต้องรอโมเดลที่ดีกว่าอาจสั้นกว่าการทำงานวิศวกรรม

ความสัมพันธ์ระหว่าง The Bitter Lesson กับผลิตภัณฑ์ AI ปัจจุบัน

นักวิจัย AI เคยออกแบบโซลูชันที่อาศัยความรู้เพื่อให้ได้ “ประสิทธิภาพที่ยอมรับได้” แต่ท้ายที่สุดโซลูชันแบบทั่วไปที่ใช้ทรัพยากรคอมพิวต์มากกว่าก็แซงหน้า
วิธีพัฒนาผลิตภัณฑ์ AI ในปัจจุบันก็คล้ายกับรูปแบบนี้

การนำข้อสังเกต 4 ข้อของ Bitter Lesson ไปใช้กับประเภทของข้อจำกัด

ข้อสังเกตสำคัญ 4 ข้อที่กล่าวถึงใน Bitter Lesson สะท้อนให้เห็นอย่างชัดเจนในข้อจำกัดด้านความเป็นอัตโนมัติและความเฉพาะทางของผลิตภัณฑ์ AI เช่นกัน
เมื่ออธิบายแยกตามข้อจำกัดแต่ละประเภท จะได้ดังนี้:

ข้อสังเกตข้อแรก: นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์

ข้อจำกัดด้านความเป็นอัตโนมัติ:
- นักพัฒนาทดลองใช้เอเจนต์อัตโนมัติ แต่ความน่าเชื่อถือยังต่ำ
- ดังนั้นจึง hardcode ขั้นตอนงานให้อยู่ในรูป workflow เพื่อให้ทำตามกระบวนการเดียวกับที่มนุษย์ใช้แก้ปัญหา
ข้อจำกัดด้านความเฉพาะทาง:
- นักพัฒนาต้องการสร้างระบบวิเคราะห์เอกสารแบบทั่วไป แต่ติดปัญหาเรื่องความน่าเชื่อถือ
- จึงหันไปโฟกัสที่เอกสารบางประเภท เช่น งบการเงิน และ hardcode metric เฉพาะกับกฎการตรวจสอบลงไป

ข้อสังเกตข้อที่สอง: ในระยะสั้น วิธีนี้ได้ผลและทำให้นักวิจัยรู้สึกพอใจ

ข้อจำกัดด้านความเป็นอัตโนมัติ:
- การ hardcode workflow ช่วยเพิ่มความเสถียร
ข้อจำกัดด้านความเฉพาะทาง:
- การทำให้เชี่ยวชาญเฉพาะเอกสารและ metric ช่วงแคบช่วยเพิ่มความแม่นยำ

ข้อสังเกตข้อที่สาม: ในระยะยาว ความก้าวหน้าจะชะงักและยิ่งไปกว่านั้นยังกลายเป็นอุปสรรค

ข้อจำกัดด้านความเป็นอัตโนมัติ:
- workflow ที่ hardcode ไว้ไม่สามารถรับมือสถานการณ์ใหม่ได้ จึงนำไปสู่ผลลัพธ์ที่ไม่แม่นยำ
ข้อจำกัดด้านความเฉพาะทาง:
- ระบบที่จัดการได้เฉพาะปัญหาบางอย่าง ไม่สามารถรองรับงานที่เกี่ยวข้อง เช่น เอกสารที่รวมหลายประเภทหรือการวิเคราะห์ผลประกอบการ
- แต่ละงานจึงต้องมีระบบเฉพาะทางแยกกัน

ข้อสังเกตข้อที่สี่: จุดเปลี่ยนเกิดขึ้นจากการขยายทรัพยากรคอมพิวต์

ข้อจำกัดด้านความเป็นอัตโนมัติ:
- โมเดลรุ่นใหม่สามารถค้นหาแนวทางที่เหมาะสมได้แบบไดนามิก แก้ข้อผิดพลาดได้เมื่อจำเป็น และทำให้เกิดเอเจนต์อัตโนมัติที่เชื่อถือได้
ข้อจำกัดด้านความเฉพาะทาง:
- โมเดลรุ่นใหม่สามารถเข้าใจเอกสารธุรกิจทั้งหมดได้อย่างครอบคลุมและดึงข้อมูลที่เกี่ยวข้องออกมาได้ ทำให้ไม่จำเป็นต้องมีระบบเฉพาะทางอีกต่อไป
ในปัญหาที่ต้องการความเป็นอัตโนมัติ ผลิตภัณฑ์ที่อัตโนมัติมากกว่าจะทำผลงานได้ดีกว่า
เมื่อต้องรับมือกับอินพุตที่ซับซ้อนและมีขอบเขตกว้าง ผลิตภัณฑ์ที่เฉพาะทางน้อยกว่าจะให้ผลลัพธ์ดีกว่า

สรุปส่งท้าย: AI สตาร์ตอัปกับ The Bitter Lesson

บทความนี้เป็นตอนแรกของซีรีส์ 4 ตอนที่สำรวจบทบาทของสตาร์ตอัปในโลก AI โดยเน้นย้ำรูปแบบทางประวัติศาสตร์ที่โมเดล AI ซึ่งอาศัยความรู้เชิงโดเมนถูกแทนที่อย่างต่อเนื่องด้วยโมเดลที่ใช้ทรัพยากรคอมพิวต์
ผลิตภัณฑ์ AI ในปัจจุบันมีลักษณะคล้ายกับรูปแบบนี้อย่างน่าทึ่ง
การพัฒนาซอฟต์แวร์เพื่อชดเชยข้อจำกัดของโมเดลปัจจุบัน เป็นกลยุทธ์ที่มีโอกาสล้มเหลวสูง โดยเฉพาะในสถานการณ์ที่โมเดลพัฒนาอย่างรวดเร็ว
ข้อสังเกตของ Jarred พาร์ตเนอร์จาก YC: แอป LLM แบบ vertical workflow รุ่นแรก ๆ ถูกแทนที่โดยโมเดล GPT รุ่นถัดไป
คำแนะนำของ Sam Altman: สิ่งสำคัญคือการสร้างสตาร์ตอัปที่ไม่กลัวการมาของโมเดลที่ดีกว่า และกลับคาดหวังได้ด้วยซ้ำ
ผู้ก่อตั้งจำนวนมากในเลเยอร์แอปพลิเคชัน AI ตื่นเต้นกับการเปิดตัวโมเดลใหม่ แต่สิ่งนี้อาจเป็นสัญญาณอันตราย
- หากมีโมเดลที่ดีกว่าออกมา อาจทำให้ความได้เปรียบในการแข่งขันในปัจจุบันลดลงอย่างมาก
- โดยเฉพาะเมื่อมองในแง่ประสิทธิภาพของผลิตภัณฑ์ในการแก้ปัญหาที่ยากขึ้นได้ดีกว่า ความเสี่ยงนี้จะยิ่งชัดเจน
บทความถัดไปจะสำรวจอีกมิติหนึ่งคือการยอมรับของตลาด และอภิปรายว่าประสิทธิภาพที่ดีกว่าไม่ได้รับประกันความสำเร็จในตลาดเสมอไป

บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน (No Powers)

tl;dr:

ในประวัติศาสตร์ของ AI แนวทางที่พยายามชดเชยข้อจำกัดของโมเดลด้วยความรู้เฉพาะโดเมน มักถูกแซงในท้ายที่สุดโดยแนวทางที่ใช้ทรัพยากรคอมพิวต์เพื่อทำให้เป็นวิธีการแบบทั่วไป
vertical AI เข้าสู่ตลาดก่อนด้วยวิธีเพิ่มความแม่นยำผ่านการกำหนด task flow เฉพาะล่วงหน้าเพื่อชดเชยข้อจำกัดของโมเดลในปัจจุบัน
horizontal AI เป็นแนวทางที่ใช้โมเดลอเนกประสงค์อย่าง ChatGPT และพัฒนาต่อเนื่อง ซึ่งมีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าในหลายสาขาทุกครั้งที่โมเดลได้รับการปรับปรุง
ในระยะยาว horizontal AI มีแนวโน้มได้เปรียบเหนือ vertical AI ที่มีข้อจำกัดหลายอย่าง เพราะมีทั้งประสิทธิภาพและความยืดหยุ่นสูงกว่า

ความยากของปัญหาและเส้นโค้งประสิทธิภาพ

Figure 1 เป็นตัวอย่างอย่างง่ายที่แสดงว่า vertical AI เข้าสู่ตลาดก่อน แต่ท้ายที่สุด horizontal AI ที่โมเดลได้รับการปรับปรุงแล้วจะไล่แซงด้านประสิทธิภาพ
ในกรณีที่ปัญหามีความยากสูง (Figure 2) vertical AI อาจไปไม่ถึงระดับประสิทธิภาพที่เพียงพอเลย และต้องรอให้ horizontal AI พัฒนาขึ้นก่อนจึงจะเริ่มแก้ปัญหาได้
ปัญหาที่ vertical AI นำไปใช้ได้ในตอนนี้ค่อนข้างเป็น “ปัญหาความยากต่ำ” ดังนั้นแม้จะได้ประโยชน์จากการเข้าตลาดก่อนในหมวดนี้ แต่ความสามารถในการแข่งขันระยะยาวยังไม่แน่นอน

แนวคิด “ผู้ร่วมงานทางไกล” ที่ horizontal AI มอบให้

ในอนาคต horizontal AI อาจพัฒนาไปเป็นรูปแบบคล้ายพนักงานทางไกล ที่ได้รับคอมพิวเตอร์และบัญชีผู้ใช้ แล้วสามารถค้นหาและใช้ข้อมูลที่จำเป็นได้ด้วยตนเอง
UI ที่ผู้ใช้จำนวนมากคุ้นเคยอยู่แล้ว เช่น ChatGPT อาจค่อย ๆ ถูกเสริมความสามารถ จนเอื้อต่อการนำไปใช้ในองค์กรได้อย่างรวดเร็ว
เนื่องจาก horizontal AI สามารถดูดซับความสามารถใหม่ ๆ ได้ทันทีทุกครั้งที่โมเดลพัฒนา จึงรักษาความได้เปรียบในการแข่งขันได้ง่ายกว่า vertical AI

กรณีก่อนหน้า: ประสบการณ์กับ AcademicGPT

ในช่วง GPT-3.5 ผู้เขียนเปิดตัว AcademicGPT เพื่อก้าวข้ามข้อจำกัดด้านอินพุตยาว แต่เมื่อ GPT-4 รองรับอินพุตยาวเป็นพื้นฐานแล้ว โซลูชันเดิมก็ถูกแทนที่อย่างรวดเร็ว
อย่างที่ Jared พาร์ตเนอร์ของ YC กล่าวไว้ว่า “แอป LLM รุ่นแรกส่วนใหญ่แพ้ให้กับโมเดลรุ่นถัดไป”
vertical AI ที่รวมหลายความสามารถไว้พร้อมกันก็เสี่ยงจะเจอกระบวนการเดียวกัน เมื่อประสิทธิภาพของโมเดลพัฒนาไปอีก

การวิเคราะห์ 7 Powers ของ Helmer

ในส่วนนี้จะพิจารณาว่า vertical AI สามารถแข่งขันกับ horizontal AI ได้หรือไม่ ผ่านกรอบความได้เปรียบทางการแข่งขัน 7 ประการของ Hamilton Helmer (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource)
Switching Cost (ต้นทุนการเปลี่ยน)
- แม้ผู้ใช้จะคุ้นเคยกับ UI หรือ workflow ของโซลูชัน vertical AI บางรายแล้ว แต่ horizontal AI สามารถนำไปใช้ได้ง่ายในลักษณะ “จ้างพนักงานใหม่” แล้ว onboard เข้ามา
- ปัจจุบันมีองค์กรเพิ่มขึ้นที่นำโซลูชัน horizontal AI อย่าง ChatGPT มาใช้แล้ว จึงมีแนวโน้มว่ากระบวนการเปลี่ยนผ่านจะไม่ยาก
- ในด้านราคา horizontal AI ก็มีแนวโน้มช่วยลดต้นทุน เพราะสามารถรวมหลายโซลูชันแบบ vertical เข้าไว้ด้วยกันได้
Counter Positioning (การวางตำแหน่งสวนกลับ)
- vertical AI อาจมอบคุณค่าเฉพาะทางด้วยโซลูชันที่ออกแบบมาสำหรับตลาดหนึ่งโดยเฉพาะ แต่เมื่อโมเดลค่อย ๆ ดีขึ้น horizontal AI ก็มีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าโดยรวม
- vertical AI เผชิญภาวะกลืนไม่เข้าคายไม่ออก คือทุกครั้งที่นำโมเดลใหม่เข้ามาใช้ ก็อาจสูญเสียความแตกต่างเพราะ “ข้อจำกัด” เดิม หรือถ้าปลดข้อจำกัดเหล่านั้น ก็จะยิ่งคล้ายโมเดลแนวนอนมากขึ้นในที่สุด
Scale Economy (เศรษฐศาสตร์จากขนาด)
- vertical AI ก็เหมือน SaaS ตรงที่ลดต้นทุนได้ตามขนาด แต่ horizontal AI เองก็มีข้อได้เปรียบจากการรวมหลายสาขาเข้าด้วยกันและกระจายต้นทุนได้เช่นกัน
- การนำโมเดลแนวนอนที่พัฒนาด้วยการลงทุน R&D ขนาดใหญ่มาใช้ในหลายกรณี จะยิ่งเร่งการลดต้นทุนได้
Network Economy (อานิสงส์เครือข่าย)
- ทั้ง vertical AI และ horizontal AI ต่างมีโอกาสพัฒนาจากข้อมูลผู้ใช้ได้ แต่ horizontal AI ได้เปรียบมากกว่าเพราะรับฟีดแบ็กจากฐานผู้ใช้ที่กว้างกว่า และยกระดับประสิทธิภาพโดยรวมของโมเดลได้
- เนื่องจากใช้ข้อมูลที่สะสมจากหลายสาขาเพื่อพัฒนาโมเดลทั้งระบบ จึงอาจก้าวหน้าได้เร็วเกินกว่าที่ vertical AI จะตามทัน
Brand Power (พลังของแบรนด์)
- พลังของแบรนด์เป็นความได้เปรียบที่แทบสร้างไม่ได้ในช่วงที่ยังเป็นสตาร์ทอัปขนาดเล็ก
- บริษัทอย่าง OpenAI หรือ Google ที่มีอิทธิพลด้านแบรนด์อยู่แล้วเป็นข้อยกเว้น แต่สตาร์ทอัป vertical AI ส่วนใหญ่ยากจะใช้แบรนด์เป็นอาวุธหลัก
Process Power (พลังของกระบวนการ)
- พลังของกระบวนการก็เป็นความได้เปรียบที่มักเกิดจากระบบปฏิบัติการภายในที่องค์กรขนาดใหญ่ขัดเกลามาเป็นเวลานาน
- สำหรับสตาร์ทอัประยะเริ่มต้น สิ่งนี้แทบไม่ใช่หมวดที่เกี่ยวข้อง
Cornered Resource (ทรัพยากรผูกขาด)
- ทรัพยากรผูกขาดจะกลายเป็นความได้เปรียบที่สำคัญก็ต่อเมื่อมีเพียงบริษัทเดียวที่ถือครองข้อมูลหรือทรัพยากรนั้น และทรัพยากรดังกล่าวจำเป็นอย่างแท้จริงต่อสาขานั้น
- สตาร์ทอัป AI จำนวนมากอ้างว่าตนมี “ข้อมูลผูกขาด” แต่ในความเป็นจริง ข้อมูลนั้นมักไม่ได้ผูกขาดอย่างแท้จริง หรือถึงไม่มีข้อมูลนั้น โมเดลก็ยังเรียนรู้ได้เพียงพอ
- ในทางกลับกัน บริษัทที่ครอบครองทรัพยากรผูกขาดอย่างแท้จริงอาจยังคงรักษาความสามารถในการแข่งขันไว้ได้ แม้ horizontal AI จะพัฒนาไปมากก็ตาม

บทสรุป

สุดท้ายแล้ว แม้จะเป็นสถานการณ์ที่ vertical AI ได้ประโยชน์จากการเข้าตลาดก่อน หาก horizontal AI มีประสิทธิภาพสูงกว่า vertical AI ส่วนใหญ่ก็จะอยู่รอดได้ยาก
ในบรรดา 7 Powers ของ Helmer มีเพียงกรณีที่ครอบครอง “Cornered Resource” อย่างแท้จริงเท่านั้น ที่ vertical AI อาจรักษาโมเมนตัมระยะยาวไว้ได้
เช่นเดียวกับกรณีของ AcademicGPT ที่ล่มสลายอย่างรวดเร็วหลัง GPT-4 เปิดตัว vertical AI ที่เสริมฟังก์ชันหลายอย่างเข้าไปก็อาจเผชิญเส้นทางคล้ายกันเมื่อโมเดลพัฒนาขึ้น
ในบทถัดไป (บทที่ 3) จะคาดการณ์ว่า horizontal AI ในรูปแบบ “ผู้ร่วมงานทางไกล” จะเกิดขึ้นจริงเมื่อใดและอย่างไร พร้อมเจาะลึกอุปสรรคด้านเทคนิค กฎระเบียบ ความน่าเชื่อถือ และเศรษฐศาสตร์ที่ขัดขวางสิ่งนี้อยู่

บทที่ 3: ร่องรอยเชิงอรรถในประวัติศาสตร์ (A Footnote in History)

มีการเผยแพร่บทสัมภาษณ์ที่ CEO ของ Anthropic อธิบายแนวคิด “virtual collaborator”
แนวคิดนี้คล้ายกับสิ่งที่ผู้เขียนเรียกในซีรีส์นี้ว่า “horizontal AI product”
คาดว่า OpenAI จะประกาศ “Operator” ในเร็ว ๆ นี้ และตามเบนช์มาร์กที่หลุดออกมา ประสิทธิภาพนำหน้า Claude อย่างมาก (บน OSWorld benchmark Claude ได้ 22%, Operator ได้ 38%)
การเพิ่มขึ้นของประสิทธิภาพนี้ยังอยู่ในกรอบที่คาดไว้ และผู้เขียนยังคงยืนตามการคาดการณ์เมื่อ 3 เดือนก่อน
ในบทก่อนหน้าได้อธิบายแล้วว่าทำไมแอปพลิเคชัน vertical AI จึงรักษาความสามารถในการแข่งขันได้ยาก
- ช่องว่างด้านประสิทธิภาพกับโซลูชัน AI ทั่วไปกำลังแคบลง
- เมื่อผลิตภัณฑ์ horizontal AI แข่งขันได้แล้ว ผลิตภัณฑ์ vertical AI ก็แทบไม่มีวิธีป้องกันตัว
คำถามสำคัญคือ: “การเปลี่ยนผ่านจาก vertical AI ไปสู่ horizontal AI จะเกิดขึ้นเมื่อไร?”
- หากอีก 10 ปีค่อยเกิดขึ้น การพัฒนา vertical AI ตอนนี้ก็อาจยังมีความหมาย
- แต่หากความเปลี่ยนแปลงมาถึงภายใน 1–2 ปี ก็จำเป็นต้องใช้กลยุทธ์ที่ต่างออกไปโดยสิ้นเชิง
การเปลี่ยนผ่านจาก vertical AI ไปเป็น horizontal AI จะไม่ได้เกิดขึ้นพร้อมกันในทุกอุตสาหกรรม
อย่างไรก็ตาม ตลาดที่สตาร์ทอัป AI ส่วนใหญ่กำลังมุ่งเน้นอยู่ในตอนนี้เป็นสาขาที่ค่อนข้างเรียบง่าย จึงคาดว่าการเปลี่ยนแปลงจะเกิดขึ้นในช่วงเวลาใกล้เคียงกันในอุตสาหกรรมหลักต่าง ๆ
มีการคาดการณ์ว่าภายในปี 2027 ผลิตภัณฑ์ vertical AI จะอยู่รอดได้ยากในอุตสาหกรรมส่วนใหญ่
“adoption” หมายถึง เมื่อผู้ใช้ต้องแก้ปัญหาใหม่หรือเปลี่ยนวิธีแก้ปัญหาเดิม พวกเขาเลือกผลิตภัณฑ์ใด
การวิเคราะห์นี้ไม่พิจารณาปัจจัยต่อไปนี้
- ส่วนแบ่งตลาด: อาจได้รับผลจากสัญญาเดิมหรือปัจจัยอื่น
- ขนาดสัมบูรณ์: แม้ตลาดจะขยายตัวเพราะ AI เปิดกรณีใช้งานใหม่ ๆ แต่การวิเคราะห์นี้พิจารณาเฉพาะการเปลี่ยนแปลงเชิงสัมพัทธ์
- มูลค่าแฝงในอนาคต: การประเมินนี้ดูว่าผู้คนเลือกโซลูชันใด ณ เวลาปัจจุบัน โดยไม่นับรวมความเป็นไปได้ในการพัฒนาในอนาคต
ตัวอย่างเช่น หากกระแสย้ายจาก A ไป B นั่นหมายความว่าในอดีต A เคยเป็นตัวเลือกที่ได้รับความนิยม แต่ตอนนี้ B ถูกมองว่าเป็นทางเลือกที่ดีกว่าแล้ว

แนวคิด AI แนวตั้ง/แนวนอน และ workflow/agent

"AI แนวตั้ง (vertical)" และ "AI แนวนอน (horizontal)" หมายถึงประเภทของผลิตภัณฑ์ AI ที่แตกต่างกัน
"เวิร์กโฟลว์ (workflow)" และ "เอเจนต์ (agent)" ก็เป็นแนวคิดที่ใช้จัดประเภทผลิตภัณฑ์ AI เช่นกัน
ในเอกสารนี้ จะอธิบายแนวคิดเรื่องเวิร์กโฟลว์และเอเจนต์รวมกันภายในผลิตภัณฑ์ AI แนวนอน
- มีความเป็นไปได้สูงว่าบริษัทเดียวกันจะพัฒนาผลิตภัณฑ์ที่มีทั้งสองความสามารถรวมอยู่ด้วย
- ตัวอย่างเช่น ChatGPT อาจเพิ่มความสามารถแบบเอเจนต์เข้าไป ขณะเดียวกันก็ยังคงฐานแบบเวิร์กโฟลว์เดิมไว้

อดีต

(1) ช่วงก่อน ChatGPT เป็นสถานการณ์ที่ซอฟต์แวร์แบบดั้งเดิมครองตลาด
(2) การเปิดตัว ChatGPT ทำให้เกิดผลิตภัณฑ์ AI แนวนอนที่มีความหมายเป็นครั้งแรก
(3) หลังการมาถึงของ GPT-3.5 API ผลิตภัณฑ์แนวตั้งจำนวนมากที่ออกแบบมาสำหรับ AI โดยเฉพาะก็เริ่มเปิดตัวเป็นครั้งแรก

ปีนี้

(4) มีการคาดการณ์ว่าในปี 2025 ประสิทธิภาพของโมเดลจะมีเสถียรภาพเพียงพอสำหรับการใช้งานเป็นเอเจนต์ที่ใช้งานได้จริง
- เอเจนต์ที่จนถึงตอนนี้ถูกใช้เพียงในโครงการวิจัยหรือการทดสอบแบบจำกัด คาดว่าจะเริ่มถูกนำมาใช้อย่างจริงจัง
- ผลิตภัณฑ์เวิร์กโฟลว์แนวตั้งเดิมก็มีโอกาสเปลี่ยนรูปแบบไปเป็น AI agent เช่นกัน
(5) แม้เอเจนต์จะเริ่มปรากฏขึ้น แต่คาดว่าจนถึงปี 2025 เวิร์กโฟลว์แนวตั้งจะยังคงรักษาตำแหน่งที่ครองตลาดไว้
- นิสัยของผู้ใช้ที่ไม่อยากเปลี่ยนเครื่องมือที่ใช้อยู่แล้ว และแรงเฉื่อยของนักพัฒนาที่ต้องการใช้ประโยชน์จากทรัพยากรทางวิศวกรรมที่สร้างไว้ต่อไป จะยังคงมีผล
(6) คาดว่าผลิตภัณฑ์ AI แนวนอนหลักอย่าง ChatGPT, Claude และ Gemini จะขยายความสามารถและครอบคลุมโดเมนแนวตั้งได้มากขึ้น
- มีความเป็นไปได้ที่ความสามารถเฉพาะทางเดิมของผลิตภัณฑ์ AI แนวตั้งจะถูกดูดซับเข้าไปในผลิตภัณฑ์ AI แนวนอนอย่างรวดเร็ว
- ตอนนี้ ChatGPT เริ่มเชื่อมต่อกับแอปเดสก์ท็อปแล้ว

อนาคตอันใกล้

(7) คาดว่าช่องว่างด้านความสามารถระหว่าง AI agent แนวนอนกับแรงงานมนุษย์จะค่อย ๆ แคบลง
- แม้จะยังไม่ถึงระดับผู้เชี่ยวชาญ แต่ก็คาดว่าจะมีประสิทธิภาพพอสำหรับการทำงานอัตโนมัติกับงานสำนักงานทั่วไปได้อย่างมาก
- ด้วยเหตุนี้ เหตุผลในการมีอยู่ของโซลูชัน AI แนวตั้งอาจลดลง
- ตัวอย่างที่เป็นรูปธรรม:
  - ผู้ใช้รายบุคคลอาจมอบหมายงานซับซ้อน เช่น การยื่นภาษีหรือการเตรียมหางาน ให้เอเจนต์แนวนอนจัดการ
  - บริษัทอาจแทนที่หรือลดจำนวนพนักงานระดับจูเนียร์ลงได้อย่างมาก
  - อาจเกิดกรณีที่คนเพียงคนเดียวสามารถสร้างมูลค่าระดับยูนิคอร์นได้
(8) คาดว่าซอฟต์แวร์แบบดั้งเดิมจะยังคงมีคุณค่าในฐานะอินเทอร์เฟซที่เอเจนต์สามารถใช้งานได้
- การให้เอเจนต์ใช้ซอฟต์แวร์ที่มีอยู่เดิมอาจคุ้มค่ากว่าการให้มันสร้างซอฟต์แวร์ใหม่ทั้งหมดขึ้นมาเองโดยตรง
- โดยเฉพาะซอฟต์แวร์อเนกประสงค์และซอฟต์แวร์แนวนอน มีแนวโน้มสูงกว่าจะอยู่รอด
(9) ผลิตภัณฑ์ AI แนวตั้งที่จะอยู่รอดได้น่าจะมีเพียงส่วนน้อยที่ครอบครองทรัพยากรเชิงป้องกันซึ่งกล่าวถึงในบทที่ 2 (เช่น ข้อมูลผูกขาด สิทธิบัตร เป็นต้น)
- พวกเขาอาจสามารถขายทรัพยากรเหล่านั้นได้ในมูลค่าสูง

2024 - การพัฒนาหยุดชะงักหรือไม่?

มีการประเมินว่าคำกล่าวอ้างว่าโมเดล AI หยุดนิ่งในปี 2024 นั้นไม่น่าเชื่อถือมากนัก
- ตั้งแต่ก่อนการเปิดตัว o3 ประสิทธิภาพของโมเดลในหลายด้าน เช่น GPT-4, Claude และ Open Weight model ก็พัฒนาขึ้นอย่างต่อเนื่อง
- คะแนนเบนช์มาร์กอย่าง ARC-AGI และ GPQA Diamond ก็ปรับตัวดีขึ้นอย่างก้าวกระโดดมาโดยตลอด
Anthropic พัฒนาอย่างรวดเร็วจาก Claude 2 ไปสู่ Claude 3 และต่อด้วย Claude 3.5 Sonnet และมีการคาดเดาว่าบริษัทได้นำอัปเกรดที่ยังไม่เปิดเผยมาใช้ภายในองค์กร
ด้วยเหตุนี้ จึงมีมุมมองว่าคำกล่าวอ้างว่าปี 2024 เป็นปีที่การปรับปรุงโมเดล AI หยุดลงนั้นขาดหลักฐานรองรับ

อุปสรรคที่อาจเกิดขึ้น

Model Stagnation: แม้ปี 2024 จะไม่มีภาวะชะงักงัน แต่ก็มีความกังวลว่าหลังปี 2025 การพัฒนาโมเดลอาจหยุดนิ่ง
- Ilya Sutskever กล่าวถึงข้อจำกัดของวิธี Pre-training แบบดั้งเดิมในงาน NeurIPS แต่ก็เสนอพร้อมกันว่ายังมีเส้นทางอื่น เช่น Test-time compute
- สถาบันวิจัย AI และบริษัทใหญ่ ๆ ยังคงลงทุนอย่างจริงจังในทรัพยากรคอมพิวต์ขนาดมหาศาล
Regulation: หากมีกฎระเบียบที่ไม่คาดคิดเกิดขึ้น ก็อาจทำให้การพัฒนา AI ถูกจำกัด
Trust Barriers: ผู้ใช้ยังมีความกังวลเรื่องความเสถียรและความน่าเชื่อถือของเอเจนต์
- มีการคาดการณ์ว่าเมื่อเวลาผ่านไป เรื่องนี้จะถูกเอาชนะได้ โดยยกตัวอย่างกรณีในอดีตที่ความกลัวต่อระบบลิฟต์อัตโนมัติสุดท้ายก็หายไป
AI Labs Hesitate: Anthropic หรือ OpenAI อาจมีกรณีที่แม้จะมีศักยภาพทางเทคนิคจริง แต่ก็ยังคงจำกัดปฏิสัมพันธ์ของผู้ใช้ไว้บางส่วน
Expensive Inference: เช่นกรณีของ o3 การทำ inference ประสิทธิภาพสูงอาจต้องใช้ต้นทุนที่สูงมาก
- แต่ต้นทุน inference ก็กำลังลดลงเรื่อย ๆ ตามเวลา และก็มีความเป็นไปได้สูงที่เอเจนต์จะไม่ใช้การอนุมานประสิทธิภาพสูงในระดับเดียวกันกับทุกงาน
เมื่อพิจารณาปัจจัยทั้งหมดข้างต้น แม้การคาดการณ์ความก้าวหน้าทางเทคโนโลยีจะทำได้ยาก แต่คาดว่าสตาร์ทอัพ AI แนวตั้งจะเหลือเวลาไม่มากนัก
มีการเสนอกราฟมูลค่าแบบรูปตัว U ที่ชี้ว่า เมื่อโมเดล AI มีความก้าวหน้ามากขึ้น มูลค่าที่อิงกับวิศวกรรมแบบเดิมอาจสลายไปอย่างรวดเร็ว

ข้อสังเกตเพิ่มเติม

มีคำอธิบายว่าการขยาย Test-time compute ที่เห็นใน o3 เป็นผลลัพธ์ที่มีการคาดการณ์ไว้แล้วจากงานวิจัยเดิม
เช่นเดียวกับกรณีของ AlphaZero มีข้อสังเกตว่าในสภาพแวดล้อมที่สามารถตรวจสอบผลลัพธ์ได้ ประสิทธิภาพสามารถพัฒนาไปถึงระดับเหนือมนุษย์ได้อย่างรวดเร็ว
มีการวิเคราะห์ว่า o3 แม้จะโดดเด่นในด้านอย่างการเขียนโค้ดและคณิตศาสตร์ แต่ในด้านอื่น เช่น การเขียนเชิงสร้างสรรค์ ก็ไม่ได้แตกต่างจาก o1 มากนัก
มีนัยว่าการไปในทิศทางอื่นที่เกี่ยวข้องกับทรัพยากรที่กว้างขวางกว่าหรือผูกขาดมากกว่า อาจเป็นทางเลือกที่ดีกว่าสำหรับผู้ก่อตั้ง มากกว่าการพัฒนา AI แนวตั้งใหม่ขึ้นมาอีก

บทที่ 4: คุณคือพ่อมด (You’re a wizard Harry)

ผู้ก่อตั้งก็เหมือนพ่อมด

มีความสามารถในการสร้างสิ่งที่ไม่เคยมีให้เกิดขึ้น
การเริ่มต้นบริษัทใหม่ต้องอาศัยความคิดที่แปลกใหม่
คำพูดของ Paul Graham (PG): "ไอเดียต้องไม่เพียงแค่ถูกต้อง แต่ต้องแปลกใหม่ด้วย คุณไม่ควรเริ่มทำสิ่งที่ทุกคนต่างเห็นพ้องว่าเป็นความคิดที่ดี"
ผู้ก่อตั้งจำนวนมากกำลังสูญเสียความคิดที่เป็นอิสระ เพราะมัวตื่นตากับการเติบโตของรายได้ที่น่าประทับใจของเพื่อนร่วมวงการ
เมื่อทุกคนกำลังทำสิ่งเดียวกันและมันดูเหมือนจะได้ผล การคิดอย่างอิสระยิ่งเป็นเรื่องยาก
ผู้เขียนพยายามคิดอย่างอิสระ และหวังว่าแนวคิดเหล่านี้จะฟังดูเป็นความคิดที่ไม่ดี

อนาคตของเอเจนต์แนวนอนและการแข่งขัน

คาดว่าเอเจนต์แนวนอนที่จะครองชั้นแอปพลิเคชัน AI จะถูกพัฒนาโดย AI lab
แม้ประสิทธิภาพของโมเดลอาจแตกต่างจนเกิดผู้ชนะเพียงรายเดียวได้ แต่การแข่งขันที่ดุเดือดระหว่าง Anthropic, OpenAI, GDM และ xAI มีแนวโน้มเป็นไปได้มากกว่า
สิ่งนี้จะก่อให้เกิดการแข่งขันด้านราคาที่เป็นประโยชน์ต่อผู้ใช้ปลายทางในระยะสั้น
แม้ AI lab อาจยังไม่สามารถเก็บเกี่ยวมูลค่าทางการเงินได้มากนักในระยะสั้น แต่ก็ยังคาดว่าจะครองตำแหน่งที่ทรงพลังอย่างยิ่ง
ดังนั้นจึงสมเหตุสมผลที่ผู้ก่อตั้งจะมองสตาร์ทอัพของตนในบริบทของความสัมพันธ์กับห้องแล็บเหล่านี้

การเข้าหาในฐานะลูกค้า

ตามที่กล่าวไว้ในบทที่ 2 การสร้างผลิตภัณฑ์ AI แนวตั้งที่ใช้ LLM API นั้นเป็นไปได้ แต่จะเป็นไปได้ก็ต่อเมื่อมีสิทธิ์เข้าถึงทรัพยากรสำคัญแบบผูกขาด
หากต้องการสร้างผลิตภัณฑ์ AI แนวตั้ง ก็จำเป็นต้องทุ่มเทความพยายามอย่างมหาศาลเพื่อค้นหาทรัพยากรประเภทนั้น

แนวทางในฐานะคู่แข่ง

หากเอเจนต์แนวนอนคืออนาคต ทำไมไม่สร้างมันขึ้นมาเสียเอง? พิจารณาแนวทางอยู่สามแบบ
การช่วงชิงตลาดก่อน
- แล็บ AI จะเข้ามาแข่งขันกับเวิร์กโฟลว์แนวตั้งอย่างจริงจังก็ต่อเมื่อโมเดลมีความน่าเชื่อถือมากพอที่จะสร้างเอเจนต์แนวนอนได้ด้วยความพยายามด้านวิศวกรรมเพียงเล็กน้อย
- ในทางทฤษฎี เราอาจนำความพยายามด้านวิศวกรรมไปใช้กับโมเดลรุ่นก่อนหน้าและเข้าสู่ตลาดก่อนแล็บได้ แต่ก็ไม่แน่นอน
- Leopold Aschenbrenner มองว่าความพยายามนี้อาจใช้เวลานานกว่าการสร้างโมเดลรุ่นถัดไปเสียอีก: "อาจต้องใช้เวลาพอสมควรกว่าที่พนักงานทางไกลจะทำงานจำนวนมากให้เป็นอัตโนมัติได้ และในระหว่างนั้น โมเดลระดับกลางอาจยังไม่ได้ถูกใช้งานและบูรณาการอย่างเต็มที่"
- ไม่ว่าใครจะเข้าตลาดก่อน ก็คาดว่าความได้เปรียบนี้จะอยู่ได้ไม่นาน
ตัวหุ้ม API ของเอเจนต์
- เพื่อนร่วมห้องถามว่า "บนโลกนี้ไม่มีใครมีทักษะด้าน UI เลยหรือ?"
- นี่ชี้ให้เห็นปัญหาสองอย่าง: 1) ต้นทุน API ทำให้มาร์จินไม่ยั่งยืน 2) แล็บไม่เปิดเผยโมเดลที่ดีที่สุดออกมา (ChatGPT ใช้โมเดลเฉพาะภายในสำหรับการค้นหา การท่องเว็บ ฯลฯ)
- ปัจจุบันไม่มีใครใช้ GPT API เพื่อแข่งขันกับ ChatGPT โดยตรง และคาดว่าแพตเทิร์นนี้จะเกิดซ้ำกับเอเจนต์แนวนอน
โมเดลโอเพนซอร์ส
- โมเดลโอเพนซอร์สอาจเป็นอีกเส้นทางหนึ่ง
- Perplexity แสดงให้เห็นว่าสามารถแข่งขันกับแล็บในผลิตภัณฑ์แนวนอนได้
- อย่างไรก็ตาม โมเดลโอเพนซอร์สมักทำได้ดีในการวัดผลแบบ benchmark ที่เรียบง่าย แต่กลับลำบากกับงานเอเจนต์ที่ซับซ้อน
- Llama-3.1-405b ตามหลังโมเดลชั้นนำอย่างมากใน MLE-bench
- ที่ Andon Labs เชี่ยวชาญ benchmark ประเภทนี้ และสิ่งนั้นก็สอดคล้องกับสิ่งที่เราเห็น
- Deepseek V3 และ R1 เปิดตัวพร้อมผลลัพธ์ที่น่าประทับใจมาก แต่ o3 ก็เช่นกัน และมีรายงานว่า Anthropic มีเวอร์ชันที่ดีกว่านี้อยู่ภายใน
- โมเดลโอเพนซอร์สอาจเข้าใกล้ระดับแนวหน้าได้ แต่ก็น่าสงสัยว่าจะเหนือกว่าได้
- ถึงอย่างนั้น มันก็อาจดีพอสำหรับการแข่งขันในเกมแนวนอน
- ต้นทุนการอนุมานยังคงสูงมากอยู่ดี

แนวทางในฐานะซัพพลายเออร์

หากแล็บ AI ทรงพลังได้ถึงระดับนั้นจริง การเป็นซัพพลายเออร์ให้พวกเขาถือเป็นตำแหน่งที่ยอดเยี่ยม
พวกเขาจะต้องการพลังประมวลผลและพลังงานจำนวนมากอย่างแน่นอน
หากการวิเคราะห์ของ Leo ถูกต้อง พวกเขาอาจต้องการมากกว่าที่คาดไว้เสียอีก
โอกาสนี้ต้องอาศัยความเชี่ยวชาญเชิงอุตสาหกรรม ซึ่งอาจไม่ใช่สิ่งที่เป็นธรรมชาติสำหรับผู้ก่อตั้งที่อยู่ในชั้นแอปพลิเคชัน AI ตอนนี้
แต่อย่าลืมว่าคุณเป็นพ่อมด
แล็บยังซื้อข้อมูลจากบุคคลที่สามด้วย
Scale AI กำลังพิสูจน์ว่านี่คือธุรกิจที่ยอดเยี่ยม
อย่างไรก็ตาม ยังน่าสงสัยว่าแล็บ AI จะทำให้ "การเรียนรู้ด้วยตนเอง" ใช้งานได้จริงหรือไม่
AlphaZero ถูกฝึกโดยไม่มีข้อมูลภายนอก และสิ่งนี้ถูกมองว่าเป็นจอกศักดิ์สิทธิ์ของโมเดล AI ในอนาคต
หากพวกเขาทำให้การเรียนรู้ด้วยตนเองใช้ไม่ได้จริง ทางเลือกก็คือการรวมชุดข้อมูลสำหรับการฝึกขั้นต่อเนื่องหลายชุดเข้าด้วยกัน
ในโลกแบบนั้น การขายข้อมูลน่าจะเป็นทางเลือกที่ดี

แนวทางในฐานะผู้มีส่วนร่วมในระบบนิเวศ

สิ่งสุดท้ายที่ควรพิจารณาในความสัมพันธ์กับแล็บ AI คือการเป็นผู้มีส่วนร่วมในระบบนิเวศ
นั่นหมายถึงการสร้างเครื่องมือที่ช่วยเอเจนต์แนวนอน แต่สิ่งสำคัญคือต้องแยกออกจากตัวเอเจนต์เอง
ดังที่แสดงไว้ในบทที่ 3 ซอฟต์แวร์แบบดั้งเดิมจะยังคงอยู่ต่อไป เพราะเอเจนต์ต้องการอินเทอร์เฟซที่มีประสิทธิภาพ
เอเจนต์อาจเขียนซอฟต์แวร์ของตัวเองได้ แต่ต้นทุนการอนุมานอาจทำให้สิ่งนี้ไม่คุ้มในทางปฏิบัติ
อย่างไรก็ตาม ผู้เล่นในระบบนิเวศมีความเสี่ยงที่จะกลายเป็นสินค้าโภคภัณฑ์ และมูลค่าส่วนใหญ่อาจถูกเก็บเกี่ยวไปที่อื่น
เรื่องนี้จะขึ้นอยู่กับว่าต้นทุนการอนุมาน (inference cost) สำหรับการรันเอเจนต์แนวนอนนั้นสูงเพียงใด
- หากต้นทุนการอนุมานต่ำ ก็จะยิ่งพบเห็นการที่เอเจนต์สร้างซอฟต์แวร์ที่ตัวเองต้องการขึ้นมาเองได้ทั่วไปมากขึ้น

หากเอเจนต์ AI แนวนอนมาช้ากว่าที่คาดล่ะ?

กรอบเวลา (timeline) มีความสำคัญมาก
- หากเอเจนต์แนวนอนจะมีความสามารถในการแข่งขันได้จริง อีก 10 ปีข้างหน้า การสร้างเวิร์กโฟลว์ AI แนวตั้งในตอนนี้ก็น่าจะเป็นความคิดที่ยอดเยี่ยม
- เวลาระดับนี้เพียงพอที่จะ สร้างบริษัทที่ใหญ่และแข็งแกร่งได้
แต่เมื่อดูจากความเร็วของความก้าวหน้าในแล็บ AI แล้ว 10 ปีดูไม่สมจริง
- ถ้าอย่างนั้น อีก 4 ปีล่ะ?
- 4 ปีอาจไม่พอสำหรับการสร้างบริษัทยักษ์ใหญ่ แต่ก็ให้โอกาสสำหรับการทำซ้ำปรับปรุง (iteration) ได้มากพอ
- การเริ่มจากชั้นแอปพลิเคชัน AI อาจช่วยให้เปลี่ยนไปเป็นผู้ขายหรือผู้เล่นในระบบนิเวศได้ง่ายขึ้นในภายหลัง

บทส่งท้าย: นี่คือความผิดพลาดของ YC(Y Combinator) หรือไม่?

เมื่อมองผิวเผิน อาจดูเหมือนว่า YC กำลังตัดสินใจผิดพลาด
- ตอนนี้ YC กำลังทุ่มการลงทุนส่วนใหญ่ไปที่ ผลิตภัณฑ์ AI แนวตั้ง
- แต่ ตลาดนี้มีโอกาสสูงที่จะหายไปในไม่ช้า
อย่างไรก็ตาม ผู้เขียน ไม่ได้มีความเชี่ยวชาญด้าน VC(venture capital) มากพอ จึงไม่อาจสรุปอย่างมั่นใจได้
- เพียงแค่ กำลังสับสนและแบ่งปันความกังวลเท่านั้น
YC อ้างว่าตนใช้กลยุทธ์การลงทุนที่ ค่อนข้างเป็นกลาง
- ลงทุนในคนที่ฉลาด แล้วหวังให้พวกเขาค้นหาไอเดียที่ดีที่สุด
- นี่เป็นกลยุทธ์ที่ยอดเยี่ยม และ ผู้ก่อตั้งหลายร้อยคนอาจคาดการณ์อนาคตได้ดีกว่าพาร์ตเนอร์ YC 14 คน
แต่ผู้เขียน กังวลว่าระบบ batch ของ YC อาจผลักดันให้เกิดการคิดระยะสั้น
- ใน YC การ ตั้งเป้าหมายรายสัปดาห์ เป็นเรื่องสำคัญมาก และการเดินหน้าไปพร้อมกับ กลุ่มขนาดใหญ่ ก็ช่วยสร้างแรงจูงใจได้ดี
- แต่หาก ความหลากหลายของไอเดียมีไม่มากพอ ก็อาจกระตุ้นการคิดระยะสั้นได้
- การสร้างผลิตภัณฑ์ AI แนวตั้งสามารถทำให้แตะ MRR 5,000 ดอลลาร์ได้อย่างรวดเร็ว
- แต่ นี่คือวิธีสร้างธุรกิจที่ยั่งยืนจริงหรือ?
- หากผู้เขียนอยู่ใน batch ของ YC ตอนนี้ ก็คงรู้สึก ถูกล่อลวงให้อยากสร้างผลิตภัณฑ์ AI แนวตั้ง
- ยิ่งไปกว่านั้น ในพอดแคสต์ของ YC อย่าง "The Light Cone" ก็มีเนื้อหาจำนวนมากที่สนับสนุนผลิตภัณฑ์ AI แนวตั้ง

1 ความคิดเห็น

zkdlfrlwl2 2025-02-14

การแบ่งแยกและคำอธิบายระหว่าง Vertical AI กับ Horizontal AI น่าสนใจดี

บทเรียนขมขื่นของผู้ก่อตั้ง AI (Bitter Lesson)

บทที่ 1: ประวัติศาสตร์ซ้ำรอย (History Repeats Itself)

tl;dr:

สรุปบทความของ Richard Sutton: The Bitter Lesson (ฉบับแปลเกาหลี)

ผลิตภัณฑ์ AI และ The Bitter Lesson

ประเภทของข้อจำกัดและผลิตภัณฑ์ AI

ความเชื่อมโยงระหว่าง Vertical Workflow กับ The Bitter Lesson

ความสัมพันธ์ระหว่าง The Bitter Lesson กับผลิตภัณฑ์ AI ปัจจุบัน

การนำข้อสังเกต 4 ข้อของ Bitter Lesson ไปใช้กับประเภทของข้อจำกัด

สรุปส่งท้าย: AI สตาร์ตอัปกับ The Bitter Lesson

บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน (No Powers)

tl;dr:

ความยากของปัญหาและเส้นโค้งประสิทธิภาพ

แนวคิด “ผู้ร่วมงานทางไกล” ที่ horizontal AI มอบให้

กรณีก่อนหน้า: ประสบการณ์กับ AcademicGPT

การวิเคราะห์ 7 Powers ของ Helmer

Switching Cost (ต้นทุนการเปลี่ยน)

Counter Positioning (การวางตำแหน่งสวนกลับ)

Scale Economy (เศรษฐศาสตร์จากขนาด)

Network Economy (อานิสงส์เครือข่าย)

Brand Power (พลังของแบรนด์)

Process Power (พลังของกระบวนการ)

Cornered Resource (ทรัพยากรผูกขาด)

บทสรุป

บทที่ 3: ร่องรอยเชิงอรรถในประวัติศาสตร์ (A Footnote in History)

แนวคิด AI แนวตั้ง/แนวนอน และ workflow/agent

อดีต

ปีนี้

อนาคตอันใกล้

2024 - การพัฒนาหยุดชะงักหรือไม่?

อุปสรรคที่อาจเกิดขึ้น

ข้อสังเกตเพิ่มเติม

บทที่ 4: คุณคือพ่อมด (You’re a wizard Harry)

ผู้ก่อตั้งก็เหมือนพ่อมด

อนาคตของเอเจนต์แนวนอนและการแข่งขัน

การเข้าหาในฐานะลูกค้า

แนวทางในฐานะคู่แข่ง

แนวทางในฐานะซัพพลายเออร์

แนวทางในฐานะผู้มีส่วนร่วมในระบบนิเวศ

หากเอเจนต์ AI แนวนอนมาช้ากว่าที่คาดล่ะ?

บทส่งท้าย: นี่คือความผิดพลาดของ YC(Y Combinator) หรือไม่?

บทความที่เกี่ยวข้อง

1 ความคิดเห็น