บทเรียนขมขื่นของผู้ก่อตั้ง AI (Bitter Lesson)
(lukaspetersson.com)- สรุปรวมบทความชุด 4 ตอนของ Lukas Petersson ผู้ก่อตั้ง Andon Labs สตาร์ตอัปด้าน AI Safety (YC w24) ไว้เป็นเรื่องเดียว
- ในเชิงประวัติศาสตร์ วงการ AI นั้นแนวทางแบบทั่วไปมักเป็นฝ่ายชนะเสมอ
- ผู้ก่อตั้งในสายแอปพลิเคชัน AI ปัจจุบันกำลังทำซ้ำความผิดพลาดที่นักวิจัย AI ในอดีตเคยทำ
- โมเดล AI ที่ดีขึ้นจะทำให้แอปพลิเคชัน AI แบบอเนกประสงค์เป็นไปได้ และในขณะเดียวกันก็จะลดมูลค่าเพิ่มของซอฟต์แวร์ที่เกี่ยวข้องกับโมเดล AI ลง
- บทที่ 1: ประวัติศาสตร์ซ้ำรอย
- บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน
- บทที่ 3: รอยเท้าของประวัติศาสตร์
- บทที่ 4: คุณคือพ่อมด
บทที่ 1: ประวัติศาสตร์ซ้ำรอย (History Repeats Itself)
tl;dr:
- ความก้าวหน้าของ AI ในช่วงหลังทำให้เกิดผลิตภัณฑ์ใหม่ที่แก้ปัญหาได้หลากหลาย
- แต่ผลิตภัณฑ์ส่วนใหญ่ยังทำงานอยู่ภายในขีดจำกัดของโมเดลปัจจุบัน และยังไม่สามารถใช้ประโยชน์จากความยืดหยุ่นซึ่งเป็นพลังแท้จริงของ AI ได้
- ประวัติศาสตร์ของ AI แสดงให้เห็นซ้ำแล้วซ้ำเล่าว่าแนวทางแบบทั่วไปเป็นฝ่ายชนะเสมอ ซึ่ง Richard Sutton เน้นไว้ใน "The Bitter Lesson"
- ผู้ก่อตั้ง AI ในปัจจุบันมีแนวโน้มจะทำซ้ำความผิดพลาดแบบเดียวกับที่นักวิจัย AI ในอดีตเคยเผชิญ
สรุปบทความของ Richard Sutton: The Bitter Lesson (ฉบับแปลเกาหลี)
- บทความนี้เสนอข้อเรียนรู้ดังต่อไปนี้:
- นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์
- วิธีนี้ได้ผลในระยะสั้นและให้ความรู้สึกน่าพอใจ
- แต่ในระยะยาว ความก้าวหน้าจะหยุดชะงัก และยิ่งไปกว่านั้นยังขัดขวางความคืบหน้า
- ในท้ายที่สุด จุดเปลี่ยนกลับเกิดจากการขยายขนาดของการคำนวณที่ตั้งอยู่บนแนวทางตรงกันข้าม
- เตือนว่ารูปแบบนี้ถูกพบซ้ำแล้วซ้ำเล่าในการวิจัย AI และจนถึงตอนนี้ก็ยังไม่สิ้นสุด
ผลิตภัณฑ์ AI และ The Bitter Lesson
- โดยทั่วไปผลิตภัณฑ์ AI ประกอบด้วยโมเดล AI และซอฟต์แวร์ที่ล้อมรอบมัน
- มี 2 วิธีในการปรับปรุงประสิทธิภาพ:
- งานวิศวกรรมที่ใส่ข้อจำกัดให้ซอฟต์แวร์เพื่อลดข้อผิดพลาด
- รอจนกว่าโมเดลที่ดีกว่าจะออกมา
- ยิ่งโมเดลพัฒนาไปมากเท่าไร มูลค่าของงานวิศวกรรมก็ยิ่งลดลง
- กรณีที่มูลค่าของ prompt engineering ลดลงหลัง OpenAI เปิดตัวโมเดลใหม่ เป็นตัวอย่างที่แสดงเรื่องนี้
ประเภทของข้อจำกัดและผลิตภัณฑ์ AI
- องค์ประกอบที่เป็นข้อจำกัดของผลิตภัณฑ์ AI สามารถแบ่งได้เป็น 2 ประเภท:
- ความเฉพาะทาง: ซอฟต์แวร์ที่มุ่งเน้นปัญหาเฉพาะอย่าง (โซลูชันแนวตั้ง)
- ความเป็นอัตโนมัติ: ความสามารถที่ AI จะลงมือทำงานได้ด้วยตัวเอง
- จากกรอบนี้สามารถจัดหมวดหมู่ผลิตภัณฑ์ AI ได้ตามความเฉพาะทาง (Vertical vs. Horizontal) และความเป็นอัตโนมัติ (Workflow vs. Agent)
- Vertical Workflow
- ระบบที่ทำงานตามลำดับตายตัวเพื่อแก้ปัญหาเฉพาะ
- Harvey เป็นตัวอย่างเด่น เป็นระบบ workflow ที่ออกแบบมาเพื่อจัดการปัญหาในขอบเขตแคบ เช่น งานด้านกฎหมายเฉพาะทาง
- Vertical Agent
- ระบบที่ทำงานได้อย่างอัตโนมัติในขอบเขตงานเฉพาะ และตัดสินใจเองระหว่างกระบวนการทำงาน
- Devin เป็นตัวอย่างเด่น โดยใช้เครื่องมือและข้อมูลที่จำกัดเพื่อทำงานซ้ำ ๆ และปรับขั้นตอนการทำงานตามความจำเป็น
- Horizontal Workflow
- ระบบ workflow แบบทั่วไปที่สามารถแก้ปัญหาได้หลากหลาย
- ChatGPT เป็นตัวอย่างเด่น โดยตอบสนองต่ออินพุตหลายประเภทตามขั้นตอนที่กำหนดไว้ล่วงหน้า แต่ยังไม่มีความเป็นอัตโนมัติเต็มรูปแบบ
- Horizontal Agent
- ระบบอัตโนมัติเต็มรูปแบบที่สามารถจัดการปัญหาได้หลากหลาย
- Claude computer-use เป็นตัวอย่างเด่น โดยใช้ซอฟต์แวร์มาตรฐานของบริษัทเพื่อทำงานตามคำสั่งของผู้ใช้และแก้ปัญหาในลักษณะคล้ายมนุษย์
- Vertical Workflow
ความเชื่อมโยงระหว่าง Vertical Workflow กับ The Bitter Lesson
- ผลิตภัณฑ์ส่วนใหญ่ที่นำเสนอใน Demo Day จัดอยู่ในรูปแบบ Vertical Workflow
- เนื่องจากความน่าเชื่อถือของโมเดลปัจจุบันยังไม่เพียงพอ จึงยากที่จะใช้แนวทางอื่น
- มีแนวโน้มจะจำกัดแม้แต่ปัญหาที่ซับซ้อนให้อยู่ในรูป Vertical Workflow เพื่อให้ได้ประสิทธิภาพที่ยอมรับได้
- แม้จะปรับปรุงโซลูชันเหล่านี้ได้ด้วยงานวิศวกรรม แต่ก็มีข้อจำกัด
- ปัญหาที่โมเดลปัจจุบันยังแก้ไม่ได้ การรอโมเดลที่ก้าวหน้ากว่าน่าจะเป็นกลยุทธ์ที่ดีกว่า
- ข้อสังเกตของ Leopold Aschenbrenner: เวลาที่ต้องรอโมเดลที่ดีกว่าอาจสั้นกว่าการทำงานวิศวกรรม
ความสัมพันธ์ระหว่าง The Bitter Lesson กับผลิตภัณฑ์ AI ปัจจุบัน
- นักวิจัย AI เคยออกแบบโซลูชันที่อาศัยความรู้เพื่อให้ได้ “ประสิทธิภาพที่ยอมรับได้” แต่ท้ายที่สุดโซลูชันแบบทั่วไปที่ใช้ทรัพยากรคอมพิวต์มากกว่าก็แซงหน้า
- วิธีพัฒนาผลิตภัณฑ์ AI ในปัจจุบันก็คล้ายกับรูปแบบนี้
การนำข้อสังเกต 4 ข้อของ Bitter Lesson ไปใช้กับประเภทของข้อจำกัด
ข้อสังเกตสำคัญ 4 ข้อที่กล่าวถึงใน Bitter Lesson สะท้อนให้เห็นอย่างชัดเจนในข้อจำกัดด้านความเป็นอัตโนมัติและความเฉพาะทางของผลิตภัณฑ์ AI เช่นกัน
เมื่ออธิบายแยกตามข้อจำกัดแต่ละประเภท จะได้ดังนี้:
- ข้อสังเกตข้อแรก: นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์
- ข้อจำกัดด้านความเป็นอัตโนมัติ:
- นักพัฒนาทดลองใช้เอเจนต์อัตโนมัติ แต่ความน่าเชื่อถือยังต่ำ
- ดังนั้นจึง hardcode ขั้นตอนงานให้อยู่ในรูป workflow เพื่อให้ทำตามกระบวนการเดียวกับที่มนุษย์ใช้แก้ปัญหา
- ข้อจำกัดด้านความเฉพาะทาง:
- นักพัฒนาต้องการสร้างระบบวิเคราะห์เอกสารแบบทั่วไป แต่ติดปัญหาเรื่องความน่าเชื่อถือ
- จึงหันไปโฟกัสที่เอกสารบางประเภท เช่น งบการเงิน และ hardcode metric เฉพาะกับกฎการตรวจสอบลงไป
- ข้อสังเกตข้อที่สอง: ในระยะสั้น วิธีนี้ได้ผลและทำให้นักวิจัยรู้สึกพอใจ
- ข้อจำกัดด้านความเป็นอัตโนมัติ:
- การ hardcode workflow ช่วยเพิ่มความเสถียร
- ข้อจำกัดด้านความเฉพาะทาง:
- การทำให้เชี่ยวชาญเฉพาะเอกสารและ metric ช่วงแคบช่วยเพิ่มความแม่นยำ
- ข้อสังเกตข้อที่สาม: ในระยะยาว ความก้าวหน้าจะชะงักและยิ่งไปกว่านั้นยังกลายเป็นอุปสรรค
- ข้อจำกัดด้านความเป็นอัตโนมัติ:
- workflow ที่ hardcode ไว้ไม่สามารถรับมือสถานการณ์ใหม่ได้ จึงนำไปสู่ผลลัพธ์ที่ไม่แม่นยำ
- ข้อจำกัดด้านความเฉพาะทาง:
- ระบบที่จัดการได้เฉพาะปัญหาบางอย่าง ไม่สามารถรองรับงานที่เกี่ยวข้อง เช่น เอกสารที่รวมหลายประเภทหรือการวิเคราะห์ผลประกอบการ
- แต่ละงานจึงต้องมีระบบเฉพาะทางแยกกัน
- ข้อสังเกตข้อที่สี่: จุดเปลี่ยนเกิดขึ้นจากการขยายทรัพยากรคอมพิวต์
-
ข้อจำกัดด้านความเป็นอัตโนมัติ:
- โมเดลรุ่นใหม่สามารถค้นหาแนวทางที่เหมาะสมได้แบบไดนามิก แก้ข้อผิดพลาดได้เมื่อจำเป็น และทำให้เกิดเอเจนต์อัตโนมัติที่เชื่อถือได้
-
ข้อจำกัดด้านความเฉพาะทาง:
- โมเดลรุ่นใหม่สามารถเข้าใจเอกสารธุรกิจทั้งหมดได้อย่างครอบคลุมและดึงข้อมูลที่เกี่ยวข้องออกมาได้ ทำให้ไม่จำเป็นต้องมีระบบเฉพาะทางอีกต่อไป
-
ในปัญหาที่ต้องการความเป็นอัตโนมัติ ผลิตภัณฑ์ที่อัตโนมัติมากกว่าจะทำผลงานได้ดีกว่า
-
เมื่อต้องรับมือกับอินพุตที่ซับซ้อนและมีขอบเขตกว้าง ผลิตภัณฑ์ที่เฉพาะทางน้อยกว่าจะให้ผลลัพธ์ดีกว่า
สรุปส่งท้าย: AI สตาร์ตอัปกับ The Bitter Lesson
- บทความนี้เป็นตอนแรกของซีรีส์ 4 ตอนที่สำรวจบทบาทของสตาร์ตอัปในโลก AI โดยเน้นย้ำรูปแบบทางประวัติศาสตร์ที่โมเดล AI ซึ่งอาศัยความรู้เชิงโดเมนถูกแทนที่อย่างต่อเนื่องด้วยโมเดลที่ใช้ทรัพยากรคอมพิวต์
- ผลิตภัณฑ์ AI ในปัจจุบันมีลักษณะคล้ายกับรูปแบบนี้อย่างน่าทึ่ง
- การพัฒนาซอฟต์แวร์เพื่อชดเชยข้อจำกัดของโมเดลปัจจุบัน เป็นกลยุทธ์ที่มีโอกาสล้มเหลวสูง โดยเฉพาะในสถานการณ์ที่โมเดลพัฒนาอย่างรวดเร็ว
- ข้อสังเกตของ Jarred พาร์ตเนอร์จาก YC: แอป LLM แบบ vertical workflow รุ่นแรก ๆ ถูกแทนที่โดยโมเดล GPT รุ่นถัดไป
- คำแนะนำของ Sam Altman: สิ่งสำคัญคือการสร้างสตาร์ตอัปที่ไม่กลัวการมาของโมเดลที่ดีกว่า และกลับคาดหวังได้ด้วยซ้ำ
- ผู้ก่อตั้งจำนวนมากในเลเยอร์แอปพลิเคชัน AI ตื่นเต้นกับการเปิดตัวโมเดลใหม่ แต่สิ่งนี้อาจเป็นสัญญาณอันตราย
- หากมีโมเดลที่ดีกว่าออกมา อาจทำให้ความได้เปรียบในการแข่งขันในปัจจุบันลดลงอย่างมาก
- โดยเฉพาะเมื่อมองในแง่ประสิทธิภาพของผลิตภัณฑ์ในการแก้ปัญหาที่ยากขึ้นได้ดีกว่า ความเสี่ยงนี้จะยิ่งชัดเจน
- บทความถัดไปจะสำรวจอีกมิติหนึ่งคือการยอมรับของตลาด และอภิปรายว่าประสิทธิภาพที่ดีกว่าไม่ได้รับประกันความสำเร็จในตลาดเสมอไป
บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน (No Powers)
tl;dr:
- ในประวัติศาสตร์ของ AI แนวทางที่พยายามชดเชยข้อจำกัดของโมเดลด้วยความรู้เฉพาะโดเมน มักถูกแซงในท้ายที่สุดโดยแนวทางที่ใช้ทรัพยากรคอมพิวต์เพื่อทำให้เป็นวิธีการแบบทั่วไป
- vertical AI เข้าสู่ตลาดก่อนด้วยวิธีเพิ่มความแม่นยำผ่านการกำหนด task flow เฉพาะล่วงหน้าเพื่อชดเชยข้อจำกัดของโมเดลในปัจจุบัน
- horizontal AI เป็นแนวทางที่ใช้โมเดลอเนกประสงค์อย่าง ChatGPT และพัฒนาต่อเนื่อง ซึ่งมีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าในหลายสาขาทุกครั้งที่โมเดลได้รับการปรับปรุง
- ในระยะยาว horizontal AI มีแนวโน้มได้เปรียบเหนือ vertical AI ที่มีข้อจำกัดหลายอย่าง เพราะมีทั้งประสิทธิภาพและความยืดหยุ่นสูงกว่า
ความยากของปัญหาและเส้นโค้งประสิทธิภาพ
- Figure 1 เป็นตัวอย่างอย่างง่ายที่แสดงว่า vertical AI เข้าสู่ตลาดก่อน แต่ท้ายที่สุด horizontal AI ที่โมเดลได้รับการปรับปรุงแล้วจะไล่แซงด้านประสิทธิภาพ
- ในกรณีที่ปัญหามีความยากสูง (Figure 2) vertical AI อาจไปไม่ถึงระดับประสิทธิภาพที่เพียงพอเลย และต้องรอให้ horizontal AI พัฒนาขึ้นก่อนจึงจะเริ่มแก้ปัญหาได้
- ปัญหาที่ vertical AI นำไปใช้ได้ในตอนนี้ค่อนข้างเป็น “ปัญหาความยากต่ำ” ดังนั้นแม้จะได้ประโยชน์จากการเข้าตลาดก่อนในหมวดนี้ แต่ความสามารถในการแข่งขันระยะยาวยังไม่แน่นอน
แนวคิด “ผู้ร่วมงานทางไกล” ที่ horizontal AI มอบให้
- ในอนาคต horizontal AI อาจพัฒนาไปเป็นรูปแบบคล้ายพนักงานทางไกล ที่ได้รับคอมพิวเตอร์และบัญชีผู้ใช้ แล้วสามารถค้นหาและใช้ข้อมูลที่จำเป็นได้ด้วยตนเอง
- UI ที่ผู้ใช้จำนวนมากคุ้นเคยอยู่แล้ว เช่น ChatGPT อาจค่อย ๆ ถูกเสริมความสามารถ จนเอื้อต่อการนำไปใช้ในองค์กรได้อย่างรวดเร็ว
- เนื่องจาก horizontal AI สามารถดูดซับความสามารถใหม่ ๆ ได้ทันทีทุกครั้งที่โมเดลพัฒนา จึงรักษาความได้เปรียบในการแข่งขันได้ง่ายกว่า vertical AI
กรณีก่อนหน้า: ประสบการณ์กับ AcademicGPT
- ในช่วง GPT-3.5 ผู้เขียนเปิดตัว AcademicGPT เพื่อก้าวข้ามข้อจำกัดด้านอินพุตยาว แต่เมื่อ GPT-4 รองรับอินพุตยาวเป็นพื้นฐานแล้ว โซลูชันเดิมก็ถูกแทนที่อย่างรวดเร็ว
- อย่างที่ Jared พาร์ตเนอร์ของ YC กล่าวไว้ว่า “แอป LLM รุ่นแรกส่วนใหญ่แพ้ให้กับโมเดลรุ่นถัดไป”
- vertical AI ที่รวมหลายความสามารถไว้พร้อมกันก็เสี่ยงจะเจอกระบวนการเดียวกัน เมื่อประสิทธิภาพของโมเดลพัฒนาไปอีก
การวิเคราะห์ 7 Powers ของ Helmer
- ในส่วนนี้จะพิจารณาว่า vertical AI สามารถแข่งขันกับ horizontal AI ได้หรือไม่ ผ่านกรอบความได้เปรียบทางการแข่งขัน 7 ประการของ Hamilton Helmer (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource)
-
Switching Cost (ต้นทุนการเปลี่ยน)
- แม้ผู้ใช้จะคุ้นเคยกับ UI หรือ workflow ของโซลูชัน vertical AI บางรายแล้ว แต่ horizontal AI สามารถนำไปใช้ได้ง่ายในลักษณะ “จ้างพนักงานใหม่” แล้ว onboard เข้ามา
- ปัจจุบันมีองค์กรเพิ่มขึ้นที่นำโซลูชัน horizontal AI อย่าง ChatGPT มาใช้แล้ว จึงมีแนวโน้มว่ากระบวนการเปลี่ยนผ่านจะไม่ยาก
- ในด้านราคา horizontal AI ก็มีแนวโน้มช่วยลดต้นทุน เพราะสามารถรวมหลายโซลูชันแบบ vertical เข้าไว้ด้วยกันได้
-
Counter Positioning (การวางตำแหน่งสวนกลับ)
- vertical AI อาจมอบคุณค่าเฉพาะทางด้วยโซลูชันที่ออกแบบมาสำหรับตลาดหนึ่งโดยเฉพาะ แต่เมื่อโมเดลค่อย ๆ ดีขึ้น horizontal AI ก็มีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าโดยรวม
- vertical AI เผชิญภาวะกลืนไม่เข้าคายไม่ออก คือทุกครั้งที่นำโมเดลใหม่เข้ามาใช้ ก็อาจสูญเสียความแตกต่างเพราะ “ข้อจำกัด” เดิม หรือถ้าปลดข้อจำกัดเหล่านั้น ก็จะยิ่งคล้ายโมเดลแนวนอนมากขึ้นในที่สุด
-
Scale Economy (เศรษฐศาสตร์จากขนาด)
- vertical AI ก็เหมือน SaaS ตรงที่ลดต้นทุนได้ตามขนาด แต่ horizontal AI เองก็มีข้อได้เปรียบจากการรวมหลายสาขาเข้าด้วยกันและกระจายต้นทุนได้เช่นกัน
- การนำโมเดลแนวนอนที่พัฒนาด้วยการลงทุน R&D ขนาดใหญ่มาใช้ในหลายกรณี จะยิ่งเร่งการลดต้นทุนได้
-
Network Economy (อานิสงส์เครือข่าย)
- ทั้ง vertical AI และ horizontal AI ต่างมีโอกาสพัฒนาจากข้อมูลผู้ใช้ได้ แต่ horizontal AI ได้เปรียบมากกว่าเพราะรับฟีดแบ็กจากฐานผู้ใช้ที่กว้างกว่า และยกระดับประสิทธิภาพโดยรวมของโมเดลได้
- เนื่องจากใช้ข้อมูลที่สะสมจากหลายสาขาเพื่อพัฒนาโมเดลทั้งระบบ จึงอาจก้าวหน้าได้เร็วเกินกว่าที่ vertical AI จะตามทัน
-
Brand Power (พลังของแบรนด์)
- พลังของแบรนด์เป็นความได้เปรียบที่แทบสร้างไม่ได้ในช่วงที่ยังเป็นสตาร์ทอัปขนาดเล็ก
- บริษัทอย่าง OpenAI หรือ Google ที่มีอิทธิพลด้านแบรนด์อยู่แล้วเป็นข้อยกเว้น แต่สตาร์ทอัป vertical AI ส่วนใหญ่ยากจะใช้แบรนด์เป็นอาวุธหลัก
-
Process Power (พลังของกระบวนการ)
- พลังของกระบวนการก็เป็นความได้เปรียบที่มักเกิดจากระบบปฏิบัติการภายในที่องค์กรขนาดใหญ่ขัดเกลามาเป็นเวลานาน
- สำหรับสตาร์ทอัประยะเริ่มต้น สิ่งนี้แทบไม่ใช่หมวดที่เกี่ยวข้อง
-
Cornered Resource (ทรัพยากรผูกขาด)
- ทรัพยากรผูกขาดจะกลายเป็นความได้เปรียบที่สำคัญก็ต่อเมื่อมีเพียงบริษัทเดียวที่ถือครองข้อมูลหรือทรัพยากรนั้น และทรัพยากรดังกล่าวจำเป็นอย่างแท้จริงต่อสาขานั้น
- สตาร์ทอัป AI จำนวนมากอ้างว่าตนมี “ข้อมูลผูกขาด” แต่ในความเป็นจริง ข้อมูลนั้นมักไม่ได้ผูกขาดอย่างแท้จริง หรือถึงไม่มีข้อมูลนั้น โมเดลก็ยังเรียนรู้ได้เพียงพอ
- ในทางกลับกัน บริษัทที่ครอบครองทรัพยากรผูกขาดอย่างแท้จริงอาจยังคงรักษาความสามารถในการแข่งขันไว้ได้ แม้ horizontal AI จะพัฒนาไปมากก็ตาม
บทสรุป
- สุดท้ายแล้ว แม้จะเป็นสถานการณ์ที่ vertical AI ได้ประโยชน์จากการเข้าตลาดก่อน หาก horizontal AI มีประสิทธิภาพสูงกว่า vertical AI ส่วนใหญ่ก็จะอยู่รอดได้ยาก
- ในบรรดา 7 Powers ของ Helmer มีเพียงกรณีที่ครอบครอง “Cornered Resource” อย่างแท้จริงเท่านั้น ที่ vertical AI อาจรักษาโมเมนตัมระยะยาวไว้ได้
- เช่นเดียวกับกรณีของ AcademicGPT ที่ล่มสลายอย่างรวดเร็วหลัง GPT-4 เปิดตัว vertical AI ที่เสริมฟังก์ชันหลายอย่างเข้าไปก็อาจเผชิญเส้นทางคล้ายกันเมื่อโมเดลพัฒนาขึ้น
- ในบทถัดไป (บทที่ 3) จะคาดการณ์ว่า horizontal AI ในรูปแบบ “ผู้ร่วมงานทางไกล” จะเกิดขึ้นจริงเมื่อใดและอย่างไร พร้อมเจาะลึกอุปสรรคด้านเทคนิค กฎระเบียบ ความน่าเชื่อถือ และเศรษฐศาสตร์ที่ขัดขวางสิ่งนี้อยู่
บทที่ 3: ร่องรอยเชิงอรรถในประวัติศาสตร์ (A Footnote in History)
- มีการเผยแพร่บทสัมภาษณ์ที่ CEO ของ Anthropic อธิบายแนวคิด “virtual collaborator”
- แนวคิดนี้คล้ายกับสิ่งที่ผู้เขียนเรียกในซีรีส์นี้ว่า “horizontal AI product”
- คาดว่า OpenAI จะประกาศ “Operator” ในเร็ว ๆ นี้ และตามเบนช์มาร์กที่หลุดออกมา ประสิทธิภาพนำหน้า Claude อย่างมาก (บน OSWorld benchmark Claude ได้ 22%, Operator ได้ 38%)
- การเพิ่มขึ้นของประสิทธิภาพนี้ยังอยู่ในกรอบที่คาดไว้ และผู้เขียนยังคงยืนตามการคาดการณ์เมื่อ 3 เดือนก่อน
- ในบทก่อนหน้าได้อธิบายแล้วว่าทำไมแอปพลิเคชัน vertical AI จึงรักษาความสามารถในการแข่งขันได้ยาก
- ช่องว่างด้านประสิทธิภาพกับโซลูชัน AI ทั่วไปกำลังแคบลง
- เมื่อผลิตภัณฑ์ horizontal AI แข่งขันได้แล้ว ผลิตภัณฑ์ vertical AI ก็แทบไม่มีวิธีป้องกันตัว
- คำถามสำคัญคือ: “การเปลี่ยนผ่านจาก vertical AI ไปสู่ horizontal AI จะเกิดขึ้นเมื่อไร?”
- หากอีก 10 ปีค่อยเกิดขึ้น การพัฒนา vertical AI ตอนนี้ก็อาจยังมีความหมาย
- แต่หากความเปลี่ยนแปลงมาถึงภายใน 1–2 ปี ก็จำเป็นต้องใช้กลยุทธ์ที่ต่างออกไปโดยสิ้นเชิง
- การเปลี่ยนผ่านจาก vertical AI ไปเป็น horizontal AI จะไม่ได้เกิดขึ้นพร้อมกันในทุกอุตสาหกรรม
- อย่างไรก็ตาม ตลาดที่สตาร์ทอัป AI ส่วนใหญ่กำลังมุ่งเน้นอยู่ในตอนนี้เป็นสาขาที่ค่อนข้างเรียบง่าย จึงคาดว่าการเปลี่ยนแปลงจะเกิดขึ้นในช่วงเวลาใกล้เคียงกันในอุตสาหกรรมหลักต่าง ๆ
- มีการคาดการณ์ว่าภายในปี 2027 ผลิตภัณฑ์ vertical AI จะอยู่รอดได้ยากในอุตสาหกรรมส่วนใหญ่
- “adoption” หมายถึง เมื่อผู้ใช้ต้องแก้ปัญหาใหม่หรือเปลี่ยนวิธีแก้ปัญหาเดิม พวกเขาเลือกผลิตภัณฑ์ใด
- การวิเคราะห์นี้ไม่พิจารณาปัจจัยต่อไปนี้
- ส่วนแบ่งตลาด: อาจได้รับผลจากสัญญาเดิมหรือปัจจัยอื่น
- ขนาดสัมบูรณ์: แม้ตลาดจะขยายตัวเพราะ AI เปิดกรณีใช้งานใหม่ ๆ แต่การวิเคราะห์นี้พิจารณาเฉพาะการเปลี่ยนแปลงเชิงสัมพัทธ์
- มูลค่าแฝงในอนาคต: การประเมินนี้ดูว่าผู้คนเลือกโซลูชันใด ณ เวลาปัจจุบัน โดยไม่นับรวมความเป็นไปได้ในการพัฒนาในอนาคต
- ตัวอย่างเช่น หากกระแสย้ายจาก A ไป B นั่นหมายความว่าในอดีต A เคยเป็นตัวเลือกที่ได้รับความนิยม แต่ตอนนี้ B ถูกมองว่าเป็นทางเลือกที่ดีกว่าแล้ว
แนวคิด AI แนวตั้ง/แนวนอน และ workflow/agent
- "AI แนวตั้ง (vertical)" และ "AI แนวนอน (horizontal)" หมายถึงประเภทของผลิตภัณฑ์ AI ที่แตกต่างกัน
- "เวิร์กโฟลว์ (workflow)" และ "เอเจนต์ (agent)" ก็เป็นแนวคิดที่ใช้จัดประเภทผลิตภัณฑ์ AI เช่นกัน
- ในเอกสารนี้ จะอธิบายแนวคิดเรื่องเวิร์กโฟลว์และเอเจนต์รวมกันภายในผลิตภัณฑ์ AI แนวนอน
- มีความเป็นไปได้สูงว่าบริษัทเดียวกันจะพัฒนาผลิตภัณฑ์ที่มีทั้งสองความสามารถรวมอยู่ด้วย
- ตัวอย่างเช่น ChatGPT อาจเพิ่มความสามารถแบบเอเจนต์เข้าไป ขณะเดียวกันก็ยังคงฐานแบบเวิร์กโฟลว์เดิมไว้
อดีต
- (1) ช่วงก่อน ChatGPT เป็นสถานการณ์ที่ซอฟต์แวร์แบบดั้งเดิมครองตลาด
- (2) การเปิดตัว ChatGPT ทำให้เกิดผลิตภัณฑ์ AI แนวนอนที่มีความหมายเป็นครั้งแรก
- (3) หลังการมาถึงของ GPT-3.5 API ผลิตภัณฑ์แนวตั้งจำนวนมากที่ออกแบบมาสำหรับ AI โดยเฉพาะก็เริ่มเปิดตัวเป็นครั้งแรก
ปีนี้
- (4) มีการคาดการณ์ว่าในปี 2025 ประสิทธิภาพของโมเดลจะมีเสถียรภาพเพียงพอสำหรับการใช้งานเป็นเอเจนต์ที่ใช้งานได้จริง
- เอเจนต์ที่จนถึงตอนนี้ถูกใช้เพียงในโครงการวิจัยหรือการทดสอบแบบจำกัด คาดว่าจะเริ่มถูกนำมาใช้อย่างจริงจัง
- ผลิตภัณฑ์เวิร์กโฟลว์แนวตั้งเดิมก็มีโอกาสเปลี่ยนรูปแบบไปเป็น AI agent เช่นกัน
- (5) แม้เอเจนต์จะเริ่มปรากฏขึ้น แต่คาดว่าจนถึงปี 2025 เวิร์กโฟลว์แนวตั้งจะยังคงรักษาตำแหน่งที่ครองตลาดไว้
- นิสัยของผู้ใช้ที่ไม่อยากเปลี่ยนเครื่องมือที่ใช้อยู่แล้ว และแรงเฉื่อยของนักพัฒนาที่ต้องการใช้ประโยชน์จากทรัพยากรทางวิศวกรรมที่สร้างไว้ต่อไป จะยังคงมีผล
- (6) คาดว่าผลิตภัณฑ์ AI แนวนอนหลักอย่าง ChatGPT, Claude และ Gemini จะขยายความสามารถและครอบคลุมโดเมนแนวตั้งได้มากขึ้น
- มีความเป็นไปได้ที่ความสามารถเฉพาะทางเดิมของผลิตภัณฑ์ AI แนวตั้งจะถูกดูดซับเข้าไปในผลิตภัณฑ์ AI แนวนอนอย่างรวดเร็ว
- ตอนนี้ ChatGPT เริ่มเชื่อมต่อกับแอปเดสก์ท็อปแล้ว
อนาคตอันใกล้
- (7) คาดว่าช่องว่างด้านความสามารถระหว่าง AI agent แนวนอนกับแรงงานมนุษย์จะค่อย ๆ แคบลง
- แม้จะยังไม่ถึงระดับผู้เชี่ยวชาญ แต่ก็คาดว่าจะมีประสิทธิภาพพอสำหรับการทำงานอัตโนมัติกับงานสำนักงานทั่วไปได้อย่างมาก
- ด้วยเหตุนี้ เหตุผลในการมีอยู่ของโซลูชัน AI แนวตั้งอาจลดลง
- ตัวอย่างที่เป็นรูปธรรม:
- ผู้ใช้รายบุคคลอาจมอบหมายงานซับซ้อน เช่น การยื่นภาษีหรือการเตรียมหางาน ให้เอเจนต์แนวนอนจัดการ
- บริษัทอาจแทนที่หรือลดจำนวนพนักงานระดับจูเนียร์ลงได้อย่างมาก
- อาจเกิดกรณีที่คนเพียงคนเดียวสามารถสร้างมูลค่าระดับยูนิคอร์นได้
- (8) คาดว่าซอฟต์แวร์แบบดั้งเดิมจะยังคงมีคุณค่าในฐานะอินเทอร์เฟซที่เอเจนต์สามารถใช้งานได้
- การให้เอเจนต์ใช้ซอฟต์แวร์ที่มีอยู่เดิมอาจคุ้มค่ากว่าการให้มันสร้างซอฟต์แวร์ใหม่ทั้งหมดขึ้นมาเองโดยตรง
- โดยเฉพาะซอฟต์แวร์อเนกประสงค์และซอฟต์แวร์แนวนอน มีแนวโน้มสูงกว่าจะอยู่รอด
- (9) ผลิตภัณฑ์ AI แนวตั้งที่จะอยู่รอดได้น่าจะมีเพียงส่วนน้อยที่ครอบครองทรัพยากรเชิงป้องกันซึ่งกล่าวถึงในบทที่ 2 (เช่น ข้อมูลผูกขาด สิทธิบัตร เป็นต้น)
- พวกเขาอาจสามารถขายทรัพยากรเหล่านั้นได้ในมูลค่าสูง
2024 - การพัฒนาหยุดชะงักหรือไม่?
- มีการประเมินว่าคำกล่าวอ้างว่าโมเดล AI หยุดนิ่งในปี 2024 นั้นไม่น่าเชื่อถือมากนัก
- ตั้งแต่ก่อนการเปิดตัว o3 ประสิทธิภาพของโมเดลในหลายด้าน เช่น GPT-4, Claude และ Open Weight model ก็พัฒนาขึ้นอย่างต่อเนื่อง
- คะแนนเบนช์มาร์กอย่าง ARC-AGI และ GPQA Diamond ก็ปรับตัวดีขึ้นอย่างก้าวกระโดดมาโดยตลอด
- Anthropic พัฒนาอย่างรวดเร็วจาก Claude 2 ไปสู่ Claude 3 และต่อด้วย Claude 3.5 Sonnet และมีการคาดเดาว่าบริษัทได้นำอัปเกรดที่ยังไม่เปิดเผยมาใช้ภายในองค์กร
- ด้วยเหตุนี้ จึงมีมุมมองว่าคำกล่าวอ้างว่าปี 2024 เป็นปีที่การปรับปรุงโมเดล AI หยุดลงนั้นขาดหลักฐานรองรับ
อุปสรรคที่อาจเกิดขึ้น
-
Model Stagnation: แม้ปี 2024 จะไม่มีภาวะชะงักงัน แต่ก็มีความกังวลว่าหลังปี 2025 การพัฒนาโมเดลอาจหยุดนิ่ง
- Ilya Sutskever กล่าวถึงข้อจำกัดของวิธี Pre-training แบบดั้งเดิมในงาน NeurIPS แต่ก็เสนอพร้อมกันว่ายังมีเส้นทางอื่น เช่น Test-time compute
- สถาบันวิจัย AI และบริษัทใหญ่ ๆ ยังคงลงทุนอย่างจริงจังในทรัพยากรคอมพิวต์ขนาดมหาศาล
-
Regulation: หากมีกฎระเบียบที่ไม่คาดคิดเกิดขึ้น ก็อาจทำให้การพัฒนา AI ถูกจำกัด
-
Trust Barriers: ผู้ใช้ยังมีความกังวลเรื่องความเสถียรและความน่าเชื่อถือของเอเจนต์
- มีการคาดการณ์ว่าเมื่อเวลาผ่านไป เรื่องนี้จะถูกเอาชนะได้ โดยยกตัวอย่างกรณีในอดีตที่ความกลัวต่อระบบลิฟต์อัตโนมัติสุดท้ายก็หายไป
-
AI Labs Hesitate: Anthropic หรือ OpenAI อาจมีกรณีที่แม้จะมีศักยภาพทางเทคนิคจริง แต่ก็ยังคงจำกัดปฏิสัมพันธ์ของผู้ใช้ไว้บางส่วน
-
Expensive Inference: เช่นกรณีของ o3 การทำ inference ประสิทธิภาพสูงอาจต้องใช้ต้นทุนที่สูงมาก
- แต่ต้นทุน inference ก็กำลังลดลงเรื่อย ๆ ตามเวลา และก็มีความเป็นไปได้สูงที่เอเจนต์จะไม่ใช้การอนุมานประสิทธิภาพสูงในระดับเดียวกันกับทุกงาน
-
เมื่อพิจารณาปัจจัยทั้งหมดข้างต้น แม้การคาดการณ์ความก้าวหน้าทางเทคโนโลยีจะทำได้ยาก แต่คาดว่าสตาร์ทอัพ AI แนวตั้งจะเหลือเวลาไม่มากนัก
-
มีการเสนอกราฟมูลค่าแบบรูปตัว U ที่ชี้ว่า เมื่อโมเดล AI มีความก้าวหน้ามากขึ้น มูลค่าที่อิงกับวิศวกรรมแบบเดิมอาจสลายไปอย่างรวดเร็ว
ข้อสังเกตเพิ่มเติม
- มีคำอธิบายว่าการขยาย Test-time compute ที่เห็นใน o3 เป็นผลลัพธ์ที่มีการคาดการณ์ไว้แล้วจากงานวิจัยเดิม
- เช่นเดียวกับกรณีของ AlphaZero มีข้อสังเกตว่าในสภาพแวดล้อมที่สามารถตรวจสอบผลลัพธ์ได้ ประสิทธิภาพสามารถพัฒนาไปถึงระดับเหนือมนุษย์ได้อย่างรวดเร็ว
- มีการวิเคราะห์ว่า o3 แม้จะโดดเด่นในด้านอย่างการเขียนโค้ดและคณิตศาสตร์ แต่ในด้านอื่น เช่น การเขียนเชิงสร้างสรรค์ ก็ไม่ได้แตกต่างจาก o1 มากนัก
- มีนัยว่าการไปในทิศทางอื่นที่เกี่ยวข้องกับทรัพยากรที่กว้างขวางกว่าหรือผูกขาดมากกว่า อาจเป็นทางเลือกที่ดีกว่าสำหรับผู้ก่อตั้ง มากกว่าการพัฒนา AI แนวตั้งใหม่ขึ้นมาอีก
บทที่ 4: คุณคือพ่อมด (You’re a wizard Harry)
ผู้ก่อตั้งก็เหมือนพ่อมด
- มีความสามารถในการสร้างสิ่งที่ไม่เคยมีให้เกิดขึ้น
- การเริ่มต้นบริษัทใหม่ต้องอาศัยความคิดที่แปลกใหม่
- คำพูดของ Paul Graham (PG): "ไอเดียต้องไม่เพียงแค่ถูกต้อง แต่ต้องแปลกใหม่ด้วย คุณไม่ควรเริ่มทำสิ่งที่ทุกคนต่างเห็นพ้องว่าเป็นความคิดที่ดี"
- ผู้ก่อตั้งจำนวนมากกำลังสูญเสียความคิดที่เป็นอิสระ เพราะมัวตื่นตากับการเติบโตของรายได้ที่น่าประทับใจของเพื่อนร่วมวงการ
- เมื่อทุกคนกำลังทำสิ่งเดียวกันและมันดูเหมือนจะได้ผล การคิดอย่างอิสระยิ่งเป็นเรื่องยาก
- ผู้เขียนพยายามคิดอย่างอิสระ และหวังว่าแนวคิดเหล่านี้จะฟังดูเป็นความคิดที่ไม่ดี
อนาคตของเอเจนต์แนวนอนและการแข่งขัน
- คาดว่าเอเจนต์แนวนอนที่จะครองชั้นแอปพลิเคชัน AI จะถูกพัฒนาโดย AI lab
- แม้ประสิทธิภาพของโมเดลอาจแตกต่างจนเกิดผู้ชนะเพียงรายเดียวได้ แต่การแข่งขันที่ดุเดือดระหว่าง Anthropic, OpenAI, GDM และ xAI มีแนวโน้มเป็นไปได้มากกว่า
- สิ่งนี้จะก่อให้เกิดการแข่งขันด้านราคาที่เป็นประโยชน์ต่อผู้ใช้ปลายทางในระยะสั้น
- แม้ AI lab อาจยังไม่สามารถเก็บเกี่ยวมูลค่าทางการเงินได้มากนักในระยะสั้น แต่ก็ยังคาดว่าจะครองตำแหน่งที่ทรงพลังอย่างยิ่ง
- ดังนั้นจึงสมเหตุสมผลที่ผู้ก่อตั้งจะมองสตาร์ทอัพของตนในบริบทของความสัมพันธ์กับห้องแล็บเหล่านี้
การเข้าหาในฐานะลูกค้า
- ตามที่กล่าวไว้ในบทที่ 2 การสร้างผลิตภัณฑ์ AI แนวตั้งที่ใช้ LLM API นั้นเป็นไปได้ แต่จะเป็นไปได้ก็ต่อเมื่อมีสิทธิ์เข้าถึงทรัพยากรสำคัญแบบผูกขาด
- หากต้องการสร้างผลิตภัณฑ์ AI แนวตั้ง ก็จำเป็นต้องทุ่มเทความพยายามอย่างมหาศาลเพื่อค้นหาทรัพยากรประเภทนั้น
แนวทางในฐานะคู่แข่ง
- หากเอเจนต์แนวนอนคืออนาคต ทำไมไม่สร้างมันขึ้นมาเสียเอง? พิจารณาแนวทางอยู่สามแบบ
- การช่วงชิงตลาดก่อน
- แล็บ AI จะเข้ามาแข่งขันกับเวิร์กโฟลว์แนวตั้งอย่างจริงจังก็ต่อเมื่อโมเดลมีความน่าเชื่อถือมากพอที่จะสร้างเอเจนต์แนวนอนได้ด้วยความพยายามด้านวิศวกรรมเพียงเล็กน้อย
- ในทางทฤษฎี เราอาจนำความพยายามด้านวิศวกรรมไปใช้กับโมเดลรุ่นก่อนหน้าและเข้าสู่ตลาดก่อนแล็บได้ แต่ก็ไม่แน่นอน
- Leopold Aschenbrenner มองว่าความพยายามนี้อาจใช้เวลานานกว่าการสร้างโมเดลรุ่นถัดไปเสียอีก: "อาจต้องใช้เวลาพอสมควรกว่าที่พนักงานทางไกลจะทำงานจำนวนมากให้เป็นอัตโนมัติได้ และในระหว่างนั้น โมเดลระดับกลางอาจยังไม่ได้ถูกใช้งานและบูรณาการอย่างเต็มที่"
- ไม่ว่าใครจะเข้าตลาดก่อน ก็คาดว่าความได้เปรียบนี้จะอยู่ได้ไม่นาน
- ตัวหุ้ม API ของเอเจนต์
- เพื่อนร่วมห้องถามว่า "บนโลกนี้ไม่มีใครมีทักษะด้าน UI เลยหรือ?"
- นี่ชี้ให้เห็นปัญหาสองอย่าง: 1) ต้นทุน API ทำให้มาร์จินไม่ยั่งยืน 2) แล็บไม่เปิดเผยโมเดลที่ดีที่สุดออกมา (ChatGPT ใช้โมเดลเฉพาะภายในสำหรับการค้นหา การท่องเว็บ ฯลฯ)
- ปัจจุบันไม่มีใครใช้ GPT API เพื่อแข่งขันกับ ChatGPT โดยตรง และคาดว่าแพตเทิร์นนี้จะเกิดซ้ำกับเอเจนต์แนวนอน
- โมเดลโอเพนซอร์ส
- โมเดลโอเพนซอร์สอาจเป็นอีกเส้นทางหนึ่ง
- Perplexity แสดงให้เห็นว่าสามารถแข่งขันกับแล็บในผลิตภัณฑ์แนวนอนได้
- อย่างไรก็ตาม โมเดลโอเพนซอร์สมักทำได้ดีในการวัดผลแบบ benchmark ที่เรียบง่าย แต่กลับลำบากกับงานเอเจนต์ที่ซับซ้อน
- Llama-3.1-405b ตามหลังโมเดลชั้นนำอย่างมากใน MLE-bench
- ที่ Andon Labs เชี่ยวชาญ benchmark ประเภทนี้ และสิ่งนั้นก็สอดคล้องกับสิ่งที่เราเห็น
- Deepseek V3 และ R1 เปิดตัวพร้อมผลลัพธ์ที่น่าประทับใจมาก แต่ o3 ก็เช่นกัน และมีรายงานว่า Anthropic มีเวอร์ชันที่ดีกว่านี้อยู่ภายใน
- โมเดลโอเพนซอร์สอาจเข้าใกล้ระดับแนวหน้าได้ แต่ก็น่าสงสัยว่าจะเหนือกว่าได้
- ถึงอย่างนั้น มันก็อาจดีพอสำหรับการแข่งขันในเกมแนวนอน
- ต้นทุนการอนุมานยังคงสูงมากอยู่ดี
แนวทางในฐานะซัพพลายเออร์
- หากแล็บ AI ทรงพลังได้ถึงระดับนั้นจริง การเป็นซัพพลายเออร์ให้พวกเขาถือเป็นตำแหน่งที่ยอดเยี่ยม
- พวกเขาจะต้องการพลังประมวลผลและพลังงานจำนวนมากอย่างแน่นอน
- หากการวิเคราะห์ของ Leo ถูกต้อง พวกเขาอาจต้องการมากกว่าที่คาดไว้เสียอีก
- โอกาสนี้ต้องอาศัยความเชี่ยวชาญเชิงอุตสาหกรรม ซึ่งอาจไม่ใช่สิ่งที่เป็นธรรมชาติสำหรับผู้ก่อตั้งที่อยู่ในชั้นแอปพลิเคชัน AI ตอนนี้
- แต่อย่าลืมว่าคุณเป็นพ่อมด
- แล็บยังซื้อข้อมูลจากบุคคลที่สามด้วย
- Scale AI กำลังพิสูจน์ว่านี่คือธุรกิจที่ยอดเยี่ยม
- อย่างไรก็ตาม ยังน่าสงสัยว่าแล็บ AI จะทำให้ "การเรียนรู้ด้วยตนเอง" ใช้งานได้จริงหรือไม่
- AlphaZero ถูกฝึกโดยไม่มีข้อมูลภายนอก และสิ่งนี้ถูกมองว่าเป็นจอกศักดิ์สิทธิ์ของโมเดล AI ในอนาคต
- หากพวกเขาทำให้การเรียนรู้ด้วยตนเองใช้ไม่ได้จริง ทางเลือกก็คือการรวมชุดข้อมูลสำหรับการฝึกขั้นต่อเนื่องหลายชุดเข้าด้วยกัน
- ในโลกแบบนั้น การขายข้อมูลน่าจะเป็นทางเลือกที่ดี
แนวทางในฐานะผู้มีส่วนร่วมในระบบนิเวศ
- สิ่งสุดท้ายที่ควรพิจารณาในความสัมพันธ์กับแล็บ AI คือการเป็นผู้มีส่วนร่วมในระบบนิเวศ
- นั่นหมายถึงการสร้างเครื่องมือที่ช่วยเอเจนต์แนวนอน แต่สิ่งสำคัญคือต้องแยกออกจากตัวเอเจนต์เอง
- ดังที่แสดงไว้ในบทที่ 3 ซอฟต์แวร์แบบดั้งเดิมจะยังคงอยู่ต่อไป เพราะเอเจนต์ต้องการอินเทอร์เฟซที่มีประสิทธิภาพ
- เอเจนต์อาจเขียนซอฟต์แวร์ของตัวเองได้ แต่ต้นทุนการอนุมานอาจทำให้สิ่งนี้ไม่คุ้มในทางปฏิบัติ
- อย่างไรก็ตาม ผู้เล่นในระบบนิเวศมีความเสี่ยงที่จะกลายเป็นสินค้าโภคภัณฑ์ และมูลค่าส่วนใหญ่อาจถูกเก็บเกี่ยวไปที่อื่น
- เรื่องนี้จะขึ้นอยู่กับว่าต้นทุนการอนุมาน (inference cost) สำหรับการรันเอเจนต์แนวนอนนั้นสูงเพียงใด
- หากต้นทุนการอนุมานต่ำ ก็จะยิ่งพบเห็นการที่เอเจนต์สร้างซอฟต์แวร์ที่ตัวเองต้องการขึ้นมาเองได้ทั่วไปมากขึ้น
หากเอเจนต์ AI แนวนอนมาช้ากว่าที่คาดล่ะ?
- กรอบเวลา (timeline) มีความสำคัญมาก
- หากเอเจนต์แนวนอนจะมีความสามารถในการแข่งขันได้จริง อีก 10 ปีข้างหน้า การสร้างเวิร์กโฟลว์ AI แนวตั้งในตอนนี้ก็น่าจะเป็นความคิดที่ยอดเยี่ยม
- เวลาระดับนี้เพียงพอที่จะ สร้างบริษัทที่ใหญ่และแข็งแกร่งได้
- แต่เมื่อดูจากความเร็วของความก้าวหน้าในแล็บ AI แล้ว 10 ปีดูไม่สมจริง
- ถ้าอย่างนั้น อีก 4 ปีล่ะ?
- 4 ปีอาจไม่พอสำหรับการสร้างบริษัทยักษ์ใหญ่ แต่ก็ให้โอกาสสำหรับการทำซ้ำปรับปรุง (iteration) ได้มากพอ
- การเริ่มจากชั้นแอปพลิเคชัน AI อาจช่วยให้เปลี่ยนไปเป็นผู้ขายหรือผู้เล่นในระบบนิเวศได้ง่ายขึ้นในภายหลัง
บทส่งท้าย: นี่คือความผิดพลาดของ YC(Y Combinator) หรือไม่?
- เมื่อมองผิวเผิน อาจดูเหมือนว่า YC กำลังตัดสินใจผิดพลาด
- ตอนนี้ YC กำลังทุ่มการลงทุนส่วนใหญ่ไปที่ ผลิตภัณฑ์ AI แนวตั้ง
- แต่ ตลาดนี้มีโอกาสสูงที่จะหายไปในไม่ช้า
- อย่างไรก็ตาม ผู้เขียน ไม่ได้มีความเชี่ยวชาญด้าน VC(venture capital) มากพอ จึงไม่อาจสรุปอย่างมั่นใจได้
- เพียงแค่ กำลังสับสนและแบ่งปันความกังวลเท่านั้น
- YC อ้างว่าตนใช้กลยุทธ์การลงทุนที่ ค่อนข้างเป็นกลาง
- ลงทุนในคนที่ฉลาด แล้วหวังให้พวกเขาค้นหาไอเดียที่ดีที่สุด
- นี่เป็นกลยุทธ์ที่ยอดเยี่ยม และ ผู้ก่อตั้งหลายร้อยคนอาจคาดการณ์อนาคตได้ดีกว่าพาร์ตเนอร์ YC 14 คน
- แต่ผู้เขียน กังวลว่าระบบ batch ของ YC อาจผลักดันให้เกิดการคิดระยะสั้น
- ใน YC การ ตั้งเป้าหมายรายสัปดาห์ เป็นเรื่องสำคัญมาก และการเดินหน้าไปพร้อมกับ กลุ่มขนาดใหญ่ ก็ช่วยสร้างแรงจูงใจได้ดี
- แต่หาก ความหลากหลายของไอเดียมีไม่มากพอ ก็อาจกระตุ้นการคิดระยะสั้นได้
- การสร้างผลิตภัณฑ์ AI แนวตั้งสามารถทำให้แตะ MRR 5,000 ดอลลาร์ได้อย่างรวดเร็ว
- แต่ นี่คือวิธีสร้างธุรกิจที่ยั่งยืนจริงหรือ?
- หากผู้เขียนอยู่ใน batch ของ YC ตอนนี้ ก็คงรู้สึก ถูกล่อลวงให้อยากสร้างผลิตภัณฑ์ AI แนวตั้ง
- ยิ่งไปกว่านั้น ในพอดแคสต์ของ YC อย่าง "The Light Cone" ก็มีเนื้อหาจำนวนมากที่สนับสนุนผลิตภัณฑ์ AI แนวตั้ง
1 ความคิดเห็น
การแบ่งแยกและคำอธิบายระหว่าง Vertical AI กับ Horizontal AI น่าสนใจดี