30 คะแนน โดย xguru 2025-02-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • สรุปรวมบทความชุด 4 ตอนของ Lukas Petersson ผู้ก่อตั้ง Andon Labs สตาร์ตอัปด้าน AI Safety (YC w24) ไว้เป็นเรื่องเดียว
    • ในเชิงประวัติศาสตร์ วงการ AI นั้นแนวทางแบบทั่วไปมักเป็นฝ่ายชนะเสมอ
    • ผู้ก่อตั้งในสายแอปพลิเคชัน AI ปัจจุบันกำลังทำซ้ำความผิดพลาดที่นักวิจัย AI ในอดีตเคยทำ
    • โมเดล AI ที่ดีขึ้นจะทำให้แอปพลิเคชัน AI แบบอเนกประสงค์เป็นไปได้ และในขณะเดียวกันก็จะลดมูลค่าเพิ่มของซอฟต์แวร์ที่เกี่ยวข้องกับโมเดล AI ลง
  • บทที่ 1: ประวัติศาสตร์ซ้ำรอย
  • บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน
  • บทที่ 3: รอยเท้าของประวัติศาสตร์
  • บทที่ 4: คุณคือพ่อมด

บทที่ 1: ประวัติศาสตร์ซ้ำรอย (History Repeats Itself)

tl;dr:

  • ความก้าวหน้าของ AI ในช่วงหลังทำให้เกิดผลิตภัณฑ์ใหม่ที่แก้ปัญหาได้หลากหลาย
  • แต่ผลิตภัณฑ์ส่วนใหญ่ยังทำงานอยู่ภายในขีดจำกัดของโมเดลปัจจุบัน และยังไม่สามารถใช้ประโยชน์จากความยืดหยุ่นซึ่งเป็นพลังแท้จริงของ AI ได้
  • ประวัติศาสตร์ของ AI แสดงให้เห็นซ้ำแล้วซ้ำเล่าว่าแนวทางแบบทั่วไปเป็นฝ่ายชนะเสมอ ซึ่ง Richard Sutton เน้นไว้ใน "The Bitter Lesson"
  • ผู้ก่อตั้ง AI ในปัจจุบันมีแนวโน้มจะทำซ้ำความผิดพลาดแบบเดียวกับที่นักวิจัย AI ในอดีตเคยเผชิญ

สรุปบทความของ Richard Sutton: The Bitter Lesson (ฉบับแปลเกาหลี)

  • บทความนี้เสนอข้อเรียนรู้ดังต่อไปนี้:
    • นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์
    • วิธีนี้ได้ผลในระยะสั้นและให้ความรู้สึกน่าพอใจ
    • แต่ในระยะยาว ความก้าวหน้าจะหยุดชะงัก และยิ่งไปกว่านั้นยังขัดขวางความคืบหน้า
    • ในท้ายที่สุด จุดเปลี่ยนกลับเกิดจากการขยายขนาดของการคำนวณที่ตั้งอยู่บนแนวทางตรงกันข้าม
  • เตือนว่ารูปแบบนี้ถูกพบซ้ำแล้วซ้ำเล่าในการวิจัย AI และจนถึงตอนนี้ก็ยังไม่สิ้นสุด

ผลิตภัณฑ์ AI และ The Bitter Lesson

  • โดยทั่วไปผลิตภัณฑ์ AI ประกอบด้วยโมเดล AI และซอฟต์แวร์ที่ล้อมรอบมัน
  • มี 2 วิธีในการปรับปรุงประสิทธิภาพ:
    1. งานวิศวกรรมที่ใส่ข้อจำกัดให้ซอฟต์แวร์เพื่อลดข้อผิดพลาด
    2. รอจนกว่าโมเดลที่ดีกว่าจะออกมา
  • ยิ่งโมเดลพัฒนาไปมากเท่าไร มูลค่าของงานวิศวกรรมก็ยิ่งลดลง
  • กรณีที่มูลค่าของ prompt engineering ลดลงหลัง OpenAI เปิดตัวโมเดลใหม่ เป็นตัวอย่างที่แสดงเรื่องนี้

ประเภทของข้อจำกัดและผลิตภัณฑ์ AI

  • องค์ประกอบที่เป็นข้อจำกัดของผลิตภัณฑ์ AI สามารถแบ่งได้เป็น 2 ประเภท:
    • ความเฉพาะทาง: ซอฟต์แวร์ที่มุ่งเน้นปัญหาเฉพาะอย่าง (โซลูชันแนวตั้ง)
    • ความเป็นอัตโนมัติ: ความสามารถที่ AI จะลงมือทำงานได้ด้วยตัวเอง
  • จากกรอบนี้สามารถจัดหมวดหมู่ผลิตภัณฑ์ AI ได้ตามความเฉพาะทาง (Vertical vs. Horizontal) และความเป็นอัตโนมัติ (Workflow vs. Agent)
    • Vertical Workflow
      • ระบบที่ทำงานตามลำดับตายตัวเพื่อแก้ปัญหาเฉพาะ
      • Harvey เป็นตัวอย่างเด่น เป็นระบบ workflow ที่ออกแบบมาเพื่อจัดการปัญหาในขอบเขตแคบ เช่น งานด้านกฎหมายเฉพาะทาง
    • Vertical Agent
      • ระบบที่ทำงานได้อย่างอัตโนมัติในขอบเขตงานเฉพาะ และตัดสินใจเองระหว่างกระบวนการทำงาน
      • Devin เป็นตัวอย่างเด่น โดยใช้เครื่องมือและข้อมูลที่จำกัดเพื่อทำงานซ้ำ ๆ และปรับขั้นตอนการทำงานตามความจำเป็น
    • Horizontal Workflow
      • ระบบ workflow แบบทั่วไปที่สามารถแก้ปัญหาได้หลากหลาย
      • ChatGPT เป็นตัวอย่างเด่น โดยตอบสนองต่ออินพุตหลายประเภทตามขั้นตอนที่กำหนดไว้ล่วงหน้า แต่ยังไม่มีความเป็นอัตโนมัติเต็มรูปแบบ
    • Horizontal Agent
      • ระบบอัตโนมัติเต็มรูปแบบที่สามารถจัดการปัญหาได้หลากหลาย
      • Claude computer-use เป็นตัวอย่างเด่น โดยใช้ซอฟต์แวร์มาตรฐานของบริษัทเพื่อทำงานตามคำสั่งของผู้ใช้และแก้ปัญหาในลักษณะคล้ายมนุษย์

ความเชื่อมโยงระหว่าง Vertical Workflow กับ The Bitter Lesson

  • ผลิตภัณฑ์ส่วนใหญ่ที่นำเสนอใน Demo Day จัดอยู่ในรูปแบบ Vertical Workflow
    • เนื่องจากความน่าเชื่อถือของโมเดลปัจจุบันยังไม่เพียงพอ จึงยากที่จะใช้แนวทางอื่น
    • มีแนวโน้มจะจำกัดแม้แต่ปัญหาที่ซับซ้อนให้อยู่ในรูป Vertical Workflow เพื่อให้ได้ประสิทธิภาพที่ยอมรับได้
  • แม้จะปรับปรุงโซลูชันเหล่านี้ได้ด้วยงานวิศวกรรม แต่ก็มีข้อจำกัด
    • ปัญหาที่โมเดลปัจจุบันยังแก้ไม่ได้ การรอโมเดลที่ก้าวหน้ากว่าน่าจะเป็นกลยุทธ์ที่ดีกว่า
    • ข้อสังเกตของ Leopold Aschenbrenner: เวลาที่ต้องรอโมเดลที่ดีกว่าอาจสั้นกว่าการทำงานวิศวกรรม

ความสัมพันธ์ระหว่าง The Bitter Lesson กับผลิตภัณฑ์ AI ปัจจุบัน

  • นักวิจัย AI เคยออกแบบโซลูชันที่อาศัยความรู้เพื่อให้ได้ “ประสิทธิภาพที่ยอมรับได้” แต่ท้ายที่สุดโซลูชันแบบทั่วไปที่ใช้ทรัพยากรคอมพิวต์มากกว่าก็แซงหน้า
  • วิธีพัฒนาผลิตภัณฑ์ AI ในปัจจุบันก็คล้ายกับรูปแบบนี้

การนำข้อสังเกต 4 ข้อของ Bitter Lesson ไปใช้กับประเภทของข้อจำกัด

ข้อสังเกตสำคัญ 4 ข้อที่กล่าวถึงใน Bitter Lesson สะท้อนให้เห็นอย่างชัดเจนในข้อจำกัดด้านความเป็นอัตโนมัติและความเฉพาะทางของผลิตภัณฑ์ AI เช่นกัน
เมื่ออธิบายแยกตามข้อจำกัดแต่ละประเภท จะได้ดังนี้:

  1. ข้อสังเกตข้อแรก: นักวิจัย AI พยายามผสานความรู้เข้าไปในเอเจนต์
  • ข้อจำกัดด้านความเป็นอัตโนมัติ:
    • นักพัฒนาทดลองใช้เอเจนต์อัตโนมัติ แต่ความน่าเชื่อถือยังต่ำ
    • ดังนั้นจึง hardcode ขั้นตอนงานให้อยู่ในรูป workflow เพื่อให้ทำตามกระบวนการเดียวกับที่มนุษย์ใช้แก้ปัญหา
  • ข้อจำกัดด้านความเฉพาะทาง:
    • นักพัฒนาต้องการสร้างระบบวิเคราะห์เอกสารแบบทั่วไป แต่ติดปัญหาเรื่องความน่าเชื่อถือ
    • จึงหันไปโฟกัสที่เอกสารบางประเภท เช่น งบการเงิน และ hardcode metric เฉพาะกับกฎการตรวจสอบลงไป
  1. ข้อสังเกตข้อที่สอง: ในระยะสั้น วิธีนี้ได้ผลและทำให้นักวิจัยรู้สึกพอใจ
  • ข้อจำกัดด้านความเป็นอัตโนมัติ:
    • การ hardcode workflow ช่วยเพิ่มความเสถียร
  • ข้อจำกัดด้านความเฉพาะทาง:
    • การทำให้เชี่ยวชาญเฉพาะเอกสารและ metric ช่วงแคบช่วยเพิ่มความแม่นยำ
  1. ข้อสังเกตข้อที่สาม: ในระยะยาว ความก้าวหน้าจะชะงักและยิ่งไปกว่านั้นยังกลายเป็นอุปสรรค
  • ข้อจำกัดด้านความเป็นอัตโนมัติ:
    • workflow ที่ hardcode ไว้ไม่สามารถรับมือสถานการณ์ใหม่ได้ จึงนำไปสู่ผลลัพธ์ที่ไม่แม่นยำ
  • ข้อจำกัดด้านความเฉพาะทาง:
    • ระบบที่จัดการได้เฉพาะปัญหาบางอย่าง ไม่สามารถรองรับงานที่เกี่ยวข้อง เช่น เอกสารที่รวมหลายประเภทหรือการวิเคราะห์ผลประกอบการ
    • แต่ละงานจึงต้องมีระบบเฉพาะทางแยกกัน
  1. ข้อสังเกตข้อที่สี่: จุดเปลี่ยนเกิดขึ้นจากการขยายทรัพยากรคอมพิวต์
  • ข้อจำกัดด้านความเป็นอัตโนมัติ:

    • โมเดลรุ่นใหม่สามารถค้นหาแนวทางที่เหมาะสมได้แบบไดนามิก แก้ข้อผิดพลาดได้เมื่อจำเป็น และทำให้เกิดเอเจนต์อัตโนมัติที่เชื่อถือได้
  • ข้อจำกัดด้านความเฉพาะทาง:

    • โมเดลรุ่นใหม่สามารถเข้าใจเอกสารธุรกิจทั้งหมดได้อย่างครอบคลุมและดึงข้อมูลที่เกี่ยวข้องออกมาได้ ทำให้ไม่จำเป็นต้องมีระบบเฉพาะทางอีกต่อไป
  • ในปัญหาที่ต้องการความเป็นอัตโนมัติ ผลิตภัณฑ์ที่อัตโนมัติมากกว่าจะทำผลงานได้ดีกว่า

  • เมื่อต้องรับมือกับอินพุตที่ซับซ้อนและมีขอบเขตกว้าง ผลิตภัณฑ์ที่เฉพาะทางน้อยกว่าจะให้ผลลัพธ์ดีกว่า

สรุปส่งท้าย: AI สตาร์ตอัปกับ The Bitter Lesson

  • บทความนี้เป็นตอนแรกของซีรีส์ 4 ตอนที่สำรวจบทบาทของสตาร์ตอัปในโลก AI โดยเน้นย้ำรูปแบบทางประวัติศาสตร์ที่โมเดล AI ซึ่งอาศัยความรู้เชิงโดเมนถูกแทนที่อย่างต่อเนื่องด้วยโมเดลที่ใช้ทรัพยากรคอมพิวต์
  • ผลิตภัณฑ์ AI ในปัจจุบันมีลักษณะคล้ายกับรูปแบบนี้อย่างน่าทึ่ง
  • การพัฒนาซอฟต์แวร์เพื่อชดเชยข้อจำกัดของโมเดลปัจจุบัน เป็นกลยุทธ์ที่มีโอกาสล้มเหลวสูง โดยเฉพาะในสถานการณ์ที่โมเดลพัฒนาอย่างรวดเร็ว
  • ข้อสังเกตของ Jarred พาร์ตเนอร์จาก YC: แอป LLM แบบ vertical workflow รุ่นแรก ๆ ถูกแทนที่โดยโมเดล GPT รุ่นถัดไป
  • คำแนะนำของ Sam Altman: สิ่งสำคัญคือการสร้างสตาร์ตอัปที่ไม่กลัวการมาของโมเดลที่ดีกว่า และกลับคาดหวังได้ด้วยซ้ำ
  • ผู้ก่อตั้งจำนวนมากในเลเยอร์แอปพลิเคชัน AI ตื่นเต้นกับการเปิดตัวโมเดลใหม่ แต่สิ่งนี้อาจเป็นสัญญาณอันตราย
    • หากมีโมเดลที่ดีกว่าออกมา อาจทำให้ความได้เปรียบในการแข่งขันในปัจจุบันลดลงอย่างมาก
    • โดยเฉพาะเมื่อมองในแง่ประสิทธิภาพของผลิตภัณฑ์ในการแก้ปัญหาที่ยากขึ้นได้ดีกว่า ความเสี่ยงนี้จะยิ่งชัดเจน
  • บทความถัดไปจะสำรวจอีกมิติหนึ่งคือการยอมรับของตลาด และอภิปรายว่าประสิทธิภาพที่ดีกว่าไม่ได้รับประกันความสำเร็จในตลาดเสมอไป

บทที่ 2: ไม่มีความได้เปรียบในการแข่งขัน (No Powers)

tl;dr:

  • ในประวัติศาสตร์ของ AI แนวทางที่พยายามชดเชยข้อจำกัดของโมเดลด้วยความรู้เฉพาะโดเมน มักถูกแซงในท้ายที่สุดโดยแนวทางที่ใช้ทรัพยากรคอมพิวต์เพื่อทำให้เป็นวิธีการแบบทั่วไป
  • vertical AI เข้าสู่ตลาดก่อนด้วยวิธีเพิ่มความแม่นยำผ่านการกำหนด task flow เฉพาะล่วงหน้าเพื่อชดเชยข้อจำกัดของโมเดลในปัจจุบัน
  • horizontal AI เป็นแนวทางที่ใช้โมเดลอเนกประสงค์อย่าง ChatGPT และพัฒนาต่อเนื่อง ซึ่งมีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าในหลายสาขาทุกครั้งที่โมเดลได้รับการปรับปรุง
  • ในระยะยาว horizontal AI มีแนวโน้มได้เปรียบเหนือ vertical AI ที่มีข้อจำกัดหลายอย่าง เพราะมีทั้งประสิทธิภาพและความยืดหยุ่นสูงกว่า

ความยากของปัญหาและเส้นโค้งประสิทธิภาพ

  • Figure 1 เป็นตัวอย่างอย่างง่ายที่แสดงว่า vertical AI เข้าสู่ตลาดก่อน แต่ท้ายที่สุด horizontal AI ที่โมเดลได้รับการปรับปรุงแล้วจะไล่แซงด้านประสิทธิภาพ
  • ในกรณีที่ปัญหามีความยากสูง (Figure 2) vertical AI อาจไปไม่ถึงระดับประสิทธิภาพที่เพียงพอเลย และต้องรอให้ horizontal AI พัฒนาขึ้นก่อนจึงจะเริ่มแก้ปัญหาได้
  • ปัญหาที่ vertical AI นำไปใช้ได้ในตอนนี้ค่อนข้างเป็น “ปัญหาความยากต่ำ” ดังนั้นแม้จะได้ประโยชน์จากการเข้าตลาดก่อนในหมวดนี้ แต่ความสามารถในการแข่งขันระยะยาวยังไม่แน่นอน

แนวคิด “ผู้ร่วมงานทางไกล” ที่ horizontal AI มอบให้

  • ในอนาคต horizontal AI อาจพัฒนาไปเป็นรูปแบบคล้ายพนักงานทางไกล ที่ได้รับคอมพิวเตอร์และบัญชีผู้ใช้ แล้วสามารถค้นหาและใช้ข้อมูลที่จำเป็นได้ด้วยตนเอง
  • UI ที่ผู้ใช้จำนวนมากคุ้นเคยอยู่แล้ว เช่น ChatGPT อาจค่อย ๆ ถูกเสริมความสามารถ จนเอื้อต่อการนำไปใช้ในองค์กรได้อย่างรวดเร็ว
  • เนื่องจาก horizontal AI สามารถดูดซับความสามารถใหม่ ๆ ได้ทันทีทุกครั้งที่โมเดลพัฒนา จึงรักษาความได้เปรียบในการแข่งขันได้ง่ายกว่า vertical AI

กรณีก่อนหน้า: ประสบการณ์กับ AcademicGPT

  • ในช่วง GPT-3.5 ผู้เขียนเปิดตัว AcademicGPT เพื่อก้าวข้ามข้อจำกัดด้านอินพุตยาว แต่เมื่อ GPT-4 รองรับอินพุตยาวเป็นพื้นฐานแล้ว โซลูชันเดิมก็ถูกแทนที่อย่างรวดเร็ว
  • อย่างที่ Jared พาร์ตเนอร์ของ YC กล่าวไว้ว่า “แอป LLM รุ่นแรกส่วนใหญ่แพ้ให้กับโมเดลรุ่นถัดไป”
  • vertical AI ที่รวมหลายความสามารถไว้พร้อมกันก็เสี่ยงจะเจอกระบวนการเดียวกัน เมื่อประสิทธิภาพของโมเดลพัฒนาไปอีก

การวิเคราะห์ 7 Powers ของ Helmer

  • ในส่วนนี้จะพิจารณาว่า vertical AI สามารถแข่งขันกับ horizontal AI ได้หรือไม่ ผ่านกรอบความได้เปรียบทางการแข่งขัน 7 ประการของ Hamilton Helmer (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource)
  • Switching Cost (ต้นทุนการเปลี่ยน)

    • แม้ผู้ใช้จะคุ้นเคยกับ UI หรือ workflow ของโซลูชัน vertical AI บางรายแล้ว แต่ horizontal AI สามารถนำไปใช้ได้ง่ายในลักษณะ “จ้างพนักงานใหม่” แล้ว onboard เข้ามา
    • ปัจจุบันมีองค์กรเพิ่มขึ้นที่นำโซลูชัน horizontal AI อย่าง ChatGPT มาใช้แล้ว จึงมีแนวโน้มว่ากระบวนการเปลี่ยนผ่านจะไม่ยาก
    • ในด้านราคา horizontal AI ก็มีแนวโน้มช่วยลดต้นทุน เพราะสามารถรวมหลายโซลูชันแบบ vertical เข้าไว้ด้วยกันได้
  • Counter Positioning (การวางตำแหน่งสวนกลับ)

    • vertical AI อาจมอบคุณค่าเฉพาะทางด้วยโซลูชันที่ออกแบบมาสำหรับตลาดหนึ่งโดยเฉพาะ แต่เมื่อโมเดลค่อย ๆ ดีขึ้น horizontal AI ก็มีแนวโน้มจะแสดงประสิทธิภาพที่ดีกว่าโดยรวม
    • vertical AI เผชิญภาวะกลืนไม่เข้าคายไม่ออก คือทุกครั้งที่นำโมเดลใหม่เข้ามาใช้ ก็อาจสูญเสียความแตกต่างเพราะ “ข้อจำกัด” เดิม หรือถ้าปลดข้อจำกัดเหล่านั้น ก็จะยิ่งคล้ายโมเดลแนวนอนมากขึ้นในที่สุด
  • Scale Economy (เศรษฐศาสตร์จากขนาด)

    • vertical AI ก็เหมือน SaaS ตรงที่ลดต้นทุนได้ตามขนาด แต่ horizontal AI เองก็มีข้อได้เปรียบจากการรวมหลายสาขาเข้าด้วยกันและกระจายต้นทุนได้เช่นกัน
    • การนำโมเดลแนวนอนที่พัฒนาด้วยการลงทุน R&D ขนาดใหญ่มาใช้ในหลายกรณี จะยิ่งเร่งการลดต้นทุนได้
  • Network Economy (อานิสงส์เครือข่าย)

    • ทั้ง vertical AI และ horizontal AI ต่างมีโอกาสพัฒนาจากข้อมูลผู้ใช้ได้ แต่ horizontal AI ได้เปรียบมากกว่าเพราะรับฟีดแบ็กจากฐานผู้ใช้ที่กว้างกว่า และยกระดับประสิทธิภาพโดยรวมของโมเดลได้
    • เนื่องจากใช้ข้อมูลที่สะสมจากหลายสาขาเพื่อพัฒนาโมเดลทั้งระบบ จึงอาจก้าวหน้าได้เร็วเกินกว่าที่ vertical AI จะตามทัน
  • Brand Power (พลังของแบรนด์)

    • พลังของแบรนด์เป็นความได้เปรียบที่แทบสร้างไม่ได้ในช่วงที่ยังเป็นสตาร์ทอัปขนาดเล็ก
    • บริษัทอย่าง OpenAI หรือ Google ที่มีอิทธิพลด้านแบรนด์อยู่แล้วเป็นข้อยกเว้น แต่สตาร์ทอัป vertical AI ส่วนใหญ่ยากจะใช้แบรนด์เป็นอาวุธหลัก
  • Process Power (พลังของกระบวนการ)

    • พลังของกระบวนการก็เป็นความได้เปรียบที่มักเกิดจากระบบปฏิบัติการภายในที่องค์กรขนาดใหญ่ขัดเกลามาเป็นเวลานาน
    • สำหรับสตาร์ทอัประยะเริ่มต้น สิ่งนี้แทบไม่ใช่หมวดที่เกี่ยวข้อง
  • Cornered Resource (ทรัพยากรผูกขาด)

    • ทรัพยากรผูกขาดจะกลายเป็นความได้เปรียบที่สำคัญก็ต่อเมื่อมีเพียงบริษัทเดียวที่ถือครองข้อมูลหรือทรัพยากรนั้น และทรัพยากรดังกล่าวจำเป็นอย่างแท้จริงต่อสาขานั้น
    • สตาร์ทอัป AI จำนวนมากอ้างว่าตนมี “ข้อมูลผูกขาด” แต่ในความเป็นจริง ข้อมูลนั้นมักไม่ได้ผูกขาดอย่างแท้จริง หรือถึงไม่มีข้อมูลนั้น โมเดลก็ยังเรียนรู้ได้เพียงพอ
    • ในทางกลับกัน บริษัทที่ครอบครองทรัพยากรผูกขาดอย่างแท้จริงอาจยังคงรักษาความสามารถในการแข่งขันไว้ได้ แม้ horizontal AI จะพัฒนาไปมากก็ตาม

บทสรุป

  • สุดท้ายแล้ว แม้จะเป็นสถานการณ์ที่ vertical AI ได้ประโยชน์จากการเข้าตลาดก่อน หาก horizontal AI มีประสิทธิภาพสูงกว่า vertical AI ส่วนใหญ่ก็จะอยู่รอดได้ยาก
  • ในบรรดา 7 Powers ของ Helmer มีเพียงกรณีที่ครอบครอง “Cornered Resource” อย่างแท้จริงเท่านั้น ที่ vertical AI อาจรักษาโมเมนตัมระยะยาวไว้ได้
  • เช่นเดียวกับกรณีของ AcademicGPT ที่ล่มสลายอย่างรวดเร็วหลัง GPT-4 เปิดตัว vertical AI ที่เสริมฟังก์ชันหลายอย่างเข้าไปก็อาจเผชิญเส้นทางคล้ายกันเมื่อโมเดลพัฒนาขึ้น
  • ในบทถัดไป (บทที่ 3) จะคาดการณ์ว่า horizontal AI ในรูปแบบ “ผู้ร่วมงานทางไกล” จะเกิดขึ้นจริงเมื่อใดและอย่างไร พร้อมเจาะลึกอุปสรรคด้านเทคนิค กฎระเบียบ ความน่าเชื่อถือ และเศรษฐศาสตร์ที่ขัดขวางสิ่งนี้อยู่

บทที่ 3: ร่องรอยเชิงอรรถในประวัติศาสตร์ (A Footnote in History)

  • มีการเผยแพร่บทสัมภาษณ์ที่ CEO ของ Anthropic อธิบายแนวคิด “virtual collaborator”
  • แนวคิดนี้คล้ายกับสิ่งที่ผู้เขียนเรียกในซีรีส์นี้ว่า “horizontal AI product”
  • คาดว่า OpenAI จะประกาศ “Operator” ในเร็ว ๆ นี้ และตามเบนช์มาร์กที่หลุดออกมา ประสิทธิภาพนำหน้า Claude อย่างมาก (บน OSWorld benchmark Claude ได้ 22%, Operator ได้ 38%)
  • การเพิ่มขึ้นของประสิทธิภาพนี้ยังอยู่ในกรอบที่คาดไว้ และผู้เขียนยังคงยืนตามการคาดการณ์เมื่อ 3 เดือนก่อน
  • ในบทก่อนหน้าได้อธิบายแล้วว่าทำไมแอปพลิเคชัน vertical AI จึงรักษาความสามารถในการแข่งขันได้ยาก
    • ช่องว่างด้านประสิทธิภาพกับโซลูชัน AI ทั่วไปกำลังแคบลง
    • เมื่อผลิตภัณฑ์ horizontal AI แข่งขันได้แล้ว ผลิตภัณฑ์ vertical AI ก็แทบไม่มีวิธีป้องกันตัว
  • คำถามสำคัญคือ: “การเปลี่ยนผ่านจาก vertical AI ไปสู่ horizontal AI จะเกิดขึ้นเมื่อไร?”
    • หากอีก 10 ปีค่อยเกิดขึ้น การพัฒนา vertical AI ตอนนี้ก็อาจยังมีความหมาย
    • แต่หากความเปลี่ยนแปลงมาถึงภายใน 1–2 ปี ก็จำเป็นต้องใช้กลยุทธ์ที่ต่างออกไปโดยสิ้นเชิง
  • การเปลี่ยนผ่านจาก vertical AI ไปเป็น horizontal AI จะไม่ได้เกิดขึ้นพร้อมกันในทุกอุตสาหกรรม
  • อย่างไรก็ตาม ตลาดที่สตาร์ทอัป AI ส่วนใหญ่กำลังมุ่งเน้นอยู่ในตอนนี้เป็นสาขาที่ค่อนข้างเรียบง่าย จึงคาดว่าการเปลี่ยนแปลงจะเกิดขึ้นในช่วงเวลาใกล้เคียงกันในอุตสาหกรรมหลักต่าง ๆ
  • มีการคาดการณ์ว่าภายในปี 2027 ผลิตภัณฑ์ vertical AI จะอยู่รอดได้ยากในอุตสาหกรรมส่วนใหญ่
  • “adoption” หมายถึง เมื่อผู้ใช้ต้องแก้ปัญหาใหม่หรือเปลี่ยนวิธีแก้ปัญหาเดิม พวกเขาเลือกผลิตภัณฑ์ใด
  • การวิเคราะห์นี้ไม่พิจารณาปัจจัยต่อไปนี้
    • ส่วนแบ่งตลาด: อาจได้รับผลจากสัญญาเดิมหรือปัจจัยอื่น
    • ขนาดสัมบูรณ์: แม้ตลาดจะขยายตัวเพราะ AI เปิดกรณีใช้งานใหม่ ๆ แต่การวิเคราะห์นี้พิจารณาเฉพาะการเปลี่ยนแปลงเชิงสัมพัทธ์
    • มูลค่าแฝงในอนาคต: การประเมินนี้ดูว่าผู้คนเลือกโซลูชันใด ณ เวลาปัจจุบัน โดยไม่นับรวมความเป็นไปได้ในการพัฒนาในอนาคต
  • ตัวอย่างเช่น หากกระแสย้ายจาก A ไป B นั่นหมายความว่าในอดีต A เคยเป็นตัวเลือกที่ได้รับความนิยม แต่ตอนนี้ B ถูกมองว่าเป็นทางเลือกที่ดีกว่าแล้ว

แนวคิด AI แนวตั้ง/แนวนอน และ workflow/agent

  • "AI แนวตั้ง (vertical)" และ "AI แนวนอน (horizontal)" หมายถึงประเภทของผลิตภัณฑ์ AI ที่แตกต่างกัน
  • "เวิร์กโฟลว์ (workflow)" และ "เอเจนต์ (agent)" ก็เป็นแนวคิดที่ใช้จัดประเภทผลิตภัณฑ์ AI เช่นกัน
  • ในเอกสารนี้ จะอธิบายแนวคิดเรื่องเวิร์กโฟลว์และเอเจนต์รวมกันภายในผลิตภัณฑ์ AI แนวนอน
    • มีความเป็นไปได้สูงว่าบริษัทเดียวกันจะพัฒนาผลิตภัณฑ์ที่มีทั้งสองความสามารถรวมอยู่ด้วย
    • ตัวอย่างเช่น ChatGPT อาจเพิ่มความสามารถแบบเอเจนต์เข้าไป ขณะเดียวกันก็ยังคงฐานแบบเวิร์กโฟลว์เดิมไว้

อดีต

  • (1) ช่วงก่อน ChatGPT เป็นสถานการณ์ที่ซอฟต์แวร์แบบดั้งเดิมครองตลาด
  • (2) การเปิดตัว ChatGPT ทำให้เกิดผลิตภัณฑ์ AI แนวนอนที่มีความหมายเป็นครั้งแรก
  • (3) หลังการมาถึงของ GPT-3.5 API ผลิตภัณฑ์แนวตั้งจำนวนมากที่ออกแบบมาสำหรับ AI โดยเฉพาะก็เริ่มเปิดตัวเป็นครั้งแรก

ปีนี้

  • (4) มีการคาดการณ์ว่าในปี 2025 ประสิทธิภาพของโมเดลจะมีเสถียรภาพเพียงพอสำหรับการใช้งานเป็นเอเจนต์ที่ใช้งานได้จริง
    • เอเจนต์ที่จนถึงตอนนี้ถูกใช้เพียงในโครงการวิจัยหรือการทดสอบแบบจำกัด คาดว่าจะเริ่มถูกนำมาใช้อย่างจริงจัง
    • ผลิตภัณฑ์เวิร์กโฟลว์แนวตั้งเดิมก็มีโอกาสเปลี่ยนรูปแบบไปเป็น AI agent เช่นกัน
  • (5) แม้เอเจนต์จะเริ่มปรากฏขึ้น แต่คาดว่าจนถึงปี 2025 เวิร์กโฟลว์แนวตั้งจะยังคงรักษาตำแหน่งที่ครองตลาดไว้
    • นิสัยของผู้ใช้ที่ไม่อยากเปลี่ยนเครื่องมือที่ใช้อยู่แล้ว และแรงเฉื่อยของนักพัฒนาที่ต้องการใช้ประโยชน์จากทรัพยากรทางวิศวกรรมที่สร้างไว้ต่อไป จะยังคงมีผล
  • (6) คาดว่าผลิตภัณฑ์ AI แนวนอนหลักอย่าง ChatGPT, Claude และ Gemini จะขยายความสามารถและครอบคลุมโดเมนแนวตั้งได้มากขึ้น
    • มีความเป็นไปได้ที่ความสามารถเฉพาะทางเดิมของผลิตภัณฑ์ AI แนวตั้งจะถูกดูดซับเข้าไปในผลิตภัณฑ์ AI แนวนอนอย่างรวดเร็ว
    • ตอนนี้ ChatGPT เริ่มเชื่อมต่อกับแอปเดสก์ท็อปแล้ว

อนาคตอันใกล้

  • (7) คาดว่าช่องว่างด้านความสามารถระหว่าง AI agent แนวนอนกับแรงงานมนุษย์จะค่อย ๆ แคบลง
    • แม้จะยังไม่ถึงระดับผู้เชี่ยวชาญ แต่ก็คาดว่าจะมีประสิทธิภาพพอสำหรับการทำงานอัตโนมัติกับงานสำนักงานทั่วไปได้อย่างมาก
    • ด้วยเหตุนี้ เหตุผลในการมีอยู่ของโซลูชัน AI แนวตั้งอาจลดลง
    • ตัวอย่างที่เป็นรูปธรรม:
      • ผู้ใช้รายบุคคลอาจมอบหมายงานซับซ้อน เช่น การยื่นภาษีหรือการเตรียมหางาน ให้เอเจนต์แนวนอนจัดการ
      • บริษัทอาจแทนที่หรือลดจำนวนพนักงานระดับจูเนียร์ลงได้อย่างมาก
      • อาจเกิดกรณีที่คนเพียงคนเดียวสามารถสร้างมูลค่าระดับยูนิคอร์นได้
  • (8) คาดว่าซอฟต์แวร์แบบดั้งเดิมจะยังคงมีคุณค่าในฐานะอินเทอร์เฟซที่เอเจนต์สามารถใช้งานได้
    • การให้เอเจนต์ใช้ซอฟต์แวร์ที่มีอยู่เดิมอาจคุ้มค่ากว่าการให้มันสร้างซอฟต์แวร์ใหม่ทั้งหมดขึ้นมาเองโดยตรง
    • โดยเฉพาะซอฟต์แวร์อเนกประสงค์และซอฟต์แวร์แนวนอน มีแนวโน้มสูงกว่าจะอยู่รอด
  • (9) ผลิตภัณฑ์ AI แนวตั้งที่จะอยู่รอดได้น่าจะมีเพียงส่วนน้อยที่ครอบครองทรัพยากรเชิงป้องกันซึ่งกล่าวถึงในบทที่ 2 (เช่น ข้อมูลผูกขาด สิทธิบัตร เป็นต้น)
    • พวกเขาอาจสามารถขายทรัพยากรเหล่านั้นได้ในมูลค่าสูง

2024 - การพัฒนาหยุดชะงักหรือไม่?

  • มีการประเมินว่าคำกล่าวอ้างว่าโมเดล AI หยุดนิ่งในปี 2024 นั้นไม่น่าเชื่อถือมากนัก
    • ตั้งแต่ก่อนการเปิดตัว o3 ประสิทธิภาพของโมเดลในหลายด้าน เช่น GPT-4, Claude และ Open Weight model ก็พัฒนาขึ้นอย่างต่อเนื่อง
    • คะแนนเบนช์มาร์กอย่าง ARC-AGI และ GPQA Diamond ก็ปรับตัวดีขึ้นอย่างก้าวกระโดดมาโดยตลอด
  • Anthropic พัฒนาอย่างรวดเร็วจาก Claude 2 ไปสู่ Claude 3 และต่อด้วย Claude 3.5 Sonnet และมีการคาดเดาว่าบริษัทได้นำอัปเกรดที่ยังไม่เปิดเผยมาใช้ภายในองค์กร
  • ด้วยเหตุนี้ จึงมีมุมมองว่าคำกล่าวอ้างว่าปี 2024 เป็นปีที่การปรับปรุงโมเดล AI หยุดลงนั้นขาดหลักฐานรองรับ

อุปสรรคที่อาจเกิดขึ้น

  • Model Stagnation: แม้ปี 2024 จะไม่มีภาวะชะงักงัน แต่ก็มีความกังวลว่าหลังปี 2025 การพัฒนาโมเดลอาจหยุดนิ่ง

    • Ilya Sutskever กล่าวถึงข้อจำกัดของวิธี Pre-training แบบดั้งเดิมในงาน NeurIPS แต่ก็เสนอพร้อมกันว่ายังมีเส้นทางอื่น เช่น Test-time compute
    • สถาบันวิจัย AI และบริษัทใหญ่ ๆ ยังคงลงทุนอย่างจริงจังในทรัพยากรคอมพิวต์ขนาดมหาศาล
  • Regulation: หากมีกฎระเบียบที่ไม่คาดคิดเกิดขึ้น ก็อาจทำให้การพัฒนา AI ถูกจำกัด

  • Trust Barriers: ผู้ใช้ยังมีความกังวลเรื่องความเสถียรและความน่าเชื่อถือของเอเจนต์

    • มีการคาดการณ์ว่าเมื่อเวลาผ่านไป เรื่องนี้จะถูกเอาชนะได้ โดยยกตัวอย่างกรณีในอดีตที่ความกลัวต่อระบบลิฟต์อัตโนมัติสุดท้ายก็หายไป
  • AI Labs Hesitate: Anthropic หรือ OpenAI อาจมีกรณีที่แม้จะมีศักยภาพทางเทคนิคจริง แต่ก็ยังคงจำกัดปฏิสัมพันธ์ของผู้ใช้ไว้บางส่วน

  • Expensive Inference: เช่นกรณีของ o3 การทำ inference ประสิทธิภาพสูงอาจต้องใช้ต้นทุนที่สูงมาก

    • แต่ต้นทุน inference ก็กำลังลดลงเรื่อย ๆ ตามเวลา และก็มีความเป็นไปได้สูงที่เอเจนต์จะไม่ใช้การอนุมานประสิทธิภาพสูงในระดับเดียวกันกับทุกงาน
  • เมื่อพิจารณาปัจจัยทั้งหมดข้างต้น แม้การคาดการณ์ความก้าวหน้าทางเทคโนโลยีจะทำได้ยาก แต่คาดว่าสตาร์ทอัพ AI แนวตั้งจะเหลือเวลาไม่มากนัก

  • มีการเสนอกราฟมูลค่าแบบรูปตัว U ที่ชี้ว่า เมื่อโมเดล AI มีความก้าวหน้ามากขึ้น มูลค่าที่อิงกับวิศวกรรมแบบเดิมอาจสลายไปอย่างรวดเร็ว

ข้อสังเกตเพิ่มเติม

  • มีคำอธิบายว่าการขยาย Test-time compute ที่เห็นใน o3 เป็นผลลัพธ์ที่มีการคาดการณ์ไว้แล้วจากงานวิจัยเดิม
  • เช่นเดียวกับกรณีของ AlphaZero มีข้อสังเกตว่าในสภาพแวดล้อมที่สามารถตรวจสอบผลลัพธ์ได้ ประสิทธิภาพสามารถพัฒนาไปถึงระดับเหนือมนุษย์ได้อย่างรวดเร็ว
  • มีการวิเคราะห์ว่า o3 แม้จะโดดเด่นในด้านอย่างการเขียนโค้ดและคณิตศาสตร์ แต่ในด้านอื่น เช่น การเขียนเชิงสร้างสรรค์ ก็ไม่ได้แตกต่างจาก o1 มากนัก
  • มีนัยว่าการไปในทิศทางอื่นที่เกี่ยวข้องกับทรัพยากรที่กว้างขวางกว่าหรือผูกขาดมากกว่า อาจเป็นทางเลือกที่ดีกว่าสำหรับผู้ก่อตั้ง มากกว่าการพัฒนา AI แนวตั้งใหม่ขึ้นมาอีก

บทที่ 4: คุณคือพ่อมด (You’re a wizard Harry)

ผู้ก่อตั้งก็เหมือนพ่อมด

  • มีความสามารถในการสร้างสิ่งที่ไม่เคยมีให้เกิดขึ้น
  • การเริ่มต้นบริษัทใหม่ต้องอาศัยความคิดที่แปลกใหม่
  • คำพูดของ Paul Graham (PG): "ไอเดียต้องไม่เพียงแค่ถูกต้อง แต่ต้องแปลกใหม่ด้วย คุณไม่ควรเริ่มทำสิ่งที่ทุกคนต่างเห็นพ้องว่าเป็นความคิดที่ดี"
  • ผู้ก่อตั้งจำนวนมากกำลังสูญเสียความคิดที่เป็นอิสระ เพราะมัวตื่นตากับการเติบโตของรายได้ที่น่าประทับใจของเพื่อนร่วมวงการ
  • เมื่อทุกคนกำลังทำสิ่งเดียวกันและมันดูเหมือนจะได้ผล การคิดอย่างอิสระยิ่งเป็นเรื่องยาก
  • ผู้เขียนพยายามคิดอย่างอิสระ และหวังว่าแนวคิดเหล่านี้จะฟังดูเป็นความคิดที่ไม่ดี

อนาคตของเอเจนต์แนวนอนและการแข่งขัน

  • คาดว่าเอเจนต์แนวนอนที่จะครองชั้นแอปพลิเคชัน AI จะถูกพัฒนาโดย AI lab
  • แม้ประสิทธิภาพของโมเดลอาจแตกต่างจนเกิดผู้ชนะเพียงรายเดียวได้ แต่การแข่งขันที่ดุเดือดระหว่าง Anthropic, OpenAI, GDM และ xAI มีแนวโน้มเป็นไปได้มากกว่า
  • สิ่งนี้จะก่อให้เกิดการแข่งขันด้านราคาที่เป็นประโยชน์ต่อผู้ใช้ปลายทางในระยะสั้น
  • แม้ AI lab อาจยังไม่สามารถเก็บเกี่ยวมูลค่าทางการเงินได้มากนักในระยะสั้น แต่ก็ยังคาดว่าจะครองตำแหน่งที่ทรงพลังอย่างยิ่ง
  • ดังนั้นจึงสมเหตุสมผลที่ผู้ก่อตั้งจะมองสตาร์ทอัพของตนในบริบทของความสัมพันธ์กับห้องแล็บเหล่านี้

การเข้าหาในฐานะลูกค้า

  • ตามที่กล่าวไว้ในบทที่ 2 การสร้างผลิตภัณฑ์ AI แนวตั้งที่ใช้ LLM API นั้นเป็นไปได้ แต่จะเป็นไปได้ก็ต่อเมื่อมีสิทธิ์เข้าถึงทรัพยากรสำคัญแบบผูกขาด
  • หากต้องการสร้างผลิตภัณฑ์ AI แนวตั้ง ก็จำเป็นต้องทุ่มเทความพยายามอย่างมหาศาลเพื่อค้นหาทรัพยากรประเภทนั้น

แนวทางในฐานะคู่แข่ง

  • หากเอเจนต์แนวนอนคืออนาคต ทำไมไม่สร้างมันขึ้นมาเสียเอง? พิจารณาแนวทางอยู่สามแบบ
  • การช่วงชิงตลาดก่อน
    • แล็บ AI จะเข้ามาแข่งขันกับเวิร์กโฟลว์แนวตั้งอย่างจริงจังก็ต่อเมื่อโมเดลมีความน่าเชื่อถือมากพอที่จะสร้างเอเจนต์แนวนอนได้ด้วยความพยายามด้านวิศวกรรมเพียงเล็กน้อย
    • ในทางทฤษฎี เราอาจนำความพยายามด้านวิศวกรรมไปใช้กับโมเดลรุ่นก่อนหน้าและเข้าสู่ตลาดก่อนแล็บได้ แต่ก็ไม่แน่นอน
    • Leopold Aschenbrenner มองว่าความพยายามนี้อาจใช้เวลานานกว่าการสร้างโมเดลรุ่นถัดไปเสียอีก: "อาจต้องใช้เวลาพอสมควรกว่าที่พนักงานทางไกลจะทำงานจำนวนมากให้เป็นอัตโนมัติได้ และในระหว่างนั้น โมเดลระดับกลางอาจยังไม่ได้ถูกใช้งานและบูรณาการอย่างเต็มที่"
    • ไม่ว่าใครจะเข้าตลาดก่อน ก็คาดว่าความได้เปรียบนี้จะอยู่ได้ไม่นาน
  • ตัวหุ้ม API ของเอเจนต์
    • เพื่อนร่วมห้องถามว่า "บนโลกนี้ไม่มีใครมีทักษะด้าน UI เลยหรือ?"
    • นี่ชี้ให้เห็นปัญหาสองอย่าง: 1) ต้นทุน API ทำให้มาร์จินไม่ยั่งยืน 2) แล็บไม่เปิดเผยโมเดลที่ดีที่สุดออกมา (ChatGPT ใช้โมเดลเฉพาะภายในสำหรับการค้นหา การท่องเว็บ ฯลฯ)
    • ปัจจุบันไม่มีใครใช้ GPT API เพื่อแข่งขันกับ ChatGPT โดยตรง และคาดว่าแพตเทิร์นนี้จะเกิดซ้ำกับเอเจนต์แนวนอน
  • โมเดลโอเพนซอร์ส
    • โมเดลโอเพนซอร์สอาจเป็นอีกเส้นทางหนึ่ง
    • Perplexity แสดงให้เห็นว่าสามารถแข่งขันกับแล็บในผลิตภัณฑ์แนวนอนได้
    • อย่างไรก็ตาม โมเดลโอเพนซอร์สมักทำได้ดีในการวัดผลแบบ benchmark ที่เรียบง่าย แต่กลับลำบากกับงานเอเจนต์ที่ซับซ้อน
    • Llama-3.1-405b ตามหลังโมเดลชั้นนำอย่างมากใน MLE-bench
    • ที่ Andon Labs เชี่ยวชาญ benchmark ประเภทนี้ และสิ่งนั้นก็สอดคล้องกับสิ่งที่เราเห็น
    • Deepseek V3 และ R1 เปิดตัวพร้อมผลลัพธ์ที่น่าประทับใจมาก แต่ o3 ก็เช่นกัน และมีรายงานว่า Anthropic มีเวอร์ชันที่ดีกว่านี้อยู่ภายใน
    • โมเดลโอเพนซอร์สอาจเข้าใกล้ระดับแนวหน้าได้ แต่ก็น่าสงสัยว่าจะเหนือกว่าได้
    • ถึงอย่างนั้น มันก็อาจดีพอสำหรับการแข่งขันในเกมแนวนอน
    • ต้นทุนการอนุมานยังคงสูงมากอยู่ดี

แนวทางในฐานะซัพพลายเออร์

  • หากแล็บ AI ทรงพลังได้ถึงระดับนั้นจริง การเป็นซัพพลายเออร์ให้พวกเขาถือเป็นตำแหน่งที่ยอดเยี่ยม
  • พวกเขาจะต้องการพลังประมวลผลและพลังงานจำนวนมากอย่างแน่นอน
  • หากการวิเคราะห์ของ Leo ถูกต้อง พวกเขาอาจต้องการมากกว่าที่คาดไว้เสียอีก
  • โอกาสนี้ต้องอาศัยความเชี่ยวชาญเชิงอุตสาหกรรม ซึ่งอาจไม่ใช่สิ่งที่เป็นธรรมชาติสำหรับผู้ก่อตั้งที่อยู่ในชั้นแอปพลิเคชัน AI ตอนนี้
  • แต่อย่าลืมว่าคุณเป็นพ่อมด
  • แล็บยังซื้อข้อมูลจากบุคคลที่สามด้วย
  • Scale AI กำลังพิสูจน์ว่านี่คือธุรกิจที่ยอดเยี่ยม
  • อย่างไรก็ตาม ยังน่าสงสัยว่าแล็บ AI จะทำให้ "การเรียนรู้ด้วยตนเอง" ใช้งานได้จริงหรือไม่
  • AlphaZero ถูกฝึกโดยไม่มีข้อมูลภายนอก และสิ่งนี้ถูกมองว่าเป็นจอกศักดิ์สิทธิ์ของโมเดล AI ในอนาคต
  • หากพวกเขาทำให้การเรียนรู้ด้วยตนเองใช้ไม่ได้จริง ทางเลือกก็คือการรวมชุดข้อมูลสำหรับการฝึกขั้นต่อเนื่องหลายชุดเข้าด้วยกัน
  • ในโลกแบบนั้น การขายข้อมูลน่าจะเป็นทางเลือกที่ดี

แนวทางในฐานะผู้มีส่วนร่วมในระบบนิเวศ

  • สิ่งสุดท้ายที่ควรพิจารณาในความสัมพันธ์กับแล็บ AI คือการเป็นผู้มีส่วนร่วมในระบบนิเวศ
  • นั่นหมายถึงการสร้างเครื่องมือที่ช่วยเอเจนต์แนวนอน แต่สิ่งสำคัญคือต้องแยกออกจากตัวเอเจนต์เอง
  • ดังที่แสดงไว้ในบทที่ 3 ซอฟต์แวร์แบบดั้งเดิมจะยังคงอยู่ต่อไป เพราะเอเจนต์ต้องการอินเทอร์เฟซที่มีประสิทธิภาพ
  • เอเจนต์อาจเขียนซอฟต์แวร์ของตัวเองได้ แต่ต้นทุนการอนุมานอาจทำให้สิ่งนี้ไม่คุ้มในทางปฏิบัติ
  • อย่างไรก็ตาม ผู้เล่นในระบบนิเวศมีความเสี่ยงที่จะกลายเป็นสินค้าโภคภัณฑ์ และมูลค่าส่วนใหญ่อาจถูกเก็บเกี่ยวไปที่อื่น
  • เรื่องนี้จะขึ้นอยู่กับว่าต้นทุนการอนุมาน (inference cost) สำหรับการรันเอเจนต์แนวนอนนั้นสูงเพียงใด
    • หากต้นทุนการอนุมานต่ำ ก็จะยิ่งพบเห็นการที่เอเจนต์สร้างซอฟต์แวร์ที่ตัวเองต้องการขึ้นมาเองได้ทั่วไปมากขึ้น

หากเอเจนต์ AI แนวนอนมาช้ากว่าที่คาดล่ะ?

  • กรอบเวลา (timeline) มีความสำคัญมาก
    • หากเอเจนต์แนวนอนจะมีความสามารถในการแข่งขันได้จริง อีก 10 ปีข้างหน้า การสร้างเวิร์กโฟลว์ AI แนวตั้งในตอนนี้ก็น่าจะเป็นความคิดที่ยอดเยี่ยม
    • เวลาระดับนี้เพียงพอที่จะ สร้างบริษัทที่ใหญ่และแข็งแกร่งได้
  • แต่เมื่อดูจากความเร็วของความก้าวหน้าในแล็บ AI แล้ว 10 ปีดูไม่สมจริง
    • ถ้าอย่างนั้น อีก 4 ปีล่ะ?
    • 4 ปีอาจไม่พอสำหรับการสร้างบริษัทยักษ์ใหญ่ แต่ก็ให้โอกาสสำหรับการทำซ้ำปรับปรุง (iteration) ได้มากพอ
    • การเริ่มจากชั้นแอปพลิเคชัน AI อาจช่วยให้เปลี่ยนไปเป็นผู้ขายหรือผู้เล่นในระบบนิเวศได้ง่ายขึ้นในภายหลัง

บทส่งท้าย: นี่คือความผิดพลาดของ YC(Y Combinator) หรือไม่?

  • เมื่อมองผิวเผิน อาจดูเหมือนว่า YC กำลังตัดสินใจผิดพลาด
    • ตอนนี้ YC กำลังทุ่มการลงทุนส่วนใหญ่ไปที่ ผลิตภัณฑ์ AI แนวตั้ง
    • แต่ ตลาดนี้มีโอกาสสูงที่จะหายไปในไม่ช้า
  • อย่างไรก็ตาม ผู้เขียน ไม่ได้มีความเชี่ยวชาญด้าน VC(venture capital) มากพอ จึงไม่อาจสรุปอย่างมั่นใจได้
    • เพียงแค่ กำลังสับสนและแบ่งปันความกังวลเท่านั้น
  • YC อ้างว่าตนใช้กลยุทธ์การลงทุนที่ ค่อนข้างเป็นกลาง
    • ลงทุนในคนที่ฉลาด แล้วหวังให้พวกเขาค้นหาไอเดียที่ดีที่สุด
    • นี่เป็นกลยุทธ์ที่ยอดเยี่ยม และ ผู้ก่อตั้งหลายร้อยคนอาจคาดการณ์อนาคตได้ดีกว่าพาร์ตเนอร์ YC 14 คน
  • แต่ผู้เขียน กังวลว่าระบบ batch ของ YC อาจผลักดันให้เกิดการคิดระยะสั้น
    • ใน YC การ ตั้งเป้าหมายรายสัปดาห์ เป็นเรื่องสำคัญมาก และการเดินหน้าไปพร้อมกับ กลุ่มขนาดใหญ่ ก็ช่วยสร้างแรงจูงใจได้ดี
    • แต่หาก ความหลากหลายของไอเดียมีไม่มากพอ ก็อาจกระตุ้นการคิดระยะสั้นได้
    • การสร้างผลิตภัณฑ์ AI แนวตั้งสามารถทำให้แตะ MRR 5,000 ดอลลาร์ได้อย่างรวดเร็ว
    • แต่ นี่คือวิธีสร้างธุรกิจที่ยั่งยืนจริงหรือ?
    • หากผู้เขียนอยู่ใน batch ของ YC ตอนนี้ ก็คงรู้สึก ถูกล่อลวงให้อยากสร้างผลิตภัณฑ์ AI แนวตั้ง
    • ยิ่งไปกว่านั้น ในพอดแคสต์ของ YC อย่าง "The Light Cone" ก็มีเนื้อหาจำนวนมากที่สนับสนุนผลิตภัณฑ์ AI แนวตั้ง

1 ความคิดเห็น

 
zkdlfrlwl2 2025-02-14

การแบ่งแยกและคำอธิบายระหว่าง Vertical AI กับ Horizontal AI น่าสนใจดี