4 คะแนน โดย GN⁺ 3 시간 전 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • ยิ่งโมเดล AI ทรงพลังขึ้น มูลค่าของซอฟต์แวร์เองก็ยิ่งลดลง และบริษัทแอปพลิเคชันที่ต้องการอยู่รอดจำเป็นต้องเปลี่ยนตัวเองให้เป็น บริษัทข้อมูลและบริษัทฟินเทค ไปพร้อมกัน
  • เมื่อเอเจนต์กลายเป็นผู้ใช้หลักของซอฟต์แวร์ โมเดลราคาแบบ per-seat ก็พังทลาย พนักงานหนึ่งพันคนอาจรันเอเจนต์หนึ่งแสนตัวได้ แต่ไม่ได้นับเป็นหนึ่งแสนที่นั่ง ดังนั้นสิ่งที่ยังคิดเงินได้จึงเหลือแค่ การตัดสินใจที่เอเจนต์ทิ้งไว้ (ข้อมูล) และเงินที่มันเคลื่อนย้าย (ฟินเทค)
  • Frontier model เปรียบเหมือนกลุ่มอัจฉริยะที่ไม่รู้วิธีเดินเครื่องบริษัท ดังนั้น วิจารณญาณโดยนัย (judgment) ที่คนมีอยู่จึงเป็นคูเมืองที่แท้จริง และ ประวัติการแก้ไข (corrections) ที่ผู้ใช้ใช้แก้ผลลัพธ์ของโมเดลก็ทำหน้าที่ทั้งเป็นสัญญาณการเรียนรู้และชุดทดสอบ
  • ถ้าข้อมูลไม่มีเงินไหลผ่าน มันก็เป็นได้แค่โครงการวิทยาศาสตร์ ฟินเทคแบบ มีเครือข่ายและมี lock-in อย่าง Toast, Ramp, Shopify เท่านั้นที่ยังรักษามาร์จินได้แม้ราคาโมเดลจะลดลง
  • การสะสมวิจารณญาณ การครองเส้นทางการไหลของเงิน และการ ป้องกันการเขียน (writes) คือทางเดียวที่จะทำให้บริษัทยังทดแทนไม่ได้ แม้ Lab จะมองเห็นทุกโทเคนก็ตาม

ความก้าวหน้าของโมเดลและมูลค่าซอฟต์แวร์ที่ลดลง

  • เมื่อวาน Claude Fable 5 เปิดตัว เป็น Mythos-class model ตัวแรกที่คนทั่วไปใช้ได้ ครองอันดับ 1 แทบทุก benchmark และยิ่งงานยาว ช่องว่างก็ยิ่งกว้าง
    • ยิ่งโมเดลฉลาดขึ้น มูลค่าของซอฟต์แวร์เองก็ยิ่งลดลง
  • บริษัทแอปพลิเคชันที่ได้รับเงินลงทุนจาก VC ทุกแห่ง ตอนนี้ต้องเป็นบริษัทข้อมูลหรือบริษัทฟินเทค หรือในอุดมคติคือเป็นทั้งสองอย่าง

ใครเป็นผู้ใช้ซอฟต์แวร์กำลังเปลี่ยนไป

  • ในบทความเมื่อ 2 ปีก่อน มีการชี้ว่าเมื่อเอเจนต์กลายเป็นผู้ใช้ โมเดลราคาแบบ per-seat จะพัง และตอนนี้ดูเหมือนว่าเราได้ข้ามเส้นนั้นมาแล้ว
    • Cloudflare ประกาศว่า ทราฟฟิกจากเอเจนต์แซงทราฟฟิกจากมนุษย์เป็นครั้งแรก
    • แม้ยังมีข้อถกเถียงออนไลน์ แต่แนวโน้มที่เอเจนต์จะกลายเป็นลูกค้าหลักของซอฟต์แวร์ทั้งหมดนั้นชัดเจน
  • พนักงานหนึ่งพันคนรันเอเจนต์หนึ่งแสนตัว ไม่ได้แปลว่าเป็นหนึ่งแสนที่นั่ง
  • สิ่งที่เอเจนต์ทิ้งไว้และคิดเงินได้มีอยู่สองอย่าง คือ การตัดสินใจ (=ข้อมูล) และ เงินที่เคลื่อนย้าย (=ฟินเทค)

การตัดสินใจ (Decisions) — คูเมืองที่ชื่อว่าข้อมูล

  • xAI มีออปชันเข้าซื้อ Cursor ที่มูลค่า 6 หมื่นล้านดอลลาร์ ขณะที่ Cursor มีรายได้ต่อปีแบบ annualized ราว 4 พันล้านดอลลาร์
    • แต่เหตุผลหลักที่ทำให้มันมีราคาสูง ไม่ใช่ตัวซอฟต์แวร์เอง
    • Anthropic และ OpenAI เฝ้าดูงานของนักพัฒนาแบบเรียลไทม์อยู่แล้วผ่าน Claude Code และ Codex
    • เหตุผลที่ xAI ซื้อ Cursor คือเพื่อเข้าไปอยู่ใน token flow ให้เร็วที่สุด
    • Musk (มหาเศรษฐีล้านล้านคนแรกของโลก) กล่าวว่าบันทึกการใช้งานโมเดลจริงของนักพัฒนาหนึ่งล้านคนสามารถป้อนตรงเข้าสู่การฝึก Grok ได้ ราคาแพงนี้คือค่าผ่านทางเพื่อข้ามช่วงเวลาหลายปีของการเก็บข้อมูลแบบช้า ๆ
  • หลัง Cursor เปิดตัวได้ไม่กี่สัปดาห์ ก็มีโคลนที่ใช้งานได้จริงออกมา แต่ไม่มีตัวไหนตั้งหลักได้ เพราะ Cursor ชนะด้วย taste
    • มันคือการตัดสินใจเล็ก ๆ นับพันว่าอะไรควรถูกแสดงและเมื่อไรควรหายไป
    • โคลนลอกได้แค่อินเทอร์เฟซ แต่ไม่อาจสืบทอดประวัติหลายปีที่นักพัฒนาคอยรับ ยกเลิก และเขียนใหม่
    • ตอนนี้ Cursor ใช้ diff เหล่านั้นฝึกโมเดลของตัวเอง ทำให้ข้อมูลกลายเป็นคูเมืองชั้นแรก
  • เหตุผลของมูลค่า 6 หมื่นล้านดอลลาร์: มันเหมือนการแทนที่พนักงาน 90% ด้วยทีมอัจฉริยะที่ไม่รู้อะไรเลยเกี่ยวกับวิธีที่บริษัททำงาน
    • Fable 5 แก้งานซอฟต์แวร์จริงได้ 80% ทั้งที่โมเดลที่ดีที่สุดของปีก่อนยังทำได้แค่ครึ่งเดียว และเหล่าอัจฉริยะเหล่านี้ก็แยกจากกันยากและทดแทนกันได้
    • มีเหตุผลเดียวที่พวกมันล้มเหลว: ไม่มีใครรู้อีกแล้วว่าคนที่ถูกแทนที่เคยรู้อะไร

ความรู้โดยนัย (tacit knowledge) และการสะสมวิจารณญาณ

  • วิธีแก้ชั่วคราวคือดึงความรู้ในหัวคนออกมาแล้วส่งเป็นคอนเท็กซ์ให้โมเดล แต่ความรู้ส่วนใหญ่มักไม่ได้อยู่ในรูปแบบที่มีโครงสร้าง
    • ดีลที่ปล่อยผ่านไป โค้ดบรรทัดเดียวที่ถูก revert ตอนตี 2 ลูกค้าที่ไม่มีใครตามต่อและไม่มีใครบันทึกเหตุผล — นี่ต่างหากคือแก่นจริง
    • มันคือวิจารณญาณที่เขียนเป็น workflow ไม่ได้ และตอนนี้ยังไม่ได้ถูกเก็บไว้
  • ตอนนี้เรากำลังขยับจาก context → harness → judgment
    • Context คือ retrieval หรือการวางชิ้นส่วนที่ถูกต้องไว้ตรงหน้าโมเดล
    • Harness คือ loop หรือ scaffolding ที่ทำให้โมเดลวิ่งงานได้
    • Judgment คือชั้นสุดท้าย และเป็นชั้นเดียวที่สะสมแบบทบต้นได้ เป็นสิ่งที่การเรียกใช้ การแก้ไข และการย้อนกลับทั้งหมดทิ้งไว้บนข้อมูล
  • ทุก AI application pitch ที่เห็นตอนนี้มักยก สไลด์เรื่อง context ขึ้นมาเป็นคูเมือง แต่ตอนนี้มันเป็นแค่ table stakes แล้ว
    • เพราะคู่แข่งทุกเจ้ากำลังประกอบคอนเท็กซ์ด้วยวิธีเดียวกัน

สองบทบาทของประวัติการแก้ไข (corrections)

  • เรามองการแก้ไขเป็น scorecard ได้ ทุกครั้งที่ผู้ใช้แก้ผลลัพธ์ของโมเดล มันคือการบันทึกว่าอะไรคือสิ่งที่ถูกต้องในธุรกิจนั้น
  • Scorecard ทำสองหน้าที่พร้อมกัน
    • เป็น สัญญาณการเรียนรู้ สำหรับปรับแต่งโมเดลที่ยืมมาให้เข้ากับธุรกิจนั้น
    • เป็น ชุดทดสอบ ซึ่งเป็นหนทางเดียวที่จะรู้ว่าเอเจนต์ดีขึ้นจริงหรือไม่ เพราะ benchmark สาธารณะวัด workflow เฉพาะทางเหล่านี้ไม่ได้
  • ไม่จำเป็นต้อง pretrain โมเดลเองตั้งแต่ต้น แม้แต่ Cursor ก็ไม่ได้ทำ
    • โมเดลภายในของ Cursor วางอยู่บน open-source base และ diff เป็นตัวสร้างความแตกต่าง
    • ตอนนี้ค่าใช้จ่ายของ fine-tuning และ RL บน frontier model ถูกลงมากพอที่บริษัทระดับ Series B ก็รันลูปนี้ได้แล้ว ทั้งที่เมื่อ 2 ปีก่อนต้องเป็นงานของ lab เท่านั้น
  • Sarah Guo เรียกพื้นที่นี้ว่า the untrainable (งานที่คนภายนอกให้คะแนนคำตอบถูกผิดไม่ได้) และการแก้ไขก็คือวิธีที่จะครอบครองมัน

กรณีศึกษาของผู้นำ Vertical AI

  • Harvey มีมูลค่า 1.1 หมื่นล้านดอลลาร์ และ Legora ทะลุ 5 พันล้านดอลลาร์ ทั้งคู่เจาะตลาดกฎหมาย
    • พวกเขาไม่ได้หยุดแค่การเป็นเครื่องมือเดี่ยว แต่กำลังวิ่งไปสู่การครอบครอง matter ทั้งคดี/ทั้งงาน เพราะการแก้ไขที่ทนายทำกับร่างเอกสารคือ corrections ที่ไม่มีใครอื่นมองเห็น
  • Rogo ใช้กลยุทธ์เดียวกันในวงการการเงิน โดยจับกระบวนการที่นักวิเคราะห์สร้างโมเดลและแก้โน้ต
  • ไม่มีใครในกลุ่มนี้ฝึก foundation model เอง พวกเขาสร้าง harness รอบโมเดลที่ยืมมา และถือครอง judgment ที่ไหลผ่านภายใน ซึ่งเป็นสิ่งที่สะสมแบบทบต้น
  • เจ้าเก่าที่แข็งแกร่งก็เช่นกัน
    • Figma ไม่ได้ครอบครองแค่ SVG แต่ครอบครองประวัติที่ดีไซน์เดินจาก v1 ไป v47 รวมถึงทุกเวอร์ชันที่ถูกทิ้งระหว่างทาง — บันทึกการให้คะแนนของ design taste
    • Linear ครอบครองข้อถกเถียงทั้งหมดใต้ ticket ที่ปิดไปแล้วทุกใบ
    • Notion ครอบครองรูปทรงของความคิดในทีมตลอดการแก้ไขนับพันครั้ง
    • ต่อให้คู่แข่งพยายามแย่งลูกค้าไป สิ่งเหล่านี้ก็ export ออกไปไม่ได้ และไม่มีคำตอบอยู่ในโมเดลทั่วไป

กระแสที่ Lab กำลังซื้อวิจารณญาณ

  • ตอนนี้ Lab กำลังซื้อวิจารณญาณแบบสำเร็จรูป โดยเริ่มจากข้อมูลที่มนุษย์ช่วยติดป้ายกำกับ
    • Mercor มีมูลค่า 1 หมื่นล้านดอลลาร์ และจ่ายให้เครือข่ายผู้เชี่ยวชาญชั่วโมงละ 85 ดอลลาร์
    • Meta จ่าย 1.4 หมื่นล้านดอลลาร์ให้ Scale เพื่อครอบครอง pipeline นี้
    • สตาร์ตอัปแห่งหนึ่งในนิวยอร์กทำความสะอาดอพาร์ตเมนต์ ฟรี ถ้าคุณยอมให้ถ่ายวิดีโอกระบวนการทั้งหมด เพราะทีม robotics ต้องเห็นว่ามนุษย์ตัดสินใจเลือกการกระทำถัดไปอย่างไร
    • มีหลายบริษัท RL environment ที่ขายวิจารณญาณสำหรับงานระยะยาว และมีรายได้ต่อปีแบบ annualized แตะหลายร้อยล้านดอลลาร์
  • Lab ฝึกจากทั้งอินเทอร์เน็ตมาจนหมดทางแล้ว และตอนนี้กำลังซื้อการตัดสินใจโดยตรง

เงิน (Dollars) — คูเมืองที่ชื่อว่าฟินเทค

  • 23andMe ถือครอง DNA ของคน 15 ล้านคน แต่ก็ล้มละลายในปีที่แล้ว
    • ถ้าข้อมูลไม่มีเงินไหลผ่าน มันก็เป็นได้แค่การรอทุนให้โครงการวิทยาศาสตร์
    • ผู้ก่อตั้งส่วนใหญ่มักพลาดครึ่งนี้
  • Toast เข้าใจเรื่องนี้มาหลายปีแล้ว ร้านอาหารโดยเนื้อแท้คือเครื่องประมวลผลการชำระเงินที่มีครัวติดมาด้วย
    • การชำระเงินสร้างรายได้มากกว่าซอฟต์แวร์มาก
  • Ramp ไปไกลกว่านั้น ด้วยบัตรองค์กรฟรีที่ไม่เก็บค่าธรรมเนียมจากที่ไหนเลย แต่ทุกครั้งที่มีเงินไหลผ่าน 1 ดอลลาร์ ก็หักไว้ 1–2 เซนต์
    • บริษัทมูลค่า 3.2 หมื่นล้านดอลลาร์ที่สร้างจากเศษสตางค์จากการปัดเศษ บัตรฟรีคือประตูหน้าสู่ interchange
    • swipe fee อยู่ได้เพราะมีเครือข่ายค้ำอยู่ และระหว่างที่เงินพักอยู่ก็ยังสร้างรายได้จาก float
  • แต่ไม่ใช่ทุกมาตรวัดเงินจะเป็นคูเมือง
    • แอป vibe-coding ยอดนิยมรายหนึ่งมีมาร์จินราว 50% จากเครดิตที่ขาย โดยรายได้ต่อปีส่วนใหญ่คือ markup บน inference
    • หลัง token markup ไม่มีเครือข่ายรองรับ และต้นทุน inference ของตัวเองก็ลดลงทุกไตรมาส มาร์จินจึงละลายไปเมื่อโมเดลถูกลง
    • ฟินเทคที่ยั่งยืนต้องมี lock-in ฝังอยู่ข้างใต้ เช่น การชำระเงินที่เครือข่ายช่วยพยุง หรือสินเชื่อที่อาศัยข้อมูลซึ่งธนาคารมองไม่เห็นมาประกัน

โครงสร้างพื้นฐานการชำระเงินสำหรับเอเจนต์

  • ในที่สุดโครงสร้างพื้นฐานการชำระเงินสำหรับเอเจนต์ก็เริ่มทำงาน
    • เมื่อเอเจนต์จองตั๋วเครื่องบิน สั่งอะไหล่ และจ่ายเงินให้เวนเดอร์ ก็ต้องมีบางอย่างที่อนุมัติ ขนส่ง และหักค่าธรรมเนียมจากการเรียกเก็บเงิน
    • Stripe ออกโปรโตคอลสำหรับเรื่องนี้แล้ว และ Visa กับ Mastercard ก็กำลังแข่งกันยึดมาตรฐาน
    • OpenAI หักเปอร์เซ็นต์จากทุกสิ่งที่เอเจนต์ของตัวเองซื้ออยู่แล้ว
    • ธุรกรรมของเอเจนต์ 1 ล้านล้านตัวกำลังจะกลายเป็นเศรษฐกิจการชำระเงินที่ใหญ่ที่สุดในประวัติศาสตร์

เปลี่ยนสิ่งหนึ่งให้กลายเป็นอีกสิ่งหนึ่ง

  • บริษัทแอปพลิเคชันที่ดีที่สุดและอยู่ได้นานจะไม่แยกสองฝั่งนี้ออกจากกัน
    • Judgment คือบันทึกการตัดสินใจเกี่ยวกับงาน ฟินเทคคือบันทึกการตัดสินใจเกี่ยวกับเงิน และบริษัทที่แข็งแรงจะเปลี่ยนสิ่งหนึ่งให้กลายเป็นอีกสิ่งหนึ่ง
  • Shopify คือตัวอย่างที่ดีที่สุด
    • เริ่มจากซอฟต์แวร์หน้าร้าน → ผูกกับการชำระเงิน → ต่อด้วย Shopify Capital ที่ปล่อยกู้โดยใช้ข้อมูลรายได้ที่ไหลผ่านร้านมาประกัน ซึ่งเป็นสินเชื่อที่ธนาคารทำเองไม่ได้
    • เมื่อร้านค้าเติบโต รายได้ก็เพิ่ม และข้อมูลก็ช่วยให้ปล่อยกู้ครั้งถัดไปได้ดีขึ้น
    • ตอนนี้ราวสามในสี่ของรายได้ Shopify มาจาก ฝั่งเงิน ไม่ใช่ subscription ซอฟต์แวร์
    • Stripe ใช้ลูปเดียวกันผ่าน Radar และ Ramp ก็ทำแบบเดียวกันผ่านข้อมูลรายจ่ายกับบัตร
  • Rippling ก็พยายามในทิศทางคล้ายกัน โดยมีพนักงานเป็นวัตถุหลัก
    • เงินเดือน สวัสดิการ อุปกรณ์ และบัตร ต่างพึ่งพา source of truth เดียวกัน
    • ตอนนี้ยังไม่มีใครสร้าง lock-in ได้เด็ดขาด และ Gusto กับ Deel ก็ยังโตคู่กัน แต่บริษัทที่ครอบครองวัตถุหลักจะสะสมแบบทบต้น ขณะที่รายอื่นยังต้องประกอบทุกอย่างด้วยมือ

ป้องกันการเขียน (Guard the writes)

  • มีความตึงเครียดแบบ "headless" ที่ยังไม่มีใครแก้ได้
    • ถ้าซอฟต์แวร์ทั้งหมดจะถูกใช้งานโดยเอเจนต์ เพื่อให้มีประโยชน์ก็ต้องเปิดรับเอเจนต์ แต่ถ้าอยากอยู่รอดก็ปล่อยให้มันเอาไปทั้งหมดไม่ได้
    • ทุก system of record ต้องเปิดพอให้เอเจนต์เชื่อมต่อได้ไม่ว่าจะผ่านโปรโตคอลใด และในขณะเดียวกันก็ต้องปิดพอที่จะทำให้ไม่มีใครย้ายออกได้หลังจากได้สิ่งที่ต้องการแล้ว
    • ปีนี้ Salesforce บล็อกข้อมูล Slack จาก Glean และเอเจนต์ภายนอก เป็นกรณีแรกที่ทำอย่างเปิดเผย
  • หนทางสร้างบริษัทที่ยั่งยืนคือการแยกสองส่วนนี้ออก
    • อนุญาตให้เอเจนต์ อ่าน เพราะการอ่านมีต้นทุนต่ำและสำคัญอยู่แล้ว
    • แต่ต้อง ป้องกันการเขียน
  • จุดที่ judgment ใหม่ถูกป้อนเข้าไป และที่มนุษย์กับเอเจนต์คอยอนุมัติ แก้ไข และย้อนกลับให้กัน คือส่วนที่คู่แข่งย้ายออกไปได้ยาก
    • สิ่งที่พวกเขาดึงไปได้คือสถานะของเมื่อวาน มีเพียงการตัดสินใจที่กำลังเกิดขึ้นตอนนี้เท่านั้นที่ยังเป็นของคุณ

"ถ้า Anthropic สร้างสิ่งนี้ล่ะ?"

  • อาจมีข้อโต้แย้งว่าเมื่อ Lab อยู่ใน token flow อยู่แล้ว แล้วคูเมืองอยู่ตรงไหน
    • Claude Code เห็นทุกคำสั่งที่นักพัฒนารันและทุกคำแนะนำที่ถูกเมิน ส่วน ChatGPT ก็สังเกตการตัดสินใจในหนึ่งวันได้มากกว่าที่ผลิตภัณฑ์หนึ่งเก็บได้ทั้งปี
  • คำตอบต่อข้อโต้แย้งนี้คือ สิ่งที่เครื่องมือของพวกเขาเห็นส่วนใหญ่เป็นสิ่งทั่วไป
    • เป็นการเขียนโค้ดและการเขียนข้อความแบบเดียวกันที่ทุกโมเดลเห็น และเป็นสิ่งเดียวกันกับที่ lab แข่งกันทำให้กลายเป็น commodity
    • วิจารณญาณที่หายากอยู่ลึกเข้าไปในแต่ละบริษัท — วิธีที่โรงพยาบาลอ่านสแกน วิธีที่บริษัทเรียนรู้ว่าจะ walk away จากดีลไหน ซึ่งไม่มีอย่างไหนไหลเข้าไปถึง chatbox ของ lab
  • Lab บอกองค์กรต่าง ๆ มาหลายปีแล้วว่าจะไม่ฝึกด้วยข้อมูลของพวกเขา
    • ความรู้โดยนัยที่ไหลผ่านโมเดลภายในผลิตภัณฑ์จึงยังคงเป็นขององค์กรนั้นตามสัญญา พวกเขาเห็น trace ไหลผ่าน แต่ตกลงว่าจะไม่เก็บไว้
  • ส่วนฟินเทคก็เป็นสิ่งที่ lab ไม่ได้อยากได้ด้วยซ้ำ
    • lab ยินดีเอาข้อมูล แต่ไม่ต้องการ loan book, ความเสียหายจากการทุจริต, หรือใบอนุญาต money-transmitter ใน 40 รัฐ
    • สำหรับผู้ซื้อ ข้อมูลสร้างมูลค่าที่คุ้มแก่การเข้าซื้อ และฟินเทคทำให้ดึงออกไปได้ยาก
  • Cursor สร้าง data engine ที่ดีที่สุดในหมวดหมู่ และสุดท้ายก็ถูก lab เข้าซื้อที่ราคา 6 หมื่นล้านดอลลาร์
    • นี่เป็นความฝันหรือคำเตือน จะรู้ก็ตอนที่สายเกินกว่าจะเปลี่ยนแล้ว
    • จงสร้างสองสิ่งที่จะทำให้รอด — สะสมวิจารณญาณ และ นั่งอยู่ตรงทางผ่านของเงิน นั่นคือวิธีรับมือกับคำถามว่า "ถ้า Anthropic สร้างสิ่งนี้ล่ะ?"

2 ความคิดเห็น

 
heim2 19 분 전

ฟังดูน่าเชื่ออยู่ แต่เข้าใจยากจังครับ

 
somang04 2 시간 전

การสะสมวิจารณญาณ การควบคุมกระแสเงิน และการป้องกันการเขียน (writes) คือหนทางเดียวที่จะทำให้บริษัทยังคงเป็นสิ่งที่ทดแทนไม่ได้ แม้ว่า lab จะมองเห็นทุก token ก็ตาม -> ความหมายตรงนี้ค่อนข้างคลุมเครือ ขออธิบายเพิ่มเติมได้ไหมครับ?