การตัดสินใจและเงิน: บริษัทจะอยู่รอดจากคำถาม "ถ้า Anthropic สร้างสิ่งนี้ล่ะ?" ได้อย่างไร
(writing.nikunjk.com)- ยิ่งโมเดล AI ทรงพลังขึ้น มูลค่าของซอฟต์แวร์เองก็ยิ่งลดลง และบริษัทแอปพลิเคชันที่ต้องการอยู่รอดจำเป็นต้องเปลี่ยนตัวเองให้เป็น บริษัทข้อมูลและบริษัทฟินเทค ไปพร้อมกัน
- เมื่อเอเจนต์กลายเป็นผู้ใช้หลักของซอฟต์แวร์ โมเดลราคาแบบ per-seat ก็พังทลาย พนักงานหนึ่งพันคนอาจรันเอเจนต์หนึ่งแสนตัวได้ แต่ไม่ได้นับเป็นหนึ่งแสนที่นั่ง ดังนั้นสิ่งที่ยังคิดเงินได้จึงเหลือแค่ การตัดสินใจที่เอเจนต์ทิ้งไว้ (ข้อมูล) และเงินที่มันเคลื่อนย้าย (ฟินเทค)
- Frontier model เปรียบเหมือนกลุ่มอัจฉริยะที่ไม่รู้วิธีเดินเครื่องบริษัท ดังนั้น วิจารณญาณโดยนัย (judgment) ที่คนมีอยู่จึงเป็นคูเมืองที่แท้จริง และ ประวัติการแก้ไข (corrections) ที่ผู้ใช้ใช้แก้ผลลัพธ์ของโมเดลก็ทำหน้าที่ทั้งเป็นสัญญาณการเรียนรู้และชุดทดสอบ
- ถ้าข้อมูลไม่มีเงินไหลผ่าน มันก็เป็นได้แค่โครงการวิทยาศาสตร์ ฟินเทคแบบ มีเครือข่ายและมี lock-in อย่าง Toast, Ramp, Shopify เท่านั้นที่ยังรักษามาร์จินได้แม้ราคาโมเดลจะลดลง
- การสะสมวิจารณญาณ การครองเส้นทางการไหลของเงิน และการ ป้องกันการเขียน (writes) คือทางเดียวที่จะทำให้บริษัทยังทดแทนไม่ได้ แม้ Lab จะมองเห็นทุกโทเคนก็ตาม
ความก้าวหน้าของโมเดลและมูลค่าซอฟต์แวร์ที่ลดลง
- เมื่อวาน Claude Fable 5 เปิดตัว เป็น Mythos-class model ตัวแรกที่คนทั่วไปใช้ได้ ครองอันดับ 1 แทบทุก benchmark และยิ่งงานยาว ช่องว่างก็ยิ่งกว้าง
- ยิ่งโมเดลฉลาดขึ้น มูลค่าของซอฟต์แวร์เองก็ยิ่งลดลง
- บริษัทแอปพลิเคชันที่ได้รับเงินลงทุนจาก VC ทุกแห่ง ตอนนี้ต้องเป็นบริษัทข้อมูลหรือบริษัทฟินเทค หรือในอุดมคติคือเป็นทั้งสองอย่าง
ใครเป็นผู้ใช้ซอฟต์แวร์กำลังเปลี่ยนไป
- ในบทความเมื่อ 2 ปีก่อน มีการชี้ว่าเมื่อเอเจนต์กลายเป็นผู้ใช้ โมเดลราคาแบบ per-seat จะพัง และตอนนี้ดูเหมือนว่าเราได้ข้ามเส้นนั้นมาแล้ว
- Cloudflare ประกาศว่า ทราฟฟิกจากเอเจนต์แซงทราฟฟิกจากมนุษย์เป็นครั้งแรก
- แม้ยังมีข้อถกเถียงออนไลน์ แต่แนวโน้มที่เอเจนต์จะกลายเป็นลูกค้าหลักของซอฟต์แวร์ทั้งหมดนั้นชัดเจน
- พนักงานหนึ่งพันคนรันเอเจนต์หนึ่งแสนตัว ไม่ได้แปลว่าเป็นหนึ่งแสนที่นั่ง
- สิ่งที่เอเจนต์ทิ้งไว้และคิดเงินได้มีอยู่สองอย่าง คือ การตัดสินใจ (=ข้อมูล) และ เงินที่เคลื่อนย้าย (=ฟินเทค)
การตัดสินใจ (Decisions) — คูเมืองที่ชื่อว่าข้อมูล
- xAI มีออปชันเข้าซื้อ Cursor ที่มูลค่า 6 หมื่นล้านดอลลาร์ ขณะที่ Cursor มีรายได้ต่อปีแบบ annualized ราว 4 พันล้านดอลลาร์
- แต่เหตุผลหลักที่ทำให้มันมีราคาสูง ไม่ใช่ตัวซอฟต์แวร์เอง
- Anthropic และ OpenAI เฝ้าดูงานของนักพัฒนาแบบเรียลไทม์อยู่แล้วผ่าน Claude Code และ Codex
- เหตุผลที่ xAI ซื้อ Cursor คือเพื่อเข้าไปอยู่ใน token flow ให้เร็วที่สุด
- Musk (มหาเศรษฐีล้านล้านคนแรกของโลก) กล่าวว่าบันทึกการใช้งานโมเดลจริงของนักพัฒนาหนึ่งล้านคนสามารถป้อนตรงเข้าสู่การฝึก Grok ได้ ราคาแพงนี้คือค่าผ่านทางเพื่อข้ามช่วงเวลาหลายปีของการเก็บข้อมูลแบบช้า ๆ
- หลัง Cursor เปิดตัวได้ไม่กี่สัปดาห์ ก็มีโคลนที่ใช้งานได้จริงออกมา แต่ไม่มีตัวไหนตั้งหลักได้ เพราะ Cursor ชนะด้วย taste
- มันคือการตัดสินใจเล็ก ๆ นับพันว่าอะไรควรถูกแสดงและเมื่อไรควรหายไป
- โคลนลอกได้แค่อินเทอร์เฟซ แต่ไม่อาจสืบทอดประวัติหลายปีที่นักพัฒนาคอยรับ ยกเลิก และเขียนใหม่
- ตอนนี้ Cursor ใช้ diff เหล่านั้นฝึกโมเดลของตัวเอง ทำให้ข้อมูลกลายเป็นคูเมืองชั้นแรก
- เหตุผลของมูลค่า 6 หมื่นล้านดอลลาร์: มันเหมือนการแทนที่พนักงาน 90% ด้วยทีมอัจฉริยะที่ไม่รู้อะไรเลยเกี่ยวกับวิธีที่บริษัททำงาน
- Fable 5 แก้งานซอฟต์แวร์จริงได้ 80% ทั้งที่โมเดลที่ดีที่สุดของปีก่อนยังทำได้แค่ครึ่งเดียว และเหล่าอัจฉริยะเหล่านี้ก็แยกจากกันยากและทดแทนกันได้
- มีเหตุผลเดียวที่พวกมันล้มเหลว: ไม่มีใครรู้อีกแล้วว่าคนที่ถูกแทนที่เคยรู้อะไร
ความรู้โดยนัย (tacit knowledge) และการสะสมวิจารณญาณ
- วิธีแก้ชั่วคราวคือดึงความรู้ในหัวคนออกมาแล้วส่งเป็นคอนเท็กซ์ให้โมเดล แต่ความรู้ส่วนใหญ่มักไม่ได้อยู่ในรูปแบบที่มีโครงสร้าง
- ดีลที่ปล่อยผ่านไป โค้ดบรรทัดเดียวที่ถูก revert ตอนตี 2 ลูกค้าที่ไม่มีใครตามต่อและไม่มีใครบันทึกเหตุผล — นี่ต่างหากคือแก่นจริง
- มันคือวิจารณญาณที่เขียนเป็น workflow ไม่ได้ และตอนนี้ยังไม่ได้ถูกเก็บไว้
- ตอนนี้เรากำลังขยับจาก context → harness → judgment
- Context คือ retrieval หรือการวางชิ้นส่วนที่ถูกต้องไว้ตรงหน้าโมเดล
- Harness คือ loop หรือ scaffolding ที่ทำให้โมเดลวิ่งงานได้
- Judgment คือชั้นสุดท้าย และเป็นชั้นเดียวที่สะสมแบบทบต้นได้ เป็นสิ่งที่การเรียกใช้ การแก้ไข และการย้อนกลับทั้งหมดทิ้งไว้บนข้อมูล
- ทุก AI application pitch ที่เห็นตอนนี้มักยก สไลด์เรื่อง context ขึ้นมาเป็นคูเมือง แต่ตอนนี้มันเป็นแค่ table stakes แล้ว
- เพราะคู่แข่งทุกเจ้ากำลังประกอบคอนเท็กซ์ด้วยวิธีเดียวกัน
สองบทบาทของประวัติการแก้ไข (corrections)
- เรามองการแก้ไขเป็น scorecard ได้ ทุกครั้งที่ผู้ใช้แก้ผลลัพธ์ของโมเดล มันคือการบันทึกว่าอะไรคือสิ่งที่ถูกต้องในธุรกิจนั้น
- Scorecard ทำสองหน้าที่พร้อมกัน
- เป็น สัญญาณการเรียนรู้ สำหรับปรับแต่งโมเดลที่ยืมมาให้เข้ากับธุรกิจนั้น
- เป็น ชุดทดสอบ ซึ่งเป็นหนทางเดียวที่จะรู้ว่าเอเจนต์ดีขึ้นจริงหรือไม่ เพราะ benchmark สาธารณะวัด workflow เฉพาะทางเหล่านี้ไม่ได้
- ไม่จำเป็นต้อง pretrain โมเดลเองตั้งแต่ต้น แม้แต่ Cursor ก็ไม่ได้ทำ
- โมเดลภายในของ Cursor วางอยู่บน open-source base และ diff เป็นตัวสร้างความแตกต่าง
- ตอนนี้ค่าใช้จ่ายของ fine-tuning และ RL บน frontier model ถูกลงมากพอที่บริษัทระดับ Series B ก็รันลูปนี้ได้แล้ว ทั้งที่เมื่อ 2 ปีก่อนต้องเป็นงานของ lab เท่านั้น
- Sarah Guo เรียกพื้นที่นี้ว่า the untrainable (งานที่คนภายนอกให้คะแนนคำตอบถูกผิดไม่ได้) และการแก้ไขก็คือวิธีที่จะครอบครองมัน
กรณีศึกษาของผู้นำ Vertical AI
- Harvey มีมูลค่า 1.1 หมื่นล้านดอลลาร์ และ Legora ทะลุ 5 พันล้านดอลลาร์ ทั้งคู่เจาะตลาดกฎหมาย
- พวกเขาไม่ได้หยุดแค่การเป็นเครื่องมือเดี่ยว แต่กำลังวิ่งไปสู่การครอบครอง matter ทั้งคดี/ทั้งงาน เพราะการแก้ไขที่ทนายทำกับร่างเอกสารคือ corrections ที่ไม่มีใครอื่นมองเห็น
- Rogo ใช้กลยุทธ์เดียวกันในวงการการเงิน โดยจับกระบวนการที่นักวิเคราะห์สร้างโมเดลและแก้โน้ต
- ไม่มีใครในกลุ่มนี้ฝึก foundation model เอง พวกเขาสร้าง harness รอบโมเดลที่ยืมมา และถือครอง judgment ที่ไหลผ่านภายใน ซึ่งเป็นสิ่งที่สะสมแบบทบต้น
- เจ้าเก่าที่แข็งแกร่งก็เช่นกัน
- Figma ไม่ได้ครอบครองแค่ SVG แต่ครอบครองประวัติที่ดีไซน์เดินจาก v1 ไป v47 รวมถึงทุกเวอร์ชันที่ถูกทิ้งระหว่างทาง — บันทึกการให้คะแนนของ design taste
- Linear ครอบครองข้อถกเถียงทั้งหมดใต้ ticket ที่ปิดไปแล้วทุกใบ
- Notion ครอบครองรูปทรงของความคิดในทีมตลอดการแก้ไขนับพันครั้ง
- ต่อให้คู่แข่งพยายามแย่งลูกค้าไป สิ่งเหล่านี้ก็ export ออกไปไม่ได้ และไม่มีคำตอบอยู่ในโมเดลทั่วไป
กระแสที่ Lab กำลังซื้อวิจารณญาณ
- ตอนนี้ Lab กำลังซื้อวิจารณญาณแบบสำเร็จรูป โดยเริ่มจากข้อมูลที่มนุษย์ช่วยติดป้ายกำกับ
- Mercor มีมูลค่า 1 หมื่นล้านดอลลาร์ และจ่ายให้เครือข่ายผู้เชี่ยวชาญชั่วโมงละ 85 ดอลลาร์
- Meta จ่าย 1.4 หมื่นล้านดอลลาร์ให้ Scale เพื่อครอบครอง pipeline นี้
- สตาร์ตอัปแห่งหนึ่งในนิวยอร์กทำความสะอาดอพาร์ตเมนต์ ฟรี ถ้าคุณยอมให้ถ่ายวิดีโอกระบวนการทั้งหมด เพราะทีม robotics ต้องเห็นว่ามนุษย์ตัดสินใจเลือกการกระทำถัดไปอย่างไร
- มีหลายบริษัท RL environment ที่ขายวิจารณญาณสำหรับงานระยะยาว และมีรายได้ต่อปีแบบ annualized แตะหลายร้อยล้านดอลลาร์
- Lab ฝึกจากทั้งอินเทอร์เน็ตมาจนหมดทางแล้ว และตอนนี้กำลังซื้อการตัดสินใจโดยตรง
เงิน (Dollars) — คูเมืองที่ชื่อว่าฟินเทค
- 23andMe ถือครอง DNA ของคน 15 ล้านคน แต่ก็ล้มละลายในปีที่แล้ว
- ถ้าข้อมูลไม่มีเงินไหลผ่าน มันก็เป็นได้แค่การรอทุนให้โครงการวิทยาศาสตร์
- ผู้ก่อตั้งส่วนใหญ่มักพลาดครึ่งนี้
- Toast เข้าใจเรื่องนี้มาหลายปีแล้ว ร้านอาหารโดยเนื้อแท้คือเครื่องประมวลผลการชำระเงินที่มีครัวติดมาด้วย
- การชำระเงินสร้างรายได้มากกว่าซอฟต์แวร์มาก
- Ramp ไปไกลกว่านั้น ด้วยบัตรองค์กรฟรีที่ไม่เก็บค่าธรรมเนียมจากที่ไหนเลย แต่ทุกครั้งที่มีเงินไหลผ่าน 1 ดอลลาร์ ก็หักไว้ 1–2 เซนต์
- บริษัทมูลค่า 3.2 หมื่นล้านดอลลาร์ที่สร้างจากเศษสตางค์จากการปัดเศษ บัตรฟรีคือประตูหน้าสู่ interchange
- swipe fee อยู่ได้เพราะมีเครือข่ายค้ำอยู่ และระหว่างที่เงินพักอยู่ก็ยังสร้างรายได้จาก float
- แต่ไม่ใช่ทุกมาตรวัดเงินจะเป็นคูเมือง
- แอป vibe-coding ยอดนิยมรายหนึ่งมีมาร์จินราว 50% จากเครดิตที่ขาย โดยรายได้ต่อปีส่วนใหญ่คือ markup บน inference
- หลัง token markup ไม่มีเครือข่ายรองรับ และต้นทุน inference ของตัวเองก็ลดลงทุกไตรมาส มาร์จินจึงละลายไปเมื่อโมเดลถูกลง
- ฟินเทคที่ยั่งยืนต้องมี lock-in ฝังอยู่ข้างใต้ เช่น การชำระเงินที่เครือข่ายช่วยพยุง หรือสินเชื่อที่อาศัยข้อมูลซึ่งธนาคารมองไม่เห็นมาประกัน
โครงสร้างพื้นฐานการชำระเงินสำหรับเอเจนต์
- ในที่สุดโครงสร้างพื้นฐานการชำระเงินสำหรับเอเจนต์ก็เริ่มทำงาน
- เมื่อเอเจนต์จองตั๋วเครื่องบิน สั่งอะไหล่ และจ่ายเงินให้เวนเดอร์ ก็ต้องมีบางอย่างที่อนุมัติ ขนส่ง และหักค่าธรรมเนียมจากการเรียกเก็บเงิน
- Stripe ออกโปรโตคอลสำหรับเรื่องนี้แล้ว และ Visa กับ Mastercard ก็กำลังแข่งกันยึดมาตรฐาน
- OpenAI หักเปอร์เซ็นต์จากทุกสิ่งที่เอเจนต์ของตัวเองซื้ออยู่แล้ว
- ธุรกรรมของเอเจนต์ 1 ล้านล้านตัวกำลังจะกลายเป็นเศรษฐกิจการชำระเงินที่ใหญ่ที่สุดในประวัติศาสตร์
เปลี่ยนสิ่งหนึ่งให้กลายเป็นอีกสิ่งหนึ่ง
- บริษัทแอปพลิเคชันที่ดีที่สุดและอยู่ได้นานจะไม่แยกสองฝั่งนี้ออกจากกัน
- Judgment คือบันทึกการตัดสินใจเกี่ยวกับงาน ฟินเทคคือบันทึกการตัดสินใจเกี่ยวกับเงิน และบริษัทที่แข็งแรงจะเปลี่ยนสิ่งหนึ่งให้กลายเป็นอีกสิ่งหนึ่ง
- Shopify คือตัวอย่างที่ดีที่สุด
- เริ่มจากซอฟต์แวร์หน้าร้าน → ผูกกับการชำระเงิน → ต่อด้วย Shopify Capital ที่ปล่อยกู้โดยใช้ข้อมูลรายได้ที่ไหลผ่านร้านมาประกัน ซึ่งเป็นสินเชื่อที่ธนาคารทำเองไม่ได้
- เมื่อร้านค้าเติบโต รายได้ก็เพิ่ม และข้อมูลก็ช่วยให้ปล่อยกู้ครั้งถัดไปได้ดีขึ้น
- ตอนนี้ราวสามในสี่ของรายได้ Shopify มาจาก ฝั่งเงิน ไม่ใช่ subscription ซอฟต์แวร์
- Stripe ใช้ลูปเดียวกันผ่าน Radar และ Ramp ก็ทำแบบเดียวกันผ่านข้อมูลรายจ่ายกับบัตร
- Rippling ก็พยายามในทิศทางคล้ายกัน โดยมีพนักงานเป็นวัตถุหลัก
- เงินเดือน สวัสดิการ อุปกรณ์ และบัตร ต่างพึ่งพา source of truth เดียวกัน
- ตอนนี้ยังไม่มีใครสร้าง lock-in ได้เด็ดขาด และ Gusto กับ Deel ก็ยังโตคู่กัน แต่บริษัทที่ครอบครองวัตถุหลักจะสะสมแบบทบต้น ขณะที่รายอื่นยังต้องประกอบทุกอย่างด้วยมือ
ป้องกันการเขียน (Guard the writes)
- มีความตึงเครียดแบบ "headless" ที่ยังไม่มีใครแก้ได้
- ถ้าซอฟต์แวร์ทั้งหมดจะถูกใช้งานโดยเอเจนต์ เพื่อให้มีประโยชน์ก็ต้องเปิดรับเอเจนต์ แต่ถ้าอยากอยู่รอดก็ปล่อยให้มันเอาไปทั้งหมดไม่ได้
- ทุก system of record ต้องเปิดพอให้เอเจนต์เชื่อมต่อได้ไม่ว่าจะผ่านโปรโตคอลใด และในขณะเดียวกันก็ต้องปิดพอที่จะทำให้ไม่มีใครย้ายออกได้หลังจากได้สิ่งที่ต้องการแล้ว
- ปีนี้ Salesforce บล็อกข้อมูล Slack จาก Glean และเอเจนต์ภายนอก เป็นกรณีแรกที่ทำอย่างเปิดเผย
- หนทางสร้างบริษัทที่ยั่งยืนคือการแยกสองส่วนนี้ออก
- อนุญาตให้เอเจนต์ อ่าน เพราะการอ่านมีต้นทุนต่ำและสำคัญอยู่แล้ว
- แต่ต้อง ป้องกันการเขียน
- จุดที่ judgment ใหม่ถูกป้อนเข้าไป และที่มนุษย์กับเอเจนต์คอยอนุมัติ แก้ไข และย้อนกลับให้กัน คือส่วนที่คู่แข่งย้ายออกไปได้ยาก
- สิ่งที่พวกเขาดึงไปได้คือสถานะของเมื่อวาน มีเพียงการตัดสินใจที่กำลังเกิดขึ้นตอนนี้เท่านั้นที่ยังเป็นของคุณ
"ถ้า Anthropic สร้างสิ่งนี้ล่ะ?"
- อาจมีข้อโต้แย้งว่าเมื่อ Lab อยู่ใน token flow อยู่แล้ว แล้วคูเมืองอยู่ตรงไหน
- Claude Code เห็นทุกคำสั่งที่นักพัฒนารันและทุกคำแนะนำที่ถูกเมิน ส่วน ChatGPT ก็สังเกตการตัดสินใจในหนึ่งวันได้มากกว่าที่ผลิตภัณฑ์หนึ่งเก็บได้ทั้งปี
- คำตอบต่อข้อโต้แย้งนี้คือ สิ่งที่เครื่องมือของพวกเขาเห็นส่วนใหญ่เป็นสิ่งทั่วไป
- เป็นการเขียนโค้ดและการเขียนข้อความแบบเดียวกันที่ทุกโมเดลเห็น และเป็นสิ่งเดียวกันกับที่ lab แข่งกันทำให้กลายเป็น commodity
- วิจารณญาณที่หายากอยู่ลึกเข้าไปในแต่ละบริษัท — วิธีที่โรงพยาบาลอ่านสแกน วิธีที่บริษัทเรียนรู้ว่าจะ walk away จากดีลไหน ซึ่งไม่มีอย่างไหนไหลเข้าไปถึง chatbox ของ lab
- Lab บอกองค์กรต่าง ๆ มาหลายปีแล้วว่าจะไม่ฝึกด้วยข้อมูลของพวกเขา
- ความรู้โดยนัยที่ไหลผ่านโมเดลภายในผลิตภัณฑ์จึงยังคงเป็นขององค์กรนั้นตามสัญญา พวกเขาเห็น trace ไหลผ่าน แต่ตกลงว่าจะไม่เก็บไว้
- ส่วนฟินเทคก็เป็นสิ่งที่ lab ไม่ได้อยากได้ด้วยซ้ำ
- lab ยินดีเอาข้อมูล แต่ไม่ต้องการ loan book, ความเสียหายจากการทุจริต, หรือใบอนุญาต money-transmitter ใน 40 รัฐ
- สำหรับผู้ซื้อ ข้อมูลสร้างมูลค่าที่คุ้มแก่การเข้าซื้อ และฟินเทคทำให้ดึงออกไปได้ยาก
- Cursor สร้าง data engine ที่ดีที่สุดในหมวดหมู่ และสุดท้ายก็ถูก lab เข้าซื้อที่ราคา 6 หมื่นล้านดอลลาร์
- นี่เป็นความฝันหรือคำเตือน จะรู้ก็ตอนที่สายเกินกว่าจะเปลี่ยนแล้ว
- จงสร้างสองสิ่งที่จะทำให้รอด — สะสมวิจารณญาณ และ นั่งอยู่ตรงทางผ่านของเงิน นั่นคือวิธีรับมือกับคำถามว่า "ถ้า Anthropic สร้างสิ่งนี้ล่ะ?"
2 ความคิดเห็น
ฟังดูน่าเชื่ออยู่ แต่เข้าใจยากจังครับ
การสะสมวิจารณญาณ การควบคุมกระแสเงิน และการป้องกันการเขียน (writes) คือหนทางเดียวที่จะทำให้บริษัทยังคงเป็นสิ่งที่ทดแทนไม่ได้ แม้ว่า lab จะมองเห็นทุก token ก็ตาม -> ความหมายตรงนี้ค่อนข้างคลุมเครือ ขออธิบายเพิ่มเติมได้ไหมครับ?