- หลังการเปิดตัว ChatGPT ในเดือนพฤศจิกายน 2022 สตาร์ทอัพ AI ได้รับความสนใจอย่างมากจากนักลงทุน โดยในไตรมาส 2 ปี 2024 เงินทุนร่วมลงทุนทั้งหมด 49% ถูกลงทุนในสตาร์ทอัพด้าน AI และแมชชีนเลิร์นนิง
- แม้ผู้ให้บริการโมเดลอย่าง OpenAI และบริษัท AI-native อย่าง Perplexity หรือ Jasper จะได้รับความสนใจ แต่ในความเป็นจริง จำนวนบริษัท "ที่ไม่ใช่ AI" ซึ่งได้รับผลกระทบจาก AI มีมากกว่า
- เราเรียกผลกระทบของ AI ต่อบริษัทที่ไม่ใช่ AI เหล่านี้ว่า "หางยาวของ AI" และหางยาวนี้สามารถแบ่งออกได้เป็น 4 หมวดหมู่ตามวิธีที่บริษัทผสาน AI เข้าด้วยกัน:
- สร้างโมเดลอย่างอิสระ
- ใช้โมเดลที่มีอยู่แล้ว เช่น GPT-4 ของ OpenAI
- พัฒนาบนพื้นฐานของโมเดลโอเพนซอร์ส เช่น Llama ของ Meta
- ใช้เครื่องมือ AI ที่พัฒนาไว้ล่วงหน้า เช่น ChatGPT
- การสร้างโมเดลที่เป็นอิสระและเป็นกรรมสิทธิ์เองเป็นวิธีใช้ AI ที่ใช้ทรัพยากรมากที่สุด และโดยทั่วไปเหมาะกับบริษัทที่มีแหล่งข้อมูลเฉพาะขนาดใหญ่ รวมถึงมีทรัพยากรบุคคลและการเงินเพียงพอสำหรับการฝึกโมเดลใหม่
- โมเดลแบบปิดซอร์สอย่าง GPT ของ OpenAI หรือ Claude ของ Anthropic ได้รับการฝึกด้วยพารามิเตอร์ตั้งแต่หลายพันล้านถึงหลายล้านล้านตัว และสามารถสร้างผลลัพธ์ที่แม่นยำและละเอียดในหลากหลายสาขา ตั้งแต่การเขียนโค้ดไปจนถึงการบริการลูกค้า ทั้งยังเข้าถึงได้ง่ายผ่าน API
- โมเดลโอเพนซอร์สอย่าง Mistral หรือ Llama ของ Meta เป็นเครื่องมือที่ทรงพลัง โดย Llama 3.1 ได้รับการฝึกด้วยพารามิเตอร์ 405 พันล้านตัว แตกต่างจากโมเดลแบบปิดซอร์ส โมเดลโอเพนซอร์สมอบทั้งความโปร่งใสและความยืดหยุ่น และสามารถปรับน้ำหนักโมเดลให้เข้ากับความต้องการเฉพาะของลูกค้าได้
- เครื่องมือ AI ของบุคคลที่สามอย่าง ChatGPT เป็นรูปแบบที่ผสานรวมได้ง่ายที่สุด ลูกค้าสามารถใช้เครื่องมือสำเร็จรูปได้โดยไม่ต้องสร้างหรือปรับแต่งโมเดลภายในองค์กรเอง
- แม้กลยุทธ์ AI จะแตกต่างกันไปในแต่ละบริษัท แต่บริษัทที่ประสบความสำเร็จต่างใช้ AI เพื่อเสริมธุรกิจเดิม เลียนแบบกรณีความสำเร็จในอุตสาหกรรมเดียวกัน และรักษาความยืดหยุ่นไว้เมื่อเทคโนโลยี AI พัฒนาไป
กฎกำลังของกระแส Hype ใน AI
- การกระจายแบบปกติ vs. กฎกำลัง: การกระจายแบบปกติเป็นรูปแบบการกระจายที่พบได้ทั่วไปในชีวิตประจำวัน เช่น IQ คะแนนสอบ และความดันโลหิต ซึ่งข้อมูลจะกระจุกตัวอยู่รอบค่าเฉลี่ย ในทางกลับกัน ปรากฏการณ์จำนวนมากในโลกถูกกำหนดโดยกฎกำลัง ซึ่งกรณีสุดขั้วเพียงไม่กี่กรณีเป็นตัวตัดสินผลลัพธ์ส่วนใหญ่
- ตัวอย่างเช่น มากกว่าครึ่งหนึ่งของอัตราการเพิ่มขึ้นของดัชนี S&P 500 ในปี 2023 มาจากหุ้นเพียง 7 ตัว ซึ่งคิดเป็นแค่ 1.4% เท่านั้น
- ในวงการเวนเจอร์แคปิทัลก็เช่นกัน การลงทุนที่ประสบความสำเร็จเพียงไม่กี่รายการสร้างผลตอบแทนส่วนใหญ่ของกองทุน ตัวอย่างเช่น Fred Wilson ผู้ก่อตั้ง Union Square Ventures กล่าวไว้ว่า "การลงทุนเพียงครั้งเดียวสามารถสร้างผลตอบแทนให้ทั้งกองทุนได้"
- กฎกำลังในวงการ AI: เช่นเดียวกับที่เงินทุนเคยไหลเข้าสู่บริษัทอินเทอร์เน็ตในยุคฟองสบู่ดอตคอม ปี 2024 ก็เห็นกระแส hype คล้ายกันในวงการ AI
- ในกลุ่มรุ่นฤดูร้อนปี 2024 ของ YCombinator มีถึง 75% ที่กำลังพัฒนาผลิตภัณฑ์เกี่ยวกับ AI
- ในบรรดาการลงทุนของเวนเจอร์แคปิทัลในไตรมาส 2 ปี 2024 มี 49% ที่กระจุกอยู่ในสตาร์ทอัพด้าน AI และแมชชีนเลิร์นนิง (เทียบกับ 29% ในไตรมาส 2 ปี 2022)
- มูลค่าประเมินมัธยฐานของบริษัท AI, SaaS และฟินเทคระยะเริ่มต้นในปี 2020 อยู่ที่ $25M, $27M และ $28M ตามลำดับ แต่ในปี 2024 เพิ่มขึ้นเป็น $70M, $46M และ $50M
- แม้ OpenAI จะขาดทุน แต่ก็ระดมทุนใหม่ได้ที่มูลค่า $157B ในเดือนตุลาคม 2024 (คิดเป็นมูลค่า 39 เท่าของรายได้)
- ข้อจำกัดของสตาร์ทอัพ AI-native: การมาถึงของ generative AI และ LLM ทำให้ AI กลายเป็นผลิตภัณฑ์หลักขององค์กร อย่างไรก็ตาม ในขณะที่บริษัท AI-native ครองความสนใจจากนักลงทุน บริษัทที่ไม่ใช่ AI ก็ได้รับผลกระทบจากความก้าวหน้าทางเทคโนโลยี AI เช่นกัน ธุรกิจส่วนใหญ่โดยเนื้อแท้แล้วไม่ใช่บริษัท AI แต่ความก้าวหน้าของ AI จะส่งผลอย่างมากต่อโมเดลธุรกิจของพวกเขา
- จากหางยาวของอินเทอร์เน็ตสู่หางยาวของ AI: หลังฟองสบู่ดอตคอม บริษัทที่ไม่ใช่อินเทอร์เน็ตแต่ปรับตัวตามเทรนด์อินเทอร์เน็ตได้ประสบความสำเร็จอย่างมาก ตัวอย่างเช่น Walmart ก่อตั้งในปี 1962 แต่มีรายได้อีคอมเมิร์ซแตะ $73B ในปี 2023 และเติบโต 5 เท่า เมื่อเทียบกับปี 2017
- ปัจจุบัน "หางยาวของ AI" กำลังเกิดขึ้น ซึ่งครอบคลุมบริษัทที่ไม่ใช่ AI ในหลายอุตสาหกรรม เช่น ฟินเทค SaaS เฮลท์แคร์ อีคอมเมิร์ซ และโลจิสติกส์
- ผลกระทบในวงกว้างของ AI: ตั้งแต่การใช้เครื่องมือ AI ที่สร้างไว้ล่วงหน้า ไปจนถึงการผสาน AI เข้ากับเวิร์กโฟลว์ภายใน บริษัทในหลากหลายอุตสาหกรรมกำลังใช้หรือพยายามใช้ AI เช่นเดียวกับที่อินเทอร์เน็ตส่งผลต่อบริษัทที่ไม่ใช่อินเทอร์เน็ต AI ก็จะสร้างผลกระทบในวงกว้างที่ไม่ได้จำกัดอยู่แค่บริษัทที่สร้างโมเดล AI เท่านั้น
นิยามของหางยาวของ AI
- บริษัท AI ครองความสนใจและการลงทุนส่วนใหญ่ที่เกี่ยวข้องกับ AI และสามารถแบ่งออกได้เป็น 2 ประเภท:
- บริษัทโมเดล: บริษัทอย่าง OpenAI, Anthropic และ Mistral ที่พัฒนาและให้บริการ LLM (large language model) แบบกรรมสิทธิ์หรือโอเพนซอร์สแก่ผู้ใช้
- บริษัท AI-native: บริษัทอย่าง Perplexity และ Jasper ที่นำเสนอผลิตภัณฑ์และบริการโดยอิงจากโมเดล AI
- ในประเภทแรก โมเดลเองคือผลิตภัณฑ์ ส่วนในประเภทที่สอง แม้โมเดล AI จะเป็นแกนกลางของฟังก์ชันการทำงาน แต่หากไม่มีโมเดล บริษัทนั้นก็ไม่อาจมีอยู่ได้ ตัวอย่างเช่น Tuhin Srivastava ซีอีโอของ Baseten อธิบายว่า "หากไม่มีโมเดล บริษัท AI-native ก็ไม่มีทางมีอยู่ได้"
- อย่างไรก็ตาม บริษัทส่วนใหญ่ เช่น Bloomberg, Walmart และ Canva ไม่ได้อยู่ในสองหมวดนี้ พวกเขาอยู่ในหมวดที่กว้างกว่านั้นซึ่งเรียกว่า "หางยาวของ AI"
- คำถามสำคัญของหางยาว
- ความก้าวหน้าของเทคโนโลยี AI จะส่งผลต่อโมเดลธุรกิจที่มีอยู่ก่อนการเปิดตัว ChatGPT อย่างไร?
- พนักงานในหลากหลายอุตสาหกรรม ตั้งแต่นักวิเคราะห์ของบริษัทที่ปรึกษาไปจนถึงวิศวกรซอฟต์แวร์ของบริษัทเทคโนโลยี กำลังใช้ AI อย่างไร และจะใช้อย่างไรในอนาคต?
- บริษัทต่าง ๆ กำลังวางตำแหน่งตัวเองในตลาด AI อย่างไร? พวกเขากำลังสร้างโมเดลของตนเอง หรือกำลังใช้เครื่องมือที่พัฒนาจากภายนอก?
- ตัวอย่างการใช้ AI ของบริษัทต่าง ๆ
- ตัวอย่างเช่น Ramp (แพลตฟอร์มบริหารค่าใช้จ่าย) และ Atlassian (บริษัท SaaS จากออสเตรเลีย) ได้เพิ่ม generative AI ลงบนข้อมูลและเวิร์กโฟลว์ที่มีอยู่เดิม
- Klarna (บริษัทฟินเทคจากสวีเดน) ลงทุนใน AI เพื่อปรับปรุงประสิทธิภาพการดำเนินงานภายใน และแชตบอต AI ของบริษัทก็แสดงผลลัพธ์ได้มากพอจะทดแทนพนักงานบริการลูกค้าเต็มเวลา 700 คน
- PwC ลงนามข้อตกลงในเดือนพฤษภาคม 2024 เพื่อมอบความสามารถของ ChatGPT Enterprise ให้กับพนักงาน 100,000 คน นอกจากนี้ ในแบบสำรวจของหอการค้าสหรัฐฯ ปี 2024 ยังมีธุรกิจขนาดเล็กและขนาดกลาง 98% ที่ตอบว่ากำลังใช้เครื่องมือ AI
- การเปรียบเทียบอดีตกับปัจจุบัน
- เช่นเดียวกับหลังบูมอินเทอร์เน็ตที่บริษัทไม่ใช่อินเทอร์เน็ตจำนวนมากประสบความสำเร็จจากการนำอีคอมเมิร์ซมาใช้ "หางยาวของ AI" ก็จะทำให้บริษัทที่ไม่ใช่ AI ในหลากหลายอุตสาหกรรมได้รับผลกระทบจาก AI
- เช่นเดียวกับที่อินเทอร์เน็ตส่งผลอย่างกว้างขวางต่อบริษัทที่ไม่ใช่อินเทอร์เน็ต AI ก็จะไม่จำกัดผลกระทบอยู่แค่บริษัทที่สร้างโมเดล AI แต่จะส่งผลต่อเศรษฐกิจในวงกว้างมากกว่า
- 4 ชั้นของหางยาว AI
- การสร้างโมเดล AI ภายในแบบอิสระ: บริษัทที่สร้างโมเดล AI ของตนเองโดยใช้ชุดข้อมูลที่เป็นกรรมสิทธิ์
- การใช้โมเดลแบบปิดซอร์ส: บริษัทที่ใช้โมเดลแบบปิดซอร์สจาก OpenAI, Anthropic และอื่น ๆ
- การใช้โมเดลโอเพนซอร์ส: บริษัทที่ใช้โมเดลจาก Llama, Mistral และ Hugging Face
- การผสานรวมเครื่องมือ AI ที่สร้างไว้ล่วงหน้า: บริษัทที่นำเครื่องมือ AI ที่พัฒนาเสร็จแล้วมาผสานเข้ากับเวิร์กโฟลว์
- ทั้ง 4 ชั้นนี้ไม่ได้ตายตัว และบริษัทที่ใช้ AI ในหลายรูปแบบอาจถูกจัดอยู่ได้มากกว่าหนึ่งชั้น วิธีที่บริษัทใช้ AI ก็กำลังเปลี่ยนแปลงอย่างต่อเนื่องตามการพัฒนาอย่างรวดเร็วของเทคโนโลยี AI
เลเยอร์ 1: การสร้างโมเดลของตนเอง
- กลยุทธ์ที่ใช้ทรัพยากรมากที่สุด: กลยุทธ์ที่มีต้นทุนสูงที่สุดในหางยาวของ AI คือการสร้างโมเดลอิสระขึ้นมาตั้งแต่ต้น บริษัทที่เหมาะกับกลยุทธ์นี้คือบริษัทที่ (1) มีเงินทุนมาก และ (2) มีชุดข้อมูลเฉพาะที่มีคุณค่าในครอบครอง
- ตัวอย่าง: ตามคำกล่าวของ Sam Altman ต้นทุนในการฝึก GPT-4 อยู่ที่ $100M
- แม้การมีโมเดลของตนเองจะมีต้นทุนสูง แต่สำหรับบริษัทที่มีชุดข้อมูลเฉพาะ จะให้ประโยชน์คือ (A) ผลลัพธ์ที่ละเอียดและปรับให้เหมาะกับบริษัทมากกว่า (B) การควบคุมโมเดลและค่าน้ำหนักได้อย่างสมบูรณ์ และ (C) ความเป็นไปได้ในการลดต้นทุนเมื่อเทียบกับโมเดลแบบปิดซอร์ส
- Bloomberg
- Bloomberg เป็นบริษัทข้อมูลการเงินและสื่อที่มีสำนักงานใหญ่ในนิวยอร์ก และมีรายได้ต่อปีมากกว่า $12B โดยผลิตภัณฑ์หลักของบริษัทคือ Bloomberg Terminal ซึ่งคิดเป็นประมาณ 2/3 ของรายได้ทั้งหมด
- Bloomberg มีวิศวกรมากกว่า 8,000 คน โดยมีมากกว่า 350 คน อยู่ในทีมวิศวกรรม AI และเผยแพร่งานวิจัยด้าน AI หลายฉบับในแต่ละปี
- ในเดือนมีนาคม 2023 Bloomberg ได้เปิดตัว BloombergGPT ซึ่งเป็น LLM เฉพาะทางด้านการเงิน โมเดลนี้มีพารามิเตอร์รวม 50B และได้รับการฝึกด้วยการผสานชุดข้อมูลสาธารณะ 345B รายการเข้ากับชุดข้อมูลเอกสารการเงิน 363B รายการที่สะสมมาตลอด 40 ปี
- ต้นทุนการฝึกถูกประเมินว่าอยู่ระหว่าง $2.7M ถึงมากกว่า $10M
- ในเดือนมกราคม 2024 Bloomberg ได้นำฟีเจอร์สรุปเนื้อหาที่สร้างโดย AI ซึ่งคาดว่าใช้โมเดลภายในบริษัท มาใส่ใน Terminal โดยมีการฝึกด้วยความช่วยเหลือจากนักวิเคราะห์ภายใน
- Replit
- Replit คือ IDE บนเว็บที่ให้ความสามารถด้านการทำงานร่วมกัน การเติมโค้ดอัตโนมัติ และการดีบัก
- ฟีเจอร์ AI ของ Replit ให้บริการผ่านการผสมผสานระหว่างโมเดลที่พัฒนาขึ้นเอง การ fine-tune โมเดลโอเพนซอร์ส และโมเดลปิดซอร์สจาก OpenAI และ Anthropic
- ในเดือนเมษายนและตุลาคม 2023 Replit ได้เปิดตัวโมเดลเติมโค้ดของตนเอง และเผยแพร่บน Hugging Face
- ในเดือนเมษายน 2024 ได้เปิดตัวฟีเจอร์ดีบักอัตโนมัติด้วยการ fine-tune โมเดลโอเพนซอร์ส
- ในเดือนกันยายน 2024 ได้เปิดตัวผู้ช่วย pair programmer อัตโนมัติที่อิงกับ โมเดล 7B พารามิเตอร์ ของตนเอง แต่ผู้ใช้บางส่วนแสดงความไม่พอใจกับความสามารถช่วงแรก
- Canva
- Canva เป็นแพลตฟอร์มออกแบบบนเว็บจากออสเตรเลีย ซึ่งได้รับการประเมินมูลค่า $49B ในเดือนตุลาคม 2024
- ในเดือนตุลาคม 2023 Canva เปิดตัวสตูดิโอออกแบบ Generative AI ชื่อ Magic Studio โดยสตูดิโอนี้สร้าง “โมเดลเฉพาะ” จากคอนเทนต์ที่ผู้ใช้สร้างขึ้นเพื่อนำมาเป็นข้อมูลฝึก
- ข้อมูลผู้ใช้จะไม่ถูกนำไปใช้โดยไม่ได้รับอนุญาต และผู้ใช้ที่เข้าร่วมจะได้รับค่าตอบแทน
- ในเดือนกรกฎาคม 2024 Canva เข้าซื้อแพลตฟอร์มสร้างภาพ Leonardo.Ai และมีแผนจะรวมเข้ากับ Magic Studio
- Walmart
- Walmart สร้างเครื่องมือ AI ที่ลูกค้าใช้งานโดยตรงมาตั้งแต่ปี 2018 และในเดือนมิถุนายน 2024 ได้เปลี่ยนไปใช้โมเดลของตนเองในฟีเจอร์ Generative AI ทั้งหมด
- ในเดือนตุลาคม 2024 Walmart ได้เปิดตัว LLM เฉพาะทางค้าปลีกชื่อ Wallaby โมเดลนี้ได้รับการฝึกด้วยข้อมูลของ Walmart เพื่อสร้างคำตอบที่เป็นธรรมชาติซึ่งเกี่ยวข้องกับการบริการลูกค้า
- Walmart ใช้ AI เพื่อปรับปรุงแชตบอตสนับสนุนลูกค้า การจัดระเบียบแค็ตตาล็อกสินค้า และประสบการณ์ช้อปปิ้งแบบ Augmented Reality นอกจากนี้ยังมอบประสบการณ์ช้อปปิ้งเสมือนจริงบนแพลตฟอร์มออนไลน์อย่าง Roblox อีกด้วย
- Walmart ชื่นชอบการใช้โมเดลของตนเอง แต่ยังมีแผนจะใช้โมเดลของบริษัทอื่นต่อไปตามกรณีการใช้งานเฉพาะ
เลเยอร์ 2: การใช้โมเดลปิดซอร์สที่มีอยู่แล้ว
- แทนที่จะสร้างโมเดลขึ้นมาเอง บริษัทต่าง ๆ สามารถเข้าถึง โมเดล AI แบบปิดซอร์ส ของ OpenAI, Anthropic และรายอื่นผ่าน API เพื่อนำไปสร้างโซลูชันของตนเองได้
- โมเดลปิดซอร์ส สามารถให้ผลลัพธ์ที่แม่นยำในหลากหลายสาขา จึงมีประโยชน์สำหรับงานทั่วไป เช่น การถอดเสียง การบริการลูกค้า และการดึงข้อมูล
- โมเดล GPT ของ OpenAI และ Claude ของ Anthropic ให้ผลลัพธ์คุณภาพสูงมาก
- ด้วย ความง่ายในการเข้าถึงผ่าน API จึงถือเป็นหนึ่งในวิธีที่ง่ายที่สุดในการนำ AI มาใช้ในเชิงวิศวกรรม
- ระยะหลังยังมีการเปิดตัวโมเดลขนาดเล็กอย่าง GPT-4o mini เพื่อมอบความคุ้มค่าด้านต้นทุนและประสิทธิภาพการอนุมานที่รวดเร็ว
- Zapier
- Zapier เป็นแพลตฟอร์มทำงานอัตโนมัติสำหรับเวิร์กโฟลว์ ก่อตั้งในปี 2011 และมีมูลค่าประเมิน $5B ณ เดือนสิงหาคม 2023
- ใช้ โมเดลของ OpenAI เพื่อปรับปรุงกระบวนการอัตโนมัติภายใน เช่น ฟีเจอร์ สร้างและสรุปบันทึกการประชุม และฟีเจอร์ สรุปบทความบนเว็บ
- เครื่องมือ Copilot ของ Zapier ช่วยให้สามารถสร้างเวิร์กโฟลว์ได้ด้วยพรอมป์ภาษาธรรมชาติ
- Klarna
- Klarna เป็นบริษัทฟินเทคจากสวีเดนที่ให้บริการ “Buy Now, Pay Later” และในเดือนกันยายน 2024 ได้ประกาศว่าจะ แทนที่ Salesforce และ Workday ด้วย AI
- ผ่านผู้ช่วย AI สำหรับบริการลูกค้าที่ใช้ โมเดลของ OpenAI บริษัทสามารถจัดการคำขอสนับสนุนลูกค้าได้ 2/3 และทดแทนปริมาณงานเทียบเท่าพนักงานประจำ 700 คน
- ภายในองค์กรยังใช้ผู้ช่วย AI ชื่อ Kiki เพื่อช่วยให้พนักงานตอบคำถามได้มากกว่า 2,000 รายการต่อวัน
- Ramp
- Ramp เป็น สตาร์ตอัปฟินเทค B2B ที่ก่อตั้งในปี 2019 และให้บริการผลิตภัณฑ์ซอฟต์แวร์การเงินหลากหลายประเภท
- ใช้โมเดล GPT-4 และ Claude เพื่อทำงานอัตโนมัติ เช่น การวิเคราะห์ข้อมูลสัญญา การจัดหมวดหมู่ธุรกรรม และการเขียนบันทึกใบเสร็จ
- ภายในองค์กรยังใช้ AI เพื่อสรุปการโทรกับลูกค้าและตอบคำถาม โดยเชื่อมรวมกับ Slack
- Atlassian
- Atlassian เป็นบริษัทมูลค่า $50B ที่ให้บริการซอฟต์แวร์ทำงานร่วมกันเป็นทีม เช่น Jira, Trello และ Confluence
- ในเดือนเมษายน 2023 ได้ประกาศฟีเจอร์ Generative AI ชื่อ Atlassian Intelligence
- ฟีเจอร์นี้ใช้งานโดยผสานโมเดลของ OpenAI เข้ากับโมเดลของ Atlassian เอง
- ผู้ช่วย AI Rovo ช่วยเสริมความสามารถการค้นหาใน Jira และทำงานอัตโนมัติ เช่น การสร้างคอนเทนต์การตลาดและการรวบรวมฟีดแบ็ก ผ่านเอเจนต์แบบ No-Code
- Canva
- แม้ Canva จะใช้โมเดลเฉพาะใน Magic Studio แต่บางฟีเจอร์ก็ใช้ โมเดลปิดซอร์ส
- ตัวอย่าง: ตัวแก้ไขงานเขียน ที่ใช้โมเดลของ OpenAI สามารถสร้างคอนเทนต์ให้มีโทนสอดคล้องกับตัวอย่างที่อัปโหลด
- Canva ยังดำเนินการ AI app marketplace ที่หลากหลาย ซึ่งรวมถึงแอป DALL-E ของ OpenAI และแอป Imagen ของ Google เป็นต้น
เลเยอร์ 3: การพัฒนาบนพื้นฐานโมเดลโอเพนซอร์ส
- แทนที่จะสร้างโมเดลขึ้นมาเองแบบอิสระ หรือใช้โมเดลปิดซอร์สอย่าง GPT-4o ของ OpenAI หลายบริษัทกำลังนำ โมเดลโอเพนซอร์ส จาก Meta, Mistral, Hugging Face และรายอื่น ๆ มาใช้สร้างเครื่องมือของตนเอง
- โมเดลโอเพนซอร์ส ให้ข้อดีทั้งด้านการปรับแต่งได้สูง ความโปร่งใส การเสริมความเป็นส่วนตัวของข้อมูล และการลดต้นทุน
- ตามรายงานปี 2024 ของ Databricks บริษัทที่ใช้ LLM 76% เลือกโอเพนซอร์ส
- โมเดลโอเพนซอร์ส ไม่มีค่าไลเซนส์เพิ่มเติมและสามารถโฮสต์เองได้ จึงหลีกเลี่ยงค่าใช้จ่ายคลาวด์ขนาดใหญ่ได้
- สำหรับลูกค้าองค์กร การลดปัญหาลิขสิทธิ์และความเสี่ยงจากข้อมูลรั่วไหลก็เป็นปัจจัยสำคัญเช่นกัน
- VMware
- VMware เป็นผู้ให้บริการซอฟต์แวร์ virtualization และถูก Broadcom เข้าซื้อกิจการในปี 2023 ด้วยมูลค่า $69B
- VMware ร่วมมือกับ Hugging Face เพื่อพัฒนา coding assistant แบบโอเพนซอร์สชื่อ SafeCoder
- โดยใช้โมเดล 15.5B พารามิเตอร์ ชื่อ StarCoder ซึ่งเก็บข้อมูลจากโปรเจ็กต์โอเพนซอร์สเพื่อลดปัญหาลิขสิทธิ์ให้น้อยที่สุด
- ลูกค้าองค์กรสามารถ fine-tune โมเดล StarCoder ด้วยโค้ดของตนเองได้ จึงช่วยงานภายในที่ต้องใช้ความรู้เฉพาะโดเมน
- Mathpresso
- Mathpresso เป็นบริษัท edtech ของเกาหลี โดยแอปหลักอย่าง QANDA ให้ผู้เรียนอัปโหลดภาพหน้าจอของโจทย์คณิตศาสตร์ แล้วระบบจะให้คำตอบโดยอัตโนมัติ
- ในปี 2023 บริษัทพัฒนา LLM เฉพาะทางด้านคณิตศาสตร์ชื่อ MathGPT โดยใช้โมเดล Llama 2 ของ Meta
- MathGPT ใช้คำตอบโจทย์คณิตศาสตร์ของ QANDA เป็นข้อมูลฝึก และให้ทั้งการปรับแต่งที่สูงกว่าและความแม่นยำที่เหมาะกับบริบทการศึกษาเมื่อเทียบกับโมเดลเชิงพาณิชย์เดิม
- MathGPT ทำผลงานเหนือกว่า Microsoft Tora บนเบนช์มาร์ก MATH และ GSM8K และอยู่อันดับ 1 ในกลุ่มโมเดลที่มีพารามิเตอร์ไม่เกิน 13B
- Brave
- Brave เป็นเว็บเบราว์เซอร์ที่ให้ความสำคัญกับความเป็นส่วนตัว โดยมีฟีเจอร์อย่างการบล็อกโฆษณาและตัวติดตาม
- ในเดือนสิงหาคม 2023 บริษัทเปิดตัว AI assistant ชื่อ Leo โดยใช้โมเดลโอเพนซอร์ส Llama 2 ของ Meta และ Mixtral 8x7B ของ Mistral
- Brave ไม่เก็บข้อมูลผู้ใช้ และใช้โมเดลที่โฮสต์เองเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้
- แม้จะรองรับโมเดล Claude ของ Anthropic ด้วย แต่ค่าตั้งต้นถูกตั้งเป็นโมเดลโอเพนซอร์ส
- Replit
- นอกจากโมเดลเติมโค้ดอัตโนมัติแบบปรับแต่งเองแล้ว ในเดือนเมษายน 2024 Replit ยังเปิดตัว AI agent ชื่อ Code Repair โดย fine-tune โมเดล 7B พารามิเตอร์ของ Hugging Face
- ผู้ใช้แบบชำระเงินสามารถสลับระหว่างโมเดลโอเพนซอร์สของ Replit กับโมเดลปิดซอร์สอื่น ๆ ได้ เพื่อมอบโซลูชันที่เหมาะกับความต้องการลูกค้าที่หลากหลาย
เลเยอร์ 4: การใช้เครื่องมือ AI ที่สร้างไว้ล่วงหน้า
- เป็นกรณีที่บริษัทไม่ได้สร้างโมเดล AI ขึ้นมาเอง แต่ซื้อ เครื่องมือ generative AI สำเร็จรูป มาใช้งาน
- ข้อดีหลักของเครื่องมือภายนอกคือการลดต้นทุน การซื้อเครื่องมือเฉพาะทางมีราคาถูกกว่าการฝึกหรือ fine-tune โมเดลเอง
- เหตุผลหลัก 3 ข้อที่บริษัทเลือกเครื่องมือ AI ภายนอก:
- เมื่อต้องการเครื่องมือสำหรับ การค้นคว้าความรู้ทั่วไป และ การระดมความคิด
- ตัวอย่าง: จากงานวิจัยของ BCG เครื่องมือ generative AI ช่วยเพิ่มผลิตภาพในการทำงาน และมีประโยชน์เป็นพิเศษเมื่อขาดความเชี่ยวชาญทางเทคนิค
- เมื่อต้องการ เครื่องมือธุรกิจทั่วไป (เช่น แชตบอตบริการลูกค้า)
- การใช้เครื่องมือจากบุคคลที่สามเพื่อรับประโยชน์ได้อย่างรวดเร็วคุ้มค่ากว่าการสร้างโมเดลเอง
- เมื่อมีการพัฒนา เครื่องมือเฉพาะทางสำหรับอุตสาหกรรม นั้นไว้แล้ว
- ตัวอย่าง: Kira ซึ่งเป็นเครื่องมือสำหรับตรวจทานสัญญากฎหมาย ถูกใช้งานในสำนักงานกฎหมายจำนวนมาก
- Boston Consulting Group (BCG)
- BCG เป็นบริษัทที่ปรึกษาระดับโลก มีพนักงาน 32K คนทั่วโลก และมีรายได้ $12.3B
- ในปี 2023 BCG ทำการทดลองภายในโดยใช้ ChatGPT ของ OpenAI และพบว่า generative AI ช่วยเพิ่มผลลัพธ์ของงานสร้างสรรค์ 40%
- ตัวอย่าง: ผลงานดีขึ้นในการแก้ปัญหาเชิงสร้างสรรค์ เช่น การคิดไอเดียสินค้ารองเท้าใหม่ และการเขียนสโลแกนการตลาด
- ในปี 2024 BCG นำ ChatGPT Enterprise มาใช้กับพนักงานทุกคน สะท้อนการยอมรับถึงประโยชน์ใช้สอยที่สูงของเครื่องมือ AI
- Dollar Shave Club
- Dollar Shave Club เป็นผู้จัดจำหน่ายอุปกรณ์โกนหนวดที่เคยถูก Unilever เข้าซื้อด้วยมูลค่า $1B ก่อนจะถูกขายต่อให้ Nexus Capital Management
- บริษัทใช้ Answer Bot ของ Zendesk เพื่อทำให้การสนับสนุนลูกค้าเป็นอัตโนมัติ แทนการสร้างแชตบอตเอง
- Answer Bot ฝึกจากข้อมูล 12M ปฏิสัมพันธ์กับลูกค้า และตอบคำถามลูกค้าง่าย ๆ ได้ภายในไม่กี่วินาที
- ช่วยปิดเคสได้ 4.5K ใบต่อเดือน คิดเป็น 10% ของปริมาณทิกเก็ตทั้งหมดของบริษัท
- Law Firms (สำนักงานกฎหมาย)
- การตรวจทานสัญญากฎหมายเต็มไปด้วยคำศัพท์และข้อกำหนดที่ซับซ้อน
- สำนักงานกฎหมายหลายแห่งมีทรัพยากรไม่พอที่จะพัฒนาเครื่องมือ AI ภายใน จึงหันมาใช้เครื่องมือ AI ภายนอกอย่าง Kira
- ตัวอย่าง: สำนักงานกฎหมายขนาดใหญ่อย่าง Skadden, Hogan Lovells และ Paul, Weiss ใช้ Kira เพื่อลดเวลาตรวจทานสัญญาได้ สูงสุด 60%
- Kira สามารถวิเคราะห์ ข้อกำหนดและจุดข้อมูลทั่วไปมากกว่า 1K รายการ ได้อย่างรวดเร็ว จึงถูกใช้ในงานตรวจสอบสถานะ M&A การตรวจทานสัญญาเงินกู้ และงานลักษณะใกล้เคียงกัน
3 วิธีที่บริษัทใน Long Tail ใช้ AI
- บริษัทในกลุ่ม Long Tail กำลังประยุกต์ใช้ generative AI ในหลากหลายรูปแบบ เช่น Bloomberg พัฒนาเครื่องมือแบบปรับแต่งสำหรับผู้เชี่ยวชาญด้านการเงิน และที่ปรึกษาของ BCG ใช้ ChatGPT เป็นเครื่องมือเพิ่มประสิทธิภาพการทำงาน
- โมเดลที่ขับเคลื่อนเครื่องมือเหล่านี้มีความหลากหลาย ตั้งแต่โมเดลสร้างภาพของ Canva ไปจนถึงโมเดลที่ผสาน GPT ของ Ramp
- เมื่อพิจารณารูปแบบของบริษัทที่นำ AI ไปใช้ จะเห็นได้ว่าแม้เทคโนโลยีจะพัฒนาอย่างรวดเร็วในปัจจุบัน แต่ยังมี 3 เทรนด์หลักที่โดดเด่นดังนี้
- ใช้ AI เป็นเครื่องมือเสริมธุรกิจเดิม
- บริษัท Long Tail ส่วนใหญ่มีสินค้าและบริการที่มั่นคงอยู่แล้ว และ AI ทำหน้าที่เสริมและปรับปรุงสิ่งเหล่านั้น
- ตัวอย่าง: Replit ประสบความสำเร็จมาก่อนแล้วตั้งแต่ก่อนเปิดตัวเครื่องมือ AI และ AI ก็ถูกใช้เพื่อปรับปรุงผลิตภัณฑ์ในฐานะส่วนต่อขยายของเครื่องมือสำหรับนักพัฒนาเดิม
- Leo AI ของ Brave เป็นเครื่องมือ generative AI ที่ต่อยอดจากแนวทางให้ความสำคัญกับความเป็นส่วนตัวของเบราว์เซอร์ Brave ทำงานด้านการปกป้องความเป็นส่วนตัวมา 8 ปี และ Leo ก็เป็นเครื่องมือที่สืบทอดหลักการนี้
- Walmart มีหัวใจสำคัญอยู่ที่ราคาที่ประหยัดและนโยบายคืนสินค้าที่มีความยืดหยุ่น โดย AI เป็นเพียงเครื่องมือสนับสนุน ไม่ได้เข้ามาแทนที่กลยุทธ์หลัก
- โดยสรุป บริษัทต่าง ๆ นำ AI มาใช้ภายในเพื่อเพิ่มประสิทธิภาพของกระบวนการ แต่ ประสบการณ์ผู้ใช้หลักยังคงมาก่อน
- ลอกแบบกลยุทธ์ AI ของบริษัทในอุตสาหกรรมเดียวกัน
- บริษัทต่าง ๆ นำกลยุทธ์ AI ที่ประสบความสำเร็จมาใช้ได้อย่างรวดเร็ว เพื่อรักษาความสามารถในการแข่งขัน
- ตัวอย่าง: BCG ใช้ ChatGPT จนช่วยยกระดับ ผลงานด้านงานสร้างสรรค์และงานเขียนโค้ด ได้อย่างมาก ผลลัพธ์เช่นนี้อาจกดดันให้บริษัทที่ปรึกษาอื่นอย่าง McKinsey และ Bain ต้องนำเครื่องมือ AI ลักษณะเดียวกันมาใช้
- Brave และ VMware แม้จะมีผลิตภัณฑ์หลักต่างกัน แต่ทั้งคู่ให้ความสำคัญกับ ความเป็นส่วนตัวของข้อมูล และเลือกใช้โมเดลโอเพนซอร์สด้วยเหตุผลนี้
- หากบริษัทผู้นำสามารถสร้างความได้เปรียบในการแข่งขันอย่างต่อเนื่องจากการใช้ AI ได้ ก็คาดว่าบริษัทอื่น ๆ จะต้องนำกลยุทธ์ AI ที่คล้ายกันมาใช้เช่นกัน
- รักษากลยุทธ์ AI ที่ยืดหยุ่น
- วิธีการใช้ AI ไม่ได้ตายตัว และบริษัทต่าง ๆ สามารถ ใช้หรือปรับเปลี่ยนกลยุทธ์ได้หลากหลาย
- ตัวอย่าง: ในช่วงแรก OpenAI มุ่งสร้างโมเดลที่ใหญ่ขึ้นเรื่อย ๆ แต่ในปี 2024 ได้เปิดตัว GPT-4o mini ซึ่งเป็น โมเดลขนาดเล็กและมีประสิทธิภาพ ที่ช่วยลดต้นทุนและทำ inference ได้รวดเร็วขึ้น
- CTO ของ Ramp กล่าวถึง GPT-4o mini ว่าสามารถ ตอบโจทย์ความต้องการได้ 90% และมองว่าโมเดลขนาดเล็กอาจมีประสิทธิภาพมากกว่าโมเดลขนาดใหญ่
- Tuhin Srivastava ซีอีโอของ Baseten ชี้ว่าบริษัทต่าง ๆ มักมีแนวโน้มอยากสร้างโมเดลของตนเอง แต่สิ่งนี้อาจใช้ทรัพยากรและเวลามากเกินไป
- คำแนะนำของ Srivastava: กลยุทธ์แบบ "เริ่มจากใช้เครื่องมือที่ได้ผลแน่นอนก่อน แล้วค่อย ๆ แทนที่ด้วยโมเดลของตนเอง" เป็นสิ่งสำคัญ
- บริษัทต่าง ๆ ควรอยู่ในตำแหน่งที่ ตอบสนองได้อย่างยืดหยุ่น เมื่อมีเทคโนโลยี AI ใหม่ออกมา เพื่อให้สามารถใช้ประโยชน์จากเทคโนโลยีที่พัฒนาเร็วขึ้นได้อย่างทันท่วงที
เป้าหมายสุดท้ายของบริษัท Long Tail
- แม้ความสนใจและกระแสความร้อนแรงของ AI ในปัจจุบันจะมุ่งไปที่โมเดลและบริษัท AI-native เป็นหลัก แต่ในกลุ่ม บริษัทที่ไม่ใช่ AI-native การใช้งาน AI ก็เริ่มโดดเด่นขึ้นเรื่อย ๆ
- บริษัทเหล่านี้กำลังนำโซลูชัน AI มาใช้หลากหลาย ตั้งแต่ แชตบอตบริการลูกค้า ไปจนถึง ประสบการณ์ช้อปปิ้งด้วย augmented reality
- เมื่อคำนึงถึงความเร็วของนวัตกรรม AI วิธีที่ง่ายที่สุดในการทำความเข้าใจว่าบริษัท Long Tail ใช้ AI อย่างไร คือการจัดหมวดหมู่ตาม 4 เลเยอร์ที่นำเสนอในบทวิเคราะห์เชิงลึกนี้:
- โมเดลแบบกำหนดเอง, โมเดลปิดซอร์ส, โมเดลโอเพนซอร์ส, และเครื่องมือ AI จากผู้ให้บริการภายนอก
- ตัวอย่างหลากหลายที่ยกมาในบทวิเคราะห์เชิงลึกนี้ แสดงให้เห็นว่าบริษัทต่าง ๆ สร้างและนำเครื่องมือ AI ที่แตกต่างกันมาใช้อย่างไร ซึ่งช่วยให้ผู้อ่านเข้าใจได้ว่าควรเข้าหาการผสาน AI เข้ากับองค์กรของตนอย่างไร
- ทั้ง 4 เลเยอร์ต่างมี trade-off ในด้าน เวลาเรียนรู้ ต้นทุน การปรับแต่ง ความเป็นส่วนตัว และคุณภาพ แต่เนื่องจากต้นทุนในการสลับระหว่างโมเดลค่อนข้างต่ำ ลูกค้าจึงมีความยืดหยุ่นในการทดลองโซลูชันที่หลากหลายได้
- เป้าหมายสุดท้าย ของบริษัท Long Tail ไม่ใช่การกลายเป็นบริษัท AI แต่คือ การใช้เครื่องมือ AI เพื่อเสริมและเร่งธุรกิจหลักของตน
ยังไม่มีความคิดเห็น