• เนื้อหาที่ Ahmad Khan หัวหน้าฝ่ายกลยุทธ์ AI/ML ของ Snowflake นำเสนอ

สร้างรายได้จากการใช้ประโยชน์ข้อมูล 'ไม่มีโครงสร้าง'

  • ข้อมูลขององค์กรส่วนใหญ่มากกว่า 80% เป็น 'ข้อมูลไม่มีโครงสร้าง' เช่น เอกสาร Word, รูปภาพ, ไฟล์เสียง/วิดีโอ
  • แต่บริษัทส่วนใหญ่แทบไม่ได้ใช้ข้อมูลเหล่านี้เลย ซึ่งหมายความว่าในการตัดสินใจทางธุรกิจ พวกเขาใช้ข้อมูลที่มีอยู่ไม่ถึง 20%
  • หากนำข้อมูลไม่มีโครงสร้างเหล่านี้ไปวางเคียงข้างโมเดลภาษาขนาดใหญ่เพื่อสร้างแชตบอตอย่างมีประสิทธิภาพ ก็อาจช่วยตีความและวิเคราะห์ข้อมูลจำนวนมหาศาลที่ปัจจุบันยังถูกใช้ประโยชน์ต่ำได้
  • ศักยภาพในการสร้างโมเดลที่เหมาะกับอุตสาหกรรมเฉพาะของแต่ละองค์กรนั้นแทบไร้ขีดจำกัด

ความเป็นส่วนตัวและความปลอดภัย

  • ความกังวลในหมู่บริษัทต่างๆ เพิ่มขึ้นว่า ข้อมูลของตนอาจถูกนำไปใช้ฝึกโมเดลที่บริษัทอื่นรวมถึงคู่แข่งสามารถใช้งานได้
  • ผลคือ หลายองค์กรยอมใช้ผลิตภัณฑ์ที่ด้อยกว่าแต่ให้ความปลอดภัยดีกว่า ซึ่งสร้างตลาดให้กับผลิตภัณฑ์ที่ปลอดภัยมากขึ้น
  • ตัวอย่างเช่น Llama 2 อาจไม่ใช่โมเดลภาษาขนาดใหญ่ที่มีประสิทธิภาพดีที่สุด แต่ลูกค้าจำนวนมากก็ยังเลือก Llama 2 แทนโมเดลที่ควบคุมได้น้อยกว่าอย่าง Chat GPT
  • หลายบริษัทมองว่าความเป็นเอกลักษณ์ของข้อมูลเป็นข้อได้เปรียบ จึงต้องการหลีกเลี่ยงสถานการณ์ที่ข้อมูลถูกเปิดเผยสู่สาธารณะบนอินเทอร์เน็ต

สร้างความได้เปรียบในการแข่งขันด้วยประสบการณ์ผู้ใช้ที่ยอดเยี่ยม

  • สตาร์ตอัปจะสู้กับขนาดของบริษัทใหญ่ได้อย่างไร?
  • ข้อเสนอคือให้โฟกัสที่การสร้างประสบการณ์ผู้ใช้ที่น่าพึงพอใจ เช่น การออกแบบส่วนติดต่อผู้ใช้ที่น่าดึงดูด
  • นี่คือแนวทางที่ Snowflake เลือกใช้
  • โดยเฉพาะเมื่อบริการส่วนใหญ่ของตนไม่สามารถแข่งขันกับผู้ให้บริการคลาวด์อย่าง Amazon Web Services ได้ จึงมุ่งสร้างประสบการณ์ผู้ใช้ที่เหนือกว่าเพื่อทำให้ราคาที่สูงมีเหตุผล

โฟกัสที่อุตสาหกรรมเฉพาะ

  • อีกวิธีที่ดาวิดจะชนะโกลิอัทได้คือ การมุ่งเน้นอุตสาหกรรมเฉพาะอย่างการผลิต การเงิน การแพทย์ หรือความบันเทิง แทนที่จะทำแอปพลิเคชันแบบใช้งานทั่วไป
  • เขาแนะนำว่า "ต้องเข้าใจก่อนว่าบริษัทในอุตสาหกรรมนั้นกำลังมองหาอะไร แล้วจึงนำเสนอบริการที่ตอบโจทย์ความต้องการเหล่านั้น"
  • ตัวอย่างเช่น Google มีแนวโน้มจะพัฒนาโมเดลภาษาขนาดใหญ่สำหรับการแพทย์ แต่มีโอกาสสูงที่จะไม่ลงลึกเป็นพิเศษ จึงเป็นโอกาสให้บริษัทขนาดเล็กสร้างโมเดลดังกล่าว

ความต้องการเรื่อง data attribution กำลังเพิ่มขึ้นเรื่อยๆ

  • มีความเป็นไปได้ของโมเดลใหม่ที่ติดตามสื่อที่มีลิขสิทธิ์และจ่ายค่าตอบแทนให้ผู้สร้างต้นฉบับ เพื่อสร้างแรงจูงใจให้ผู้สร้างพัฒนาสื่อเพิ่มเติม
  • Khan ยกหลายกรณีที่ไม่สามารถใช้โมเดลโอเพนซอร์สได้ด้วยเหตุผลทางกฎหมาย และยกตัวอย่างสตูดิโอภาพยนตร์แห่งหนึ่งที่ไม่ต้องการใช้โมเดลโอเพนซอร์สสำหรับการสร้างภาพ
  • สตูดิโอนี้จ่ายค่าไลเซนส์และค่าใช้จ่ายเพื่อใช้โมเดลที่ฝึกจากข้อมูลของ Getty Images
  • ในอนาคต ตลาดสำหรับโมเดลลักษณะคล้ายกันที่ใช้ชุดข้อมูล attribution จะเติบโตขึ้นเรื่อยๆ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น