• แม้ Apple Intelligence จะมีรากฐานที่แข็งแกร่งอย่าง การประมวลผลบนอุปกรณ์ และ Private Cloud Compute แต่ประสบการณ์ของผลิตภัณฑ์จริงกลับใกล้เคียงกับ การปรับปรุงแบบเดโมเทคโนโลยี มากกว่าจะเป็น “จักรยานสำหรับจิตใจ” ที่ช่วยงานสร้างสรรค์
  • ความสามารถของ Siri ในการ เข้าใจบริบทส่วนตัว ที่ Apple เคยประกาศไว้ สัญญาว่าจะรองรับการใช้งานอย่าง “เล่นพอดแคสต์ที่ภรรยาส่งมาเมื่อสองสามวันก่อน” แต่ฟีเจอร์หลักที่ถูกย้ำซ้ำในโฆษณายังไม่ถูกปล่อยออกมา
  • Private Cloud Compute กลายเป็นหนึ่งในตัวอย่างที่หาได้ยากของ trusted compute ที่ตรวจสอบจากระยะไกลได้ ด้วยการลบข้อมูลผู้ใช้ การตรวจสอบโหนด การเปิดเผยอิมเมจ OS สู่สาธารณะ และการเปิดซอร์สโค้ดส่วนสำคัญด้านความปลอดภัย แต่ฟีเจอร์ที่อยู่บนรากฐานนี้กลับไปไม่ถึงความคาดหวัง
  • ในบรรดาฟีเจอร์ที่มีใช้งานจริง Math Notes น่าพอใจที่สุด เพราะคำนวณตัวแปรได้ทันทีใน Notes ส่วน Writing Tools, สรุปการแจ้งเตือน, Clean Up และ Image Playground ล้วนมีจุดอ่อนด้านประโยชน์ใช้สอย ความแม่นยำ และการควบคุมงานสร้างสรรค์
  • Generative AI ดูเหมือนจะใกล้เคียงกับ รายละเอียดการติดตั้งใช้งาน ภายในผลิตภัณฑ์ที่ใหญ่กว่า มากกว่าจะเป็นผลิตภัณฑ์เดี่ยว และ Apple Intelligence ยังให้ความรู้สึกว่ามีประโยชน์น้อยกว่าการผสาน Ollama เข้ากับอุปกรณ์เดียวกันโดยตรง

ปรัชญาผลิตภัณฑ์ Apple ที่เคยเป็น “จักรยานสำหรับจิตใจ”

  • Steve Jobs เคยเปรียบคอมพิวเตอร์ในปี 1981 ว่าเป็น จักรยาน สำหรับจิตใจมนุษย์ คือเป็นเครื่องมือที่ช่วยให้ใช้พลังงานน้อยลงแต่สร้างสรรค์ได้มากขึ้น
  • Macintosh และ MacWrite ทำให้ผู้ใช้สามารถมองเห็นเอกสารบนหน้าจอก่อนพิมพ์ออกมา และแก้ไขด้วย Backspace ได้ ต่างจากเครื่องพิมพ์ดีดหรือการเขียนด้วยมือ
  • โปรแกรมประมวลผลคำได้เปลี่ยนวิธีการเขียนเอกสารอย่างมาก และวางมาตรฐานว่าผลิตภัณฑ์ของ Apple ไม่ควรเป็นแค่เครื่องคำนวณ แต่ควรทำงานราวกับเป็นส่วนขยายของร่างกายที่ช่วยให้มนุษย์สร้างสรรค์ได้
  • ด้วยมาตรฐานนี้ Apple จึงถูกมองว่าเป็นบริษัทที่ขาย เครื่องมือสำหรับการสร้างสรรค์ มากกว่าบริษัทที่ขาย “คอมพิวเตอร์ไว้ทำงานของคอมพิวเตอร์”

วิสัยทัศน์ที่ Apple Intelligence เคยสัญญาไว้

  • Apple เปิดตัว Apple Intelligence ในเดือนมิถุนายน 2024 โดยอธิบายว่าเป็นชุดความสามารถที่จะทำให้สมาร์ตโฟนฉลาดขึ้น
  • ตัวอย่างที่ Siri รับคำสั่งอย่าง “เล่นพอดแคสต์ที่ภรรยาส่งมาเมื่อสองสามวันก่อน” แสดงให้เห็นศักยภาพของ การค้นหาบริบทส่วนตัว ที่เชื่อมโยงความสัมพันธ์ ลิงก์ และบริบทของแอปเข้าด้วยกัน
  • หากวิสัยทัศน์นี้เกิดขึ้นจริง ผู้ใช้จะสามารถค้นหาชีวิตดิจิทัลที่กระจายอยู่ตามหลายแอปด้วยภาษาธรรมชาติ และให้โทรศัพท์ลงมือทำงานแทนได้
  • Apple นำเสนอภาพอนาคตที่อุปกรณ์ Apple ทุกเครื่องเข้าถึง intelligence ได้ เหมือนที่ Spotify ทำให้เพลงพร้อมใช้เสมอ หรือ AWS API ทำให้ compute กลายเป็นทรัพยากรที่เปิดก๊อกใช้ได้ทันที
  • ทิศทางนี้ใกล้เคียงกับวิสัยทัศน์ “จักรยานสำหรับจิตใจ” ที่ให้คอมพิวเตอร์ทำงานร่วมกับผู้ใช้เพื่อทำสิ่งที่ผู้ใช้ต้องการ

วิธีที่แอปสมัยใหม่ทำให้ผู้ใช้ห่างจากข้อมูลของตัวเอง

  • ปัญหาใหญ่ของแอปสมัยใหม่คือหลายแอปทำงานเหมือน เปลือกบาง ๆ ของเว็บเซอร์วิส
  • แอปอย่าง Instagram หรือ Bluesky ส่งคำขอไปยังเซิร์ฟเวอร์ รับคำตอบกลับมา แล้วจึงแสดงคอนเทนต์
  • ถ้าไม่มีสัญญาณ คุณอาจทำได้ยากแม้แต่การตั้งเวลาโพสต์ การดูโพสต์ที่เคยเห็น หรือการตรวจว่าคอนเทนต์ที่เพิ่งลงไปแสดงผลแล้วหรือยัง
  • มีการยก Signal และแอปของ Apple เป็นข้อยกเว้น ขณะที่แอปอื่นจำนวนมากค่อย ๆ ทำให้ผู้ใช้ห่างออกจากข้อมูลของตนเอง
  • บทความของ Ed Zitron วิจารณ์ว่าแพลตฟอร์มต่าง ๆ กัดกร่อนประสบการณ์ผู้ใช้เพื่อการเติบโตและการหารายได้ ด้วยตัวติดตามโฆษณา โฆษณาวิดีโอ และคำขอเปิดการแจ้งเตือน
  • ตลาดไม่ต้องการจ่ายเงินตรงสำหรับแชตหรือโซเชียลมีเดีย ขณะที่ต้นทุนการให้บริการเหล่านี้สูงมาก จึงทำให้ข้อมูลผู้ใช้กลายเป็นเป้าหมายของการสร้างรายได้ได้ง่าย

รากฐานที่แข็งแกร่งชื่อ Private Cloud Compute

  • Apple Intelligence จะทำงานบนอุปกรณ์เมื่อเป็นไปได้ และ Apple ก็วิจัยการรัน large language model และโมเดล AI บนอุปกรณ์ด้วย
  • การประมวลผลที่เกิดขึ้นบนอุปกรณ์หรือฮาร์ดแวร์ที่ผู้ใช้มองเห็นได้ให้ความแข็งแกร่งด้าน ความเป็นส่วนตัว มากกว่าวิธีที่ต้องส่งคำขอออกไปภายนอกอย่างมาก
  • ในงาน WWDC Apple ระบุว่า Private Cloud Compute ให้การคุ้มครองความเป็นส่วนตัวสำหรับคำขอผ่านเครือข่ายได้เทียบเท่าหรือมากกว่าการคำนวณบนอุปกรณ์
  • หากมองจากประสบการณ์การให้บริการเว็บทั่วไป Private Cloud Compute ต้องตอบโจทย์ที่ยากมากหลายอย่างพร้อมกัน
    • ข้อมูลผู้ใช้ถูกใช้เฉพาะเพื่อประมวลผลคำขอและจะถูกลบทิ้งหลังจากนั้น
    • โครงสร้างพื้นฐานด้าน load balancing ไม่รู้ว่าใครเป็นผู้ส่งคำขอและคำขอนั้นไปลงที่เซิร์ฟเวอร์ใด
    • นักวิจัยสามารถตรวจสอบและยืนยันระบบ รวมถึงจำลองการทำงานบนแล็ปท็อปได้
    • พนักงาน Apple ฝ่าย SRE ไม่มีสิทธิ์เข้าถึงแบบ privileged ไปยังโหนด Private Cloud Compute และการทำ logging ถูกลดให้เหลือน้อยที่สุดในระดับคอมไพเลอร์
    • ผู้โจมตีไม่สามารถระบุโหนดที่ประมวลผลคำขอของผู้ใช้รายใดรายหนึ่งได้อย่างเสถียร

โมเดลความปลอดภัยที่เปิดเผย กับความปิดของระบบ

  • เอกสารทางเทคนิค ของ Apple ถูกยกให้เป็นตัวอย่างที่หาได้ยากของทีมผลิตภัณฑ์ AI ที่เปิดเผย โมเดลความปลอดภัย อย่างสม่ำเสมอ
  • ในกระบวนการประกอบฮาร์ดแวร์ มีการถ่ายภาพ X-ray ในแต่ละขั้นและเทียบกับภาพอ้างอิง เพื่อป้องกันภัยคุกคามจากการเพิ่มฮาร์ดแวร์ที่ไม่ได้รับอนุญาตลงบนบอร์ดเซิร์ฟเวอร์
  • ผู้ใช้สามารถตั้งค่าโหนด Private Cloud Compute ฉบับจำลองไว้ในเครื่องเพื่อทดลองโจมตีได้ และ Apple จ่ายเงินรางวัลหากค้นพบช่องโหว่
  • การรับรองฮาร์ดแวร์เกี่ยวข้องกับบุคลากรจากหลายฝ่ายภายใน Apple ที่ไม่ได้เกี่ยวข้องกันโดยตรง
  • โหนด Private Cloud Compute จะยกเลิกการรับรองตัวเองเมื่อไฟถูกตัด และสวิตช์ตรวจจับการงัดแงะที่ตัวแชสซีเซิร์ฟเวอร์เชื่อมกับไฟหลัก ทำให้เมื่อเปิดเครื่อง ไฟจะตัดและโหนดจะถูกยกเลิกการรับรอง
  • อุปกรณ์จะบันทึก node ID ที่ใช้เมื่อส่งคำขอไปยัง Private Cloud Compute และผู้ใช้สามารถตรวจสอบได้ว่าโหนดนั้นยังอยู่ในสถานะได้รับการรับรองหรือไม่
  • อิมเมจ OS สำหรับโปรดักชันเปิดให้ดาวน์โหลดสาธารณะได้และไม่ได้ถูกเข้ารหัส
  • แพ็กเกจสำคัญของ OS ถูกแยกโค้ดและข้อมูลออกจากกัน โดยไม่สามารถสอดโค้ดเข้าไปในแพ็กเกจข้อมูลหรือทำกลับกันได้
  • Apple เปิดซอร์สโค้ดของส่วนสำคัญด้านความปลอดภัยของ Private Cloud Compute บน GitHub
  • ระบบนี้เข้าใกล้ จอกศักดิ์สิทธิ์ ของ trusted compute ที่ตรวจสอบจากระยะไกลได้ แต่ถ้าส่งมอบในรูปแบบ consumer OS มันก็จะเป็นระบบที่ปิดมาก รันได้เฉพาะซอฟต์แวร์ที่กำหนดไว้ โดยไม่มีสิทธิ์ root ไม่มีคอมไพเลอร์ และไม่มีดีบักเกอร์

ฟีเจอร์ที่ออกมาจริงในช่วงปลายปี 2024

  • ชุดฟีเจอร์แรกของ Apple Intelligence เปิดตัวในช่วงปลายเดือนตุลาคม 2024
  • ฟีเจอร์ที่มีให้ใช้งานได้แก่ Writing Tools, การสรุปการแจ้งเตือน หน้าเว็บ และอีเมล, Clean Up สำหรับลบวัตถุในภาพ, การค้นหาภาพตามเนื้อหา, การค้นหาเอกสารบนอุปกรณ์ผ่าน Siri และ Math Notes ในแอป Notes
  • หลังจากนั้นมีการเพิ่ม Image Playground และการจัดหมวดหมู่อีเมล
  • ฟีเจอร์ บริบทส่วนตัว ที่ถูกพูดซ้ำในโฆษณายังไม่ถูกปล่อยออกมา

Math Notes: ฟีเจอร์ที่สำเร็จที่สุด

  • Math Notes ถูกยกให้เป็นฟีเจอร์ของ Apple Intelligence ที่น่าพอใจที่สุด
  • หากพิมพ์การคำนวณแบบตัวแปรในแอป Notes ดังนี้ ระบบจะเติมผลลัพธ์หลังเครื่องหมายเท่ากับตัวสุดท้ายให้อัตโนมัติ
Rent = 2300
FamilySize = 2
Rent / FamilySize =
  • ตัวอย่างข้างต้นจะใส่ 1150
  • มีประโยชน์สำหรับการคำนวณพื้นฐาน การใช้ตัวแปร และการประมาณรายรับรายจ่ายแบบคร่าว ๆ
  • ผู้เขียนประเมินว่าไม่มีอะไรให้บ่นเกี่ยวกับ Math Notes

Writing Tools: ให้ผลลัพธ์แบบแทนที่ มากกว่าช่วยสร้างสรรค์

  • สำหรับผู้ใช้ที่มีประสบการณ์การเขียนมาก Writing Tools แทบไม่มีประโยชน์ และให้ผลลัพธ์ที่เป็นเพียงเวอร์ชันที่แย่ลงเล็กน้อยของสิ่งที่ผู้ใช้ทำได้ดีกว่าเองอยู่แล้ว
  • ฟีเจอร์นี้ทำให้สัมผัสถึงผลข้างเคียงที่แย่ของเครื่องมือ AI แบบเดิม ๆ ซึ่งไม่ได้เพิ่มพูนกระบวนการสร้างสรรค์ แต่กลับ เข้าไปแทนที่ มัน
  • ผลลัพธ์ออกมาเป็นก้อนข้อความทึบ ๆ หลังตัวเลือกจำกัดอย่าง “ทำให้เป็นมืออาชีพ” หรือ “เปลี่ยนเป็นตาราง” โดยไม่มีเลเยอร์หรือความสามารถในการปรับแต่งอย่างละเอียด
  • ในการใช้งานจริง เมื่อลองให้สรุปย่อหน้า กลับเกิดข้อผิดพลาด “Writing Tools Unavailable: Certain capabilities are unavailable at this time. Try again later.”
  • มันอาจมีประโยชน์กับการเปลี่ยนคำพูดยาว ๆ ระหว่างสตรีมให้กลายเป็นเค้าโครงตั้งต้นของบทความ แต่ไม่เหมาะกับงานที่ให้มันเขียนตัวบทความแทน
  • สำหรับคนที่ไม่ได้มีประสบการณ์ภาษาอังกฤษมาก อาจมีประโยชน์มากกว่า แต่สำหรับผู้เขียนแล้วไม่ได้มีประโยชน์มากนัก

ปัญหาของการสรุปการแจ้งเตือน ข้อความ และอีเมล

  • แนวคิดของการสรุปการแจ้งเตือนดูเหมือนจะดี เพราะช่วยให้กวาดดูการแจ้งเตือนจำนวนมากได้ง่ายในคราวเดียว
  • แต่ในการใช้งานจริง ตัวอย่างความล้มเหลวกลับเด่นชัดมาก
  • ข้อความ SMS หลอกลวงอาจถูกสรุปเป็น “การจัดส่งพัสดุล่าช้าเพราะข้อมูลที่อยู่ไม่ครบถ้วน” ซึ่งอาจทำให้ผู้ใช้รู้สึกว่าจำเป็นต้องรีบลงมือทำบางอย่างทันที
  • BBC รายงานกรณีที่การสรุปการแจ้งเตือนทำให้ผู้คนเข้าใจไปเองว่าผู้ต้องสงสัยที่ถูกคุมขังได้ฆ่าตัวตาย
  • หากเปิด Apple Intelligence ไว้แต่ปิดเฉพาะการสรุปการแจ้งเตือน การแจ้งเตือนอาจมาช้าสุดถึง 5 วินาที
  • ฟีเจอร์สรุปบางส่วนใช้งานบน iPhone ไม่ได้ และเพราะมันไม่ค่อยมีประโยชน์ จึงถูกเปิดค้างไว้เฉพาะบน MacBook เพื่อหลีกเลี่ยงปัญหาการแจ้งเตือนล่าช้า
  • โดยรวมแล้วแม้จะยังมีความเนี้ยบแบบ Apple แต่ก็ให้ความรู้สึกว่า ยังทำไม่เสร็จครึ่งหนึ่ง

Clean Up: เครื่องมือที่เปลี่ยนความจริงของภาพถ่าย

  • Clean Up เป็นฟีเจอร์สำหรับลบวัตถุที่ไม่ต้องการออกจากภาพ
  • หากมองว่าภาพถ่ายคือการสะท้อนความจริง และแยกงานที่เปลี่ยนการนำเสนอ เช่น ปรับสีหรือครอป ออกจากงานที่เปลี่ยน เนื้อหา ของภาพ ฟีเจอร์นี้ก็เป็นสิ่งที่ยอมรับได้ยาก
  • มีการยกกรณีการตัดต่อภาพประวัติศาสตร์ยุคสตาลินที่ลบ Nikolai Yezhov ออกจากภาพ มาใช้อธิบายลักษณะของ Clean Up
  • เครื่องมือนี้สามารถทำให้ภาพกลายเป็นช่วงเวลาที่ผู้ใช้ต้องการให้เกิดขึ้น แทนที่จะเป็นช่วงเวลาที่เกิดขึ้นจริง
  • ด้วยเหตุผลเชิงปรัชญานี้ ผู้เขียนจึงไม่ได้ใช้ Clean Up และไม่ได้ประเมินมันในรายละเอียด

Image Playground: ผลลัพธ์ที่ไม่เหมือนผลิตภัณฑ์ Apple

  • Image Playground เป็นฟีเจอร์สร้างภาพจาก text prompt และภาพบุคคล เป็นต้น
  • มีการยกภาพที่สร้างจาก Stable Diffusion 1.5, ComfyUI และเวิร์กโฟลว์การแพร่กระจายแบบซับซ้อนที่ผสมโมเดล 11~12 ตัว เป็นตัวอย่างของมาตรฐานระดับสูง
  • ภาพหอส่งสัญญาณโทรทัศน์ East Berlin ยามพระอาทิตย์ตกที่สร้างด้วย Image Playground อาจพอดูผ่าน ๆ ได้บนหน้าจอโทรศัพท์ แต่ช่วงเวลาบนท้องฟ้าปะปนกัน และเส้นตรงของหน้าต่างกับดาดฟ้าดูแปลก
  • ตัวอย่างที่ดีเป็นผลลัพธ์ที่ถูกคัดเลือกมาอย่างมาก ขณะที่ส่วนใหญ่สามารถผิดเพี้ยนทั้งรูปทรงและความหมายอย่างมาก เช่น “taco smoking beer at a party”
  • หากใช้รูปของตัวเอง ผลลัพธ์อาจชวนไม่สบายใจจากสัดส่วนใบหน้าหรือดวงตา
  • การที่ Apple ปล่อยผลงานลักษณะนี้ออกมาเป็นผลิตภัณฑ์จริง ให้ความรู้สึกตรงข้ามกับ คุณภาพและความใส่ใจในรายละเอียด ที่เคยคาดหวังจาก Apple
  • Genmoji ก็ถูกประเมินในทำนองเดียวกันว่าสร้างผลลัพธ์ที่ว่างเปล่าไร้วิญญาณ แต่ดึงตัวอย่างจากข้อความแชตออกมาโดยยังรักษาคุณภาพไว้ได้ยาก จึงไม่ได้ลงรายละเอียด
  • บริษัทอื่นที่ใช้โมเดล open-weights อาจสร้างผลลัพธ์ที่ดีกว่าได้ และฝั่ง Apple ก็น่าเสียดายที่ยังไม่มีเครื่องมือแบบ IntelligenceKit ที่เปิดให้นักพัฒนาใช้โมเดลอย่างสร้างสรรค์

Generative AI ไม่ใช่ผลิตภัณฑ์ แต่เป็นรายละเอียดการติดตั้งใช้งาน

  • Generative AI โดยตัวมันเองนั้นใกล้เคียงกับ รายละเอียดการติดตั้งใช้งาน ภายในผลิตภัณฑ์ที่ใหญ่กว่า มากกว่าจะเป็นผลิตภัณฑ์ในตัวเอง
  • แม้จะสร้างภาพหอส่งสัญญาณโทรทัศน์เบอร์ลินได้ใน 1~2 วินาที ผู้ใช้ก็ยังไม่ได้รับการแก้ไขแบบเลเยอร์หรือการควบคุมงานสร้างสรรค์อย่างการปรับสีท้องฟ้า แต่ได้เพียงผลลัพธ์สุดท้ายชิ้นเดียว
  • ฟีเจอร์ลักษณะนี้อาจใช้กับโพสต์โซเชียลมีเดียแบบใช้แรงน้อยได้ แต่เป็นสิ่งที่ใกล้เคียงกับเดโมเทคโนโลยีมากกว่าผลิตภัณฑ์ และในปี 2025 ก็ถูกมองว่าเป็นระดับที่ถ้าออกมาในปี 2022 จะน่าตื่นเต้นกว่า
  • พื้นที่ที่ Generative AI มีประโยชน์จริงกลับเป็นงานที่ไม่หวือหวากว่า
  • มีการกล่าวถึงงานวิจัยที่ใช้ Generative AI จัดหมวดหมู่ความรู้สึกที่อธิบายได้ยากจากประสบการณ์การทำสมาธิ และจะมีข่าวเพิ่มเติมพร้อมแผนตีพิมพ์งานวิจัยภายในเดือนมิถุนายน

สรุปสุดท้าย: รากฐานแข็งแกร่ง แต่ผลิตภัณฑ์อ่อนแรง

  • Apple Intelligence ถูกประเมินว่าเป็นผลิตภัณฑ์ที่ล้มเหลวในเชิงการนำไปใช้งานจริง
  • รากฐานของมันแข็งแกร่งมาก
    • ข้อมูลทุกอย่างที่เป็นไปได้ถูกประมวลผลบนอุปกรณ์
    • งานที่ทำบนอุปกรณ์ไม่ได้จะใช้แนวปฏิบัติด้านความปลอดภัยที่เข้มแข็งของ Private Cloud Compute
    • ตั้งเป้าให้การประมวลผลเป็นแบบปิดและเข้ารหัสให้ได้มากที่สุด
  • ปัญหาคือ แม้จะสร้างรากฐานที่เข้าใกล้จอกศักดิ์สิทธิ์ของ trusted compute ที่ตรวจสอบจากระยะไกลได้ แต่ประสบการณ์ผู้ใช้ปลายทางกลับให้ความรู้สึกว่ายังด้อยกว่าการทำ integration โดยตรงกับ Ollama บนอุปกรณ์เดียวกัน
  • เมื่อใช้ Ollama ผู้ใช้เลือกโมเดลที่ดีกว่า Apple Intelligence ได้มาก และยังคงรักษาความเป็นส่วนตัวไว้ได้เพราะรันอยู่บนอุปกรณ์เดียวกัน
  • ชุมชนโอเพนซอร์สต้องดึงประสิทธิภาพสูงสุดจากฮาร์ดแวร์ที่จำกัด จึงสามารถสร้างผลลัพธ์ผ่าน lateral thinking with withered technology และนำขึ้นโปรดักชันได้โดยแทบไม่ต้องแก้ไข
  • Apple Intelligence ไม่ได้มอบ “จักรยานสำหรับจิตใจ” แต่ให้เพียงการปรับปรุงข้างเคียงคล้ายเดโมเทคโนโลยี และจบลงเหมือนเป็นการปล่อยให้ศักยภาพอันไร้ขีดจำกัดสูญเปล่า
  • ข้อยกเว้นคือ Math Notes ซึ่งได้รับคำชมอย่างมากถึงขั้นอยากให้มีอยู่ในแอปจดโน้ตอื่นด้วย

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น