- แม้ Apple Intelligence จะมีรากฐานที่แข็งแกร่งอย่าง การประมวลผลบนอุปกรณ์ และ Private Cloud Compute แต่ประสบการณ์ของผลิตภัณฑ์จริงกลับใกล้เคียงกับ การปรับปรุงแบบเดโมเทคโนโลยี มากกว่าจะเป็น “จักรยานสำหรับจิตใจ” ที่ช่วยงานสร้างสรรค์
- ความสามารถของ Siri ในการ เข้าใจบริบทส่วนตัว ที่ Apple เคยประกาศไว้ สัญญาว่าจะรองรับการใช้งานอย่าง “เล่นพอดแคสต์ที่ภรรยาส่งมาเมื่อสองสามวันก่อน” แต่ฟีเจอร์หลักที่ถูกย้ำซ้ำในโฆษณายังไม่ถูกปล่อยออกมา
- Private Cloud Compute กลายเป็นหนึ่งในตัวอย่างที่หาได้ยากของ trusted compute ที่ตรวจสอบจากระยะไกลได้ ด้วยการลบข้อมูลผู้ใช้ การตรวจสอบโหนด การเปิดเผยอิมเมจ OS สู่สาธารณะ และการเปิดซอร์สโค้ดส่วนสำคัญด้านความปลอดภัย แต่ฟีเจอร์ที่อยู่บนรากฐานนี้กลับไปไม่ถึงความคาดหวัง
- ในบรรดาฟีเจอร์ที่มีใช้งานจริง Math Notes น่าพอใจที่สุด เพราะคำนวณตัวแปรได้ทันทีใน Notes ส่วน Writing Tools, สรุปการแจ้งเตือน, Clean Up และ Image Playground ล้วนมีจุดอ่อนด้านประโยชน์ใช้สอย ความแม่นยำ และการควบคุมงานสร้างสรรค์
- Generative AI ดูเหมือนจะใกล้เคียงกับ รายละเอียดการติดตั้งใช้งาน ภายในผลิตภัณฑ์ที่ใหญ่กว่า มากกว่าจะเป็นผลิตภัณฑ์เดี่ยว และ Apple Intelligence ยังให้ความรู้สึกว่ามีประโยชน์น้อยกว่าการผสาน Ollama เข้ากับอุปกรณ์เดียวกันโดยตรง
ปรัชญาผลิตภัณฑ์ Apple ที่เคยเป็น “จักรยานสำหรับจิตใจ”
- Steve Jobs เคยเปรียบคอมพิวเตอร์ในปี 1981 ว่าเป็น จักรยาน สำหรับจิตใจมนุษย์ คือเป็นเครื่องมือที่ช่วยให้ใช้พลังงานน้อยลงแต่สร้างสรรค์ได้มากขึ้น
- Macintosh และ MacWrite ทำให้ผู้ใช้สามารถมองเห็นเอกสารบนหน้าจอก่อนพิมพ์ออกมา และแก้ไขด้วย Backspace ได้ ต่างจากเครื่องพิมพ์ดีดหรือการเขียนด้วยมือ
- โปรแกรมประมวลผลคำได้เปลี่ยนวิธีการเขียนเอกสารอย่างมาก และวางมาตรฐานว่าผลิตภัณฑ์ของ Apple ไม่ควรเป็นแค่เครื่องคำนวณ แต่ควรทำงานราวกับเป็นส่วนขยายของร่างกายที่ช่วยให้มนุษย์สร้างสรรค์ได้
- ด้วยมาตรฐานนี้ Apple จึงถูกมองว่าเป็นบริษัทที่ขาย เครื่องมือสำหรับการสร้างสรรค์ มากกว่าบริษัทที่ขาย “คอมพิวเตอร์ไว้ทำงานของคอมพิวเตอร์”
วิสัยทัศน์ที่ Apple Intelligence เคยสัญญาไว้
- Apple เปิดตัว Apple Intelligence ในเดือนมิถุนายน 2024 โดยอธิบายว่าเป็นชุดความสามารถที่จะทำให้สมาร์ตโฟนฉลาดขึ้น
- ตัวอย่างที่ Siri รับคำสั่งอย่าง “เล่นพอดแคสต์ที่ภรรยาส่งมาเมื่อสองสามวันก่อน” แสดงให้เห็นศักยภาพของ การค้นหาบริบทส่วนตัว ที่เชื่อมโยงความสัมพันธ์ ลิงก์ และบริบทของแอปเข้าด้วยกัน
- หากวิสัยทัศน์นี้เกิดขึ้นจริง ผู้ใช้จะสามารถค้นหาชีวิตดิจิทัลที่กระจายอยู่ตามหลายแอปด้วยภาษาธรรมชาติ และให้โทรศัพท์ลงมือทำงานแทนได้
- Apple นำเสนอภาพอนาคตที่อุปกรณ์ Apple ทุกเครื่องเข้าถึง intelligence ได้ เหมือนที่ Spotify ทำให้เพลงพร้อมใช้เสมอ หรือ AWS API ทำให้ compute กลายเป็นทรัพยากรที่เปิดก๊อกใช้ได้ทันที
- ทิศทางนี้ใกล้เคียงกับวิสัยทัศน์ “จักรยานสำหรับจิตใจ” ที่ให้คอมพิวเตอร์ทำงานร่วมกับผู้ใช้เพื่อทำสิ่งที่ผู้ใช้ต้องการ
วิธีที่แอปสมัยใหม่ทำให้ผู้ใช้ห่างจากข้อมูลของตัวเอง
- ปัญหาใหญ่ของแอปสมัยใหม่คือหลายแอปทำงานเหมือน เปลือกบาง ๆ ของเว็บเซอร์วิส
- แอปอย่าง Instagram หรือ Bluesky ส่งคำขอไปยังเซิร์ฟเวอร์ รับคำตอบกลับมา แล้วจึงแสดงคอนเทนต์
- ถ้าไม่มีสัญญาณ คุณอาจทำได้ยากแม้แต่การตั้งเวลาโพสต์ การดูโพสต์ที่เคยเห็น หรือการตรวจว่าคอนเทนต์ที่เพิ่งลงไปแสดงผลแล้วหรือยัง
- มีการยก Signal และแอปของ Apple เป็นข้อยกเว้น ขณะที่แอปอื่นจำนวนมากค่อย ๆ ทำให้ผู้ใช้ห่างออกจากข้อมูลของตนเอง
- บทความของ Ed Zitron วิจารณ์ว่าแพลตฟอร์มต่าง ๆ กัดกร่อนประสบการณ์ผู้ใช้เพื่อการเติบโตและการหารายได้ ด้วยตัวติดตามโฆษณา โฆษณาวิดีโอ และคำขอเปิดการแจ้งเตือน
- ตลาดไม่ต้องการจ่ายเงินตรงสำหรับแชตหรือโซเชียลมีเดีย ขณะที่ต้นทุนการให้บริการเหล่านี้สูงมาก จึงทำให้ข้อมูลผู้ใช้กลายเป็นเป้าหมายของการสร้างรายได้ได้ง่าย
รากฐานที่แข็งแกร่งชื่อ Private Cloud Compute
- Apple Intelligence จะทำงานบนอุปกรณ์เมื่อเป็นไปได้ และ Apple ก็วิจัยการรัน large language model และโมเดล AI บนอุปกรณ์ด้วย
- การประมวลผลที่เกิดขึ้นบนอุปกรณ์หรือฮาร์ดแวร์ที่ผู้ใช้มองเห็นได้ให้ความแข็งแกร่งด้าน ความเป็นส่วนตัว มากกว่าวิธีที่ต้องส่งคำขอออกไปภายนอกอย่างมาก
- ในงาน WWDC Apple ระบุว่า Private Cloud Compute ให้การคุ้มครองความเป็นส่วนตัวสำหรับคำขอผ่านเครือข่ายได้เทียบเท่าหรือมากกว่าการคำนวณบนอุปกรณ์
- หากมองจากประสบการณ์การให้บริการเว็บทั่วไป Private Cloud Compute ต้องตอบโจทย์ที่ยากมากหลายอย่างพร้อมกัน
- ข้อมูลผู้ใช้ถูกใช้เฉพาะเพื่อประมวลผลคำขอและจะถูกลบทิ้งหลังจากนั้น
- โครงสร้างพื้นฐานด้าน load balancing ไม่รู้ว่าใครเป็นผู้ส่งคำขอและคำขอนั้นไปลงที่เซิร์ฟเวอร์ใด
- นักวิจัยสามารถตรวจสอบและยืนยันระบบ รวมถึงจำลองการทำงานบนแล็ปท็อปได้
- พนักงาน Apple ฝ่าย SRE ไม่มีสิทธิ์เข้าถึงแบบ privileged ไปยังโหนด Private Cloud Compute และการทำ logging ถูกลดให้เหลือน้อยที่สุดในระดับคอมไพเลอร์
- ผู้โจมตีไม่สามารถระบุโหนดที่ประมวลผลคำขอของผู้ใช้รายใดรายหนึ่งได้อย่างเสถียร
โมเดลความปลอดภัยที่เปิดเผย กับความปิดของระบบ
- เอกสารทางเทคนิค ของ Apple ถูกยกให้เป็นตัวอย่างที่หาได้ยากของทีมผลิตภัณฑ์ AI ที่เปิดเผย โมเดลความปลอดภัย อย่างสม่ำเสมอ
- ในกระบวนการประกอบฮาร์ดแวร์ มีการถ่ายภาพ X-ray ในแต่ละขั้นและเทียบกับภาพอ้างอิง เพื่อป้องกันภัยคุกคามจากการเพิ่มฮาร์ดแวร์ที่ไม่ได้รับอนุญาตลงบนบอร์ดเซิร์ฟเวอร์
- ผู้ใช้สามารถตั้งค่าโหนด Private Cloud Compute ฉบับจำลองไว้ในเครื่องเพื่อทดลองโจมตีได้ และ Apple จ่ายเงินรางวัลหากค้นพบช่องโหว่
- การรับรองฮาร์ดแวร์เกี่ยวข้องกับบุคลากรจากหลายฝ่ายภายใน Apple ที่ไม่ได้เกี่ยวข้องกันโดยตรง
- โหนด Private Cloud Compute จะยกเลิกการรับรองตัวเองเมื่อไฟถูกตัด และสวิตช์ตรวจจับการงัดแงะที่ตัวแชสซีเซิร์ฟเวอร์เชื่อมกับไฟหลัก ทำให้เมื่อเปิดเครื่อง ไฟจะตัดและโหนดจะถูกยกเลิกการรับรอง
- อุปกรณ์จะบันทึก node ID ที่ใช้เมื่อส่งคำขอไปยัง Private Cloud Compute และผู้ใช้สามารถตรวจสอบได้ว่าโหนดนั้นยังอยู่ในสถานะได้รับการรับรองหรือไม่
- อิมเมจ OS สำหรับโปรดักชันเปิดให้ดาวน์โหลดสาธารณะได้และไม่ได้ถูกเข้ารหัส
- แพ็กเกจสำคัญของ OS ถูกแยกโค้ดและข้อมูลออกจากกัน โดยไม่สามารถสอดโค้ดเข้าไปในแพ็กเกจข้อมูลหรือทำกลับกันได้
- Apple เปิดซอร์สโค้ดของส่วนสำคัญด้านความปลอดภัยของ Private Cloud Compute บน GitHub
- ระบบนี้เข้าใกล้ จอกศักดิ์สิทธิ์ ของ trusted compute ที่ตรวจสอบจากระยะไกลได้ แต่ถ้าส่งมอบในรูปแบบ consumer OS มันก็จะเป็นระบบที่ปิดมาก รันได้เฉพาะซอฟต์แวร์ที่กำหนดไว้ โดยไม่มีสิทธิ์ root ไม่มีคอมไพเลอร์ และไม่มีดีบักเกอร์
ฟีเจอร์ที่ออกมาจริงในช่วงปลายปี 2024
- ชุดฟีเจอร์แรกของ Apple Intelligence เปิดตัวในช่วงปลายเดือนตุลาคม 2024
- ฟีเจอร์ที่มีให้ใช้งานได้แก่ Writing Tools, การสรุปการแจ้งเตือน หน้าเว็บ และอีเมล, Clean Up สำหรับลบวัตถุในภาพ, การค้นหาภาพตามเนื้อหา, การค้นหาเอกสารบนอุปกรณ์ผ่าน Siri และ Math Notes ในแอป Notes
- หลังจากนั้นมีการเพิ่ม Image Playground และการจัดหมวดหมู่อีเมล
- ฟีเจอร์ บริบทส่วนตัว ที่ถูกพูดซ้ำในโฆษณายังไม่ถูกปล่อยออกมา
Math Notes: ฟีเจอร์ที่สำเร็จที่สุด
- Math Notes ถูกยกให้เป็นฟีเจอร์ของ Apple Intelligence ที่น่าพอใจที่สุด
- หากพิมพ์การคำนวณแบบตัวแปรในแอป Notes ดังนี้ ระบบจะเติมผลลัพธ์หลังเครื่องหมายเท่ากับตัวสุดท้ายให้อัตโนมัติ
Rent = 2300
FamilySize = 2
Rent / FamilySize =
- ตัวอย่างข้างต้นจะใส่
1150
- มีประโยชน์สำหรับการคำนวณพื้นฐาน การใช้ตัวแปร และการประมาณรายรับรายจ่ายแบบคร่าว ๆ
- ผู้เขียนประเมินว่าไม่มีอะไรให้บ่นเกี่ยวกับ Math Notes
Writing Tools: ให้ผลลัพธ์แบบแทนที่ มากกว่าช่วยสร้างสรรค์
- สำหรับผู้ใช้ที่มีประสบการณ์การเขียนมาก Writing Tools แทบไม่มีประโยชน์ และให้ผลลัพธ์ที่เป็นเพียงเวอร์ชันที่แย่ลงเล็กน้อยของสิ่งที่ผู้ใช้ทำได้ดีกว่าเองอยู่แล้ว
- ฟีเจอร์นี้ทำให้สัมผัสถึงผลข้างเคียงที่แย่ของเครื่องมือ AI แบบเดิม ๆ ซึ่งไม่ได้เพิ่มพูนกระบวนการสร้างสรรค์ แต่กลับ เข้าไปแทนที่ มัน
- ผลลัพธ์ออกมาเป็นก้อนข้อความทึบ ๆ หลังตัวเลือกจำกัดอย่าง “ทำให้เป็นมืออาชีพ” หรือ “เปลี่ยนเป็นตาราง” โดยไม่มีเลเยอร์หรือความสามารถในการปรับแต่งอย่างละเอียด
- ในการใช้งานจริง เมื่อลองให้สรุปย่อหน้า กลับเกิดข้อผิดพลาด “Writing Tools Unavailable: Certain capabilities are unavailable at this time. Try again later.”
- มันอาจมีประโยชน์กับการเปลี่ยนคำพูดยาว ๆ ระหว่างสตรีมให้กลายเป็นเค้าโครงตั้งต้นของบทความ แต่ไม่เหมาะกับงานที่ให้มันเขียนตัวบทความแทน
- สำหรับคนที่ไม่ได้มีประสบการณ์ภาษาอังกฤษมาก อาจมีประโยชน์มากกว่า แต่สำหรับผู้เขียนแล้วไม่ได้มีประโยชน์มากนัก
ปัญหาของการสรุปการแจ้งเตือน ข้อความ และอีเมล
- แนวคิดของการสรุปการแจ้งเตือนดูเหมือนจะดี เพราะช่วยให้กวาดดูการแจ้งเตือนจำนวนมากได้ง่ายในคราวเดียว
- แต่ในการใช้งานจริง ตัวอย่างความล้มเหลวกลับเด่นชัดมาก
- ข้อความ SMS หลอกลวงอาจถูกสรุปเป็น “การจัดส่งพัสดุล่าช้าเพราะข้อมูลที่อยู่ไม่ครบถ้วน” ซึ่งอาจทำให้ผู้ใช้รู้สึกว่าจำเป็นต้องรีบลงมือทำบางอย่างทันที
- BBC รายงานกรณีที่การสรุปการแจ้งเตือนทำให้ผู้คนเข้าใจไปเองว่าผู้ต้องสงสัยที่ถูกคุมขังได้ฆ่าตัวตาย
- หากเปิด Apple Intelligence ไว้แต่ปิดเฉพาะการสรุปการแจ้งเตือน การแจ้งเตือนอาจมาช้าสุดถึง 5 วินาที
- ฟีเจอร์สรุปบางส่วนใช้งานบน iPhone ไม่ได้ และเพราะมันไม่ค่อยมีประโยชน์ จึงถูกเปิดค้างไว้เฉพาะบน MacBook เพื่อหลีกเลี่ยงปัญหาการแจ้งเตือนล่าช้า
- โดยรวมแล้วแม้จะยังมีความเนี้ยบแบบ Apple แต่ก็ให้ความรู้สึกว่า ยังทำไม่เสร็จครึ่งหนึ่ง
Clean Up: เครื่องมือที่เปลี่ยนความจริงของภาพถ่าย
- Clean Up เป็นฟีเจอร์สำหรับลบวัตถุที่ไม่ต้องการออกจากภาพ
- หากมองว่าภาพถ่ายคือการสะท้อนความจริง และแยกงานที่เปลี่ยนการนำเสนอ เช่น ปรับสีหรือครอป ออกจากงานที่เปลี่ยน เนื้อหา ของภาพ ฟีเจอร์นี้ก็เป็นสิ่งที่ยอมรับได้ยาก
- มีการยกกรณีการตัดต่อภาพประวัติศาสตร์ยุคสตาลินที่ลบ Nikolai Yezhov ออกจากภาพ มาใช้อธิบายลักษณะของ Clean Up
- เครื่องมือนี้สามารถทำให้ภาพกลายเป็นช่วงเวลาที่ผู้ใช้ต้องการให้เกิดขึ้น แทนที่จะเป็นช่วงเวลาที่เกิดขึ้นจริง
- ด้วยเหตุผลเชิงปรัชญานี้ ผู้เขียนจึงไม่ได้ใช้ Clean Up และไม่ได้ประเมินมันในรายละเอียด
Image Playground: ผลลัพธ์ที่ไม่เหมือนผลิตภัณฑ์ Apple
- Image Playground เป็นฟีเจอร์สร้างภาพจาก text prompt และภาพบุคคล เป็นต้น
- มีการยกภาพที่สร้างจาก Stable Diffusion 1.5, ComfyUI และเวิร์กโฟลว์การแพร่กระจายแบบซับซ้อนที่ผสมโมเดล 11~12 ตัว เป็นตัวอย่างของมาตรฐานระดับสูง
- ภาพหอส่งสัญญาณโทรทัศน์ East Berlin ยามพระอาทิตย์ตกที่สร้างด้วย Image Playground อาจพอดูผ่าน ๆ ได้บนหน้าจอโทรศัพท์ แต่ช่วงเวลาบนท้องฟ้าปะปนกัน และเส้นตรงของหน้าต่างกับดาดฟ้าดูแปลก
- ตัวอย่างที่ดีเป็นผลลัพธ์ที่ถูกคัดเลือกมาอย่างมาก ขณะที่ส่วนใหญ่สามารถผิดเพี้ยนทั้งรูปทรงและความหมายอย่างมาก เช่น “taco smoking beer at a party”
- หากใช้รูปของตัวเอง ผลลัพธ์อาจชวนไม่สบายใจจากสัดส่วนใบหน้าหรือดวงตา
- การที่ Apple ปล่อยผลงานลักษณะนี้ออกมาเป็นผลิตภัณฑ์จริง ให้ความรู้สึกตรงข้ามกับ คุณภาพและความใส่ใจในรายละเอียด ที่เคยคาดหวังจาก Apple
- Genmoji ก็ถูกประเมินในทำนองเดียวกันว่าสร้างผลลัพธ์ที่ว่างเปล่าไร้วิญญาณ แต่ดึงตัวอย่างจากข้อความแชตออกมาโดยยังรักษาคุณภาพไว้ได้ยาก จึงไม่ได้ลงรายละเอียด
- บริษัทอื่นที่ใช้โมเดล open-weights อาจสร้างผลลัพธ์ที่ดีกว่าได้ และฝั่ง Apple ก็น่าเสียดายที่ยังไม่มีเครื่องมือแบบ IntelligenceKit ที่เปิดให้นักพัฒนาใช้โมเดลอย่างสร้างสรรค์
Generative AI ไม่ใช่ผลิตภัณฑ์ แต่เป็นรายละเอียดการติดตั้งใช้งาน
- Generative AI โดยตัวมันเองนั้นใกล้เคียงกับ รายละเอียดการติดตั้งใช้งาน ภายในผลิตภัณฑ์ที่ใหญ่กว่า มากกว่าจะเป็นผลิตภัณฑ์ในตัวเอง
- แม้จะสร้างภาพหอส่งสัญญาณโทรทัศน์เบอร์ลินได้ใน 1~2 วินาที ผู้ใช้ก็ยังไม่ได้รับการแก้ไขแบบเลเยอร์หรือการควบคุมงานสร้างสรรค์อย่างการปรับสีท้องฟ้า แต่ได้เพียงผลลัพธ์สุดท้ายชิ้นเดียว
- ฟีเจอร์ลักษณะนี้อาจใช้กับโพสต์โซเชียลมีเดียแบบใช้แรงน้อยได้ แต่เป็นสิ่งที่ใกล้เคียงกับเดโมเทคโนโลยีมากกว่าผลิตภัณฑ์ และในปี 2025 ก็ถูกมองว่าเป็นระดับที่ถ้าออกมาในปี 2022 จะน่าตื่นเต้นกว่า
- พื้นที่ที่ Generative AI มีประโยชน์จริงกลับเป็นงานที่ไม่หวือหวากว่า
- มีการกล่าวถึงงานวิจัยที่ใช้ Generative AI จัดหมวดหมู่ความรู้สึกที่อธิบายได้ยากจากประสบการณ์การทำสมาธิ และจะมีข่าวเพิ่มเติมพร้อมแผนตีพิมพ์งานวิจัยภายในเดือนมิถุนายน
สรุปสุดท้าย: รากฐานแข็งแกร่ง แต่ผลิตภัณฑ์อ่อนแรง
- Apple Intelligence ถูกประเมินว่าเป็นผลิตภัณฑ์ที่ล้มเหลวในเชิงการนำไปใช้งานจริง
- รากฐานของมันแข็งแกร่งมาก
- ข้อมูลทุกอย่างที่เป็นไปได้ถูกประมวลผลบนอุปกรณ์
- งานที่ทำบนอุปกรณ์ไม่ได้จะใช้แนวปฏิบัติด้านความปลอดภัยที่เข้มแข็งของ Private Cloud Compute
- ตั้งเป้าให้การประมวลผลเป็นแบบปิดและเข้ารหัสให้ได้มากที่สุด
- ปัญหาคือ แม้จะสร้างรากฐานที่เข้าใกล้จอกศักดิ์สิทธิ์ของ trusted compute ที่ตรวจสอบจากระยะไกลได้ แต่ประสบการณ์ผู้ใช้ปลายทางกลับให้ความรู้สึกว่ายังด้อยกว่าการทำ integration โดยตรงกับ Ollama บนอุปกรณ์เดียวกัน
- เมื่อใช้ Ollama ผู้ใช้เลือกโมเดลที่ดีกว่า Apple Intelligence ได้มาก และยังคงรักษาความเป็นส่วนตัวไว้ได้เพราะรันอยู่บนอุปกรณ์เดียวกัน
- ชุมชนโอเพนซอร์สต้องดึงประสิทธิภาพสูงสุดจากฮาร์ดแวร์ที่จำกัด จึงสามารถสร้างผลลัพธ์ผ่าน lateral thinking with withered technology และนำขึ้นโปรดักชันได้โดยแทบไม่ต้องแก้ไข
- Apple Intelligence ไม่ได้มอบ “จักรยานสำหรับจิตใจ” แต่ให้เพียงการปรับปรุงข้างเคียงคล้ายเดโมเทคโนโลยี และจบลงเหมือนเป็นการปล่อยให้ศักยภาพอันไร้ขีดจำกัดสูญเปล่า
- ข้อยกเว้นคือ Math Notes ซึ่งได้รับคำชมอย่างมากถึงขั้นอยากให้มีอยู่ในแอปจดโน้ตอื่นด้วย
ยังไม่มีความคิดเห็น