- Apple Intelligence ได้รับการปรับโครงสร้างใหม่บนสถาปัตยกรรมใหม่ที่อิงกับ Apple Foundation Models ซึ่งพัฒนาร่วมกับ Google
- โมเดลใหม่อิงกับเทคโนโลยีตระกูล Gemini และถูกปรับให้เหมาะทั้งการทำงานบนอุปกรณ์และการประมวลผลบนเซิร์ฟเวอร์ Private Cloud Compute
- โมเดลที่อัปเกรดแล้วรองรับการทำความเข้าใจและสร้างภาพ, การสร้างภาพที่สมจริง, การแก้ไขภาพขั้นสูง และ การตอบคำถามจากภาพ
- อุปกรณ์บางรุ่นจะได้รับโมเดลประสิทธิภาพสูงที่รองรับการสร้างเสียง, ความแม่นยำของการถอดเสียงที่ดีขึ้น และความเข้าใจภาษาธรรมชาติที่แข็งแกร่งขึ้น แต่ยังไม่ได้ระบุว่าเป็นอุปกรณ์ใด
- Apple ระบุว่าข้อมูลผู้ใช้จะถูกใช้เฉพาะเพื่อประมวลผลคำขอในทันที และ Apple หรือบุคคลที่สามจะไม่สามารถเข้าถึงได้ พร้อมทั้งผู้เชี่ยวชาญภายนอกสามารถตรวจสอบการรับประกันด้านความเป็นส่วนตัวนี้ได้ทุกเมื่อ
การปรับโครงสร้างสถาปัตยกรรม Apple Intelligence
- Apple ประกาศการปรับโครงสร้างครั้งใหญ่ของแพลตฟอร์ม Apple Intelligence พร้อมเปิดเผยสถาปัตยกรรมใหม่ที่อิงกับโมเดลพื้นฐานซึ่งพัฒนาร่วมกับ Google โดยใช้เทคโนโลยีตระกูล Gemini
- แกนกลางของสถาปัตยกรรมใหม่นี้คือ Apple Foundation Models ที่พัฒนาร่วมกับ Google โดย Apple ระบุว่าโมเดลเหล่านี้ถูกปรับให้เหมาะทั้งกับการประมวลผลบนอุปกรณ์และการทำงานบนเซิร์ฟเวอร์ Private Cloud Compute
- Apple อธิบายความร่วมมือกับ Google ว่าเป็นความร่วมมือที่ “ลึกซึ้ง” และระบุว่าจะมอบ “การอัปเกรดครั้งใหญ่” ให้กับ Apple Intelligence
- โมเดลใหม่นี้มาพร้อมความสามารถล่าสุดด้านการทำความเข้าใจและการให้เหตุผล รวมถึงการรองรับแบบมัลติโหมดที่ครอบคลุมการทำความเข้าใจและการสร้างภาพ
ความสามารถของโมเดลใหม่
- โมเดลที่อัปเกรดแล้วรองรับกรณีใช้งานใหม่ เช่น การสร้างภาพที่สมจริง, การแก้ไขภาพขั้นสูง และการตอบคำถามจากภาพ
- อุปกรณ์บางรุ่นจะได้รับโมเดลเวอร์ชันประสิทธิภาพสูงพร้อมความสามารถเพิ่มเติม
- โมเดลเวอร์ชันประสิทธิภาพสูงรองรับการสร้างเสียง, ความแม่นยำของการถอดเสียงที่ดีขึ้น และความเข้าใจภาษาธรรมชาติที่แข็งแกร่งขึ้น
- Apple ไม่ได้ระบุว่าอุปกรณ์ใดบ้างที่จะได้รับโมเดลประสิทธิภาพสูง
ตัวประสานงานระบบ
- ศูนย์กลางของสถาปัตยกรรมที่ปรับใหม่คือระบบตัวประสานงานใหม่
- ตัวประสานงานระบบนี้จะประสานความสามารถของ Apple Intelligence อย่างปลอดภัยทั่วทั้งแพลตฟอร์มของ Apple
- Apple ระบุว่าตัวประสานงานสามารถปรับคำตอบให้เหมาะกับแอปที่กำลังใช้งานและงานปัจจุบันของผู้ใช้ได้
- โครงสร้างนี้ทำให้เกิดความสามารถที่ Apple เรียกว่า “ความฉลาดระดับทั้งระบบอย่างแท้จริง”
แนวทางด้านความเป็นส่วนตัว
- Apple เปรียบเทียบแนวทางของตนกับคู่แข่ง โดยระบุว่าคู่แข่งกำลัง “เร่งเดินหน้า” โดยไม่คำนึงถึงผู้ใช้
- Apple Intelligence พึ่งพาการประมวลผลบนอุปกรณ์และ Private Cloud Compute
- คำมั่นสัญญาที่ว่าข้อมูลผู้ใช้จะถูกใช้เฉพาะเพื่อประมวลผลคำขอในทันที และ Apple หรือบุคคลที่สามจะไม่สามารถเข้าถึงได้ยังคงเหมือนเดิม
- Apple เสริมว่าผู้เชี่ยวชาญภายนอกสามารถตรวจสอบการรับประกันด้านความเป็นส่วนตัวเหล่านี้ได้ “ทุกเมื่อ”
1 ความคิดเห็น
ความเห็นจาก Hacker News
มองว่าวิธีที่ Apple ใช้ไล่ตาม AI นั้นค่อนข้าง เป็นสไตล์ Apple: เอาเครื่องมือจากภายนอกมาครอบด้วยสถาปัตยกรรมความเป็นส่วนตัว ใส่เข้าไปในระบบปฏิบัติการ แล้วทำให้ชั้น orchestration กลายเป็นตัวสินค้า
น่าสนใจว่า Private Cloud Compute และการทำ routing บนอุปกรณ์จะทำให้ความสามารถของโมเดลจากบุคคลที่สามให้ความรู้สึกเหมือนเป็นระบบ first-party โดยไม่รั่วไหลบริบทของผู้ใช้ได้หรือไม่
ถ้า Apple จัดการเส้นแบ่งระหว่าง Google-Apple ได้ดี มันก็น่าจะเป็นก้าวที่สง่างาม แต่ถ้าไม่ ก็อาจให้ความรู้สึกเหมือน Apple Intelligence ที่เป็นแค่ฟรอนต์เอนด์ซึ่งเอาความเป็นส่วนตัวมาทาทับ Gemini อย่างสวยงาม
แชตบอตจากบุคคลที่สามในตอนนี้ทำ integration แบบนั้นไม่ได้ และถึงจะทำได้ ก็คงยากที่จะยกสิทธิ์เข้าถึงระดับนั้นให้บริษัทอื่น
ถ้ามี หลักประกันด้านความเป็นส่วนตัว ที่แข็งแรงกว่านี้ก็คงดีกว่า แต่ถึงอย่างนั้นก็ยังถือว่าเป็นทิศทางที่โอเค
น่าจะพิจารณาหลายปัจจัยรวมถึงโมเดลขนาดเล็กด้วย แต่ต้นทุนก็คงเป็นประเด็นใหญ่ และรู้สึกว่า Google เป็นผู้ให้บริการรายเดียวที่ปล่อย AI inference ฟรีออกมาเยอะขนาดนี้
การเปลี่ยนแปลงนี้จะทำให้ยิ่งไม่ชัดเจนว่าผู้บริโภคหรือพนักงานต้องจ่ายค่าบริการ AI เมื่อไรและอย่างไร ตัวอย่างเช่น ในงานเปิดตัวพวกเขาโชว์งานฝั่งผู้บริโภค ไม่ใช่งานเขียนโค้ด แต่เราจะเลือกไฟล์ 5 ไฟล์แล้วบอก Siri ให้เขียนสคริปต์ Python หรือแอปเล็ก ๆ ได้ไหม? องค์กรจะปิดฟีเจอร์ AI ของ Siri ไปเลยหรือเปล่า หรือจะสามารถ route ไปยังผู้ให้บริการและระบบตรวจสอบ AI ภายในของตัวเองได้?
อยากรู้มากขึ้นว่าจริง ๆ แล้วอะไรเป็นตัวขับเคลื่อน Apple Intelligence กันแน่ เป็นการใช้ โมเดลเรือธงของ Gemini อยู่หลังพรอมป์ต์ของตัวเอง หรือเป็นการ fine-tune หรือว่าเป็นการ pretrain โมเดลของตัวเองบนพื้นฐาน Gemini
และก็สงสัยด้วยว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างโมเดลที่อิง Gemini กับ Apple Foundation Models หรือไม่ ความต่างนั้นเปลี่ยนไปหรือไม่ระหว่างโมเดลบนอุปกรณ์กับโมเดลที่โฮสต์อยู่ และยังไม่ชัดว่าบางโมเดลรันบน Private Cloud Compute ของ Apple ขณะที่บางโมเดลรันบนอุปกรณ์ของ Google หรือเปล่า
ต่อมาใน “keynote tech-talk” ก็อธิบายไว้ละเอียดพอสมควร: [0]
ตามที่ Apple ระบุ มีทั้งหมด 5 โมเดล สำหรับบนอุปกรณ์มี AFM Core ซึ่งเป็นโมเดล on-device รุ่นถัดไปแบบมาตรฐานที่เป็น dense architecture และ AFM Core Advanced ซึ่งเป็น sparse architecture รองรับมัลติโหมดแบบเนทีฟ และทำให้เข้าใจภาพกับเสียงพูดที่แสดงอารมณ์ได้
ใน Private Cloud Compute มี AFM Cloud ซึ่งเป็นโมเดลหลักฝั่งเซิร์ฟเวอร์ที่ปรับให้เหมาะกับ latency และต้นทุน, AFM Cloud Image สำหรับการสร้างและแก้ไขภาพ, และ AFM Cloud Pro ซึ่งเป็นโมเดลระดับสูงสุดสำหรับการให้เหตุผลที่ซับซ้อนและงานแบบเอเจนต์ AFM Cloud Pro มีคุณภาพระดับเดียวกับโมเดลแนวหน้าของ Gemini และรันบน NVIDIA GPU ใน Google Cloud ภายใต้การคุ้มครองความเป็นส่วนตัวของ PCC ของ Apple
ทุกอย่างยกเว้น Cloud Pro เป็นโมเดลแบบปรับแต่งที่รันบน Apple Silicon และบอกว่า “ผ่านการกลั่น” ด้วย Google Gemini ส่วน Cloud Pro นั้นอธิบายว่าเป็น “โมเดลที่ทรงพลังที่สุดซึ่งมีคุณภาพใกล้เคียงกับ Gemini frontier models” ดังนั้นถ้าอ่านระหว่างบรรทัดก็ดูเหมือนเป็นการครอบ Gemini ไว้อีกชั้น
[0]: https://9to5mac.com/2026/06/…
https://machinelearning.apple.com/research/introducing-apple...
ถ้ามี Mac ก็ลองเล่นเองได้เลย
https://apfel.franzai.com/
เวอร์ชันที่แรงกว่าสำหรับอุปกรณ์ที่มี RAM 12GB เท่านั้น น่าจะเป็นโมเดลที่คล้ายกันแต่ใหญ่กว่าเล็กน้อยซึ่งยังไม่ได้เปิดตัว
ก่อนหน้านี้ Google เคยประกาศว่าจะเปิดให้เช่าฮาร์ดแวร์ในดาต้าเซ็นเตอร์ของตัวเองเพื่อรัน Gemini แบบเต็มได้ เป็นแนวทางที่อิง NVIDIA ซึ่งทำให้องค์กรฝึกหรือเข้าถึงระบบได้โดยไม่ต้องส่งข้อมูลไปยังดาต้าเซ็นเตอร์ของ Google ส่วน Private Compute ก็อาจเป็นกรณีที่ Apple เช่าอุปกรณ์ลักษณะนั้นในปริมาณมาก
คำสัญญาในทำนองว่า “Apple ต้องเห็นข้อมูลเพื่อทำฟีเจอร์นี้ แต่ถึงอยากก็ไม่มีทางดูข้อมูลนั้นได้” ดูเป็นไปไม่ได้
ควรต้องเปิดซอร์ส iOS ให้ผู้ใช้ควบคุมอุปกรณ์ได้ และโฮสต์ inference เองเพื่อยืนยันได้ว่าไม่มีทราฟฟิกเครือข่ายออกไป ถ้าเป็นอย่างที่พูดจริง การให้ผู้ใช้โฮสต์เองก็ควรไม่มีข้อเสีย
โดยเนื้อแท้แล้วมันก็ดูเหมือนยังคงทำสิ่งที่ Google Assistant และ Siri ทำกันมาหลายปี
เลยไม่ค่อยแน่ใจว่าได้อะไรเพิ่มขึ้นมาบ้าง
ในทำนองเดียวกัน โค้ดที่เขียนด้วยมือหลายล้านบรรทัดของ Google Translate ก็ถูกแทนที่ไปแล้วอย่างสิ้นเชิงด้วยโมเดลภาษาขนาดใหญ่ที่แปลได้ดีกว่ามาก
AI assistant ที่อิงกับโมเดลภาษาขนาดใหญ่เป็นคนละเทคโนโลยีสแต็กกับการเขียนโปรแกรมเชิงตรรกะแบบ “if-then-else” ที่ Siri แบบเดิมอาศัยอยู่โดยสิ้นเชิง และความสามารถก็ต่างกันมาก
มันแปลกที่ Apple เลือก Google เป็นผู้ให้บริการแทน Anthropic หรือ OpenAI ซึ่งดูเหมือนเป็นการเลือกที่เสียเปรียบตัวเอง
แบบนี้จะยิ่งทำให้สร้างความแตกต่างจาก assistant บนมือถือ Android ได้ยากขึ้นไม่ใช่หรือ? ถ้ามองแบบประชดหน่อย Google ก็อาจให้ Gemini เวอร์ชันที่ด้อยกว่ากับ Apple เพื่อให้ตัวเองนำหน้าอยู่ก็ได้ไม่ใช่หรือ?
จากมุมผู้บริโภค ไม่ว่าจะเลือกแพลตฟอร์มมือถือไหน ข้างใต้ก็กลายเป็นของเดียวกันหมด และแทบไม่มีทางเลี่ยงได้นอกจากไม่ใช้ assistant ไปเลย ซึ่งไม่น่าชอบเท่าไร
Google ทำงานเรื่องรันโมเดลภาษาขนาดใหญ่บนอุปกรณ์ edge มามากกว่า Anthropic หรือ OpenAI
แหล่งข่าวยังบอกด้วยว่าสถาปัตยกรรมใหม่นี้มี Apple Foundation Models ที่พัฒนาร่วมกับ Google เป็นแกนกลาง และถูกปรับให้ทำงานได้ทั้งบนอุปกรณ์และบนเซิร์ฟเวอร์ผ่านโครงสร้างพื้นฐาน Private Cloud Compute ของ Apple
นี่อาจหมายความว่า Google กับ Apple ได้ฝึกโมเดลแบบปรับแต่งเฉพาะสำหรับฮาร์ดแวร์ของ Apple ซึ่งน่าจะเป็นโมเดลบนอุปกรณ์
ถ้าทำให้ Gemini เป็นเพียงรายละเอียดการติดตั้งใช้งาน ก็ยังเปิดทางให้ภายหลังสลับไป Anthropic หรือ OpenAI ได้โดยที่ผู้ใช้ปลายทางไม่ต้องรู้หรือสนใจ ดังนั้นผมคิดว่าพวกเขากำลังสร้างอำนาจต่อรองไว้สำหรับการเจรจาในอนาคต
และ Apple ก็น่าจะเผาสะพานไปพอสมควรแล้วจากข้อตกลงที่ทำกับ OpenAI เมื่อปีที่แล้ว
ผมเป็นสมาชิกเสียเงินของ Claude มาหลายปี แต่ช่วงนี้กลับใช้แอป Gemini ฟรีบน Android Pixel 9 บ่อยกว่า มันค้นหาให้ได้ดีมากในฐานะส่วนหนึ่งของคำตอบ
โมเดลให้ความรู้สึกว่า สดใหม่และอัปเดตล่าสุด มาก คำถามที่ยังเปิดอยู่คือ Apple จะรวมความสามารถด้านการค้นหานั้นเข้าไปได้หรือไม่
ผมอาจจะคิดผิด แต่สิ่งนี้ดูเหมือนจะกระทบคำกล่าวอ้างเรื่อง ความเป็นส่วนตัว ของ Apple ค่อนข้างแรง
Apple ยังเสริมด้วยว่าผู้เชี่ยวชาญภายนอกสามารถตรวจสอบการรับประกันความเป็นส่วนตัวเหล่านี้ได้ “ทุกเมื่อ”
คุณคิดจริงหรือว่า Google จะไม่ปกป้องความเป็นส่วนตัวของลูกค้ารายใหญ่ที่จ่ายเงิน?
ผมใช้ผลิตภัณฑ์แบบเสียเงินของ Google มาหลายปีโดยไม่มีปัญหา และเงื่อนไขการคุ้มครองความเป็นส่วนตัวก็ชัดเจน
หลายคนมองข้ามไปว่า Google นำหน้าไปมากในด้าน edge AI
ผมพูดแบบนี้มาตลอดตั้งแต่ก่อนกระแส GPT บูม และมือถือ Pixel ก็มีฟีเจอร์คำบรรยายสด หรือก็คือการถอดเสียงบนอุปกรณ์แบบเรียลไทม์ มาสักพักแล้ว
ความเคลื่อนไหวนี้ทำให้นึกถึง iPhone รุ่นแรก ที่มาพร้อม Google Maps
เป็นโครงสร้างที่แข่งขันกับ Google แต่ก็ยังใช้โครงสร้างพื้นฐานของพวกเขาอยู่ แล้วทำไมถึงไม่เลือกผู้ให้บริการรายอื่นอย่าง OpenAI หรือ Anthropic?
เป็นไปได้ว่า OpenAI ไม่ยอมให้รันโมเดลของตัวเองบนเซิร์ฟเวอร์ของ Apple
Google เก่งเรื่องงานเว็บฝั่งแบ็กเอนด์ และ Apple ก็นำข้อมูลคลาวด์ของ Google มาสร้างเป็นแอปโลคัลที่ยอดเยี่ยม เช่นเดียวกับแอป YouTube
หลังจาก Google ได้เห็น iPhone ก่อนเปิดตัว ก็เปลี่ยนทิศทางของ Android จากเดิมที่เป็นฮาร์ดแวร์สไตล์ BlackBerry ให้หันมาเป็นอย่างทุกวันนี้ และนั่นก็เป็นจุดเริ่มของ “สงครามนิวเคลียร์” ด้วย การที่ Steve Jobs เอา iPhone ไปให้ดูแบบนั้นก็น่าสนใจเหมือนกัน เพราะตามที่ Jobs เล่า Bill Gates ก็เคยทำอะไรคล้ายกันมาก่อน และนั่นก็นำไปสู่การพัฒนา Windows
ผ่านมา 19 ปี ตอนนี้อาจถึงเวลาที่จะกลับมาใช้แนวทางแบบปฏิบัตินิยมอีกครั้ง หาก Apple ยังส่งมอบการผสาน AI เข้ากับระบบปฏิบัติการได้ไม่ดีพอ ก็เสี่ยงจะเสียผู้ใช้ให้ Android อยู่ดี ในเมื่อสุดท้ายก็ต้องจ่ายค่าโมเดลอยู่แล้ว ก็ควรเลือกตัวเลือกที่คิดว่าดีที่สุดสำหรับผู้ใช้ แบบนี้น่าจะช่วยให้ Apple รักษาผู้ใช้ iPhone เดิมไว้ได้ และยังดึงผู้ใช้ Android ที่ต้องการฟีเจอร์แบบเดียวกันแต่ต้องการความเป็นส่วนตัวที่ดีกว่าเข้ามาได้ด้วย จึงดูเป็นประโยชน์กับ Apple
ณ จุดนี้ การจ่ายเงินให้ OpenAI แทน Google ดูคล้ายการทำไปเพราะความแค้นส่วนตัว อาจมีเหตุผลรองรับก็จริง แต่ตลอด 20 ปีที่ผ่านมา ผู้บริหารก็เปลี่ยนกันหมดแล้ว จึงเหมือนยังลากสงครามเก่า ๆ ต่อไป อย่างไรก็ตาม ก่อนจะเอาของที่ยังไม่เปิดเผยไปให้ Google ดู ก็ยังควรคิดให้รอบคอบอยู่ดี
Apple ก็จับทุกคนไว้ในระบบนิเวศของตัวเองอยู่แล้ว ขอแค่อย่าทำพังก็พอ ในกรณีนี้จึงให้ความสำคัญกับ เสถียรภาพ มากกว่าปัจจัยด้านการแข่งขัน
แต่ละหน่วยของ Google ทำงานราวกับเป็นบริษัทใน Fortune 500 แยกกัน และมักเคลื่อนไหวตามผลประโยชน์ของตัวเอง
Google น่าจะยื่นเงื่อนไขที่ดีที่สุดมาให้ และถ้าเป็นผู้เล่นอันดับ 3 ก็มักต้องยอมเสียมาร์จินเพื่อเพิ่มปริมาณงาน
คงจะดีถ้า EU บังคับให้ Apple เปิดทางให้ผู้ใช้ปลายทางเลือกโมเดลภายนอกได้
ถ้ามีโมเดลโลคัลที่เน้นความเป็นส่วนตัวเป็นหลัก และสามารถเรียกใช้โมเดลที่ต้องการอย่าง Claude, Grok, DeepSeek ผ่านโปรโตคอลเปิดที่นิยามไว้อย่างชัดเจนได้ ก็คงยอดเยี่ยมมาก
ฟังดูเหมือนเป็น สถาปัตยกรรมระบบปฏิบัติการ ที่ถูกต้องจริง ๆ ส่วนโมเดลธุรกิจแบบรีเบตก็เลิกไปได้เลย
จะให้ Apple รองรับโมเดลสารพัดแบบตามอำเภอใจงั้นหรือ? เป็นความคิดที่แย่มากจนแทบขำ