เพิ่ม Claude ให้กับ Apple Foundation Models
(platform.claude.com)- เป็นแพ็กเกจ Swift ที่เชื่อมต่อ เฟรมเวิร์ก Foundation Models ของ Apple เข้ากับ Claude ในฐานะโมเดลฝั่งเซิร์ฟเวอร์ ทำให้นักพัฒนาสามารถเรียกใช้ Claude ได้ผ่าน เส้นทางโค้ดเดียวกับโมเดล on-device ของ Apple
- ด้วย โปรโตคอล
LanguageModelที่ Apple เปิดตัวในงาน WWDC 2026 จึงสามารถสร้าง สถาปัตยกรรมแบบไฮบริด ที่เริ่มต้นต้นแบบด้วยโมเดล on-device แล้วส่งต่อเฉพาะงานที่ซับซ้อนไปยังโมเดลคลาวด์ได้ผ่าน API มาตรฐานเพียงตัวเดียว - หัวใจสำคัญคือ ความสามารถในการสลับผู้ให้บริการได้ — สามารถสลับไปมาระหว่าง Apple, Claude และ Gemini ได้โดยไม่ต้องแตะตรรกะของเซสชัน แค่เปลี่ยน dependency ของ Swift Package
- แพ็กเกจนี้ซึ่ง Anthropic เผยแพร่ภายใต้ Apache 2.0 คือ ตัวอย่างแรกที่ใช้งานได้จริง ของแนวคิด “เชื่อมต่อกับแบ็กเอนด์ใดก็ได้”
- คำขอจะส่งจากแอปไปยัง Claude API โดยตรง และ Apple ไม่ได้อยู่ในเส้นทางนั้น จึงมองไม่เห็นพรอมป์ต์หรือคำตอบ และค่าใช้จ่ายก็จะถูกเรียกเก็บกับบัญชี Anthropic โดยตรง
ทำไมเรื่องนี้สำคัญ
- ที่ผ่านมา หากต้องการใส่ language model ลงในแอป iOS นักพัฒนาต้องสมัครใช้คลาวด์ API แยกต่างหาก จัดการคีย์ จ่ายค่าบริการตามโทเค็น และส่งพรอมป์ต์ทั้งหมดออกนอกอุปกรณ์ แต่ในงาน WWDC 2026 Apple ได้เข้ามาแก้ความยุ่งยากที่ค้างคามานานนี้
- เฟรมเวิร์ก Foundation Models ถูกขยายให้รองรับทั้งโมเดล on-device ของ Apple Intelligence, Private Cloud Compute และคลาวด์จากผู้ให้บริการภายนอกอย่าง Claude และ Gemini ผ่าน Swift API แบบเนทีฟเพียงชุดเดียว
- Anthropic ได้เปิดเผยแพ็กเกจ Swift ที่ implement โปรโตคอลใหม่นี้ เพื่อรับช่วงจากโมเดล on-device ของ Apple แล้ว เรียก Claude มาจัดการเวิร์กโฟลว์ที่ซับซ้อนกว่า
สิ่งที่เปลี่ยนไปสำหรับนักพัฒนา
-
สลับผู้ให้บริการได้โดยไม่ต้องแก้โค้ด
- หลังจากสร้างต้นแบบแอปด้วยโมเดล on-device ของ Apple แล้ว การส่งต่อคิวรีที่ซับซ้อนไปยัง Google Gemini หรือ Anthropic Claude หรือสลับไปมาระหว่างกัน สามารถทำได้เพียงอัปเดต dependency ใน Swift Package Manager โดยไม่ต้องแก้ตรรกะของเซสชันหรือโค้ดส่วนอื่นของแอป
- โมเดล on-device เหมาะกับงานที่รวดเร็วและทำภายในเครื่อง เช่น การสรุปหรือการดึงข้อมูล ส่วน Claude จะรับช่วงต่อเมื่อจำเป็นต้องใช้ การให้เหตุผลหลายขั้นตอน การสร้างโค้ด การค้นหาเว็บ หรือการรันโค้ด
- ทั้งสองกรณีใช้ API
LanguageModelSessionเดียวกัน จึงสลับได้เพียงเปลี่ยนอาร์กิวเมนต์model:
-
การส่งต่อแบบอิงชนิดข้อมูล
- เมื่อติดตั้งในโปรเจ็กต์และล็อกอินด้วย Anthropic API key แล้ว หากส่งผลลัพธ์แบบ typed จากโมเดล on-device ของ Apple ต่อไปยังคำขอของ Claude แพ็กเกจจะจัดการการสตรีม การเรียกใช้เครื่องมือ และคำตอบแบบมีโครงสร้างกลับเข้าสู่ SwiftUI view
- ใช้งานได้ง่ายถึงขั้นที่สามารถสร้างค่า Swift แบบ typed กลับมาได้ด้วยโค้ดเพียงสามบรรทัดผ่านการสร้างไกด์
โครงสร้างด้านความเป็นส่วนตัวและค่าใช้จ่าย
- คำขอจะถูกส่งจากแอปไปยัง Claude API โดยตรง ดังนั้น Apple จึงไม่อยู่ในเส้นทางคำขอ และไม่สามารถเห็นพรอมป์ต์หรือคำตอบได้
- การใช้งานจะถูก เรียกเก็บกับบัญชี Anthropic โดยตรง ตามราคา API มาตรฐาน
- แอปเป็นผู้ตัดสินใจเองในแต่ละเซสชันว่าจะใช้ Claude หรือโมเดล on-device ของ Apple
ภาพใหญ่กว่านั้น
- Apple มีแผนจะเปลี่ยน เฟรมเวิร์ก Foundation Models ซึ่งเป็น Swift API แบบเนทีฟสำหรับโมเดล on-device ที่เปิดตัวในปี 2025 ให้เป็นโอเพนซอร์สในช่วงฤดูร้อนนี้ และด้วยโปรโตคอล LanguageModel ใหม่ ไม่ว่าจะเป็นโมเดลของ Apple เองหรือผู้ให้บริการระยะไกล โมเดลแทบทั้งหมดก็จะสามารถ ขับเคลื่อน LanguageModelSession อยู่หลัง Swift API ชุดเดียวกัน
- ในฐานะตัวอย่างของแนวคิด “เชื่อมต่อกับแบ็กเอนด์ใดก็ได้” นั้น ClaudeForFoundationModels ของ Anthropic ได้ทำให้ adapter pattern เป็นรูปธรรม
- Apple ยังใช้ระบบ Dynamic Profiles เพื่อให้แอปสามารถสลับโมเดล เครื่องมือ และคำสั่งได้ระหว่างเซสชัน พร้อมวางตำแหน่งสิ่งนี้เป็นรากฐานของ เวิร์กโฟลว์แบบมัลติเอเจนต์
- อย่างไรก็ตาม การรวมระบบนี้ยังอยู่ในช่วงเบตา โดยต้องใช้ iOS, iPadOS, macOS, visionOS, watchOS 27 และ Xcode 27 และ API อาจมีการเปลี่ยนแปลงก่อนเปิดตัว正式
1 ความคิดเห็น
ความเห็นจาก Hacker News
Apple กำลังทำให้ LLM กลายเป็นสินค้าทั่วไปโดยที่ยัง ควบคุมประสบการณ์ผู้ใช้ เอาไว้
สมกับเป็นบริษัทฮาร์ดแวร์ นี่คือกลยุทธ์ที่จะขายเครื่องที่ดีที่สุดสำหรับการใช้งาน AI ต่อไป และดูเป็นการตัดสินใจที่ดี
คือทุ่มเงินหลายพันล้านดอลลาร์ไปกับโครงสร้างพื้นฐาน แต่สุดท้ายมูลค่ากลับถูกเก็บเกี่ยวโดยบริษัทอื่นที่อยู่ในเลเยอร์ด้านบน
บริษัทที่ไม่ยอมปรับตัวสุดท้ายก็ต้องโดน AI-based DIY web scraper ที่ผู้คนทำขึ้นเล่นงาน จนท้ายที่สุดก็ต้องยอมจำนน
จะบอกว่ากำลังทำให้ LLM กลายเป็นสินค้าทั่วไปก็คงพอได้ แต่นี่เป็นฟีเจอร์ฝั่งผู้ใช้ที่ขัดเกลามาหลายปีแล้ว
นี่เป็น Swift package ที่ทำให้
Apple's Foundation Models frameworkใช้ Claude เป็นโมเดลภาษาแบบฝั่งเซิร์ฟเวอร์ได้สินะ ผมนึกว่าจะเป็นอีกทางหนึ่ง ผมหวังว่าฟีเจอร์เดิมของ Claude Code จะสามารถไปรันแบบโลคัลบน Neural Engine ของโน้ตบุ๊กผมได้ somehowถ้าเป็น M2 กับ RAM 8GB ก็คงเป็นความฝันลม ๆ แล้ง ๆ แต่ก็มีความหวังแวบหนึ่ง
https://developer.apple.com/videos/play/wwdc2026/232/
https://www.youtube.com/watch?v=wykPErJ8M-8
แต่ของจริงที่ได้กลับเป็น Claude ที่ไม่รู้ด้วยซ้ำว่าโฮสต์อยู่ที่ไหน อาจอยู่ในดาต้าเซ็นเตอร์ของ X-AI หรืออยู่ที่ไหนสักแห่งของ Amazon ก็ได้ ไม่มีใครรู้
นี่ไม่ได้มีไว้สำหรับ Claude เท่านั้น นักพัฒนายังสร้างแอปที่เรียกใช้ โมเดล Gemini แบบเซิร์ฟเวอร์ของ Google ได้ด้วย
ในงาน WWDC Apple ประกาศว่าจะเปิด Foundation Models framework ให้ผู้ให้บริการโมเดลคลาวด์จากภายนอกด้วย ตั้งแต่ iOS 27, macOS 27, iPadOS 27, visionOS 27 และ watchOS 27 เป็นต้นไป ผู้ให้บริการโมเดลสามารถ implement
LanguageModelprotocol แบบ public ใหม่ เพื่อให้มีอินเทอร์เฟซกลางสำหรับการทำ model inference ได้ Google เองก็ทำให้โมเดล Gemini ใช้งานใน Foundation Models framework ได้ผ่าน Firebase Apple SDKสิ่งนี้ทำให้ได้ประสบการณ์พัฒนาแบบเนทีฟอย่างสมบูรณ์ โมเดล Gemini ที่โฮสต์บนคลาวด์สามารถเชื่อมต่อเข้ากับ Foundation Models framework โดยตรงผ่าน API ชุดเดียวกัน และเพราะทั้งโมเดลของ Apple บนอุปกรณ์กับโมเดล Gemini บนคลาวด์อยู่หลัง API surface ชุดเดียวกัน จึงสลับระหว่างการ inference แบบโลคัลกับแบบคลาวด์ได้ง่ายตามลักษณะการใช้งาน
https://blog.google/innovation-and-ai/technology/developers-...
language model protocolและก่อนที่เราจะโดนคำเรียกยาวน่ากลัวนี้สาปเอา ทุกคนก็ควรรีบมารวมตัวกันทางนี้ให้ไวยินดีที่ Apple นำการทำ abstraction แบบนี้มาใช้ แต่ความกังวลหลักคือฝั่ง โมเดลบนอุปกรณ์
เช่น ต่อให้อยากใช้ Gemma4 จากมุมมองผู้ใช้ ถ้าแอป 10 ตัวต่างดาวน์โหลดโมเดลเดียวกันแยกกันเอง โทรศัพท์ก็จะบวมโดยไม่จำเป็น
ยังไม่เข้าใจว่า Apple มีวิธีให้หลายแอปใช้โมเดลเดียวกันภายในอุปกรณ์ได้หรือไม่ โดยไม่ต้องพึ่ง namespace หรือกลเม็ดเรื่องสิทธิ์ที่ยุ่งยาก
ยังไม่เห็นอะไรที่บ่งชี้ถึงเรื่องนั้น
ตอนที่โมเดลบนอุปกรณ์ยังตามหลังมาก แนวคิดนี้อาจผิด แต่ในระยะยาวก็อาจยังถูกอยู่
หลายแอปที่ฉันใช้ อาจต้องการ Gemma 4 E4B แต่ผู้ใช้มีแอปเป็นสิบๆ ตัว และนักพัฒนาก็เลือกได้จากโมเดลหลายร้อยตัว ต่อให้ shared cache ช่วยลดพื้นที่ลงได้บ้างเมื่อมีส่วนที่ซ้ำกัน ปัญหาหลักก็ยังอยู่ ถ้าแต่ละแอปเลือกโมเดลกันเอง ทั้งดิสก์และการสลับหน่วยความจำจะระเบิด
มีโอกาสสูงกว่าที่ผู้ผลิตอุปกรณ์ควรฝังค่าเริ่มต้นมาให้ ไม่ได้แปลว่าควรห้ามใช้โมเดลอื่น แต่การมีค่าเริ่มต้นแบบแชร์ร่วมกันหนึ่งตัว อาจเป็นทางเลือกที่ดีที่สุดทั้งสำหรับนักพัฒนาและประสบการณ์ผู้ใช้ใน 99% ของแอป
การที่มันถูกโหลดอยู่ในหน่วยความจำแล้วคือการเพิ่มประสิทธิภาพที่ใหญ่ที่สุด และโมเดลพื้นฐานก็น่าจะถูกทำให้อุ่นพร้อมใช้งานไว้มากกว่ามาก
“โมเดลที่ดีที่สุด” โดยมากก็คือ “โมเดลที่ดีที่สุดสำหรับอุปกรณ์นี้” เมื่อคำนึงถึง RAM และปริมาณการประมวลผล นักพัฒนาไม่อาจทดสอบทุกอุปกรณ์ได้ แต่ Apple ทำได้และคงจะทำ
แต่ละโมเดลต้องถูกปรับแต่งให้เหมาะกับฮาร์ดแวร์ สิ่งสำคัญคืออะไรจะรันบน ANE, Metal, หรือ CPU และโมเดลพื้นฐานจะถูก optimize มาแล้ว
ถ้าต้องการโมเดลแบบปรับเฉพาะ LoRA น่าจะเป็นทางเลือกที่ดีที่สุด ขนาดราว 30MB และยังได้ข้อดีทั้งหมดข้างต้น
จะเถียงก็คงได้ว่าควรให้เปลี่ยนค่าเริ่มต้นได้ แต่แนวคิดนั้นใกล้กับอุดมคติแบบ Linux มากกว่า Apple จึงไม่แน่ใจว่าจะได้เห็นจริงหรือไม่ แถมยังมีข้อเสียจริงด้วย ตั้งใจหรือไม่ก็ตาม prompt มักถูกปรับให้เหมาะกับโมเดลเป้าหมายที่ใช้พัฒนา ดังนั้นถ้าเปลี่ยนโมเดลระบบเริ่มต้น คุณภาพของทุกแอปอาจแย่ลงได้
https://developer.apple.com/videos/play/wwdc2026/339
ชวนให้สงสัยว่า Apple กำลังผลักดันให้นักพัฒนาใช้ LLM ผ่าน ชั้น API abstraction ของตัวเองหรือเปล่า อาจเพื่อให้สลับไปใช้ LLM ของตัวเองได้อย่างราบรื่นเมื่อเปิดตัวในอนาคต
เหมือนเคยได้ยินว่า Apple ทุ่มเงินกับการเทรนอยู่มาก และอาจ somehow เกี่ยวข้องกับ Siri หรือ Apple AI ปัจจุบัน หรืออาจเป็นแค่ฟีเจอร์อำนวยความสะดวกให้นักพัฒนา เลยสงสัยว่ามีเจตนาอื่นไหม
ถ้าให้ความสำคัญกับความเป็นส่วนตัว การให้ Apple เป็นตัวกลางก็มีคุณค่า
แกนของ framework นี้คือการทำให้ใช้ API เดียวกันกับทั้งโมเดลที่มากับอุปกรณ์, โมเดลออนไลน์ที่ Apple โฮสต์อย่าง Private Cloud Computer, หรือ shim ของตัวเองที่เรียกโมเดลออนไลน์ซึ่งโฮสต์ที่ไหนก็ได้
แบบนี้ก็ไม่ต้องสร้างชั้น abstraction เองสำหรับกรณีอย่าง “อันนี้อยากใช้โมเดล local แต่อันนั้นอยากใช้ Claude” หรือผูก integration กับ Anthropic/OpenAI API ตรงๆ แต่สามารถใช้ system API เพื่อ route การเรียกไปยังโมเดลหรือประเภทผู้ให้บริการต่างๆ แบบไดนามิกได้
มันช่วย abstraction เรื่องอย่าง tool calling ไว้ในที่เดียว และมีจุดอำนวยความสะดวกกับความสามารถเฉพาะอีกหลายอย่าง เช่น เปลี่ยนผู้ให้บริการหรือโมเดลแบบไดนามิกระหว่าง session แล้วยังใช้
transcriptเดิมต่อได้API นี้ใช้ได้เฉพาะบนอุปกรณ์ Apple ดังนั้นถ้านักพัฒนาจะทำให้มันทำงานบน iOS ได้ดี ก็ยิ่งมีผลในการแบ่งตลาดด้วยระบบที่ใช้ร่วมกันไม่ได้ และผูกผู้ใช้ให้อยู่ในระบบนิเวศมากขึ้น
ดูเหมือนว่า Apple กำลังเตรียมรับมือกรณีที่ โมเดลบนอุปกรณ์ ของตัวเองดีขึ้น และเมื่อคิดว่าตอนนี้เข้าถึง Gemini ได้แล้วก็สมเหตุสมผล
ถ้านักพัฒนาเขียนโค้ดสำหรับเรียก LLM ภายนอกทั้งหมดผ่านสิ่งนี้ เมื่อโมเดลของ Apple เก่งขึ้นและรองรับ use case ได้กว้างขึ้น ก็จะสลับได้ง่ายที่แต่ละจุดเรียกใช้งาน แล้วประสบการณ์ผู้ใช้ของแอปก็ดีขึ้น และยังลดค่าใช้จ่ายฝั่งการเรียกเก็บของนักพัฒนาที่ Apple ไม่ได้ส่วนแบ่งอีกด้วย
Apple เป็นบริษัท และเราทุกคนก็รู้ว่าบริษัทสนใจอะไร ดังนั้นโลกอุดมคติที่มีโมเดลโลคัลรันอยู่บนมือถือคงเกิดขึ้นได้ยาก
Microsoft กับ Nvidia ไม่ได้จับมือกันโดยไม่มีเหตุผล
สงสัยว่าถ้าเอาไปใช้จริงในซอฟต์แวร์ที่แจกให้ผู้ใช้ จะใช้งานกันอย่างไร การให้ผู้ใช้ไปสร้างและกรอก API key เองเป็นกำแพงที่สูงเกินไปสำหรับประสบการณ์ผู้ใช้ที่ดี
โครงสร้างแบบ “จ่ายเงินโดยไม่รู้ว่าคำถามหนึ่งจะเสียเท่าไร อาจไม่ได้คำตอบที่ต้องการ และถ้าอยากใช้ต่อก็ต้องจ่ายเพิ่ม” ไม่น่าดึงดูดสำหรับคนส่วนใหญ่ที่ไม่ใช่นักพนัน การอธิบายว่าแค่คำว่า “ขอบคุณ” ตอนท้ายบทสนทนายาว ๆ ก็อาจแพงได้เพราะเรื่อง context ยิ่งทำให้ผู้ใช้ทั่วไปยอมรับได้ยากขึ้น
การที่ต้นทุนโทเค็นขึ้น ๆ ลง ๆ เหมือนโยโย่ก็ไม่ได้ช่วยอะไร ผู้ใช้ทั่วไปต้องการต้นทุนคงที่ และไม่อยากเสียพลังงานคอยตามกระแส AI ตลอดเวลา ปัญหาแบบ “เดือนก่อนสมัครแบบเดิมแต่ใช้ได้นานกว่านี้มาก” ก็ไม่ใช่ทิศทางที่ดี
ในกรณีส่วนใหญ่ ผมคิดว่า Apple ตัดสินถูกแล้วที่มองว่า LLM แบบโลคัล คืออนาคต
ผมก็ยังไม่เข้าใจข้อกำหนดของ Anthropic แบบครบถ้วน ยังพิมพ์อะไรอย่าง
setup-token Set up a long-lived authentication token (requires Claude subscription)ได้อยู่ แต่มันดูเหมือนกับดัก ไม่รู้ว่าใครใช้สิ่งนี้ และก็สงสัยว่าถ้าเอาไปใช้ที่ไหนก็ตามจะกลายเป็นผิดข้อกำหนดทันทีหรือเปล่าตอนนี้ใน allihat.com ถ้าไม่อยากใช้คีย์ Claude ก็ให้ใช้โมเดล Apple แบบโลคัลได้ ซึ่งทำให้อัตราเปลี่ยนเป็นผู้ใช้แบบจ่ายเงินเพิ่มขึ้นประมาณ 3 เท่า แต่แน่นอนว่ามันยังไม่ใช่ตัวแทน Claude หวังว่า Apple จะทำกลไกบางอย่างมารับหน้าที่เป็น Claude proxy แทน จะได้ไม่ต้องให้ผมพร็อกซีผ่านเซิร์ฟเวอร์ของตัวเองเพื่อคุมการใช้งาน Claude API
.proxiedเพื่อ route คำขอผ่านแบ็กเอนด์ของตัวเองApple กำลังให้โมเดล AI ฟรีผ่านเซิร์ฟเวอร์ของบริษัทแก่ดีเวลอปเปอร์ที่มียอดดาวน์โหลดต่ำกว่า 2 ล้านครั้ง https://techcrunch.com/2026/06/08/apple-bets-cheaper-ai-will...
เข้าใจว่าวลีที่ว่า “คำขอจะไปจากแอปถึง Claude API โดยตรง และ Apple ไม่ได้อยู่ในเส้นทางของคำขอและไม่เห็นทั้งพรอมป์ต์หรือคำตอบ” เป็นมุมมองของนักพัฒนา
แต่ในมุมผู้บริโภคมันก็ตลกดี
Microsoft เป็นคนทำให้เกมนี้พังเองก่อน โดยใส่ไว้ในข้อกำหนดของ Copilot ว่า “Copilot ให้บริการเพื่อ ความบันเทิง เท่านั้น” และยังใส่คำเตือนใน Copilot for Excel ว่า “หลีกเลี่ยงการใช้ COPILOT กับงานที่ต้องการความถูกต้องหรือทำซ้ำได้ หรืองานที่มีผลกระทบด้านกฎหมาย กฎระเบียบ หรือคอมพลายแอนซ์”
จากนั้น Apple ก็เงียบ ๆ ปฏิเสธที่จะเข้าร่วมแบบเต็มตัวโดยไม่ยอมทุ่มเงินหลายพันล้านถึงหลายหมื่นล้านดอลลาร์เพื่อสร้าง LLM คู่แข่งเอง แน่นอนว่ายังขายต่อ Claude หรืออาศัย Gemini เพื่อคนที่ยังเชื่ออยู่ได้บ้าง แต่ Apple รู้สถานการณ์ดี
https://www.microsoft.com/en-us/microsoft-copilot/for-indivi...
https://support.microsoft.com/en-US/Excel/copilot-function
ตัว coding agent เองก็เป็นชั้นที่ถูกยัดเข้ามาอยู่แล้ว ตอนนี้จะเพิ่มอีกชั้นหนึ่งอีกหรือ? coding agent หลายครั้งก็เหมือน vendor manager ของบริษัทจัดหาคนในยุค 90
สัญญากับลูกค้าทุกอย่างภายใต้ฟ้า แล้วไปไล่บี้ผู้รับเหมาน่าสงสารให้ส่งงาน coding agent ก็กินโทเค็นมากขึ้น 10 เท่า เหมือนส่วนต่างระหว่างเงินที่บริษัทจัดหาคนเก็บจากลูกค้ากับเงินที่จ่ายให้ผู้รับเหมา จากการทดสอบง่าย ๆ งานเดียวกันที่โมเดลเกิน context length เมื่อผ่าน coding agent กลับทำงานได้ดีถ้าพรอมป์ต์ตรง ๆ
ชั้นต่าง ๆ เป็นของฟุ่มเฟือย และทำให้การควบคุมกับความโปร่งใสหายไป