1 คะแนน โดย GN⁺ 3 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เป็นแพ็กเกจ Swift ที่เชื่อมต่อ เฟรมเวิร์ก Foundation Models ของ Apple เข้ากับ Claude ในฐานะโมเดลฝั่งเซิร์ฟเวอร์ ทำให้นักพัฒนาสามารถเรียกใช้ Claude ได้ผ่าน เส้นทางโค้ดเดียวกับโมเดล on-device ของ Apple
  • ด้วย โปรโตคอล LanguageModel ที่ Apple เปิดตัวในงาน WWDC 2026 จึงสามารถสร้าง สถาปัตยกรรมแบบไฮบริด ที่เริ่มต้นต้นแบบด้วยโมเดล on-device แล้วส่งต่อเฉพาะงานที่ซับซ้อนไปยังโมเดลคลาวด์ได้ผ่าน API มาตรฐานเพียงตัวเดียว
  • หัวใจสำคัญคือ ความสามารถในการสลับผู้ให้บริการได้ — สามารถสลับไปมาระหว่าง Apple, Claude และ Gemini ได้โดยไม่ต้องแตะตรรกะของเซสชัน แค่เปลี่ยน dependency ของ Swift Package
  • แพ็กเกจนี้ซึ่ง Anthropic เผยแพร่ภายใต้ Apache 2.0 คือ ตัวอย่างแรกที่ใช้งานได้จริง ของแนวคิด “เชื่อมต่อกับแบ็กเอนด์ใดก็ได้”
  • คำขอจะส่งจากแอปไปยัง Claude API โดยตรง และ Apple ไม่ได้อยู่ในเส้นทางนั้น จึงมองไม่เห็นพรอมป์ต์หรือคำตอบ และค่าใช้จ่ายก็จะถูกเรียกเก็บกับบัญชี Anthropic โดยตรง

ทำไมเรื่องนี้สำคัญ

  • ที่ผ่านมา หากต้องการใส่ language model ลงในแอป iOS นักพัฒนาต้องสมัครใช้คลาวด์ API แยกต่างหาก จัดการคีย์ จ่ายค่าบริการตามโทเค็น และส่งพรอมป์ต์ทั้งหมดออกนอกอุปกรณ์ แต่ในงาน WWDC 2026 Apple ได้เข้ามาแก้ความยุ่งยากที่ค้างคามานานนี้
  • เฟรมเวิร์ก Foundation Models ถูกขยายให้รองรับทั้งโมเดล on-device ของ Apple Intelligence, Private Cloud Compute และคลาวด์จากผู้ให้บริการภายนอกอย่าง Claude และ Gemini ผ่าน Swift API แบบเนทีฟเพียงชุดเดียว
  • Anthropic ได้เปิดเผยแพ็กเกจ Swift ที่ implement โปรโตคอลใหม่นี้ เพื่อรับช่วงจากโมเดล on-device ของ Apple แล้ว เรียก Claude มาจัดการเวิร์กโฟลว์ที่ซับซ้อนกว่า

สิ่งที่เปลี่ยนไปสำหรับนักพัฒนา

  • สลับผู้ให้บริการได้โดยไม่ต้องแก้โค้ด

    • หลังจากสร้างต้นแบบแอปด้วยโมเดล on-device ของ Apple แล้ว การส่งต่อคิวรีที่ซับซ้อนไปยัง Google Gemini หรือ Anthropic Claude หรือสลับไปมาระหว่างกัน สามารถทำได้เพียงอัปเดต dependency ใน Swift Package Manager โดยไม่ต้องแก้ตรรกะของเซสชันหรือโค้ดส่วนอื่นของแอป
    • โมเดล on-device เหมาะกับงานที่รวดเร็วและทำภายในเครื่อง เช่น การสรุปหรือการดึงข้อมูล ส่วน Claude จะรับช่วงต่อเมื่อจำเป็นต้องใช้ การให้เหตุผลหลายขั้นตอน การสร้างโค้ด การค้นหาเว็บ หรือการรันโค้ด
    • ทั้งสองกรณีใช้ API LanguageModelSession เดียวกัน จึงสลับได้เพียงเปลี่ยนอาร์กิวเมนต์ model:
  • การส่งต่อแบบอิงชนิดข้อมูล

    • เมื่อติดตั้งในโปรเจ็กต์และล็อกอินด้วย Anthropic API key แล้ว หากส่งผลลัพธ์แบบ typed จากโมเดล on-device ของ Apple ต่อไปยังคำขอของ Claude แพ็กเกจจะจัดการการสตรีม การเรียกใช้เครื่องมือ และคำตอบแบบมีโครงสร้างกลับเข้าสู่ SwiftUI view
    • ใช้งานได้ง่ายถึงขั้นที่สามารถสร้างค่า Swift แบบ typed กลับมาได้ด้วยโค้ดเพียงสามบรรทัดผ่านการสร้างไกด์

โครงสร้างด้านความเป็นส่วนตัวและค่าใช้จ่าย

  • คำขอจะถูกส่งจากแอปไปยัง Claude API โดยตรง ดังนั้น Apple จึงไม่อยู่ในเส้นทางคำขอ และไม่สามารถเห็นพรอมป์ต์หรือคำตอบได้
  • การใช้งานจะถูก เรียกเก็บกับบัญชี Anthropic โดยตรง ตามราคา API มาตรฐาน
  • แอปเป็นผู้ตัดสินใจเองในแต่ละเซสชันว่าจะใช้ Claude หรือโมเดล on-device ของ Apple

ภาพใหญ่กว่านั้น

  • Apple มีแผนจะเปลี่ยน เฟรมเวิร์ก Foundation Models ซึ่งเป็น Swift API แบบเนทีฟสำหรับโมเดล on-device ที่เปิดตัวในปี 2025 ให้เป็นโอเพนซอร์สในช่วงฤดูร้อนนี้ และด้วยโปรโตคอล LanguageModel ใหม่ ไม่ว่าจะเป็นโมเดลของ Apple เองหรือผู้ให้บริการระยะไกล โมเดลแทบทั้งหมดก็จะสามารถ ขับเคลื่อน LanguageModelSession อยู่หลัง Swift API ชุดเดียวกัน
  • ในฐานะตัวอย่างของแนวคิด “เชื่อมต่อกับแบ็กเอนด์ใดก็ได้” นั้น ClaudeForFoundationModels ของ Anthropic ได้ทำให้ adapter pattern เป็นรูปธรรม
  • Apple ยังใช้ระบบ Dynamic Profiles เพื่อให้แอปสามารถสลับโมเดล เครื่องมือ และคำสั่งได้ระหว่างเซสชัน พร้อมวางตำแหน่งสิ่งนี้เป็นรากฐานของ เวิร์กโฟลว์แบบมัลติเอเจนต์
  • อย่างไรก็ตาม การรวมระบบนี้ยังอยู่ในช่วงเบตา โดยต้องใช้ iOS, iPadOS, macOS, visionOS, watchOS 27 และ Xcode 27 และ API อาจมีการเปลี่ยนแปลงก่อนเปิดตัว正式

1 ความคิดเห็น

 
GN⁺ 3 시간 전
ความเห็นจาก Hacker News
  • Apple กำลังทำให้ LLM กลายเป็นสินค้าทั่วไปโดยที่ยัง ควบคุมประสบการณ์ผู้ใช้ เอาไว้
    สมกับเป็นบริษัทฮาร์ดแวร์ นี่คือกลยุทธ์ที่จะขายเครื่องที่ดีที่สุดสำหรับการใช้งาน AI ต่อไป และดูเป็นการตัดสินใจที่ดี

    • Benedict Evans อาจจะพูดถูกในท้ายที่สุดก็ได้ โมเดล frontier เริ่มดูคล้ายผู้ให้บริการโทรคมนาคมในยุค 90 มากขึ้นเรื่อย ๆ
      คือทุ่มเงินหลายพันล้านดอลลาร์ไปกับโครงสร้างพื้นฐาน แต่สุดท้ายมูลค่ากลับถูกเก็บเกี่ยวโดยบริษัทอื่นที่อยู่ในเลเยอร์ด้านบน
    • จะว่าไปแล้วประเด็นนี้ก็แยกจากเรื่อง การควบคุมประสบการณ์ผู้ใช้ อยู่บ้าง แต่ผมชอบผลลัพธ์ข้อนี้ของ AI มากที่สุด ตลอดหลายสิบปีที่ผ่านมา บริษัทต่าง ๆ สร้างกำแพงล้อมบริการของตัวเองและบังคับให้ใช้ UI แย่ ๆ แต่ในช่วง 12 เดือนที่ผ่านมา จู่ ๆ ทุกอย่างก็มี MCP และใช้งานผ่านอินเทอร์เฟซแชตบนบรรทัดคำสั่งได้
      บริษัทที่ไม่ยอมปรับตัวสุดท้ายก็ต้องโดน AI-based DIY web scraper ที่ผู้คนทำขึ้นเล่นงาน จนท้ายที่สุดก็ต้องยอมจำนน
    • ไม่แน่ใจว่าสำนวน เครื่องที่ดีที่สุดสำหรับการใช้งาน AI จะตรงนักหรือเปล่า เพราะโมเดลพวกนี้ก็ยังรันอยู่ฝั่งเซิร์ฟเวอร์ไม่ใช่หรือ
    • มันชัดเจนมาหลายปีแล้วว่า AI สุดท้ายจะถูกฝังอยู่ในระดับ ระบบปฏิบัติการ และ Apple เองก็รับรู้เรื่องนี้ตั้งแต่ตอนเปิดตัว Apple Intelligence ครั้งแรกแล้ว
      จะบอกว่ากำลังทำให้ LLM กลายเป็นสินค้าทั่วไปก็คงพอได้ แต่นี่เป็นฟีเจอร์ฝั่งผู้ใช้ที่ขัดเกลามาหลายปีแล้ว
    • ตอนนี้ก็เหลือแค่ทำให้ ฮาร์ดแวร์ กลายเป็นสินค้าทั่วไปเท่านั้น
  • นี่เป็น Swift package ที่ทำให้ Apple's Foundation Models framework ใช้ Claude เป็นโมเดลภาษาแบบฝั่งเซิร์ฟเวอร์ได้สินะ ผมนึกว่าจะเป็นอีกทางหนึ่ง ผมหวังว่าฟีเจอร์เดิมของ Claude Code จะสามารถไปรันแบบโลคัลบน Neural Engine ของโน้ตบุ๊กผมได้ somehow
    ถ้าเป็น M2 กับ RAM 8GB ก็คงเป็นความฝันลม ๆ แล้ง ๆ แต่ก็มีความหวังแวบหนึ่ง

    • ดูเซสชัน WWDC นี้ได้เลย แน่นอนว่ามันคงสู้โมเดล frontier ไม่ได้ และ 8GB ก็น้อยเกินไปด้วย แต่ Apple ก็เดโม MLX + OpenCode เอาไว้จริง
      https://developer.apple.com/videos/play/wwdc2026/232/
      https://www.youtube.com/watch?v=wykPErJ8M-8
    • ถ้าใช้ OpenCode หรือ Pi แบบ SSD streaming ในทางเทคนิคก็อาจมีฟังก์ชันครบได้ทั้งหมด แค่จะช้าจนแทบทนไม่ไหว
    • โมเดล frontier สำหรับงานเขียนโค้ด ส่วนใหญ่ดูเหมือนจะต้องใช้พื้นที่ราว 300GB ถึง 1TB ถึงจะใช้งานความสามารถได้ครบ
    • Claude Code สามารถตั้งค่าผ่านตัวแปรสภาพแวดล้อมให้ยิงไปหา endpoint ไหนก็ได้ตามต้องการ ตราบใดที่มี API ที่เข้ากันได้
    • ถ้าคลาวด์นั้นเป็น iCloud ส่วนตัวของผู้ใช้จริง ๆ ก็ดูน่าจะโอเค ถ้าผู้ใช้เป็นคนจ่ายเงินเอง และมันรันอยู่ใกล้กับเซิร์ฟเวอร์ Apple ที่เก็บ iPhotos อยู่แล้ว นี่อาจเป็นวิธีแก้ที่สวยมาก
      แต่ของจริงที่ได้กลับเป็น Claude ที่ไม่รู้ด้วยซ้ำว่าโฮสต์อยู่ที่ไหน อาจอยู่ในดาต้าเซ็นเตอร์ของ X-AI หรืออยู่ที่ไหนสักแห่งของ Amazon ก็ได้ ไม่มีใครรู้
  • นี่ไม่ได้มีไว้สำหรับ Claude เท่านั้น นักพัฒนายังสร้างแอปที่เรียกใช้ โมเดล Gemini แบบเซิร์ฟเวอร์ของ Google ได้ด้วย
    ในงาน WWDC Apple ประกาศว่าจะเปิด Foundation Models framework ให้ผู้ให้บริการโมเดลคลาวด์จากภายนอกด้วย ตั้งแต่ iOS 27, macOS 27, iPadOS 27, visionOS 27 และ watchOS 27 เป็นต้นไป ผู้ให้บริการโมเดลสามารถ implement LanguageModel protocol แบบ public ใหม่ เพื่อให้มีอินเทอร์เฟซกลางสำหรับการทำ model inference ได้ Google เองก็ทำให้โมเดล Gemini ใช้งานใน Foundation Models framework ได้ผ่าน Firebase Apple SDK
    สิ่งนี้ทำให้ได้ประสบการณ์พัฒนาแบบเนทีฟอย่างสมบูรณ์ โมเดล Gemini ที่โฮสต์บนคลาวด์สามารถเชื่อมต่อเข้ากับ Foundation Models framework โดยตรงผ่าน API ชุดเดียวกัน และเพราะทั้งโมเดลของ Apple บนอุปกรณ์กับโมเดล Gemini บนคลาวด์อยู่หลัง API surface ชุดเดียวกัน จึงสลับระหว่างการ inference แบบโลคัลกับแบบคลาวด์ได้ง่ายตามลักษณะการใช้งาน
    https://blog.google/innovation-and-ai/technology/developers-...

    • ประเด็นสำคัญคือ Apple เอา OpenAI-compatible API มาเปลี่ยนชื่อใหม่เป็น language model protocol และก่อนที่เราจะโดนคำเรียกยาวน่ากลัวนี้สาปเอา ทุกคนก็ควรรีบมารวมตัวกันทางนี้ให้ไว
  • ยินดีที่ Apple นำการทำ abstraction แบบนี้มาใช้ แต่ความกังวลหลักคือฝั่ง โมเดลบนอุปกรณ์
    เช่น ต่อให้อยากใช้ Gemma4 จากมุมมองผู้ใช้ ถ้าแอป 10 ตัวต่างดาวน์โหลดโมเดลเดียวกันแยกกันเอง โทรศัพท์ก็จะบวมโดยไม่จำเป็น
    ยังไม่เข้าใจว่า Apple มีวิธีให้หลายแอปใช้โมเดลเดียวกันภายในอุปกรณ์ได้หรือไม่ โดยไม่ต้องพึ่ง namespace หรือกลเม็ดเรื่องสิทธิ์ที่ยุ่งยาก
    ยังไม่เห็นอะไรที่บ่งชี้ถึงเรื่องนั้น

    • คิดว่านั่นแหละคือสิ่งที่ Apple พยายามหลีกเลี่ยง ถ้าต้องการความฉลาดบนอุปกรณ์ แนวคิดที่เสนอคือ “โมเดลที่มีอยู่ในเครื่องแล้วดีที่สุด” และถ้าต้องการอะไรที่เฉพาะเจาะจงกว่านั้น ตัวเลือกที่ดีที่สุดคือ adapter หรือการ fine-tuning/LoRA
      ตอนที่โมเดลบนอุปกรณ์ยังตามหลังมาก แนวคิดนี้อาจผิด แต่ในระยะยาวก็อาจยังถูกอยู่
      หลายแอปที่ฉันใช้ อาจต้องการ Gemma 4 E4B แต่ผู้ใช้มีแอปเป็นสิบๆ ตัว และนักพัฒนาก็เลือกได้จากโมเดลหลายร้อยตัว ต่อให้ shared cache ช่วยลดพื้นที่ลงได้บ้างเมื่อมีส่วนที่ซ้ำกัน ปัญหาหลักก็ยังอยู่ ถ้าแต่ละแอปเลือกโมเดลกันเอง ทั้งดิสก์และการสลับหน่วยความจำจะระเบิด
      มีโอกาสสูงกว่าที่ผู้ผลิตอุปกรณ์ควรฝังค่าเริ่มต้นมาให้ ไม่ได้แปลว่าควรห้ามใช้โมเดลอื่น แต่การมีค่าเริ่มต้นแบบแชร์ร่วมกันหนึ่งตัว อาจเป็นทางเลือกที่ดีที่สุดทั้งสำหรับนักพัฒนาและประสบการณ์ผู้ใช้ใน 99% ของแอป
      การที่มันถูกโหลดอยู่ในหน่วยความจำแล้วคือการเพิ่มประสิทธิภาพที่ใหญ่ที่สุด และโมเดลพื้นฐานก็น่าจะถูกทำให้อุ่นพร้อมใช้งานไว้มากกว่ามาก
      “โมเดลที่ดีที่สุด” โดยมากก็คือ “โมเดลที่ดีที่สุดสำหรับอุปกรณ์นี้” เมื่อคำนึงถึง RAM และปริมาณการประมวลผล นักพัฒนาไม่อาจทดสอบทุกอุปกรณ์ได้ แต่ Apple ทำได้และคงจะทำ
      แต่ละโมเดลต้องถูกปรับแต่งให้เหมาะกับฮาร์ดแวร์ สิ่งสำคัญคืออะไรจะรันบน ANE, Metal, หรือ CPU และโมเดลพื้นฐานจะถูก optimize มาแล้ว
      ถ้าต้องการโมเดลแบบปรับเฉพาะ LoRA น่าจะเป็นทางเลือกที่ดีที่สุด ขนาดราว 30MB และยังได้ข้อดีทั้งหมดข้างต้น
      จะเถียงก็คงได้ว่าควรให้เปลี่ยนค่าเริ่มต้นได้ แต่แนวคิดนั้นใกล้กับอุดมคติแบบ Linux มากกว่า Apple จึงไม่แน่ใจว่าจะได้เห็นจริงหรือไม่ แถมยังมีข้อเสียจริงด้วย ตั้งใจหรือไม่ก็ตาม prompt มักถูกปรับให้เหมาะกับโมเดลเป้าหมายที่ใช้พัฒนา ดังนั้นถ้าเปลี่ยนโมเดลระบบเริ่มต้น คุณภาพของทุกแอปอาจแย่ลงได้
    • นี่เป็นโอกาสดีที่ Apple จะให้ โปรโตคอล universal model ID และพื้นที่จัดเก็บแบบใช้ร่วมกัน เพื่อให้นักพัฒนาลงทะเบียนโมเดลได้
    • ดูที่ “Bring an LLM provider to the Foundation Models framework”
      https://developer.apple.com/videos/play/wwdc2026/339
    • แอปสามารถใช้ โมเดลบนอุปกรณ์ ที่ระบบมีให้ผ่าน framework และ API เดียวกันได้ แต่ยังไม่มีกลไกสำหรับกำจัดความซ้ำซ้อนของโมเดลแบบกำหนดเองข้ามแอป
    • นั่นแหละคือ foundation models ฝั่ง Android เอง AICore ก็คล้ายกัน โดยภายในใช้ Gemma และให้แอปส่งคำถามไปยัง LLM เพื่อรับคำตอบ แทนการ bundle โมเดลของตัวเองมา
  • ชวนให้สงสัยว่า Apple กำลังผลักดันให้นักพัฒนาใช้ LLM ผ่าน ชั้น API abstraction ของตัวเองหรือเปล่า อาจเพื่อให้สลับไปใช้ LLM ของตัวเองได้อย่างราบรื่นเมื่อเปิดตัวในอนาคต
    เหมือนเคยได้ยินว่า Apple ทุ่มเงินกับการเทรนอยู่มาก และอาจ somehow เกี่ยวข้องกับ Siri หรือ Apple AI ปัจจุบัน หรืออาจเป็นแค่ฟีเจอร์อำนวยความสะดวกให้นักพัฒนา เลยสงสัยว่ามีเจตนาอื่นไหม

    • Apple มีวิธีที่ค่อนข้างฉลาดในการปกป้องข้อมูลผู้ใช้ ช่วงหลังฉันต้องทำงานเกี่ยวกับ app tracking และพบว่าการซ่อนรายละเอียดผู้ใช้ไว้ใน cohort ที่ถูกทำให้ไม่ระบุตัวตนด้วย SKAN และ differential privacy ก่อนรายงาน event การติดตามไปยังแพลตฟอร์มภายนอกนั้น ออกแบบมาดีกว่าที่คาด
      ถ้าให้ความสำคัญกับความเป็นส่วนตัว การให้ Apple เป็นตัวกลางก็มีคุณค่า
    • นี่คือการรองรับ framework ใหม่ที่รวมอยู่ใน reality/mac/iPad/watch/tv/iOS 27 และเขาบอกว่าจะเปิดซอร์สภายในปลายปีนี้ จึงน่าจะนำไปใช้ได้แม้ในกรณี deploy Swift ฝั่ง backend
      แกนของ framework นี้คือการทำให้ใช้ API เดียวกันกับทั้งโมเดลที่มากับอุปกรณ์, โมเดลออนไลน์ที่ Apple โฮสต์อย่าง Private Cloud Computer, หรือ shim ของตัวเองที่เรียกโมเดลออนไลน์ซึ่งโฮสต์ที่ไหนก็ได้
      แบบนี้ก็ไม่ต้องสร้างชั้น abstraction เองสำหรับกรณีอย่าง “อันนี้อยากใช้โมเดล local แต่อันนั้นอยากใช้ Claude” หรือผูก integration กับ Anthropic/OpenAI API ตรงๆ แต่สามารถใช้ system API เพื่อ route การเรียกไปยังโมเดลหรือประเภทผู้ให้บริการต่างๆ แบบไดนามิกได้
      มันช่วย abstraction เรื่องอย่าง tool calling ไว้ในที่เดียว และมีจุดอำนวยความสะดวกกับความสามารถเฉพาะอีกหลายอย่าง เช่น เปลี่ยนผู้ให้บริการหรือโมเดลแบบไดนามิกระหว่าง session แล้วยังใช้ transcript เดิมต่อได้
    • ถ้ามองแบบประชดหน่อย หรือจะว่าตามความจริงก็คือ ชั้น abstraction นี้ดูเหมือนเป็นวิธีแบบ Apple ที่ทำให้ผู้ใช้ยกความดีความชอบให้ Apple Intelligence แม้ LLM ตัวจริงจะมาจากบริษัทอื่นก็ตาม
    • เป็นการตีความในด้านมืด แต่ก็ไม่ได้ไร้เหตุผลเสียทีเดียว Apple จะเก็บเงินจากโมเดลที่บริษัทอื่นให้บริการได้ง่ายขึ้น และถ้าอยากทำ ก็อาจรวบรวมข้อมูลจากวิธีที่ผู้ใช้ใช้โมเดล third-party เพื่อสร้างชุดข้อมูลสำหรับเทรนโมเดลของตัวเองได้ด้วย
      API นี้ใช้ได้เฉพาะบนอุปกรณ์ Apple ดังนั้นถ้านักพัฒนาจะทำให้มันทำงานบน iOS ได้ดี ก็ยิ่งมีผลในการแบ่งตลาดด้วยระบบที่ใช้ร่วมกันไม่ได้ และผูกผู้ใช้ให้อยู่ในระบบนิเวศมากขึ้น
    • นักพัฒนามี โมเดลบนอุปกรณ์ ที่ใช้ได้อยู่แล้วผ่าน framework นี้ ส่วน Claude ก็เป็นเพียงอีกหนึ่งโมเดลที่ถูกเพิ่มเข้ามา
  • ดูเหมือนว่า Apple กำลังเตรียมรับมือกรณีที่ โมเดลบนอุปกรณ์ ของตัวเองดีขึ้น และเมื่อคิดว่าตอนนี้เข้าถึง Gemini ได้แล้วก็สมเหตุสมผล
    ถ้านักพัฒนาเขียนโค้ดสำหรับเรียก LLM ภายนอกทั้งหมดผ่านสิ่งนี้ เมื่อโมเดลของ Apple เก่งขึ้นและรองรับ use case ได้กว้างขึ้น ก็จะสลับได้ง่ายที่แต่ละจุดเรียกใช้งาน แล้วประสบการณ์ผู้ใช้ของแอปก็ดีขึ้น และยังลดค่าใช้จ่ายฝั่งการเรียกเก็บของนักพัฒนาที่ Apple ไม่ได้ส่วนแบ่งอีกด้วย

    • พูดอีกแบบคือมันไม่ทำเงิน เลยมีโอกาสเกิดขึ้นต่ำ Apple น่าจะเลือกทำแพ็กเกจ AI กับ AI-lite ใหม่ให้คนสมัครมากกว่า
      Apple เป็นบริษัท และเราทุกคนก็รู้ว่าบริษัทสนใจอะไร ดังนั้นโลกอุดมคติที่มีโมเดลโลคัลรันอยู่บนมือถือคงเกิดขึ้นได้ยาก
    • ไม่เข้าใจว่าการใช้ Gemini จะทำให้ โมเดลบนอุปกรณ์ ดีขึ้นได้อย่างไร
    • ประสบการณ์ผู้ใช้ก็เป็นอีกชื่อหนึ่งของการสร้าง ecosystem และนั่นคือสิ่งที่ Apple ทำได้ดีกว่าคู่แข่งที่สุด แถมยังมีฮาร์ดแวร์ที่เข้ากันได้ด้วย ซึ่งยิ่งไม่เสียหาย
      Microsoft กับ Nvidia ไม่ได้จับมือกันโดยไม่มีเหตุผล
  • สงสัยว่าถ้าเอาไปใช้จริงในซอฟต์แวร์ที่แจกให้ผู้ใช้ จะใช้งานกันอย่างไร การให้ผู้ใช้ไปสร้างและกรอก API key เองเป็นกำแพงที่สูงเกินไปสำหรับประสบการณ์ผู้ใช้ที่ดี

    • กำแพงที่ใหญ่กว่าคือการทำให้ผู้ใช้ทั่วไปที่ไม่ใช่นักพัฒนาเข้าใจ การคิดราคาแบบโทเค็น
      โครงสร้างแบบ “จ่ายเงินโดยไม่รู้ว่าคำถามหนึ่งจะเสียเท่าไร อาจไม่ได้คำตอบที่ต้องการ และถ้าอยากใช้ต่อก็ต้องจ่ายเพิ่ม” ไม่น่าดึงดูดสำหรับคนส่วนใหญ่ที่ไม่ใช่นักพนัน การอธิบายว่าแค่คำว่า “ขอบคุณ” ตอนท้ายบทสนทนายาว ๆ ก็อาจแพงได้เพราะเรื่อง context ยิ่งทำให้ผู้ใช้ทั่วไปยอมรับได้ยากขึ้น
      การที่ต้นทุนโทเค็นขึ้น ๆ ลง ๆ เหมือนโยโย่ก็ไม่ได้ช่วยอะไร ผู้ใช้ทั่วไปต้องการต้นทุนคงที่ และไม่อยากเสียพลังงานคอยตามกระแส AI ตลอดเวลา ปัญหาแบบ “เดือนก่อนสมัครแบบเดิมแต่ใช้ได้นานกว่านี้มาก” ก็ไม่ใช่ทิศทางที่ดี
      ในกรณีส่วนใหญ่ ผมคิดว่า Apple ตัดสินถูกแล้วที่มองว่า LLM แบบโลคัล คืออนาคต
    • จริงมาก ผมทำ allihat.com อยู่ และดูเหมือนว่ายังเป็น Safari extension ตัวเดียวที่คุยกับ Claude ได้โดยตรง แถมก็มีความต้องการพอสมควร แต่ผู้ใช้ต้องใส่ Claude API key เองให้บ้าตาย
      ผมก็ยังไม่เข้าใจข้อกำหนดของ Anthropic แบบครบถ้วน ยังพิมพ์อะไรอย่าง setup-token Set up a long-lived authentication token (requires Claude subscription) ได้อยู่ แต่มันดูเหมือนกับดัก ไม่รู้ว่าใครใช้สิ่งนี้ และก็สงสัยว่าถ้าเอาไปใช้ที่ไหนก็ตามจะกลายเป็นผิดข้อกำหนดทันทีหรือเปล่า
      ตอนนี้ใน allihat.com ถ้าไม่อยากใช้คีย์ Claude ก็ให้ใช้โมเดล Apple แบบโลคัลได้ ซึ่งทำให้อัตราเปลี่ยนเป็นผู้ใช้แบบจ่ายเงินเพิ่มขึ้นประมาณ 3 เท่า แต่แน่นอนว่ามันยังไม่ใช่ตัวแทน Claude หวังว่า Apple จะทำกลไกบางอย่างมารับหน้าที่เป็น Claude proxy แทน จะได้ไม่ต้องให้ผมพร็อกซีผ่านเซิร์ฟเวอร์ของตัวเองเพื่อคุมการใช้งาน Claude API
    • ใน production เขาระบุให้ใช้ .proxied เพื่อ route คำขอผ่านแบ็กเอนด์ของตัวเอง
      Apple กำลังให้โมเดล AI ฟรีผ่านเซิร์ฟเวอร์ของบริษัทแก่ดีเวลอปเปอร์ที่มียอดดาวน์โหลดต่ำกว่า 2 ล้านครั้ง https://techcrunch.com/2026/06/08/apple-bets-cheaper-ai-will...
    • ก็ทำแบบเดิมคือพร็อกซีคำขอผ่าน แบ็กเอนด์ของตัวเอง
    • ไม่ใช่ให้ผู้ใช้ส่ง API key มาให้ เอกสารมีวิธีตั้งค่า backend proxy อยู่แล้ว
  • เข้าใจว่าวลีที่ว่า “คำขอจะไปจากแอปถึง Claude API โดยตรง และ Apple ไม่ได้อยู่ในเส้นทางของคำขอและไม่เห็นทั้งพรอมป์ต์หรือคำตอบ” เป็นมุมมองของนักพัฒนา
    แต่ในมุมผู้บริโภคมันก็ตลกดี

    • ทำไมล่ะ?
  • Microsoft เป็นคนทำให้เกมนี้พังเองก่อน โดยใส่ไว้ในข้อกำหนดของ Copilot ว่า “Copilot ให้บริการเพื่อ ความบันเทิง เท่านั้น” และยังใส่คำเตือนใน Copilot for Excel ว่า “หลีกเลี่ยงการใช้ COPILOT กับงานที่ต้องการความถูกต้องหรือทำซ้ำได้ หรืองานที่มีผลกระทบด้านกฎหมาย กฎระเบียบ หรือคอมพลายแอนซ์”
    จากนั้น Apple ก็เงียบ ๆ ปฏิเสธที่จะเข้าร่วมแบบเต็มตัวโดยไม่ยอมทุ่มเงินหลายพันล้านถึงหลายหมื่นล้านดอลลาร์เพื่อสร้าง LLM คู่แข่งเอง แน่นอนว่ายังขายต่อ Claude หรืออาศัย Gemini เพื่อคนที่ยังเชื่ออยู่ได้บ้าง แต่ Apple รู้สถานการณ์ดี
    https://www.microsoft.com/en-us/microsoft-copilot/for-indivi...
    https://support.microsoft.com/en-US/Excel/copilot-function

  • ตัว coding agent เองก็เป็นชั้นที่ถูกยัดเข้ามาอยู่แล้ว ตอนนี้จะเพิ่มอีกชั้นหนึ่งอีกหรือ? coding agent หลายครั้งก็เหมือน vendor manager ของบริษัทจัดหาคนในยุค 90
    สัญญากับลูกค้าทุกอย่างภายใต้ฟ้า แล้วไปไล่บี้ผู้รับเหมาน่าสงสารให้ส่งงาน coding agent ก็กินโทเค็นมากขึ้น 10 เท่า เหมือนส่วนต่างระหว่างเงินที่บริษัทจัดหาคนเก็บจากลูกค้ากับเงินที่จ่ายให้ผู้รับเหมา จากการทดสอบง่าย ๆ งานเดียวกันที่โมเดลเกิน context length เมื่อผ่าน coding agent กลับทำงานได้ดีถ้าพรอมป์ต์ตรง ๆ
    ชั้นต่าง ๆ เป็นของฟุ่มเฟือย และทำให้การควบคุมกับความโปร่งใสหายไป

    • ถ้าสร้าง coding agent ผมจะไม่ใช้สิ่งนี้