3 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Apple Intelligence ถูกนำมาใช้กับ VoiceOver, Magnifier, Voice Control และ Accessibility Reader เพื่อเสริมความสามารถด้านคำอธิบายภาพ การนำทางด้วยภาษาธรรมชาติ และการช่วยอ่าน
  • VoiceOver และ Magnifier สามารถใช้ Image Explorer และ Live Recognition เพื่อถาม-ตอบเกี่ยวกับสิ่งที่อยู่บนหน้าจอกล้องได้ แต่ไม่ควรพึ่งพาในสถานการณ์ที่มีความเสี่ยงสูง
  • Voice Control รองรับการนำทางบน iPhone และ iPad ด้วยคำสั่งภาษาธรรมชาติ เช่น “tap the purple folder” แทนการต้องระบุป้ายกำกับหรือหมายเลขให้ตรงเป๊ะ
  • สำหรับวิดีโอที่ไม่มีคำบรรยาย จะมี คำบรรยายที่สร้างบนอุปกรณ์ แสดงโดยอัตโนมัติ และจะพร้อมใช้งานบน iPhone, iPad, Mac, Apple TV และ Apple Vision Pro
  • Apple Vision Pro สามารถใช้ การติดตามดวงตา เพื่อควบคุมระบบขับเคลื่อนทดแทนของ Tolt และ LUCI ได้ และ Hikawa Grip & Stand ก็จะวางจำหน่ายทั่วโลกเช่นกัน

กำหนดการเปิดตัวและความเป็นส่วนตัว

  • ฟีเจอร์ใหม่และอัปเดตที่ขับเคลื่อนด้วย Apple Intelligence จะเปิดให้ใช้งานภายในช่วงปลายปีนี้
  • Apple ระบุว่าแม้นำ Apple Intelligence มาใช้กับฟีเจอร์การช่วยการเข้าถึง ก็ยังคงยึดหลัก privacy by design
  • Hikawa Grip & Stand for iPhone จะวางจำหน่ายบน Apple Store ออนไลน์ในสามสีใหม่

การสำรวจข้อมูลภาพด้วย VoiceOver และ Magnifier

  • VoiceOver และ Magnifier จะอธิบายข้อมูลบนหน้าจอและสภาพแวดล้อมรอบตัวได้ละเอียดขึ้นสำหรับผู้ใช้ตาบอดหรือสายตาเลือนราง
  • Image Explorer ใน VoiceOver ใช้ Apple Intelligence เพื่อให้คำอธิบายภาพทั่วทั้งระบบ ไม่ว่าจะเป็นรูปภาพ บิลที่สแกน หรือบันทึกส่วนตัว
  • ด้วยการอัปเดตของ Live Recognition ผู้ใช้ VoiceOver สามารถกด Action button บน iPhone เพื่อถามคำถามเกี่ยวกับสิ่งที่เห็นในช่องมองภาพของกล้องและรับคำตอบได้
  • ผู้ใช้สามารถถามต่อด้วยภาษาของตนเองเพื่อรับข้อมูลภาพเพิ่มเติมได้
  • Magnifier มอบความสามารถช่วยนำทางและคำอธิบายภาพแบบเดียวกันใน อินเทอร์เฟซคอนทราสต์สูง สำหรับผู้ใช้สายตาเลือนราง
  • Magnifier ยังทำงานร่วมกับ Action button และสามารถควบคุมแอปด้วยคำสั่งเสียง เช่น “zoom in”, “turn on flashlight”
  • ไม่ควรพึ่งพา VoiceOver และ Magnifier ในสถานการณ์ที่อาจทำให้คนบาดเจ็บหรือได้รับอันตราย สถานการณ์ความเสี่ยงสูง การนำทางเส้นทาง หรือการวินิจฉัยและรักษาภาวะทางการแพทย์

การป้อนข้อมูลด้วยภาษาธรรมชาติใน Voice Control

  • Voice Control ใช้ Apple Intelligence เพื่อช่วยให้ผู้ใช้ที่มีความบกพร่องทางร่างกายสามารถนำทาง iPhone และ iPad ได้อย่างเป็นธรรมชาติมากขึ้นด้วยเสียงเพียงอย่างเดียว
  • ฟีเจอร์การป้อนข้อมูลแบบยืดหยุ่นใหม่ช่วยให้สั่งงานปุ่มและคอนโทรลบนหน้าจอได้ด้วยการอธิบายเป็นภาษาธรรมชาติ แทนการต้องพูดป้ายกำกับหรือหมายเลขให้ตรงเป๊ะ
  • แนวทางแบบ “say what you see” ใช้ได้ในทุกแอป รวมถึงแอปที่มีเลย์เอาต์เชิงภาพอย่าง Apple Maps และ Files
  • ตัวอย่างคำสั่ง เช่น “tap the guide about best restaurants”, “tap the purple folder” ซึ่งเป็นการอธิบายสิ่งที่เห็นบนหน้าจอโดยตรง
  • ยังอาจช่วยลดอุปสรรคที่เกิดขึ้นเมื่อองค์ประกอบต่าง ๆ ไม่ได้ติดป้ายกำกับสำหรับการเข้าถึงไว้อย่างเหมาะสม
  • Voice Control ที่ขับเคลื่อนด้วย Apple Intelligence จะพร้อมใช้งานในสภาพแวดล้อมภาษาอังกฤษของสหรัฐฯ แคนาดา สหราชอาณาจักร และออสเตรเลีย

Accessibility Reader และคำบรรยายที่สร้างขึ้น

  • Accessibility Reader มอบประสบการณ์การอ่านแบบปรับแต่งได้สำหรับผู้ใช้ที่มีความบกพร่องหลากหลายรูปแบบ ตั้งแต่ภาวะดิสเล็กเซียไปจนถึงสายตาเลือนราง
  • เมื่อใช้ Apple Intelligence ก็จะสามารถจัดการต้นฉบับที่ซับซ้อนมากขึ้น เช่น บทความวิทยาศาสตร์
  • สามารถจัดการข้อความที่มีหลายคอลัมน์ รูปภาพ และตารางได้
  • การสรุปแบบออนดีมานด์ ช่วยให้ผู้ใช้ดูภาพรวมของเอกสารก่อนอ่านรายละเอียด
  • ฟีเจอร์แปลภาษาในตัวแบบใหม่ช่วยให้ผู้ใช้อ่านข้อความในภาษาแม่ของตนได้ โดยยังคงรูปแบบ ฟอนต์ และสีที่กำหนดเองไว้
  • คำบรรยายที่สร้างขึ้น แบบใหม่จะแสดงข้อความถอดเสียงจากเสียงพูดโดยอัตโนมัติในวิดีโอที่ไม่มีแคปชันหรือซับไตเติล
  • รองรับทั้งคลิปที่บันทึกด้วย iPhone วิดีโอที่ได้รับจากเพื่อนและครอบครัว และวิดีโอสตรีมมิงออนไลน์
  • คำบรรยายจะถูกสร้างแบบส่วนตัวด้วย การรู้จำเสียงพูดบนอุปกรณ์ และจะแสดงอัตโนมัติบนวิดีโอที่ไม่มีคำบรรยายใน iPhone, iPad, Mac, Apple TV และ Apple Vision Pro
  • ผู้ใช้สามารถปรับแต่งลักษณะของคำบรรยายได้จากเมนูเล่นวิดีโอหรือใน Settings
  • คำบรรยายที่สร้างขึ้นจะพร้อมใช้งานในสภาพแวดล้อมภาษาอังกฤษของสหรัฐฯ และแคนาดา

การควบคุมรถเข็นไฟฟ้าด้วย Apple Vision Pro

  • ผู้ใช้รถเข็นไฟฟ้าบางรายไม่สามารถขับด้วยจอยสติ๊กได้ ดังนั้นระบบควบคุมการขับเคลื่อนทดแทนอาจเป็นสิ่งจำเป็นต่อการเคลื่อนที่อย่างอิสระ
  • ระบบติดตามดวงตา ที่แม่นยำของ Apple Vision Pro ถูกนำมาใช้เป็นวิธีป้อนข้อมูลที่ตอบสนองได้ดีสำหรับระบบขับเคลื่อนทดแทนที่รองรับ
  • การติดตามดวงตาของ Vision Pro ไม่จำเป็นต้องปรับเทียบบ่อย และทำงานได้ในสภาพแสงที่หลากหลาย
  • ฟีเจอร์นี้จะเปิดตัวในสหรัฐฯ สำหรับระบบขับเคลื่อนทดแทนของ Tolt และ LUCI
  • การรองรับอุปกรณ์เสริมครอบคลุมทั้งการเชื่อมต่อผ่าน Bluetooth และแบบมีสาย โดยการเชื่อมต่อแบบมีสายต้องซื้อ Apple Vision Pro Developer Strap
  • Apple จะเดินหน้าร่วมมือกับนักพัฒนาเพื่อรองรับระบบควบคุมรถเข็นเพิ่มเติมต่อไป
  • ฟีเจอร์นี้และ Apple Vision Pro ถูกออกแบบมาให้ใช้งานในสภาพแวดล้อมที่มีการควบคุม โดยดูข้อมูลเพิ่มเติมได้ที่ support.apple.com/en-us/118507
  • Pat Dolan ผู้ใช้ชีวิตร่วมกับ ALS มานาน 10 ปี กล่าวว่า ทางเลือกในการควบคุมรถเข็นไฟฟ้าด้วยตนเองนั้น “มีค่าเหมือนทอง” สำหรับเขา

Hikawa Grip & Stand for iPhone

  • Hikawa Grip & Stand for iPhone จะวางจำหน่ายทั่วโลกผ่าน Apple Store ออนไลน์ และมีให้เลือกสามสีใหม่
  • เป็น อุปกรณ์เสริม MagSafe ที่ออกแบบโดย Bailey Hikawa ดีไซเนอร์จากลอสแอนเจลิส โดยคำนึงถึงการช่วยการเข้าถึง
  • ในกระบวนการพัฒนา มีผู้ที่มีความบกพร่องหลากหลายรูปแบบซึ่งส่งผลต่อการจับ การออกแรง และการเคลื่อนไหวเข้าร่วมด้วย
  • เป็นกริปและขาตั้งแบบปรับให้เหมาะได้ เพื่อช่วยให้ผู้ใช้ถือ iPhone ได้ในแบบที่เหมาะกับตนที่สุด
  • ความร่วมมือระหว่าง Hikawa และ PopSockets ทำให้อุปกรณ์เสริมแบบปรับให้เหมาะได้นี้พร้อมจำหน่ายทั่วโลกเป็นครั้งแรก
  • ที่ Apple The Grove in Los Angeles จะมีเซสชัน Today at Apple ร่วมกับ Hikawa, Shane Burcaw และ Alex Barone
  • ประเทศที่สามารถซื้อได้ ได้แก่ Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK และ the U.S. โดยสั่งซื้อได้ที่ apple.com

อัปเดตการช่วยการเข้าถึงอื่น ๆ

  • Vehicle Motion Cues ถูกเพิ่มเข้ามาใน visionOS เพื่อช่วยลดอาการเมารถเมื่อใช้ Apple Vision Pro ในฐานะผู้โดยสารบนยานพาหนะที่กำลังเคลื่อนที่
  • Vision Pro รองรับท่าทางใบหน้าเพื่อสั่งการแตะและการทำงานของระบบ
  • Vision Pro ยังเพิ่มวิธีใหม่ในการเลือกองค์ประกอบด้วยสายตาระหว่างใช้ Dwell Control
  • Touch Accommodations มอบวิธีใหม่ในการปรับแต่งการตั้งค่า iOS และ iPadOS ให้เหมาะกับแต่ละบุคคล
  • Made for iPhone hearing aids จะทำให้การจับคู่และ handoff ระหว่างอุปกรณ์ Apple บน iOS, iPadOS, macOS และ visionOS มีความเสถียรมากขึ้น พร้อมปรับปรุงประสบการณ์การตั้งค่า
  • tvOS เพิ่มการรองรับ Larger Text เพื่อให้ผู้ชมที่สายตาเลือนรางสามารถขยายขนาดข้อความบนหน้าจอและอ่านได้ง่ายขึ้น
  • Name Recognition ช่วยให้ผู้ใช้ที่หูหนวกหรือมีปัญหาการได้ยินรับการแจ้งเตือนเมื่อมีคนพูดชื่อของตน และทำงานได้ในมากกว่า 50 ภาษาทั่วโลก
  • API ใหม่สำหรับนักพัฒนาแอปแปลภาษามือ รองรับให้ผู้ใช้เพิ่มล่ามมนุษย์เข้าไปในการโทรวิดีโอ FaceTime ที่กำลังดำเนินอยู่ได้
  • สามารถเชื่อมต่อ Sony Access controller กับ iOS, iPadOS และ macOS ในฐานะเกมคอนโทรลเลอร์ได้
  • บน Sony Access controller ผู้ใช้สามารถปรับแต่งเลย์เอาต์ด้วย thumbstick ปุ่มในตัว 9 ปุ่ม และปุ่มภายนอกหรือสวิตช์เฉพาะทางเพิ่มเติมได้สูงสุด 4 ปุ่ม
  • ผู้ใช้สามารถรวมคอนโทรลเลอร์สองตัวเข้าด้วยกันเพื่อสร้างประสบการณ์การเล่นเกมที่ปรับแต่งได้ลึกยิ่งขึ้น

ภาษาและข้อจำกัดด้านภูมิภาคที่รองรับ

  • Apple Intelligence เปิดให้ใช้งานในสถานะเบต้า โดยรองรับภาษา English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese, Korean
  • ฟีเจอร์บางอย่างอาจไม่พร้อมใช้งานในทุกภูมิภาคหรือทุกภาษา
  • ตรวจสอบความพร้อมใช้งานของฟีเจอร์และภาษา รวมถึงความต้องการของระบบได้ที่ support.apple.com/en-us/121115

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความคิดเห็นจาก Hacker News
  • Apple ชอบแอบใส่เทคโนโลยีใหม่ไว้ในที่ที่ดูธรรมดาเพื่อทดสอบแบบเปิดเผยแต่แนบเนียน ดังนั้นการปล่อย Agentic AI ออกมาในรูปของฟีเจอร์การช่วยการเข้าถึงก็ดูเป็นสไตล์ของ Apple
    Touch Bar ไม่ได้เป็นแค่แถบ OLED ธรรมดา แต่เป็นก้าวแรกสู่การเปลี่ยนผ่าน Mac ไปเป็น Apple Silicon และชิป Apple T1 ใน MacBook ที่มี Touch Bar ปี 2016 ก็เป็นโปรเซสเซอร์ที่ Apple ออกแบบเองทั้งหมดตัวแรกที่เข้าไปอยู่ใน Mac
    มันย้ายหน้าที่อย่างการจัดการพลังงาน พัดลม การพัก/ปลุกเครื่อง การเข้าถึงกล้องและไมค์ และ Secure Enclave สำหรับ Touch ID ออกจากชิปเซ็ต Intel และต่อมา T2 ก็รับผิดชอบทั้งการเข้ารหัส SSD การจัดการเสียง การประมวลผลภาพจากกล้อง และการป้องกันการดัดแปลงขั้นตอนบูต
    iPhone 3G มาพร้อม Liquidmetal SIM ejector tool ซึ่งเป็นโลหะผสมแบบสั่งทำที่แทบจะงอด้วยมือไม่ได้เลย และถึง Apple จะไม่ได้ออกสินค้าที่ใช้โลหะผสมนี้ต่อจากนั้น แต่เกือบ 20 ปีต่อมาก็มีข่าวลือว่าจะใช้โลหะเหลวใน iPhone แบบพับได้
    RealityKit เองก็มีทั้งการสแกน 3D และฟีเจอร์ AR หลายอย่างมาหลายปีก่อนที่ Apple Vision Pro จะออกมาจนความหมายของมันชัดเจน

    • น่าจะตีความเกินไป และดูเหมือนเป็นแค่ ความพยายามที่ทำตลาดไม่สำเร็จ มากกว่า
      คนไม่ชอบ Touch Bar และกว่าจะมีคนมองว่าดีก็อีกหลายปีให้หลัง เมื่อพวกสายเทคเอาไปแฮ็กและปรับแต่งจนได้ฟังก์ชันลึกขึ้น
      การทำเครื่องจิ้มซิมจากโลหะผสมราคาแพงก็ไม่สมเหตุสมผล และ RealityKit กับ Vision ก็ดูเหมือนโซลูชันที่กำลังหาปัญหา โดยตัว Vision เองก็ดูเหมือนกำลังไปไม่รอด
      3D Touch ก็มีปัญหาเรื่องการค้นพบและการใช้งาน และยังมีตัวอย่างแบบนี้อีกเยอะ
    • โมเด็ม ที่ Apple ทำเองตัวแรกก็เริ่มใส่มาจาก iPhone 16e ซึ่งเป็นไลน์ที่ถูกที่สุด
    • “liquid metal” ฟังดูเท่มาก แต่จริง ๆ น่าจะเป็น metallic glass มากกว่า
      วัสดุแบบนี้มีมาหลายสิบปีแล้ว แต่กลับดูเหมือนจะกลายเป็นคำพ้องกับแบรนด์ Apple ไปโดยพฤตินัย ซึ่งผมไม่ค่อยชอบเท่าไร
      ที่มันไม่ค่อยถูกใช้ก็หลัก ๆ เพราะแพงมาก แต่ถ้าอยู่ในจุดที่มีความต้องการชิ้นส่วนหลายสิบล้านชิ้นแบบ Apple ก็ทำให้คุ้มทุนได้ง่ายกว่ามาก
    • สงสัยว่า “LiquidMetal” มันดีกว่า โลหะผสมอะลูมิเนียม ที่ดี ๆ จริงหรือเปล่า
    • แว่นอัจฉริยะของ Apple ที่น่าจะมาเร็ว ๆ นี้อาจให้ ประสบการณ์ผู้ใช้ ที่ดีกว่าในแทบทุกสถานการณ์ในวิดีโอที่ผู้ใช้ต้องยก iPhone ขึ้นมา
      ผมอ่านมาว่าเวลาอัดวิดีโอหรือถ่ายรูป เลนส์จะติดไฟหรือกะพริบให้เห็นชัดกว่า Meta ซึ่งอาจช่วยเรื่องความเป็นส่วนตัวได้ และอย่างน้อยมันก็ไม่ใช่ Meta
      ผมชอบแว่นอัจฉริยะของ Meta นะ แต่สองคู่ที่มีพังหมดแล้ว และก็ไม่มีร้านให้รับบริการ เลยคิดว่าถ้า Apple ออกมาก็คงเปลี่ยนทันที
  • ในมุมของนักพัฒนา API การช่วยการเข้าถึง ระดับระบบปฏิบัติการของ Apple นั้นดีมากจริง ๆ
    จุดที่มันพังคือรอยต่อระหว่าง WebKit ที่ถูกฝังอยู่ในแอปเนทีฟ
    ผมเคยปล่อยแอป Tauri ที่ใส่ Monaco editor ไว้ใน WKWebView และกว่าจะรู้ก็เหนื่อยมากว่าโหมด accessibilitySupport: auto ของ VoiceOver ไปทำให้การเลือกข้อความย้อนหลังของ Monaco พังแบบเงียบ ๆ
    ต้องตั้งเป็น "off" ถึงจะเลือกข้อความได้ถูกต้อง สุดท้ายเลยต้องเลือกระหว่างการเลือกข้อความที่ใช้งานได้จริงกับการรองรับ VoiceOver และคำตอบก็คือเลือกความสามารถในการเลือกข้อความ
    มันแข็งแรงใน AppKit/UIKit แต่พอมาถึง ขอบเขตของ WebView ที่ฝังมา ซึ่งเป็นที่ที่แอปเดสก์ท็อปยุคนี้ส่วนใหญ่อยู่จริง ๆ มันกลับพัง

  • เมื่อก่อนผมเคยสมัคร Be My Eyes ในฐานะคนที่มองเห็นได้
    ไม่ได้มีสายเข้าเยอะอย่างที่คาดไว้ แต่ก็ดีที่ได้ช่วยอยู่สองสามครั้ง
    เคยอ่านซองจดหมายให้บ้าง อ่านขวดยาให้บ้าง แล้วก็มีครั้งหนึ่งที่ผู้ชายตลก ๆ สองคนกำลังนั่งอยู่บนเก้าอี้นุ่มตัวใหญ่ พร้อมถุงช้อปปิ้งที่เต็มไปด้วยกล่องซีเรียล และอยากรู้ว่าแต่ละกล่องคืออะไร
    จำได้ว่าหนึ่งในนั้นเกลียดชนิดหนึ่งเป็นพิเศษ
    แอปนี้มีฟีเจอร์แปลกดีที่คนมองเห็นสามารถเปิดกล้องของผู้พิการทางสายตาได้
    https://www.bemyeyes.com

    • ผมยังติดตั้งแอป Be My Eyes ไว้อยู่ แต่ไม่ได้รับสายมานานกว่าหนึ่งปีแล้ว ซึ่งดูเหมือนเป็นหลักฐานว่า โมเดล AI ด้านการมองเห็น เก่งขึ้นมาก
      ผมคิดว่ามันเจ๋งดีที่ AI ทำงานได้ดีพอให้ผู้พิการทางสายตาแก้ปัญหาของตัวเองได้
      ถึงอย่างนั้น การได้ช่วยเรื่องเล็ก ๆ สุ่ม ๆ ของคนแปลกหน้าก็ให้ความรู้สึกที่เป็นมนุษย์และดีมาก
      ผมยังจำได้ดีถึงหญิงชราคนหนึ่งที่ทำบลูเบอร์รี่หกเต็มพื้นครัว และผมช่วยบอกทิศทางให้จนเก็บครบหมด
      มันเป็น 10 นาทีที่ได้เชื่อมต่อกับคนแปลกหน้าและทำอะไรสนุก ๆ ร่วมกัน และผ่านไป 4 ปีก็ยังเป็นความทรงจำอบอุ่นอยู่
    • เท่าที่ทราบ หลังจาก Be My Eyes เพิ่ม ฟีเจอร์ AI เข้าไป ความต้องการอาสาสมัครก็ลดลงมาก
      ในฐานะคนตาบอดสนิท ผมเริ่มใช้แอปนี้หลังมี AI เพิ่มเข้ามา และมันทำงานได้ดีมากสำหรับการอ่านฉลากอาหารหลังจากเด็ก ๆ ย้ายของไปมา หรือเช็กว่าทีวียังเปิดอยู่ไหม
      ถ้ายังอยู่คนเดียวก็คงใช้ฟีเจอร์อาสาสมัครด้วย แต่ตอนนี้ไม่ได้อยู่ลำพังแล้ว
    • คนที่อยากช่วยมีมากกว่าคนที่ต้องการความช่วยเหลืออยู่แล้วมาก
      ก็เป็นเรื่องดีนะ ไม่ได้จะบ่นอะไร แต่ผมสมัครไว้เมื่อหลายปีก่อนแล้วไม่เคยมีสายเข้าเลย สุดท้ายก็ลบไป
    • สงสัยว่าใครเป็นคนโทรมา เป็นผู้พิการทางสายตาหรือเปล่า?
  • สิ่งหนึ่งที่ Apple ควรทำให้ดีจริง ๆ คือ speech-to-text
    เรื่องการช่วยการเข้าถึงทำมาหลายอย่างได้ดี แต่การถอดเสียงพูดรู้สึกว่าตามหลังอยู่ไม่ใช่ 10 ปีก็อย่างน้อย 5 ปี
    การพิมพ์บน iPhone ตอนนี้แย่มาก
    การป้องกันการแตะด้วยฝ่ามือแย่ลงกว่าสมัยก่อนชัดเจนจนพิมพ์ผิดบ่อยขึ้น และอัลกอริทึมแก้อัตโนมัติก็ดูแย่ลงจนชอบไปเปลี่ยนคำที่อยู่ถัดไปอีกหลายคำจากตำแหน่งที่ผมกำลังพิมพ์
    การรู้จำเสียงก็ไม่ได้ดีขึ้น และตัวรูปแบบของโทรศัพท์เองก็ทำให้นิ้วล้า
    อยากให้การใช้ iPhone ไม่ใช่เรื่องทรมาน

    • Wispr Flow เป็นกรณีตัวอย่างของ speech-to-text ที่ดีมาก
      ถ้าเทียบกันแล้ววิธีของ Apple ให้ความรู้สึกเหมือนของจากศตวรรษก่อน
      text-to-speech ของ Apple ก็เหมือนกัน ในเมื่อ ElevenLabs กับ OpenAI นำไปไกลกว่ามากแล้ว
      สิ่งที่ต้องการคือให้ iPhone รองรับเรื่องพวกนี้แบบเนทีฟด้วยคุณภาพเดียวกัน เพราะในระบบนิเวศปิดของ Apple ถ้าไม่เป็นแบบนั้นก็จะใช้ได้ไม่ทั่วทุกที่
    • จนกว่า Siri จะสามารถจัดการคำสั่ง “Navigate to ” โดยใช้แผนที่ที่โหลดออฟไลน์ไว้ล่วงหน้าได้อย่างน่าเชื่อถือ ผมก็จะมองการทำ speech-to-text หรือฟีเจอร์สนทนาที่ซับซ้อนกว่านี้ว่าเป็นภาพลวงตาทั้งหมด
      เมื่อวานผมเพิ่งเจอ “ฟีเจอร์” การป้อนข้อมูลสุดห่วยของ iPhone อีกอย่าง
      ถ้ากำลังเลื่อนดูรายการในแอป CarPlay ของบุคคลที่สามและกำลังจะแตะเลือก แต่ดันเหยียบคันเร่งก่อน รายการจะถูกตัดให้เหลือแค่ไม่กี่รายการและเลื่อนกลับไปด้านบนสุด
      ช่างเป็นวิธีที่ยอดเยี่ยมในการลดสิ่งรบกวนระหว่างขับรถสินะ คราวหน้ารถขยับแล้วจุดหมายบนแผนที่จะเปลี่ยนด้วยไหม?
      อยากให้มีการนำงานวิจัยด้านปฏิสัมพันธ์มนุษย์-คอมพิวเตอร์มาใช้ให้กว้างกว่านี้ และผมคิดว่าถ้าระบบนิเวศรถยนต์/CarPlay ทำอะไรโง่ ๆ แบบนี้ก็ควรต้องรับผิดในศาล
      ผมเคยขับรถคันหนึ่งที่ทุกครั้งจะต้องซ่อนกล้องถอยหลังไว้หลังคำเตือนทางกฎหมาย และคงมีคนเดินถนนอย่างน้อยหนึ่งคนที่ถูกรถถอยชนในช่วงที่หน้าจอนั้นยังแสดงอยู่
      ผู้ผลิตควรต้องรับผิดชอบ 100% ต่อการตัดสินใจด้าน UI ที่แย่แบบนั้น
    • สิ่งที่ช่วยได้มากกับการแก้คีย์บอร์ด iPhone คือ ปิด Slide to Type
      ผมก็ได้ทริกนี้จาก HN เหมือนกัน
      เปิดแอป Settings แตะ General แล้วเลื่อนลงไปที่ Keyboard จากนั้นปิด Slide to Type
    • iPhone ทำให้ผมรู้สึกเหมือนตัวเองโง่ทุกวันทั้งวัน
      ผมต้องคอยแก้แทบจะทุกอีกหนึ่งคำ ไม่ว่าจะเป็นคำที่ผมพิมพ์จริง ๆ หรือคำที่ iPhone คิดว่าผมพิมพ์
      และระหว่างที่แก้ autocorrect ก็ยังสร้างคำผิดใหม่ที่ยิ่งไม่เข้าใจเข้าไปอีก
      บางครั้งมันไปถึงระดับความบ้าคลั่งแบบ ความฝันเพ้อจากไข้ ที่ทำให้ทำเรื่องธรรมดา ๆ ไม่ได้
      ที่แย่ที่สุดคือเมื่อก่อนมันเคยดี
      ตอนใช้ iPhone 4S ผมพิมพ์ได้เกือบเร็วและแม่นเท่ากับใช้คีย์บอร์ดเต็มรูปแบบ
    • ผมไม่คิดว่าด้านนี้ดีขึ้นมากนักตั้งแต่ Colin Hughes สรุปปัญหาของ Voice Control ไว้เมื่อหลายปีก่อน
      https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
      อย่างน้อยก็อยากให้แก้บั๊กใหญ่สองอย่าง
      แม้ในที่ที่รองรับ การป้อนข้อมูลก็ยังล้มเหลวแบบสุ่ม และแอปของบริษัทใหญ่จำนวนมากอย่าง OneNote ก็ไม่รองรับการป้อนด้วยการบอกตามเลย
      ในกรณีแบบนี้อย่างน้อยก็ควรมีทางเลือกสำรองเหมือน Dragon Dictate เมื่อหลายสิบปีก่อน
      การใช้ตัวพิมพ์ใหญ่ก็ยังสุ่มอยู่และยังมีข้อผิดพลาดอีกมากที่ต้องแก้
      ดูเหมือน Apple จะมองการช่วยการเข้าถึงเป็นวัตถุดิบสำหรับข่าวประชาสัมพันธ์มากกว่าจะเป็นฟีเจอร์จริง
  • เกร็ดน่าสนใจ: วิดีโอนี้ถูกทำให้เข้าถึงได้สำหรับคนที่มองเห็น
    ถ้าเป็นคนตาบอดจริง ๆ ไม่มีใครฟังเสียงพูดความเร็วระดับนั้นหรอก และถ้าคุณดูคนตาบอดใช้คอมพิวเตอร์ คุณจะทึ่งกับความสามารถในการฟังเสียงที่เร็วเกินจินตนาการ

    • https://youtu.be/wKISPePFrIs?si=ahGfFp0U7-pTU9w6&t=43
      ตัวอย่างที่ผมหยิบมาบ่อยคือวิดีโอนี้ที่ Saqib Shaikh วิศวกรซอฟต์แวร์ผู้พิการทางสายตาของ Microsoft พูดเกี่ยวกับ Visual Studio
      ลิงก์ตั้งเวลาไว้ตรงช่วงนั้นแล้ว
    • นานมาแล้วผมเคยทำงาน IT ที่ศูนย์ชุมชน และผู้อำนวยการศูนย์เป็นผู้พิการทางสายตา
      ผมทึ่งมากกับความเร็วที่ โปรแกรมอ่านหน้าจอ ของเขาอ่านเนื้อหา และสำหรับผมมันฟังไม่ออกเลย
      ประสิทธิภาพในการใช้คีย์ลัดของเขาทำให้แม้แต่สาย elite ของ vim/emacs ยังน่าอาย
    • น่าจะเพราะมันเป็นโฆษณา
      เสียงหุ่นยนต์ที่เร็วมากอาจฟังหยาบและน่ารำคาญพอสมควร และแม้แต่คนตาบอดที่พึ่งมันใช้งาน บางครั้งก็รู้สึกถูกกระตุ้นมากเกินไปได้
    • ใช่ ไม่ใช่แค่เร็ว แต่บ่อยครั้งยังเป็น เสียงแบบหุ่นยนต์ มาก ๆ ด้วย จนคนที่มองเห็นจำนวนมากยังฟังที่ 1.5x ไม่รู้เรื่อง
      ผมเคยอ่านเรื่องคนตาบอดที่เรียนรู้การระบุตำแหน่งด้วยเสียงสะท้อน มันดูเหมือนพลังพิเศษที่เจ๋งมากจนผมอยากลองถอดจอออกสักวันและเรียนรู้การใช้เครื่องมือให้ถูกทาง
      คนตาบอดที่ผมเคยทำงานด้วยเมื่อหลายปีก่อนปิดหน้าจอตลอดเวลา ทำให้แบตเตอรี่โน้ตบุ๊กอยู่ได้นานเกือบสองเท่าของคนอื่น แค่นั้นก็เป็นฟีเจอร์ที่ดีแล้ว
      ต่อให้ไม่ถึงขั้น echolocation ระดับสุดยอด แค่ทำได้ครึ่งหนึ่งก็น่าจะเจ๋ง และยังได้โบนัสคือสามารถทำ QA การเปลี่ยนแปลงด้าน accessibility ได้จริงด้วย
    • เมื่อ 20 ปีก่อนผมรับสายซัพพอร์ตเทคนิคระดับ 1 และใช้เวลาประมาณ 3.2 วินาทีก็รู้ว่าคนที่โทรมาเป็นผู้พิการทางสายตา และก็รู้ทันทีด้วยว่า โปรแกรมอ่านหน้าจอ ที่เขาใช้ทำให้เรื่องนี้ไม่ใช่อุปสรรคต่อการใช้คอมพิวเตอร์เลย
  • นี่ดูเป็นการใช้งาน LLM ที่มีประโยชน์จริง
    อยากให้บริษัทต่าง ๆ โฟกัสมากขึ้นว่ามันจะช่วยคนได้อย่างไร แทนที่จะใช้คำว่าประสิทธิภาพการทำงานมาแทนการแทนที่คนหรือบีบเค้นคนให้มากที่สุด

    • ผมคิดว่าควรรอดูไปก่อนจนกว่ามันจะไปอยู่ในมือของคนที่ได้ประโยชน์จริง
      ประสบการณ์ของผมมีแค่กับพ่อแม่สูงอายุที่สายตาแย่ลง แต่ถ้าตั้งขนาดตัวอักษรตามที่ Apple อนุญาต โทรศัพท์จะอ่านไม่ได้เลย
      ข้อความล้นออกนอกจอในทุกแอป ไม่ว่าจะเป็นแอปของ Apple เองหรือแอปภายนอก
      ในตัวอย่างบิล มันบอกให้ผู้ใช้ตรวจสอบกับผู้ให้บริการ แต่ผมไม่เข้าใจว่าทำไมไม่โทรไปยังหมายเลขที่อยู่บนบิลให้เลย
      แทนที่จะบอกให้ใช้ text detection ทำไมไม่ทำให้เสร็จไปเลย? ถ้าเป็น Apple Intelligence ก็น่าจะมีความสามารถนั้นอยู่แล้ว
      ผมกังวลว่ามันอาจเป็นได้แค่ ฟีเจอร์หลอกตา ที่ทำให้ดูดี
      เสริมนิดว่า ตัวด้ามจับดูดีนะ และหวังว่าจะไม่บวก Apple tax เข้าไปด้วย
    • นี่คือสิ่งที่ Apple ทำได้ดีที่สุด
      มองความก้าวหน้าของอุตสาหกรรมใหม่ในฐานะ เทคโนโลยี ไม่ใช่ตัวผลิตภัณฑ์เอง
      AI จะไม่ใช่ตัวผลิตภัณฑ์ แต่จะเป็นฟีเจอร์ที่ช่วยยกระดับประสบการณ์ของลูกค้า
    • เห็นด้วย แม้มองจากคนนอกก็ยังดูว่าพื้นที่นี้มีศักยภาพสูงมาก
      เพียงแต่หวังจริง ๆ ว่าปัญหานี้ในโพสต์ก่อนหน้า (https://news.ycombinator.com/item?id=48178378) จะไม่แพร่หลายจนทำให้ฟีเจอร์ที่มีประโยชน์แบบนี้เสี่ยงอันตราย
      ในระยะสั้นดูไม่น่าเป็นไปได้มาก แต่เมื่อ use case เพิ่มขึ้น ผู้ไม่หวังดีก็จะเพิ่มขึ้นด้วย
    • มันทำงานผ่านเซิร์ฟเวอร์หรือเปล่า? กำลังฝากชีวิตไว้กับ iPhone หรือกำลังเชื่อ ดาต้าเซ็นเตอร์ กันแน่?
    • พูดตรง ๆ เลยนะ ก็ลองเทียบดูว่าบริษัทจะหาเงินได้มากแค่ไหนจากการช่วยคนตาบอด กับได้มากแค่ไหนจากการแทนที่นักพัฒนาซอฟต์แวร์และนักวิเคราะห์การเงิน
      การที่ Apple ใช้เทคโนโลยีนี้ช่วยคนที่ต้องการความช่วยเหลือเป็นเรื่องที่ควรชื่นชม
      แต่ก็ไม่จำเป็นต้องแกล้งทำเป็นไม่รู้ว่าทำไมบริษัทส่วนใหญ่ถึงไม่ขุดลงมาทางนี้
      เอาจริง ๆ ทุกคนก็รู้เหตุผลนั้นดีอยู่แล้ว และเรื่องแบบนี้ก็มักถูกปล่อยให้เป็นหน้าที่ของ “ใครสักคน” ที่เลือนรางเสมอ
  • ดูเหมือนทุกคนจะข้ามส่วนนี้ไป แต่ การควบคุมด้วยสายตา สำหรับรถเข็นไฟฟ้าดูน่าสนใจมาก
    อาจเป็นแค่ผมคนเดียวที่คิดแบบนี้ หรือมันอาจเป็นไอเดียเก่ามากแล้วก็ได้
    VR แบบเต็มรูปแบบอาจยังไปไม่สุด แต่ก็ทำให้ผมสงสัยอยู่เรื่อย ๆ ว่าจะมีตลาดสำหรับอุปกรณ์ที่เบาและบางลงกว่านั้นไหม
    ถ้ามันย่อมาอยู่ในขนาดแว่นธรรมดาได้ ผมอาจสนใจอุปกรณ์ควบคุมด้วยสายตา
    ถ้ามีระบบ HUD ก็ยิ่งสนใจมากขึ้น และถึงจะเป็นระดับพื้นฐานมาก ๆ ที่แสดงแค่สัญลักษณ์ไม่กี่อย่างก็ยังดี
    ถ้ามีเสียงพื้นฐานมาด้วยก็ดีขึ้นอีก แต่การคง รูปทรงแว่นปกติ ไว้สำคัญกว่าทั้ง HUD หรือเสียง

    • เทคโนโลยีนี้มีมาสักพักแล้ว
      ถ้าตามลิงก์ที่อ้างอิงไปก็จะเห็นตัวอย่างอย่าง https://www.tolt.tech
      สิ่งที่น่าสนใจคือ Apple เอามันมา ผนวกรวม ไว้ในระบบปฏิบัติการ
    • มันดูเป็นสัญญาณที่ค่อนข้างแรงว่าแว่น AR ยังอยู่ระหว่างการพัฒนา
      ให้ความรู้สึกเหมือนเป็นหนึ่งในฟีเจอร์ที่ Apple ปล่อยออกมาขัดเกลาก่อนฮาร์ดแวร์จริงจะพร้อม
  • ยอดชำระรวมของบิลนี้คือ $83.89 โปรดยืนยันกับผู้ให้บริการสาธารณูปโภคก่อนชำระเงิน หรือใช้ Text Detection เพื่อตรวจสอบจำนวนนี้

    1. ใช้ AI หาเงินในบิล
    2. โทรหาคนที่เรียกเก็บเงินเพื่อถามว่าเรียกเก็บเท่าไร
    3. จ่ายตามยอดที่ถูกเรียกเก็บ
    • แค่ได้ข้อมูลทันทีแล้วค่อยไปยืนยันทีหลังก็ยังมีประโยชน์อยู่ดี
      การขอให้คนที่ไว้ใจได้ช่วยอ่านตัวเลขให้ อาจดีกว่าการโทรหาบริษัท แต่ไม่ใช่ทุกคนที่จะมีทางเลือกนั้น
    • ถ้าจ่ายบิลเดิมอยู่หลายเดือน คุณก็มักจะรู้คร่าว ๆ อยู่แล้วว่าค่ามือถือควรอยู่ประมาณเท่าไร ดังนั้นคงไม่ต้องทำแบบนั้นทุกครั้ง
      ข้อความนั้นก็เป็นสิ่งที่ต้องใส่ไว้ตามธรรมชาติ คล้ายกับที่ ChatGPT เขียนไว้ท้ายข้อความว่า “โปรดตรวจสอบทุกอย่างที่เราบอกคุณ”
    • ผมเดาว่าการโทรหาฝ่ายบริการลูกค้าน่าจะน่าหงุดหงิดสำหรับผู้พิการไม่แพ้ใครคนอื่น หรืออย่างน้อยก็มากพอ ๆ กัน
    • ถ้ามันจำบิลนั้นไว้ได้สัก 60 วัน แล้วบอก เปอร์เซ็นต์การเปลี่ยนแปลง เทียบกับบิลก่อนหน้าด้วยก็น่าจะมีประโยชน์
      เช่น “ยอดชำระรวมของบิลนี้คือ $83.89 ซึ่งสูงกว่าบิลของบริษัทเดียวกันเมื่อเดือนก่อน 4%”
  • เสียดายที่ Apple ลบคำบรรยายหน้าจอ “the Apple logo” ออกจากเวอร์ชันโฆษณาบน YouTube
    https://www.youtube.com/watch?v=B3SmsSCvoss
    ผมคิดว่าส่วนนั้นทำให้โฆษณาโดดเด่น

    • เปลี่ยนภาษาเสียงเป็น "English descriptive" ได้
  • พูดตามตรง ในฐานะคนตาบอดและเป็นนักพัฒนาที่ตาบอดด้วย ฟีเจอร์ส่วนใหญ่พวกนี้ก็ดูน่าตื่นเต้นได้ไม่มากนัก
    แอปภายนอกอย่าง Seeing AI, Envision AI, BeMyEyes, Aira ทำสิ่งเหล่านี้ได้เกือบทั้งหมดอยู่แล้ว
    ดังนั้นอย่างดีที่สุดก็คงเป็นแค่การทำสิ่งที่แอปเหล่านั้นทำได้ให้เร็วขึ้นและอยู่บนอุปกรณ์ ซึ่งก็อาจหมายถึงแม่นยำน้อยลงด้วย ต้องรอดู
    ตลอดเวลาที่ผ่านมา VoiceOver ซึ่งเป็นโปรแกรมอ่านหน้าจอของ macOS แทบถูกปล่อยไว้ในโหมดบำรุงรักษา และผู้ใช้ต้องสร้างทางแก้ของบุคคลที่สามที่น่าทึ่งพอสมควรขึ้นมาเองเพื่อเพิ่มฟีเจอร์ที่โปรแกรมอ่านหน้าจอฝั่ง Windows มีมานานแล้ว
    จากมุมมองนั้น ทุกอย่างนี้จึงดูค่อนข้างเป็นการโชว์ แต่ก็อาจทำให้ผมแปลกใจในทางที่ดีก็ได้
    สิ่งที่พอทำให้คาดหวังเล็กน้อยคือการปรับปรุง Voice Control
    เพราะการต้องเดาชื่อเชิงโปรแกรมของปุ่ม หรือคอยใช้กริดตัวเลขเพื่อเล็งองค์ประกอบนั้นไม่น่าสนุกเลย
    เรื่องความเร็วเสียงนั้น การจะเร่งให้เร็วมากต้องฝึกพอสมควร และแม้แต่การเปลี่ยนเสียงก็ต้องปรับตัวใหม่ระดับหนึ่ง
    เสียงที่ดู “เป็นมนุษย์” มากกว่ามักตามไม่ทันเมื่อเปิดที่ความเร็วสูงมาก ดังนั้นหลายคนจึงชอบเสียงที่เป็นหุ่นยนต์กว่าแต่สม่ำเสมอ และยังไม่ค่อยมั่นใจกับ AI-based TTS
    เสียงแบบนี้มักพังเมื่อเพิ่มความเร็วการพูดเกินระดับหนึ่ง
    ประเด็นเรื่องต้องรอการตัดสินจากผู้ใช้จริงสำคัญมากจริง ๆ
    บริษัทและคนจำนวนมากขึ้นเรื่อย ๆ พูดเรื่อง accessibility สร้างโซลูชัน accessibility และเทศนาเรื่อง AI เพื่อ accessibility โดยไม่เคยคุยกับคนที่พวกเขาบอกว่ากำลังช่วยเลยสักครั้ง
    แบบนี้แทบจะแน่นอนว่าจะเกิดความผิดพลาด และในกรณีแย่ ๆ มันอาจทำร้ายมากกว่าช่วย
    ถ้าจะทำ accessibility ให้ดีจริง รวมถึงผลิตภัณฑ์ AI ด้วย ต้องจ้างคนที่มี lived experience จริง
    ไม่อย่างนั้นผลลัพธ์ก็จะออกมาเป็นข้อความที่แปลด้วยเครื่อง ระบบความปลอดภัยกันแฮ็กได้ด้วยคลิกเดียว หรือ AI coffee bar ที่สั่งถุงมือยางมาหลายพันชิ้น
    ว่าแต่ ตอนนี้ผมพอมีเวลาทำโปรเจกต์ใหม่อยู่พอดี :P

    • เห็นด้วย ถ้าหลังจากผมอ่านโพสต์นี้ไปหนึ่งชั่วโมงแล้วสถานการณ์ยังไม่เปลี่ยน นี่ก็น่าจะเป็นคอมเมนต์ระดับบนสุดแรกจากผู้พิการทางสายตา/สายตาเลือนรางตัวจริงในที่นี้
      สำหรับผมที่กำลังเปลี่ยนจากสายตา “แย่แต่แก้ได้” ไปเป็น สายตาเลือนราง มันมีคุณค่ามาก
      ผมไม่รู้มาก่อนว่าแอปพวกนั้นมีอยู่ และกำลังมองหาเทคโนโลยีช่วยเหลือแบบนั้นอยู่พอดี
    • การได้ยินข้อสรุปเดียวกับที่เราสรุปกันเองจากคนที่ไม่เคยเจอกันมาก่อนทำให้มั่นใจขึ้น
      Apple ดูเหมือนจะทำผลิตภัณฑ์พวกนี้โดยไม่เคยคุยกับคนที่มีปัญหานั้นเลย
      น่าขำตรงที่เราก็กำลังทำผลิตภัณฑ์แข่งกับแอปภายนอกที่พูดถึงเหล่านั้นอยู่ และเพื่อนร่วมงานผมก็มีประสบการณ์มากจากการมีพ่อแม่ที่พิการทางสายตา
      มี MVP อยู่บนออนไลน์แล้ว แต่ยังไม่ได้ยอดเยี่ยมอะไร และผมก็ไม่อยากเป็นคนนั้นที่โผล่มาบอกว่า “เฮ้ ผมทำแอปนั้นนะ?”
    • ดีจังที่ได้ฟังมุมมองจากคนที่มีประสบการณ์ตรง
      แต่มีอย่างหนึ่งที่ผมยังสับสนคือส่วนที่คุณบอกว่าการประมวลผลบนอุปกรณ์อาจเป็นแค่ภาพลวงตา
      แบบไร้เดียงสา ผมคิดว่านี่เป็นข้อดีใหญ่เพราะมันหมายถึงใช้งานได้ตลอดโดยไม่ขึ้นกับบริการมือถือ
      ใช้ได้ทั้งบนรถไฟใต้ดิน บนเครื่องบิน หรือในที่ห่างไกล
      แยกอีกเรื่องหนึ่ง อยากรู้ว่าแอปไหนสร้างความแตกต่างในชีวิตประจำวันได้มากที่สุดสำหรับคุณ