6 คะแนน โดย GN⁺ 2025-04-19 | 6 ความคิดเห็น | แชร์ทาง WhatsApp
  • การติดตามตำแหน่งจากภาพด้วย ChatGPT กำลังแพร่กระจายเป็นกระแสไวรัล
  • โมเดลล่าสุดของ OpenAI อย่าง o3 และ o4-mini ผสานความสามารถด้านการวิเคราะห์ภาพและการค้นหาเว็บ เพื่ออนุมานตำแหน่งได้อย่างแม่นยำสูง
  • ผู้ใช้ป้อน เมนูร้านอาหาร, ภาพถนน, รูปบุคคล ฯลฯ ให้ o3 เพื่อให้เดาตำแหน่งเหมือนเกม "GeoGuessr"
  • ความกังวลเรื่อง การละเมิดความเป็นส่วนตัว เพิ่มสูงขึ้น ขณะที่ OpenAI ระบุว่ามีมาตรการความปลอดภัย แต่ยังขาดแนวทางป้องกันที่ชัดเจน
  • OpenAI เปิดเผยว่ามี ระบบตรวจจับและรับมือการใช้งานในทางที่ผิด แต่ก็ยังมีเสียงวิจารณ์ว่าข้อจำกัดจริงยังไม่เพียงพอ

เทรนด์การสืบย้อนจากภาพด้วย ChatGPT

  • ช่วงนี้ในหมู่ผู้ใช้กำลังเกิดเทรนด์ ติดตามตำแหน่งในภาพผ่าน ChatGPT
  • โมเดลใหม่ o3 และ o4-mini ของ OpenAI มีความสามารถในการอนุมานข้อมูลเชิงภาพภายในรูป
  • แม้จะเป็นภาพเบลอหรือบิดเบี้ยว ก็ยังสามารถวิเคราะห์ได้ผ่าน การตัดภาพ, หมุนภาพ, ซูมภาพ และการเตรียมภาพล่วงหน้าอื่น ๆ
  • เมื่อรวมกับความสามารถในการค้นหาเว็บ ฟีเจอร์นี้แสดงประสิทธิภาพโดดเด่นในการ อนุมานตำแหน่งของเมือง, แลนด์มาร์ก, ร้านอาหาร, บาร์ ฯลฯ

ChatGPT ถูกใช้งานเหมือน GeoGuessr

  • ผู้ใช้ขอให้ o3 "ทำตัวเหมือน GeoGuessr" และพยายาม ประเมินตำแหน่งจากภาพแคปสตอรี่ Instagram, ภาพถนน, เมนูร้าน ฯลฯ
    • GeoGuessr คือเกมออนไลน์ที่ให้อัปโหลดภาพแล้วค้นหาตำแหน่ง
  • ChatGPT สามารถ อนุมานตำแหน่งจากเบาะแสทางภาพเพียงอย่างเดียว โดยไม่ต้องอาศัยประวัติการสนทนาหรือข้อมูลเมตา EXIF
  • โดยเฉพาะ o3 แสดงผลงานเหนือกว่า GPT-4o ในบางสถานการณ์

    ตัวอย่าง: เมื่อดูภาพของตกแต่งเป็นแรดสีม่วงที่แขวนอยู่ในบาร์มืด ๆ

    • GPT-4o ตอบผิดว่าเป็น "ผับในอังกฤษ"
    • o3 อนุมานถูกต้องว่าเป็น "บาร์สปีคอีซีย่านวิลเลียมส์เบิร์ก"

GPT-4o ก็แสดงความแม่นยำที่น่าทึ่ง

  • ในการทดสอบของ TechCrunch พบว่า GPT-4o ก็มีความแม่นยำค่อนข้างสูง และประมวลผลได้เร็วกว่า
  • อย่างไรก็ตาม ในบางภาพมีกรณีที่มีเพียง o3 เท่านั้นที่ระบุตำแหน่งได้ถูกต้อง
  • แต่ o3 ก็ไม่ได้สมบูรณ์แบบ และยังมีกรณีที่ ตอบไม่ได้หรือเสนอสถานที่ที่ผิดไปอย่างมาก

ความกังวลเรื่องการละเมิดความเป็นส่วนตัวที่อาจเกิดขึ้น

  • การที่ใครก็สามารถใช้ภาพของผู้อื่นเพื่อติดตาม ตำแหน่งได้โดยแทบไม่มีข้อจำกัด ถือเป็นปัญหาใหญ่
  • ตัวอย่างเช่น การ แคปสตอรี่ Instagram อาจนำไปสู่ความเสี่ยงของ doxxing
  • ปัจจุบัน OpenAI ไม่ได้กล่าวถึงประเด็นนี้ในรายงานความปลอดภัยอย่างเป็นทางการของโมเดล o3 และ o4-mini

จุดยืนอย่างเป็นทางการของ OpenAI

  • ไม่กี่ชั่วโมงหลังบทความเผยแพร่ OpenAI ได้ส่งแถลงการณ์ต่อ TechCrunch ดังนี้:

    “o3 และ o4-mini เพิ่มความสามารถในการให้เหตุผลจากภาพให้กับ ChatGPT และ
    สามารถนำไปใช้ประโยชน์ได้มากในด้านการเข้าถึง, งานวิจัย และสถานการณ์รับมือเหตุฉุกเฉิน
    เราได้ฝึกให้ระบบปฏิเสธคำขอข้อมูลที่อ่อนไหว
    พร้อมทั้งนำกลไกป้องกันการระบุตัวบุคคลและการเฝ้าระวังการใช้งานในทางที่ผิดมาใช้
    และเราดำเนินการเชิงรุกเมื่อพบการละเมิดนโยบาย”

  • อย่างไรก็ดี ขณะนี้ยังคง ขาดกลไกการบล็อกเฉพาะทางหรือการควบคุมเชิงเทคนิคที่เป็นรูปธรรมต่อฟังก์ชันการสืบย้อนตำแหน่ง

6 ความคิดเห็น

 
ndrgrd 2025-04-19

จริง ๆ แล้วก็แค่ให้คอมพิวเตอร์มาทำส่วนที่น่ารำคาญแทนไม่ใช่เหรอ วิธีการเองก็มีอยู่เดิมแล้วนี่

 
kandk 2025-04-21

AI ก็คือการทำสิ่งที่มนุษย์ทำได้อยู่แล้วนั่นแหละ (เหมือนหุ่นยนต์ดูดฝุ่น)

 
unsure4000 2025-04-19

เวลาและค่าใช้จ่ายที่ต้องใช้ลดลงไปหลายสิบเท่า เห็นได้ชัดว่านี่คือการเพิ่มขึ้นของภัยคุกคาม

 
ndrgrd 2025-04-19

อย่างที่กล่าวไว้ในบทความ เดิมทีมันก็เป็นสิ่งที่ผู้คนสนุกกับมันในลักษณะของ "เกม" กันอยู่แล้ว ดังนั้นก่อนหน้านี้มันก็ไม่ถึงขั้นเป็นเรื่องที่คนทั่วไปเข้าถึงได้ยากอะไรนัก
ภัยคุกคามจะเกิดขึ้นเมื่อมีการโพสต์รูปที่สามารถระบุตำแหน่งได้ง่าย ในสถานการณ์ที่ไม่ควรถูกระบุตำแหน่ง

ก่อนหน้านั้นเอง อย่างที่มีในคอมเมนต์ของ Hacker News การโพสต์อะไรสักอย่างลงบนอินเทอร์เน็ตสาธารณะ ก็เป็นเรื่องที่ต้องตั้งสมมติฐานไว้แล้วว่าข้อมูลจะถูกเปิดเผย

 
roxie 2025-04-20

โดยรวมแล้วผมเห็นด้วย แต่การที่ตอนนี้ ‘ใครก็ได้’ สามารถทำได้ ‘ในพริบตา’ ก็ทำให้นึกถึงผลข้างเคียงที่ค่อนข้างน่ากลัวอยู่เหมือนกัน

 
GN⁺ 2025-04-19
ความเห็นจาก Hacker News
  • มีการอนุมานว่า "รถพวงมาลัยซ้าย แต่การจราจรวิ่งชิดซ้าย" แต่ภาพถ่ายไม่ได้ให้เบาะแสว่าการจราจรไหลไปทางไหน
  • ต่อความเห็นที่ว่า "ภาษาบนป้ายร้านดูเหมือนชื่อธุรกิจที่ใช้อักษรละติน มากกว่าจะเป็นภาษาสเปนหรือโปรตุเกส" ก็ต้องบอกว่าภาษาสเปนและโปรตุเกสก็เขียนด้วยอักษรละตินเช่นกัน
  • มีการถ่ายภาพถนนแล้วตัดบางแลนด์มาร์กออก ผลคลาดเคลื่อนราว 500 กม. แต่ก็ยังอนุมานสิ่งต่าง ๆ ได้ถูกต้องหลายอย่าง
    • เมื่อใช้ภาพเต็ม ระบบกลับระบุว่าเป็นเกาะที่มีชื่อเสียงแห่งหนึ่งผิดพลาด
    • แม้ใช้ภาพแลนด์มาร์กจาก Google Images ก็ยังระบุว่าเป็นเกาะเดียวกัน
  • มั่นใจว่านี่เป็นเทคโนโลยีที่เหนือไปกว่า ChatGPT
    • เมื่อนำภาพที่สร้างด้วย ChatGPT ไปใส่ในฟังก์ชัน "Describe" ของ Midjourney ระบบก็สร้างคำอธิบายที่รวมตำแหน่งที่ถูกต้องออกมา
    • การเรียงตัวของภูเขาในฉากหลังดูเหมือนจะบ่งชี้ถึงพื้นที่เฉพาะแห่งหนึ่ง
  • ทุกครั้งที่มีเทรนด์ใหม่เกิดขึ้นก็รู้สึกต่อต้าน
    • เมื่อแสดงภาพถนนในโรม ระบบกลับลบออกโดยอ้างว่าละเมิดนโยบาย
  • เมื่อถามวิธีตั้งนาฬิกาบนวิทยุรถยนต์ ระบบสามารถระบุทั้งวิธีที่ถูกต้องและรุ่นของวิทยุได้
  • มีความกังวลเกี่ยวกับ "ความเสี่ยงด้านความเป็นส่วนตัวแบบใหม่"
    • ตัวอินเทอร์เน็ตเองก็มีความเสี่ยงด้านความเป็นส่วนตัวอยู่แล้ว
    • การเน้นย้ำถึงความเสี่ยงใหม่ทุกครั้งนั้นมากเกินไป
  • ทักษะการอนุมานตำแหน่งในเกม Geoguessr น่าจะพัฒนาขึ้น
    • จะมีการพัฒนาเทคโนโลยีที่สามารถระบุตำแหน่งได้อย่างแม่นยำผ่านภาพถ่ายดาวเทียมหรือภาพที่ไม่ใช่ดาวเทียม
  • ในเกม Geoguessr มีคนทำได้ 22k/25k คะแนนด้วย Gemini 2.5
    • จุดที่เดาถูกคือเอสเซินในเยอรมนีและเชฟฟิลด์ในสหราชอาณาจักร แต่ในอิตาลีและรัสเซียยังคลาดเคลื่อน
    • เป็นผลจากการอนุมานด้วยภาพเดียวเท่านั้น
  • วิเคราะห์ภาพที่ถ่ายจากแม่น้ำฮั่นในเมืองดานัง ประเทศเวียดนาม แล้วระบุตำแหน่งได้อย่างถูกต้อง
    • ยืนยันได้ว่ามีเทคนิคการวิเคราะห์เช่นนี้อยู่
  • สามารถระบุเมืองจากภาพถนนได้อย่างถูกต้อง แต่เดาถนนหรือย่านเฉพาะผิด
    • การค้นหารูปภาพย้อนกลับของ Google ให้ผลลัพธ์ที่แม่นยำกว่า