กำลังฮิตกับการใช้ ChatGPT ทำ 'การค้นหาตำแหน่งย้อนกลับ' จากภาพถ่าย

(techcrunch.com)

6 คะแนน โดย GN⁺ 2025-04-19 | 6 ความคิดเห็น | แชร์ทาง WhatsApp

การติดตามตำแหน่งจากภาพด้วย ChatGPT กำลังแพร่กระจายเป็นกระแสไวรัล
โมเดลล่าสุดของ OpenAI อย่าง o3 และ o4-mini ผสานความสามารถด้านการวิเคราะห์ภาพและการค้นหาเว็บ เพื่ออนุมานตำแหน่งได้อย่างแม่นยำสูง
ผู้ใช้ป้อน เมนูร้านอาหาร, ภาพถนน, รูปบุคคล ฯลฯ ให้ o3 เพื่อให้เดาตำแหน่งเหมือนเกม "GeoGuessr"
ความกังวลเรื่อง การละเมิดความเป็นส่วนตัว เพิ่มสูงขึ้น ขณะที่ OpenAI ระบุว่ามีมาตรการความปลอดภัย แต่ยังขาดแนวทางป้องกันที่ชัดเจน
OpenAI เปิดเผยว่ามี ระบบตรวจจับและรับมือการใช้งานในทางที่ผิด แต่ก็ยังมีเสียงวิจารณ์ว่าข้อจำกัดจริงยังไม่เพียงพอ

เทรนด์การสืบย้อนจากภาพด้วย ChatGPT

ช่วงนี้ในหมู่ผู้ใช้กำลังเกิดเทรนด์ ติดตามตำแหน่งในภาพผ่าน ChatGPT
โมเดลใหม่ o3 และ o4-mini ของ OpenAI มีความสามารถในการอนุมานข้อมูลเชิงภาพภายในรูป
แม้จะเป็นภาพเบลอหรือบิดเบี้ยว ก็ยังสามารถวิเคราะห์ได้ผ่าน การตัดภาพ, หมุนภาพ, ซูมภาพ และการเตรียมภาพล่วงหน้าอื่น ๆ
เมื่อรวมกับความสามารถในการค้นหาเว็บ ฟีเจอร์นี้แสดงประสิทธิภาพโดดเด่นในการ อนุมานตำแหน่งของเมือง, แลนด์มาร์ก, ร้านอาหาร, บาร์ ฯลฯ

ChatGPT ถูกใช้งานเหมือน GeoGuessr

ผู้ใช้ขอให้ o3 "ทำตัวเหมือน GeoGuessr" และพยายาม ประเมินตำแหน่งจากภาพแคปสตอรี่ Instagram, ภาพถนน, เมนูร้าน ฯลฯ
- GeoGuessr คือเกมออนไลน์ที่ให้อัปโหลดภาพแล้วค้นหาตำแหน่ง
ChatGPT สามารถ อนุมานตำแหน่งจากเบาะแสทางภาพเพียงอย่างเดียว โดยไม่ต้องอาศัยประวัติการสนทนาหรือข้อมูลเมตา EXIF
โดยเฉพาะ o3 แสดงผลงานเหนือกว่า GPT-4o ในบางสถานการณ์
ตัวอย่าง: เมื่อดูภาพของตกแต่งเป็นแรดสีม่วงที่แขวนอยู่ในบาร์มืด ๆ
- GPT-4o ตอบผิดว่าเป็น "ผับในอังกฤษ"
- o3 อนุมานถูกต้องว่าเป็น "บาร์สปีคอีซีย่านวิลเลียมส์เบิร์ก"

GPT-4o ก็แสดงความแม่นยำที่น่าทึ่ง

ในการทดสอบของ TechCrunch พบว่า GPT-4o ก็มีความแม่นยำค่อนข้างสูง และประมวลผลได้เร็วกว่า
อย่างไรก็ตาม ในบางภาพมีกรณีที่มีเพียง o3 เท่านั้นที่ระบุตำแหน่งได้ถูกต้อง
แต่ o3 ก็ไม่ได้สมบูรณ์แบบ และยังมีกรณีที่ ตอบไม่ได้หรือเสนอสถานที่ที่ผิดไปอย่างมาก

ความกังวลเรื่องการละเมิดความเป็นส่วนตัวที่อาจเกิดขึ้น

การที่ใครก็สามารถใช้ภาพของผู้อื่นเพื่อติดตาม ตำแหน่งได้โดยแทบไม่มีข้อจำกัด ถือเป็นปัญหาใหญ่
ตัวอย่างเช่น การ แคปสตอรี่ Instagram อาจนำไปสู่ความเสี่ยงของ doxxing
ปัจจุบัน OpenAI ไม่ได้กล่าวถึงประเด็นนี้ในรายงานความปลอดภัยอย่างเป็นทางการของโมเดล o3 และ o4-mini

จุดยืนอย่างเป็นทางการของ OpenAI

ไม่กี่ชั่วโมงหลังบทความเผยแพร่ OpenAI ได้ส่งแถลงการณ์ต่อ TechCrunch ดังนี้:

“o3 และ o4-mini เพิ่มความสามารถในการให้เหตุผลจากภาพให้กับ ChatGPT และ
สามารถนำไปใช้ประโยชน์ได้มากในด้านการเข้าถึง, งานวิจัย และสถานการณ์รับมือเหตุฉุกเฉิน
เราได้ฝึกให้ระบบปฏิเสธคำขอข้อมูลที่อ่อนไหว
พร้อมทั้งนำกลไกป้องกันการระบุตัวบุคคลและการเฝ้าระวังการใช้งานในทางที่ผิดมาใช้
และเราดำเนินการเชิงรุกเมื่อพบการละเมิดนโยบาย”
อย่างไรก็ดี ขณะนี้ยังคง ขาดกลไกการบล็อกเฉพาะทางหรือการควบคุมเชิงเทคนิคที่เป็นรูปธรรมต่อฟังก์ชันการสืบย้อนตำแหน่ง

6 ความคิดเห็น

ndrgrd 2025-04-19

จริง ๆ แล้วก็แค่ให้คอมพิวเตอร์มาทำส่วนที่น่ารำคาญแทนไม่ใช่เหรอ วิธีการเองก็มีอยู่เดิมแล้วนี่

kandk 2025-04-21

AI ก็คือการทำสิ่งที่มนุษย์ทำได้อยู่แล้วนั่นแหละ (เหมือนหุ่นยนต์ดูดฝุ่น)

unsure4000 2025-04-19

เวลาและค่าใช้จ่ายที่ต้องใช้ลดลงไปหลายสิบเท่า เห็นได้ชัดว่านี่คือการเพิ่มขึ้นของภัยคุกคาม

ndrgrd 2025-04-19

อย่างที่กล่าวไว้ในบทความ เดิมทีมันก็เป็นสิ่งที่ผู้คนสนุกกับมันในลักษณะของ "เกม" กันอยู่แล้ว ดังนั้นก่อนหน้านี้มันก็ไม่ถึงขั้นเป็นเรื่องที่คนทั่วไปเข้าถึงได้ยากอะไรนัก
ภัยคุกคามจะเกิดขึ้นเมื่อมีการโพสต์รูปที่สามารถระบุตำแหน่งได้ง่าย ในสถานการณ์ที่ไม่ควรถูกระบุตำแหน่ง

ก่อนหน้านั้นเอง อย่างที่มีในคอมเมนต์ของ Hacker News การโพสต์อะไรสักอย่างลงบนอินเทอร์เน็ตสาธารณะ ก็เป็นเรื่องที่ต้องตั้งสมมติฐานไว้แล้วว่าข้อมูลจะถูกเปิดเผย

roxie 2025-04-20

โดยรวมแล้วผมเห็นด้วย แต่การที่ตอนนี้ ‘ใครก็ได้’ สามารถทำได้ ‘ในพริบตา’ ก็ทำให้นึกถึงผลข้างเคียงที่ค่อนข้างน่ากลัวอยู่เหมือนกัน

GN⁺ 2025-04-19

ความเห็นจาก Hacker News

มีการอนุมานว่า "รถพวงมาลัยซ้าย แต่การจราจรวิ่งชิดซ้าย" แต่ภาพถ่ายไม่ได้ให้เบาะแสว่าการจราจรไหลไปทางไหน
ต่อความเห็นที่ว่า "ภาษาบนป้ายร้านดูเหมือนชื่อธุรกิจที่ใช้อักษรละติน มากกว่าจะเป็นภาษาสเปนหรือโปรตุเกส" ก็ต้องบอกว่าภาษาสเปนและโปรตุเกสก็เขียนด้วยอักษรละตินเช่นกัน
มีการถ่ายภาพถนนแล้วตัดบางแลนด์มาร์กออก ผลคลาดเคลื่อนราว 500 กม. แต่ก็ยังอนุมานสิ่งต่าง ๆ ได้ถูกต้องหลายอย่าง
- เมื่อใช้ภาพเต็ม ระบบกลับระบุว่าเป็นเกาะที่มีชื่อเสียงแห่งหนึ่งผิดพลาด
- แม้ใช้ภาพแลนด์มาร์กจาก Google Images ก็ยังระบุว่าเป็นเกาะเดียวกัน
มั่นใจว่านี่เป็นเทคโนโลยีที่เหนือไปกว่า ChatGPT
- เมื่อนำภาพที่สร้างด้วย ChatGPT ไปใส่ในฟังก์ชัน "Describe" ของ Midjourney ระบบก็สร้างคำอธิบายที่รวมตำแหน่งที่ถูกต้องออกมา
- การเรียงตัวของภูเขาในฉากหลังดูเหมือนจะบ่งชี้ถึงพื้นที่เฉพาะแห่งหนึ่ง
ทุกครั้งที่มีเทรนด์ใหม่เกิดขึ้นก็รู้สึกต่อต้าน
- เมื่อแสดงภาพถนนในโรม ระบบกลับลบออกโดยอ้างว่าละเมิดนโยบาย
เมื่อถามวิธีตั้งนาฬิกาบนวิทยุรถยนต์ ระบบสามารถระบุทั้งวิธีที่ถูกต้องและรุ่นของวิทยุได้
มีความกังวลเกี่ยวกับ "ความเสี่ยงด้านความเป็นส่วนตัวแบบใหม่"
- ตัวอินเทอร์เน็ตเองก็มีความเสี่ยงด้านความเป็นส่วนตัวอยู่แล้ว
- การเน้นย้ำถึงความเสี่ยงใหม่ทุกครั้งนั้นมากเกินไป
ทักษะการอนุมานตำแหน่งในเกม Geoguessr น่าจะพัฒนาขึ้น
- จะมีการพัฒนาเทคโนโลยีที่สามารถระบุตำแหน่งได้อย่างแม่นยำผ่านภาพถ่ายดาวเทียมหรือภาพที่ไม่ใช่ดาวเทียม
ในเกม Geoguessr มีคนทำได้ 22k/25k คะแนนด้วย Gemini 2.5
- จุดที่เดาถูกคือเอสเซินในเยอรมนีและเชฟฟิลด์ในสหราชอาณาจักร แต่ในอิตาลีและรัสเซียยังคลาดเคลื่อน
- เป็นผลจากการอนุมานด้วยภาพเดียวเท่านั้น
วิเคราะห์ภาพที่ถ่ายจากแม่น้ำฮั่นในเมืองดานัง ประเทศเวียดนาม แล้วระบุตำแหน่งได้อย่างถูกต้อง
- ยืนยันได้ว่ามีเทคนิคการวิเคราะห์เช่นนี้อยู่
สามารถระบุเมืองจากภาพถนนได้อย่างถูกต้อง แต่เดาถนนหรือย่านเฉพาะผิด
- การค้นหารูปภาพย้อนกลับของ Google ให้ผลลัพธ์ที่แม่นยำกว่า