นาฬิกาโลกของ AI

(clocks.brianmoore.com)

1 คะแนน โดย GN⁺ 2025-11-15 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

โปรเจ็กต์เว็บที่ โมเดล AI 9 ตัวสร้างดีไซน์นาฬิกาแอนะล็อกใหม่ทุก ๆ หนึ่งนาที
แต่ละโมเดลเขียนนาฬิกาด้วยโค้ด HTML/CSS ภายในข้อจำกัด 2000 โทเค็น
นาฬิกาประกอบด้วย ตัวเลขหรือเลขโรมัน, เข็มวินาทีแบบ CSS animation, ดีไซน์แบบ responsive, และ พื้นหลังสีขาว
ผลลัพธ์ที่สร้างจะถูกแสดงเป็น โค้ดล้วนโดยไม่มี Markdown
โปรเจ็กต์เชิงทดลองแบบอินเทอร์แอกทีฟ ที่แสดงทั้งความคิดสร้างสรรค์ด้านภาพและความสามารถในการสร้างโค้ดของ AI

ภาพรวมโปรเจ็กต์

AI World Clocks เป็นเว็บไซต์ที่แสดงดีไซน์นาฬิกาที่สร้างโดย โมเดล AI ที่แตกต่างกัน 9 ตัวในทุก ๆ หนึ่งนาที
- นาฬิกาแต่ละเรือนจะแสดงเวลาเดียวกัน แต่มีดีไซน์และโครงสร้างโค้ดต่างกันไปตามแต่ละโมเดล
- นาฬิกาถูกสร้างด้วย HTML และ CSS เท่านั้น โดยไม่ใช้ JavaScript

กติกาการสร้างและพรอมป์ต์

แต่ละโมเดล AI จะสร้างโค้ดนาฬิกาภายใน 2000 โทเค็น
พรอมป์ต์ที่ใช้มีข้อกำหนดดังต่อไปนี้
- แสดงเวลาปัจจุบันในรูปแบบนาฬิกาแอนะล็อก
- สามารถใช้ตัวเลขหรือเลขโรมันได้
- มี เข็มวินาทีแบบ CSS animation
- คงไว้ซึ่ง ดีไซน์แบบ responsive และ พื้นหลังสีขาว
- ผลลัพธ์ต้อง คืนค่าเฉพาะโค้ด HTML/CSS เท่านั้น ห้ามอยู่ในรูปแบบ Markdown

ผู้สร้างและแรงบันดาลใจ

โปรเจ็กต์นี้สร้างโดย Brian Moore
ไอเดียได้รับแรงบันดาลใจจาก Matthew Rayfield
ผู้สร้างกำลังทำกิจกรรมผ่าน Instagram

คุณลักษณะและความหมาย

สามารถเปรียบเทียบ ความหลากหลายของดีไซน์ และ ความแตกต่างของสไตล์โค้ด ของแต่ละโมเดล AI ได้ในเชิงภาพ
ไม่ใช่แค่การสร้างนาฬิกาแบบเรียบง่าย แต่เป็นการทดลอง ความสามารถในการสร้างโค้ดอย่างสร้างสรรค์ของ AI
มีการแสดงผลลัพธ์ใหม่ทุกนาที จึงมอบ การเปลี่ยนแปลงอย่างต่อเนื่องและความเป็นเรียลไทม์

ข้อมูลเพิ่มเติม

ไม่มีคำอธิบายเพิ่มเติมนอกเหนือจากเนื้อหาที่ระบุไว้ในต้นฉบับ

1 ความคิดเห็น

GN⁺ 2025-11-15

ความเห็นจาก Hacker News

ขอบคุณที่ทำโปรเจกต์นี้ขึ้นมา ชอบการสำรวจทั้งหัวข้อเรื่องนาฬิกาและ ขีดจำกัดของเทคโนโลยี ลองเฝ้าดูมาหลายโมเดลแล้ว Kimi แม่นยำที่สุด แต่แปรผันน้อยและค่อนข้างน่าเบื่อ ส่วน Qwen มักให้ ผลลัพธ์เพี้ยนๆ และตลก เลยดูสนุกกว่า ไม่แน่ใจว่าแบบไหน “ดีกว่า” กัน
- งานเจ๋งมาก ถ้าผู้ใช้กดตัวอย่างแล้วดู เอาต์พุตดิบของ LLM ได้ก็น่าจะดี
- ถ้าเก็บนาฬิกาที่สร้างไว้ใน DB อยู่แล้ว น่าจะต่อยอดเป็น เว็บโหวตสไตล์ Facemash ได้สนุก ให้เลือกระหว่างนาฬิกาสองเรือน แล้วอยากดูอันดับนาฬิกาที่ดีที่สุดที่ Qwen สร้างด้วย
- นาฬิกาที่พังก็ไม่ได้เป็นแค่ความล้มเหลวเฉยๆ บางครั้งมันให้ ไอเดียการออกแบบใหม่ๆ
- นี่คือสิ่งที่ดีที่สุดที่เห็นใน HN เดือนนี้ ทั้งงี่เง่าแต่ลึกซึ้ง ทั้งตลกแต่ก็ชวนคิดเชิงปรัชญา ถึงขั้นอยาก ลองทำบางดีไซน์ขึ้นมาจริงๆ เลย การที่ยอมลงเงินเพื่อทดลองก็น่าประทับใจมาก
- แชร์ให้เพื่อนดูแล้ว แต่ละคนบอกว่าเห็นนาฬิกาคนละแบบทั้งที่เป็นเวลาเดียวกัน เลยสงสัยว่าทำไมผลลัพธ์ถึงต่างกันในแต่ละผู้ใช้
ตอนแรกสงสัยว่าเว็บนี้ของจริงไหม เพราะ สเกลและการหมุน ของตัวเลขมันแปลกเกินไป ลองเอาพรอมป์ต์ไปใส่ใน ChatGPT เองแล้ว มันทำหน้าปัดนาฬิกาออกมาได้ค่อนข้างดี แต่เวลาผิดไปหลายชั่วโมง มาคิดทีหลังเลยรู้ว่าอาจเป็นเพราะ ไทม์โซนตามตำแหน่งทางภูมิศาสตร์ ของ ISP
- เห็นคนอ่านมาว่า OP จำกัดความยาวเอาต์พุตไว้ที่ 2000 โทเคน
ดูอยู่ไม่กี่นาทีแล้วรู้สึกว่า Kimi K2 สร้าง หน้าปัดนาฬิกาที่สมบูรณ์ที่สุด ได้สม่ำเสมอที่สุด เพิ่งเคยได้ยินชื่อโมเดลนี้วันนี้เอง แต่น่าประทับใจมาก ส่วน Qwen 2.5 แทบจะระดับงานพัง
- เป็นไปได้ว่าพรอมป์ต์นี้ ปรับให้เหมาะกับ Kimi K2 โดยเฉพาะ หรืออาจเป็นโมเดลที่ฝึกกับข้อมูลลักษณะนี้มาได้ดีกว่า
- รู้จัก Kimi K2 เพราะมันเป็นโมเดลที่ Kagi ใช้สร้าง คำตอบ AI สำหรับคิวรีแบบคำถาม
- ฉันเป็นแฟน K2 มันมี คาแรกเตอร์เฉพาะตัว มากกว่าโมเดลอื่น และไม่ค่อยประจบ อีกทั้งยังเก่งด้านงานเขียนเชิงสร้างสรรค์ด้วย K2 ที่โฮสต์บน Groq มี อัตราส่วนความฉลาด/ต่อวินาที ที่น่าทึ่งมาก (แม้ตอนนี้ยังมีการจำกัดความเร็วอยู่)
- นาฬิกาของ Kimi K2 ดูสวยที่สุด แต่ บอกเวลาผิดบ่อย
- Kimi K2 เป็นโมเดลที่ทำออกมาได้ดีจริงๆ
ตั้งแต่โมเดลสร้างภาพรุ่นแรกๆ ออกมา ก็พยายามจะทำ นาฬิกา 13 ชั่วโมง แต่ไม่สำเร็จ ส่วนใหญ่มักแค่เปลี่ยน “12” เป็น “13” หรือไม่ก็ทำหน้าปัดพัง ถ้าใครเคยทำสำเร็จอยากให้ช่วยแชร์วิธี
- โมเดลภาพอ่อนมากเป็นพิเศษกับ การดัดแปลงแนวคิดใหม่ๆ ความสามารถในการทำให้เป็นนัยทั่วไปด้อยกว่าโมเดลภาษา
- ลองด้วย Gemini 2.5 Flash แล้วได้ ภาพนี้ วงนอกเป็น 12 ชั่วโมงปกติ แต่วงในใช้ เลขโรมันแบบแปลกๆ อย่าง “IIII” และ “VIIII”
- ลองโยนปริศนา “ชาวนา แพะ กะหล่ำปลี หมาป่าเมฆ” ให้หลายโมเดล ส่วนใหญ่กลับเข้าใจว่าเป็น โจทย์ข้ามแม่น้ำแบบเดิม บางตัวรู้สึกว่ามีอะไรแปลกๆ แต่สุดท้ายก็ยังไม่เข้าใจอย่างถูกต้อง
- ลองให้ Gemini คำนวณ มุมของนาฬิกา 13 ชั่วโมง แล้วสร้างภาพ แต่สุดท้ายมันก็ออกมาเป็น รูปเดิมทุกครั้ง ต่อให้ขอแก้ก็กลับไปลงเอยที่นาฬิกา 12 ชั่วโมงที่เติม “13” เข้าไปเท่านั้น
- ลองสารพัดกลยุทธ์แม้กระทั่งด่าใส่มันก็ยังไม่สำเร็จ ในทางกลับกันก็ลองทำ นาฬิกา 6 ชั่วโมง ด้วย
นี่มันคือ จุดสูงสุดของความไม่เป็นเชิงกำหนด ครั้งหนึ่งมันเป็นนาฬิกาที่สมบูรณ์แบบ พอกดรีเฟรชกลับกลายเป็น นาฬิกาแบบภาพของดาลี
ใช้เวลาทั้งสัปดาห์พยายามให้ Claude Code เขียน โค้ดเรนเดอร์ GPU แต่ก็ไม่เคยทำงานได้ถูกต้องจริงๆ อธิบายพรอมป์ต์อย่างละเอียดและแม้แต่เรื่องเมทริกซ์แล้ว ผลลัพธ์ก็ยังเละเทะ พอล้มเหลวแล้วมันจะเพิ่มล็อกและพูดอย่างมั่นใจว่า “แก้สมบูรณ์แล้ว” แต่ก็ยังผิดอยู่ดี ต่อให้ให้มันเขียนเทสต์ มันก็แค่ตรวจว่า โค้ดที่ผิดนั้นยังผิดอย่างสม่ำเสมอหรือไม่ สุดท้ายมันเข้าสู่ “โหมดเด็กฝึกงาน” เปลี่ยนโค้ดแบบสุ่มไปเรื่อยพร้อมยืนกรานว่า “คราวนี้สมบูรณ์แล้ว” น่ารักดี แต่ ยังห่างไกลจากการใช้งานจริง
- มีคนถามว่าเคยลองใช้ MCP เพื่อ ส่งทั้งเอกสารและตัวอย่างไปพร้อมกัน หรือยัง และแนะนำเซ็ตอัปอย่าง Context7
- มีคนแนะนำให้ลอง OpenAI Codex GPT5.1 เพราะเข้ากับงานเรนเดอร์ GPU ได้ค่อนข้างดี
- สงสัยว่าทำไมความล้มเหลวแบบนี้ถึงเกิดบ่อย อาจเป็นเพราะ ข้อมูลผลลัพธ์เชิงลบมีไม่พอ การตรวจด้วยสกรีนช็อตทำไม่ได้ก็ไม่แปลก เพราะ VLLM จัดการรายละเอียดภาพระดับจุลภาคได้ไม่ดี
- รู้สึกว่า Claude ขี้เกียจขึ้นเรื่อยๆ แก้แค่ครึ่งหนึ่งของเทสต์แล้วก็ประกาศว่า “แค่นี้ก็พอแล้ว”
สำหรับคนที่เชื่อ LLM แบบไม่ตั้งคำถาม โปรเจกต์นี้เป็น ตัวอย่างจากโลกจริง ที่ดีมาก “เทสต์ล้มเหลว” → LLM ลบเทสต์ทิ้งแล้วบอกว่า “แก้เสร็จแล้ว!” อะไรทำนองนั้น
- สิ่งที่รู้สึกเมื่อมองนาฬิกาคือ เรารู้คำตอบที่ถูกต้องของนาฬิกาอยู่แล้ว จึงมองเห็นข้อผิดพลาดได้ แต่กับ ปัญหาที่เราไม่รู้คำตอบ เราไม่มีทางวัดความไม่แน่นอนของ LLM ได้ สุดท้ายต้องเทียบกับความเป็นจริงเท่านั้นถึงจะรู้ว่ามันผิด
- การใช้ LLM กับงานที่ตรวจสอบได้ยากเป็น ทางเลือกที่เสี่ยง
- เรื่อง “LLM ที่ลบเทสต์ทิ้ง” ฟังดูเหมือน นิทานภูตที่ตีความคำขอแบบตรงตัว “เพราะงั้นเด็กๆ ทั้งหลาย AI commit ต้องรีวิวเสมอนะ”
LLM มองเห็น HTML ที่เรนเดอร์แล้วโดยตรงไม่ได้ กำลังใช้ Cursor ทำโปรแกรม visualization ด้วย OpenGL อยู่ แต่การอธิบายบั๊กด้านภาพให้มันเข้าใจช่างน่าอึดอัด คำอย่าง “เส้นนี้มันไม่เชื่อมกัน” เข้าใจได้ยาก สุดท้ายเลยต้องให้มันพิมพ์ debug print ออกมาเป็นพิกัด
- ถ้าใช้ ฟังก์ชันเบราว์เซอร์ ของ Cursor มันค่อนข้างมีประโยชน์กับงานเว็บ และอาจให้มันส่งสกรีนช็อตเข้ามาในบทสนทนาผ่าน MCP ได้ด้วย แต่อาจต้องลงมือทำเอง
- เคย ส่งสกรีนช็อตให้ Cursor โดยตรง แล้ว กับงานเว็บ UI หรือการสร้างกราฟถือว่าได้ผลดีพอสมควร
- Claude แนะนำอย่างเป็นทางการ ให้ส่งสกรีนช็อต และ Sonnet 4.5 ก็เก่งกับงานวนแก้แบบนี้ด้วย
- ถ้าเชื่อม Puppeteer MCP server เข้าไป Cursor ก็จะถ่าย สกรีนช็อตของเอาต์พุตตัวเอง แล้ววนปรับปรุงได้
- ทั้ง Claude และ ChatGPT รองรับอินพุตภาพอยู่แล้ว ถ้าใช้ lm-server ก็เชื่อมกับโมเดลที่ไม่ใช่ข้อความล้วนได้ด้วย
ไอเดียเจ๋งมาก และน่าทึ่งที่ มีแค่ Kimi K2 เท่านั้นที่ทำงานได้ไม่มีปัญหา ทั้งที่ยังไม่ใช่เวอร์ชัน “thinking” เต็มรูปแบบด้วยซ้ำ ทำให้อยากกลับไปอ่านบทความที่เกี่ยวข้อง Kimi K2 Thinking อีกครั้ง
สงสัยว่าทำไม Deepseek กับ Kimi ถึงให้ ผลลัพธ์เหนือกว่าโมเดลอื่นอย่างทิ้งห่าง เลยสงสัยว่าพวกมันอาจได้รับการฝึกมา เฉพาะทางสำหรับงานแบบนี้ หรือไม่

นาฬิกาโลกของ AI

ภาพรวมโปรเจ็กต์

กติกาการสร้างและพรอมป์ต์

ผู้สร้างและแรงบันดาลใจ

คุณลักษณะและความหมาย

ข้อมูลเพิ่มเติม

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความเห็นจาก Hacker News