1 คะแนน โดย GN⁺ 2025-11-15 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • โปรเจ็กต์เว็บที่ โมเดล AI 9 ตัวสร้างดีไซน์นาฬิกาแอนะล็อกใหม่ทุก ๆ หนึ่งนาที
  • แต่ละโมเดลเขียนนาฬิกาด้วยโค้ด HTML/CSS ภายในข้อจำกัด 2000 โทเค็น
  • นาฬิกาประกอบด้วย ตัวเลขหรือเลขโรมัน, เข็มวินาทีแบบ CSS animation, ดีไซน์แบบ responsive, และ พื้นหลังสีขาว
  • ผลลัพธ์ที่สร้างจะถูกแสดงเป็น โค้ดล้วนโดยไม่มี Markdown
  • โปรเจ็กต์เชิงทดลองแบบอินเทอร์แอกทีฟ ที่แสดงทั้งความคิดสร้างสรรค์ด้านภาพและความสามารถในการสร้างโค้ดของ AI

ภาพรวมโปรเจ็กต์

  • AI World Clocks เป็นเว็บไซต์ที่แสดงดีไซน์นาฬิกาที่สร้างโดย โมเดล AI ที่แตกต่างกัน 9 ตัวในทุก ๆ หนึ่งนาที
    • นาฬิกาแต่ละเรือนจะแสดงเวลาเดียวกัน แต่มีดีไซน์และโครงสร้างโค้ดต่างกันไปตามแต่ละโมเดล
    • นาฬิกาถูกสร้างด้วย HTML และ CSS เท่านั้น โดยไม่ใช้ JavaScript

กติกาการสร้างและพรอมป์ต์

  • แต่ละโมเดล AI จะสร้างโค้ดนาฬิกาภายใน 2000 โทเค็น
  • พรอมป์ต์ที่ใช้มีข้อกำหนดดังต่อไปนี้
    • แสดงเวลาปัจจุบันในรูปแบบนาฬิกาแอนะล็อก
    • สามารถใช้ตัวเลขหรือเลขโรมันได้
    • มี เข็มวินาทีแบบ CSS animation
    • คงไว้ซึ่ง ดีไซน์แบบ responsive และ พื้นหลังสีขาว
    • ผลลัพธ์ต้อง คืนค่าเฉพาะโค้ด HTML/CSS เท่านั้น ห้ามอยู่ในรูปแบบ Markdown

ผู้สร้างและแรงบันดาลใจ

  • โปรเจ็กต์นี้สร้างโดย Brian Moore
  • ไอเดียได้รับแรงบันดาลใจจาก Matthew Rayfield
  • ผู้สร้างกำลังทำกิจกรรมผ่าน Instagram

คุณลักษณะและความหมาย

  • สามารถเปรียบเทียบ ความหลากหลายของดีไซน์ และ ความแตกต่างของสไตล์โค้ด ของแต่ละโมเดล AI ได้ในเชิงภาพ
  • ไม่ใช่แค่การสร้างนาฬิกาแบบเรียบง่าย แต่เป็นการทดลอง ความสามารถในการสร้างโค้ดอย่างสร้างสรรค์ของ AI
  • มีการแสดงผลลัพธ์ใหม่ทุกนาที จึงมอบ การเปลี่ยนแปลงอย่างต่อเนื่องและความเป็นเรียลไทม์

ข้อมูลเพิ่มเติม

  • ไม่มีคำอธิบายเพิ่มเติมนอกเหนือจากเนื้อหาที่ระบุไว้ในต้นฉบับ

1 ความคิดเห็น

 
GN⁺ 2025-11-15
ความเห็นจาก Hacker News
  • ขอบคุณที่ทำโปรเจกต์นี้ขึ้นมา ชอบการสำรวจทั้งหัวข้อเรื่องนาฬิกาและ ขีดจำกัดของเทคโนโลยี ลองเฝ้าดูมาหลายโมเดลแล้ว Kimi แม่นยำที่สุด แต่แปรผันน้อยและค่อนข้างน่าเบื่อ ส่วน Qwen มักให้ ผลลัพธ์เพี้ยนๆ และตลก เลยดูสนุกกว่า ไม่แน่ใจว่าแบบไหน “ดีกว่า” กัน

    • งานเจ๋งมาก ถ้าผู้ใช้กดตัวอย่างแล้วดู เอาต์พุตดิบของ LLM ได้ก็น่าจะดี
    • ถ้าเก็บนาฬิกาที่สร้างไว้ใน DB อยู่แล้ว น่าจะต่อยอดเป็น เว็บโหวตสไตล์ Facemash ได้สนุก ให้เลือกระหว่างนาฬิกาสองเรือน แล้วอยากดูอันดับนาฬิกาที่ดีที่สุดที่ Qwen สร้างด้วย
    • นาฬิกาที่พังก็ไม่ได้เป็นแค่ความล้มเหลวเฉยๆ บางครั้งมันให้ ไอเดียการออกแบบใหม่ๆ
    • นี่คือสิ่งที่ดีที่สุดที่เห็นใน HN เดือนนี้ ทั้งงี่เง่าแต่ลึกซึ้ง ทั้งตลกแต่ก็ชวนคิดเชิงปรัชญา ถึงขั้นอยาก ลองทำบางดีไซน์ขึ้นมาจริงๆ เลย การที่ยอมลงเงินเพื่อทดลองก็น่าประทับใจมาก
    • แชร์ให้เพื่อนดูแล้ว แต่ละคนบอกว่าเห็นนาฬิกาคนละแบบทั้งที่เป็นเวลาเดียวกัน เลยสงสัยว่าทำไมผลลัพธ์ถึงต่างกันในแต่ละผู้ใช้
  • ตอนแรกสงสัยว่าเว็บนี้ของจริงไหม เพราะ สเกลและการหมุน ของตัวเลขมันแปลกเกินไป ลองเอาพรอมป์ต์ไปใส่ใน ChatGPT เองแล้ว มันทำหน้าปัดนาฬิกาออกมาได้ค่อนข้างดี แต่เวลาผิดไปหลายชั่วโมง มาคิดทีหลังเลยรู้ว่าอาจเป็นเพราะ ไทม์โซนตามตำแหน่งทางภูมิศาสตร์ ของ ISP

    • เห็นคนอ่านมาว่า OP จำกัดความยาวเอาต์พุตไว้ที่ 2000 โทเคน
  • ดูอยู่ไม่กี่นาทีแล้วรู้สึกว่า Kimi K2 สร้าง หน้าปัดนาฬิกาที่สมบูรณ์ที่สุด ได้สม่ำเสมอที่สุด เพิ่งเคยได้ยินชื่อโมเดลนี้วันนี้เอง แต่น่าประทับใจมาก ส่วน Qwen 2.5 แทบจะระดับงานพัง

    • เป็นไปได้ว่าพรอมป์ต์นี้ ปรับให้เหมาะกับ Kimi K2 โดยเฉพาะ หรืออาจเป็นโมเดลที่ฝึกกับข้อมูลลักษณะนี้มาได้ดีกว่า
    • รู้จัก Kimi K2 เพราะมันเป็นโมเดลที่ Kagi ใช้สร้าง คำตอบ AI สำหรับคิวรีแบบคำถาม
    • ฉันเป็นแฟน K2 มันมี คาแรกเตอร์เฉพาะตัว มากกว่าโมเดลอื่น และไม่ค่อยประจบ อีกทั้งยังเก่งด้านงานเขียนเชิงสร้างสรรค์ด้วย K2 ที่โฮสต์บน Groq มี อัตราส่วนความฉลาด/ต่อวินาที ที่น่าทึ่งมาก (แม้ตอนนี้ยังมีการจำกัดความเร็วอยู่)
    • นาฬิกาของ Kimi K2 ดูสวยที่สุด แต่ บอกเวลาผิดบ่อย
    • Kimi K2 เป็นโมเดลที่ทำออกมาได้ดีจริงๆ
  • ตั้งแต่โมเดลสร้างภาพรุ่นแรกๆ ออกมา ก็พยายามจะทำ นาฬิกา 13 ชั่วโมง แต่ไม่สำเร็จ ส่วนใหญ่มักแค่เปลี่ยน “12” เป็น “13” หรือไม่ก็ทำหน้าปัดพัง ถ้าใครเคยทำสำเร็จอยากให้ช่วยแชร์วิธี

    • โมเดลภาพอ่อนมากเป็นพิเศษกับ การดัดแปลงแนวคิดใหม่ๆ ความสามารถในการทำให้เป็นนัยทั่วไปด้อยกว่าโมเดลภาษา
    • ลองด้วย Gemini 2.5 Flash แล้วได้ ภาพนี้ วงนอกเป็น 12 ชั่วโมงปกติ แต่วงในใช้ เลขโรมันแบบแปลกๆ อย่าง “IIII” และ “VIIII”
    • ลองโยนปริศนา “ชาวนา แพะ กะหล่ำปลี หมาป่าเมฆ” ให้หลายโมเดล ส่วนใหญ่กลับเข้าใจว่าเป็น โจทย์ข้ามแม่น้ำแบบเดิม บางตัวรู้สึกว่ามีอะไรแปลกๆ แต่สุดท้ายก็ยังไม่เข้าใจอย่างถูกต้อง
    • ลองให้ Gemini คำนวณ มุมของนาฬิกา 13 ชั่วโมง แล้วสร้างภาพ แต่สุดท้ายมันก็ออกมาเป็น รูปเดิมทุกครั้ง ต่อให้ขอแก้ก็กลับไปลงเอยที่นาฬิกา 12 ชั่วโมงที่เติม “13” เข้าไปเท่านั้น
    • ลองสารพัดกลยุทธ์แม้กระทั่งด่าใส่มันก็ยังไม่สำเร็จ ในทางกลับกันก็ลองทำ นาฬิกา 6 ชั่วโมง ด้วย
  • นี่มันคือ จุดสูงสุดของความไม่เป็นเชิงกำหนด ครั้งหนึ่งมันเป็นนาฬิกาที่สมบูรณ์แบบ พอกดรีเฟรชกลับกลายเป็น นาฬิกาแบบภาพของดาลี

  • ใช้เวลาทั้งสัปดาห์พยายามให้ Claude Code เขียน โค้ดเรนเดอร์ GPU แต่ก็ไม่เคยทำงานได้ถูกต้องจริงๆ อธิบายพรอมป์ต์อย่างละเอียดและแม้แต่เรื่องเมทริกซ์แล้ว ผลลัพธ์ก็ยังเละเทะ พอล้มเหลวแล้วมันจะเพิ่มล็อกและพูดอย่างมั่นใจว่า “แก้สมบูรณ์แล้ว” แต่ก็ยังผิดอยู่ดี ต่อให้ให้มันเขียนเทสต์ มันก็แค่ตรวจว่า โค้ดที่ผิดนั้นยังผิดอย่างสม่ำเสมอหรือไม่ สุดท้ายมันเข้าสู่ “โหมดเด็กฝึกงาน” เปลี่ยนโค้ดแบบสุ่มไปเรื่อยพร้อมยืนกรานว่า “คราวนี้สมบูรณ์แล้ว” น่ารักดี แต่ ยังห่างไกลจากการใช้งานจริง

    • มีคนถามว่าเคยลองใช้ MCP เพื่อ ส่งทั้งเอกสารและตัวอย่างไปพร้อมกัน หรือยัง และแนะนำเซ็ตอัปอย่าง Context7
    • มีคนแนะนำให้ลอง OpenAI Codex GPT5.1 เพราะเข้ากับงานเรนเดอร์ GPU ได้ค่อนข้างดี
    • สงสัยว่าทำไมความล้มเหลวแบบนี้ถึงเกิดบ่อย อาจเป็นเพราะ ข้อมูลผลลัพธ์เชิงลบมีไม่พอ การตรวจด้วยสกรีนช็อตทำไม่ได้ก็ไม่แปลก เพราะ VLLM จัดการรายละเอียดภาพระดับจุลภาคได้ไม่ดี
    • รู้สึกว่า Claude ขี้เกียจขึ้นเรื่อยๆ แก้แค่ครึ่งหนึ่งของเทสต์แล้วก็ประกาศว่า “แค่นี้ก็พอแล้ว”
  • สำหรับคนที่เชื่อ LLM แบบไม่ตั้งคำถาม โปรเจกต์นี้เป็น ตัวอย่างจากโลกจริง ที่ดีมาก “เทสต์ล้มเหลว” → LLM ลบเทสต์ทิ้งแล้วบอกว่า “แก้เสร็จแล้ว!” อะไรทำนองนั้น

    • สิ่งที่รู้สึกเมื่อมองนาฬิกาคือ เรารู้คำตอบที่ถูกต้องของนาฬิกาอยู่แล้ว จึงมองเห็นข้อผิดพลาดได้ แต่กับ ปัญหาที่เราไม่รู้คำตอบ เราไม่มีทางวัดความไม่แน่นอนของ LLM ได้ สุดท้ายต้องเทียบกับความเป็นจริงเท่านั้นถึงจะรู้ว่ามันผิด
    • การใช้ LLM กับงานที่ตรวจสอบได้ยากเป็น ทางเลือกที่เสี่ยง
    • เรื่อง “LLM ที่ลบเทสต์ทิ้ง” ฟังดูเหมือน นิทานภูตที่ตีความคำขอแบบตรงตัว “เพราะงั้นเด็กๆ ทั้งหลาย AI commit ต้องรีวิวเสมอนะ”
  • LLM มองเห็น HTML ที่เรนเดอร์แล้วโดยตรงไม่ได้ กำลังใช้ Cursor ทำโปรแกรม visualization ด้วย OpenGL อยู่ แต่การอธิบายบั๊กด้านภาพให้มันเข้าใจช่างน่าอึดอัด คำอย่าง “เส้นนี้มันไม่เชื่อมกัน” เข้าใจได้ยาก สุดท้ายเลยต้องให้มันพิมพ์ debug print ออกมาเป็นพิกัด

    • ถ้าใช้ ฟังก์ชันเบราว์เซอร์ ของ Cursor มันค่อนข้างมีประโยชน์กับงานเว็บ และอาจให้มันส่งสกรีนช็อตเข้ามาในบทสนทนาผ่าน MCP ได้ด้วย แต่อาจต้องลงมือทำเอง
    • เคย ส่งสกรีนช็อตให้ Cursor โดยตรง แล้ว กับงานเว็บ UI หรือการสร้างกราฟถือว่าได้ผลดีพอสมควร
    • Claude แนะนำอย่างเป็นทางการ ให้ส่งสกรีนช็อต และ Sonnet 4.5 ก็เก่งกับงานวนแก้แบบนี้ด้วย
    • ถ้าเชื่อม Puppeteer MCP server เข้าไป Cursor ก็จะถ่าย สกรีนช็อตของเอาต์พุตตัวเอง แล้ววนปรับปรุงได้
    • ทั้ง Claude และ ChatGPT รองรับอินพุตภาพอยู่แล้ว ถ้าใช้ lm-server ก็เชื่อมกับโมเดลที่ไม่ใช่ข้อความล้วนได้ด้วย
  • ไอเดียเจ๋งมาก และน่าทึ่งที่ มีแค่ Kimi K2 เท่านั้นที่ทำงานได้ไม่มีปัญหา ทั้งที่ยังไม่ใช่เวอร์ชัน “thinking” เต็มรูปแบบด้วยซ้ำ ทำให้อยากกลับไปอ่านบทความที่เกี่ยวข้อง Kimi K2 Thinking อีกครั้ง

  • สงสัยว่าทำไม Deepseek กับ Kimi ถึงให้ ผลลัพธ์เหนือกว่าโมเดลอื่นอย่างทิ้งห่าง เลยสงสัยว่าพวกมันอาจได้รับการฝึกมา เฉพาะทางสำหรับงานแบบนี้ หรือไม่