1 คะแนน โดย GN⁺ 2025-02-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

1 ความคิดเห็น

 
GN⁺ 2025-02-10
ความคิดเห็นจาก Hacker News
  • เป็นการอธิบายชุดเครื่องมือเดโมหลากหลายแบบ

    • Segment Anything 2: สร้างวิดีโอคัตเอาต์และเอฟเฟ็กต์ภาพสนุก ๆ ได้ด้วยการคลิกไม่กี่ครั้ง
    • Seamless Translation: สามารถสัมผัสประสบการณ์การได้ยินเสียงของตัวเองในภาษาอื่น
    • Animated Drawings: ทำให้สเก็ตช์ที่วาดด้วยมือมีชีวิตชีวาด้วยแอนิเมชัน
    • Audiobox: สร้างเรื่องราวเสียงโดยใช้เสียงพูดและเสียงต่าง ๆ ที่สร้างด้วย AI
  • Seamless Translation เป็นฟีเจอร์ที่น่าทึ่งพอสมควร

    • ผู้ใช้ที่พูดอังกฤษและสเปนได้บันทึกประโยคภาษาอังกฤษ แล้วเมื่อฟังผลลัพธ์ภาษาสเปนที่สร้างขึ้น ก็พบว่าแทบจะเหมือนเสียงภาษาสเปนของตัวเอง
    • อย่างไรก็ตาม ภาษาสเปนของผู้ใช้มีสำนวนแบบคาสตีลมากกว่า
  • สงสัยว่าทำไมในชื่อถึงเขียนว่า Aidemos

  • อยากรู้ทิศทางการวิจัย AI ของ Meta

    • เข้าใจเป้าหมายของ Google และ MSFT แต่ไม่ค่อยแน่ใจว่าเป้าหมายสุดท้ายของ Meta คืออะไร
  • เดโม Seamless Translation ยอดเยี่ยมมาก

    • เสียงที่แปลแล้วคล้ายกับเสียงต้นฉบับของตัวเอง
    • ถ้าทำฟีเจอร์นี้แบบเรียลไทม์ได้จะน่าทึ่งมาก
  • Meta เข้าใจอิทธิพลของ GPT-3 และ ChatGPT อย่างลึกซึ้ง

    • โมเดลเป็นเพียงจุดเริ่มต้น และ UX ที่ใช้โมเดลต่างหากที่แสดงให้เห็นถึงความฉลาด
    • เห็นได้ชัดเป็นพิเศษในโมเดลด้านภาพ
    • น่าสนใจที่ SAM2 บอกว่า "มองเห็นอะไรก็ได้"
    • การคลิกที่ลูกฟุตบอลแล้วเห็นโมเดลติดตามมันในวิดีโอได้อย่างลื่นไหลแม้จะถูกบัง ก็ทำให้น่าทึ่ง
  • ไม่ได้รวมทุกเดโมไว้ทั้งหมด

    • ตัวอย่างเช่น เดโม Meta Motivo หายไป (โมเดลควบคุมฮิวแมนนอยด์)
  • มีข้อความขึ้นว่า "ขณะนี้ไม่สามารถใช้ไซต์ได้ในภูมิภาคของคุณ"

  • สงสัยว่าลิงก์ทั้งหมดของโมเดลอยู่ที่ไหน

  • น่าสนใจ แต่ก็อยากให้ Meta บอกให้ชัดเจนว่าจริง ๆ แล้วต้องการอะไร

    • น่าจะหมายถึง "โปรดส่งข้อมูล In the Wild มาให้เพื่อฝึกโมเดลเพิ่มเติม"
  • เคยมีประสบการณ์กับเทคโนโลยีประเมินอายุเมื่อหลายปีก่อน

    • ผู้ใช้อัปโหลดภาพ แล้วช่วยจัดแนวจุด landmark บนใบหน้า 10% ก่อนรันตัวประเมิน
    • ถ้าผิดก็จะขอให้ช่วยแก้ไขเพื่อนำไปปรับปรุง
    • ยังดูเจ๋งอยู่ แต่เมื่อเทียบกับประสบการณ์ก่อนหน้านั้นก็ไม่ได้รู้สึกว้าวมากนัก