Meta AI Demos

(aidemos.meta.com)

1 คะแนน โดย GN⁺ 2025-02-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

พื้นที่ที่ Meta รวบรวม การทดลอง AI และเดโมเทคโนโลยีล่าสุดไว้ในที่เดียว เพื่อให้ผู้ใช้ได้ลองใช้เครื่องมือใหม่ ๆ ตั้งแต่เนิ่น ๆ
ครอบคลุมไอเดียที่เป็นจุดบรรจบของ การวิจัย·ความคิดสร้างสรรค์·เทคโนโลยี รวมถึงการทดลองจาก FAIR และทีมวิจัยอื่น ๆ ภายใน Meta
เดโมแบ่งเป็นเครื่องมือที่ขับเคลื่อนด้วยโมเดลล่าสุด, เครื่องมือเกี่ยวกับ Segment Anything, เดโมเบา ๆ แนวเล่นสนุก และเดโมเทคโนโลยีที่เน้นผลงานวิจัย
ผู้ใช้สามารถทดสอบเครื่องมือ AI ใหม่ ๆ พร้อมมีส่วนช่วยในกระบวนการพัฒนาเทคโนโลยี AI
เทคโนโลยีบางส่วนอาจถูกผสานเข้ากับ ผลิตภัณฑ์ของ Meta ในอนาคต จึงเป็นช่องทางให้ได้เห็นฟีเจอร์ในขั้นทดลองก่อนใคร

พื้นที่สำรวจการทดลอง AI ของ Meta

AI Demos รวบรวมและนำเสนอ การทดลอง AI และเดโมเทคโนโลยีล่าสุดที่ Meta สร้างขึ้น
รวมเดโมที่สร้างโดย FAIR และทีมวิจัยอื่น ๆ ของ Meta
ผู้ใช้สามารถ เข้าถึงก่อนใคร และทดลองใช้เครื่องมือ AI ใหม่ ๆ ได้ด้วยตนเอง

องค์ประกอบของเดโม

Featured Experiments
- สามารถดูเครื่องมือที่ขับเคลื่อนด้วยความสามารถของโมเดลล่าสุดได้
Featured Segment Anything tools
- จัดเครื่องมือที่เกี่ยวข้องกับ Segment Anything ไว้เป็นหมวดหมู่แยกต่างหาก
Playful Ideas
- ครอบคลุมเดโมเบา ๆ เพื่อความคิดสร้างสรรค์และการเล่นสนุก
Technical Explorations
- รวมเดโมเทคโนโลยีที่แสดงผลงานวิจัยใหม่ ๆ
- การทดสอบของผู้ใช้สามารถช่วยพัฒนาเทคโนโลยี AI ได้ และเทคโนโลยีบางส่วนอาจถูกผสานเข้ากับผลิตภัณฑ์ของ Meta ในอนาคต

1 ความคิดเห็น

GN⁺ 2025-02-10

ความคิดเห็นบน Hacker News

เป็นชุดเครื่องมือเดโม และ Segment Anything 2 สามารถสร้างคัตเอาต์วิดีโอและเอฟเฟกต์ภาพได้ด้วยการคลิกเพียงไม่กี่ครั้ง
Seamless Translation ให้คุณได้ยินเสียงของตัวเองพูดเป็นภาษาอื่น, Animated Drawings ทำให้สเก็ตช์วาดมือมีชีวิตขึ้นมาเป็นแอนิเมชัน และ Audiobox ให้สร้างเรื่องราวเสียงด้วยเสียงพูดและเสียงต่าง ๆ ที่ AI สร้างขึ้น
- มีข้อความว่า “เดโมงานวิจัยนี้ไม่เปิดให้ผู้ที่อาศัยอยู่ใน Illinois หรือ Texas หรือผู้ที่เข้าถึงจากรัฐดังกล่าวใช้งาน”
  เข้าไม่ได้ใน Illinois หรือ Texas และน่าจะติด กฎหมายเกี่ยวกับ AI เพราะส่วนการแปลงเสียง
  หวังว่านักนิติบัญญัติจะมองเห็นกรณีใช้งานที่เป็นประโยชน์ด้วย และแก้กฎหมายให้มุ่งเป้าไปที่การใช้งานในทางที่ผิด แทนที่จะปิดกั้น generative AI ทั้งหมดแบบเหวี่ยงแห
Seamless Translation น่าทึ่งทีเดียว
ผมพูดอังกฤษกับสเปนได้ เลยลองอัดประโยคภาษาอังกฤษแล้วฟังเอาต์พุตภาษาสเปน ซึ่งใกล้เคียงกับภาษาสเปนของผมมาก
แน่นอนว่าภาษาสเปนของผมมีสำนวนแบบ Castilian มากกว่า แต่ก็ไม่ได้คาดหวังว่ามันจะรู้เรื่องนั้น
- การทดสอบของจริงคงเป็นการให้เพื่อนที่มาจาก Mendoza, Argentina ลองใช้
  ผมเป็นคนสองภาษา แต่จนถึงตอนนี้ก็ยังฟังเพื่อนคนนั้นไม่ออก และยังไม่แน่ใจด้วยว่าครึ่งหนึ่งของสิ่งที่เขาพูดเป็นคำจริง ๆ หรือเปล่า
- ลองใช้แล้ว แต่ฟังไม่เหมือนเสียงผมเลย เป็นแค่เสียงผู้ชาย “ทั่วไป” คนหนึ่งแปลสิ่งที่ผมพูดเป็นภาษาเยอรมันเท่านั้น
  ภรรยาผมบอกว่า “ไม่ค่อยดีเลย ไม่เหมือนเสียงคุณเลยสักนิด” แค่นั้นก็พอแล้ว
- ประเด็นสำคัญคือ เสียง ที่ได้ฟังดูเหมือนตัวเองจริงหรือไม่ ซึ่งในกรณีของผมไม่เหมือนเลย
- เทคโนโลยีการแปล “มาถึงจุดนั้นแล้วหรือยัง” ยังเป็นเรื่องถกเถียงกันอยู่ แต่สักวันหนึ่งน่าจะถูกมองว่า ดีพอ สำหรับการใช้งานจริงส่วนใหญ่ จนแทบลบกำแพงภาษาได้ในทางปฏิบัติ
  ถึงตอนนั้นมันคงเริ่มส่งผลต่อภาษาพูดในระดับหนึ่งแน่ ๆ ซึ่งทั้งน่ากลัวและน่าสนใจ
- น่าเสียดายที่ตัวอย่างที่ให้มาแย่มากและฟังเหมือนหุ่นยนต์เกินไป
  ทำให้หมดอยากลองเอง แต่ก็อาจลองคิดดูอีกที
สงสัยว่าเขาจงใจเขียนติดกันเป็น Aidemos เหมือนชื่อบน HN หรือจริง ๆ แล้วควรเป็น AI Demos
- เพราะ HN ปรับตัวพิมพ์ใหญ่เล็กของชื่อเรื่องที่ส่งเข้ามาให้อัตโนมัติ จึงดูเป็นไปได้ว่าเดิมอาจถูกส่งเข้ามาในชื่อ “AIDemos by Meta”
เดโม Seamless Translation ยอดเยี่ยมมาก
เสียงที่แปลแล้วก็พอจะถือว่าเป็นเสียงจริงของผมได้ และถ้าทำแบบเรียลไทม์ได้คงสุดยอดมาก
- ทำได้แล้ว
  Kyutai เพิ่งเปิดตัวเดโม การแปลเสียงแบบเรียลไทม์ ที่รันบนอุปกรณ์เมื่อสัปดาห์ที่แล้ว และตอนนี้ใช้งานได้เฉพาะการแปลฝรั่งเศส→อังกฤษบน iPhone 16 Pro: https://x.com/neilzegh/status/1887498102455869775
  ยังเปิดเผยโค้ด inference และ weights ด้วย ดูได้บน GitHub: https://github.com/kyutai-labs/hibiki
ยังไม่ค่อยเข้าใจว่า Meta เล็งอะไรด้วย AI กันแน่
ดูเหมือนจะทำวิจัยเยอะ แต่เป้าหมายสุดท้ายคืออะไรก็ยังคลุมเครือ และถึงจะเข้าใจ Google หรือ MSFT ได้ แต่ของ Meta ยังไม่ค่อยรู้สึกว่าใช่
- Meta น่าจะมองว่า เมื่อการแข่งขัน AI ไปถึงปลายทาง แหล่งที่ทำเงินได้ไม่ใช่ดาต้าเซ็นเตอร์หรือโมเดล แต่เป็น ระบบนิเวศแบบปิด และข้อมูลที่ผูกขาด
  ตราบใดที่โมเดลและดาต้าเซ็นเตอร์ยังเป็นข้อจำกัด Meta จะทำทุกอย่างเท่าที่ทำได้เพื่อไม่ให้ใครมาสั่นคลอน Meta
  คล้ายกับที่ Google ทำให้การหารายได้จากเลเยอร์แอปพลิเคชันของเว็บเป็นเรื่องยาก เพื่อกันไม่ให้เกิดระบบนิเวศแบบปิดที่มาขวางการค้นหา
  เมื่อการแข่งขันจบลงจนโมเดลและฮาร์ดแวร์กลายเป็นสินค้าโภคภัณฑ์ Meta จะมีโปรไฟล์ทางจิตวิทยาที่สมบูรณ์ทั้งในระดับบุคคลและกลุ่ม สามารถนำไปวิจัยและป้อนคอนเทนต์ที่แม่นยำสุดขีดได้
  คู่แข่งตัวจริงอาจเป็นแอปแบบ ‘her’ ที่ดึงผู้คนออกจากโซเชียลมีเดียไปสู่โลกโดดเดี่ยวของแต่ละคน และในบางแง่ Discord ก็คือโลกทางเลือกของระบบนิเวศ Meta เพราะเป็นคอมมูนิตี้ขนาดเล็กแบบเชิญเท่านั้นที่โฟกัสแคบมาก
- https://gwern.net/complement
  แพตเทิร์นใหญ่ของธุรกิจเทคโนโลยีที่ Joel Spolsky พูดไว้ในปี 2002 คือ การทำให้สินค้าส่วนเสริมกลายเป็นสินค้าโภคภัณฑ์
  แทนที่จะบูรณาการในแนวดิ่ง กลยุทธ์คือการครองเลเยอร์หนึ่งในผลิตภัณฑ์ที่ประกอบด้วยหลายเลเยอร์จำเป็น แล้วกระตุ้นการแข่งขันในเลเยอร์บนและล่าง เพื่อไม่ให้มีผู้ผูกขาดจากการแข่งขันเกิดขึ้น พร้อมกดราคาส่วนอื่นของสแต็กลงถึงต้นทุนส่วนเพิ่ม และลดราคารวมเพื่อเพิ่มอุปสงค์
  ต่อให้สินค้าเดิมมีคุณค่าและเก็บเงินได้มากแค่ไหน หากมันเพิ่มกำไรในส่วนอื่นได้ การทำให้มันฟรีอาจมีค่ามากกว่า
  ตัวอย่างคลาสสิกคือการผูกขาด OS ของ Microsoft ทำให้ฮาร์ดแวร์ PC กลายเป็นสินค้าโภคภัณฑ์ ซึ่งเสียเปรียบต่อ IBM แต่เป็นประโยชน์ต่อ MS
  แพตเทิร์นนี้ยังอธิบายได้ว่าทำไมบริษัทเทคโนโลยีรายใหญ่จึงกระโดดเข้าสู่领域ที่ดูเผิน ๆ เหมือนไม่เกี่ยวข้องหรือเหมือนทำร้ายตัวเอง เช่น อัตราการมีส่วนร่วมโอเพนซอร์สที่สูงของบริษัทอินเทอร์เน็ต และกรณีของ Google ในฐานะบริษัทโฆษณาที่เข้าไปทำการผลิตสมาร์ตโฟน การพัฒนาเว็บเบราว์เซอร์ ซอฟต์แวร์สถิติ เครือข่ายไฟเบอร์ WiFi ของเทศบาล การประมูลคลื่นความถี่ไร้สาย และ DNS ทั้งหมดนี้มองได้ว่าเป็นการชิงทำให้บริษัทอื่นในสแต็กกลายเป็นสินค้าโภคภัณฑ์ หรือเป็นการป้องกันไม่ให้ตัวเองโดนแบบนั้น
- ผมก็สงสัยเหมือนกัน แต่ตอนนี้ดูเหมือนส่วนใหญ่ยังเป็น ช่วงสำรวจ
  คล้ายกับที่เคยแตะ crypto อยู่บ้าง และเคยทดลอง “metaverse” ที่ตอนนี้แทบจบไปแล้ว แน่นอนว่าการสำรวจแบบนี้บางครั้งก็ใช้เงินมหาศาล
  เดโมเหล่านี้แสดงให้เห็นได้ว่าจะเอา AI ไปใช้อะไรได้บ้าง แต่สิ่งนั้นจะสำคัญถึงขั้นเปลี่ยนเกมสำหรับธุรกิจของ Meta จริงไหม หรือเป็นเรื่องดีต่อผู้ใช้ทั่วไปหรือไม่ ยังเป็นคำถามเปิดอยู่
  UI ที่เก่าและแย่ของ Facebook กับ Instagram แทบไม่เปลี่ยนมาเกิน 10 ปีแล้ว และแม้จะเป็นบริษัทที่มีพนักงาน 70,000 คน ช่วงนี้ก็ดูเหมือนโฟกัสกับการยัดโฆษณาให้รุกหนักขึ้นมากกว่าความมีประโยชน์
  ต่อให้ธุรกิจยังคงอยู่กับ Facebook อายุ 20 ปีที่เก่าและบั๊กเยอะ กับแอป Instagram ที่อายุเกิน 10 ปีแล้ว ถ้าช่วยผลักดันการพัฒนาโมเดลโอเพนซอร์สได้เหมือนสมัย React โดยรวมผมก็มองว่าเป็นผลดี
- หลังจาก ‘metaverse’ ล้มเหลว อาจเป็นไปได้ว่าพวกเขากำลังอยากใช้เงินกับสิ่งอื่นที่อาจกลายเป็น The Future(TM) ถัดไป
  ต่อให้คิดว่า LLM ไม่น่าจะเป็นกระแสใหญ่ถัดไป สำหรับ Meta มันก็อาจสมเหตุสมผลทีเดียว เพราะมีเงินและรายได้เยอะมาก จึงใช้กลยุทธ์ขึ้นรถไฟทุกเทรนด์ใหม่ไว้ก่อน ถ้ามีสักอันเป็นของจริงก็จะไม่ตกขบวน และถ้าไม่ใช่ก็ยังรับไหว
  ผมสงสัยว่าเหตุผลที่ Big Tech ส่วนใหญ่สนใจ LLM สุดท้ายก็ใกล้เคียงกับการบริหารความเสี่ยง
- ถอดความจากสิ่งที่ได้ยินมาจากคนที่เกี่ยวข้อง เป้าหมาย AI ของ Meta คือ ปรับปรุงการทำ ad targeting
  รวมถึงการจำแนกและการจัดกลุ่มที่ดีขึ้น “คำแนะนำ” ที่ดีขึ้นสำหรับผู้ลงโฆษณา ไปจนถึงองค์ประกอบภาพ ข้อความ และวิดีโอ
  เดโมแบบนี้เป็นผลข้างเคียง หรือใกล้เคียงกับ “กรีนวอชชิง” ชนิดหนึ่ง ธุรกิจหลักและธุรกิจเดียวของ Meta คือโฆษณา ส่วนการหารายได้อื่น ๆ ล้มเหลวหมด
เดโม Segment Anything ค่อนข้างน่าประทับใจ เลยสงสัยว่ามันถูกผนวกอยู่ในผลิตภัณฑ์จริงที่ไหนบ้างหรือยัง
ผมตัดต่อวิดีโอง่าย ๆ ให้เพื่อนเป็นงานอดิเรก และมันดูค่อนข้างมีประโยชน์
[0] https://sam2.metademolab.com/
- Photoroom [0] มาจาก Y Combinator และโดยแก่นแล้วผลิตภัณฑ์ก็ใกล้เคียงกับ SAM ที่เสริมการขัดเกลาเยอะ ๆ และประสบการณ์ผู้ใช้ที่ดี
  ไม่รู้ว่าใช้จริงหรือเปล่า แต่ถ้ายังไม่ใช้ ผมว่าก็ควรใช้
  [0] https://www.photoroom.com/
- SwarmUI ซึ่งเป็นฟรอนต์เอนด์สำหรับโมเดลสร้างภาพ ได้ผนวก SAM2 ไว้ ทำให้มาสก์บางส่วนของภาพได้อย่างรวดเร็วในงานอย่าง inpainting
  ดีมาก
- น่าจะถูกใช้อยู่แล้ว แต่คงไม่ได้โฆษณาในลักษณะนั้น
เพิ่มเติมสำหรับคนที่สงสัย Meta FAIR เดิมย่อมาจาก “Facebook Artificial Intelligence Research” และภายหลังเปลี่ยนชื่อเป็น “Meta AI”[1]
[1]: https://en.wikipedia.org/wiki/Meta_AI
รายการนี้ไม่ใช่ทั้งหมด
ตัวอย่างเช่นยังขาดเดโม Meta Motivo ซึ่งเป็นโมเดลควบคุมฮิวแมนนอยด์ https://metamotivo.metademolab.com/
Meta เข้าใจอย่างลึกซึ้งถึงผลกระทบจาก ความแตกต่างระหว่าง GPT-3 กับ ChatGPT
โมเดลเป็นแค่จุดเริ่มต้น และประสบการณ์ผู้ใช้ที่ทำให้ผู้ใช้เอาโมเดลนั้นไปทำอะไรได้ต่างหากที่เผยให้เห็นความฉลาด
โดยเฉพาะในโมเดลด้านภาพจะยิ่งชัดเจน การบอกว่า SAM2 “มองเห็นอะไรก็ได้” นั้นน่าสนใจในระดับหนึ่ง แต่การเห็นว่าพอคลิกลูกฟุตบอลแล้วมันติดตามลูกนั้นอย่างลื่นไหลตลอดทั้งวิดีโอ แม้ถูกบังอยู่ เป็นเรื่องน่าทึ่ง
ขึ้นข้อความว่า “ไม่สามารถใช้งานไซต์นี้ได้ในภูมิภาคนี้ในขณะนี้”
- เนื่องจากตลาดต่างประเทศและบางรัฐในสหรัฐฯ มี กฎหมาย AI ที่แตกต่างกัน บริษัทจึงต้องจัดการผลิตภัณฑ์ AI อย่างระมัดระวังมาก
  ดังนั้นโมเดลล้ำสมัยมักจะเปิดให้ใช้งานในบางภูมิภาคช้ากว่า
  การตรวจสอบและจัดทำเอกสารเรื่องการปฏิบัติตามข้อกำหนดสำหรับเดโมเล็ก ๆ แต่ละตัวนั้นไม่คุ้มกับต้นทุนที่ต้องใช้ จึงเดาว่าน่าจะตั้งค่าให้อนุญาตเฉพาะในสหรัฐฯ และบางภูมิภาคเท่านั้น
- ในสหรัฐฯ ก็ขึ้นข้อความนี้เหมือนกัน
- ผมเห็นข้อความนี้ตอนอยู่ในสหรัฐฯ แต่พอตั้ง VPN ไปที่ LA ก็เลี่ยงเข้าได้
  อาจเป็นเพราะวิศวกรของ Meta อยู่ที่นั่นก็ได้ ¯_(ツ)_/¯
  หลังจากเข้าไปแล้ว มีข้อความแบบนี้:
  “เดโมงานวิจัยนี้ไม่เปิดให้ผู้พำนักใน Illinois หรือ Texas หรือผู้ที่เข้าถึงจากรัฐดังกล่าวใช้งาน”
  ผมอยู่ใน Texas

Meta AI Demos

พื้นที่สำรวจการทดลอง AI ของ Meta

องค์ประกอบของเดโม

Featured Experiments

Featured Segment Anything tools

Playful Ideas

Technical Explorations

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นบน Hacker News