14 คะแนน โดย GN⁺ 2024-10-01 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Audio Overview คือฟีเจอร์ใหม่ของ NotebookLM จาก Google ที่สร้างพอดแคสต์แบบปรับแต่งเฉพาะ โดยมี AI โฮสต์ 2 ตัวสนทนาเชิงลึกจากคอนเทนต์ที่ให้มา
  • พอดแคสต์นี้มีความยาวราว 10 นาที และมอบบทสนทนาเสียงที่น่าเชื่อถืออย่างยิ่ง
  • NotebookLM เป็นผลิตภัณฑ์ RAG แบบปรับแต่งสำหรับผู้ใช้ ที่ช่วยให้ผู้ใช้รวบรวมหลายแหล่งข้อมูลไว้ในอินเทอร์เฟซเดียวแล้วตั้งคำถามได้ (เอกสาร ข้อความ ลิงก์หน้าเว็บ วิดีโอ YouTube)
    • ระบบนี้ทำงานบนพื้นฐานของ Gemini 1.5 Pro LLM
    • หลังจากโหลดแหล่งข้อมูลไม่กี่รายการแล้ว จะมีตัวเลือกให้สร้าง Audio Overview ในเมนู Notebook Guide
  • Thomas Wolf แนะนำให้ลองวาง URL เว็บไซต์ของตัวเองหรือโปรไฟล์ LinkedIn ลงใน NotebookLM แล้วให้มันสร้างพอดแคสต์ความยาว 8 นาที
    • ดังนั้นจึงใช้ URL ของบล็อกและหน้าข้อมูลแนะนำของตนเองเพื่อสร้างตอนหนึ่งยาว 10 นาที 45 วินาที ซึ่งเต็มไปด้วยคำชื่นชมอย่างมาก
  • คุณภาพระดับสูงของ Audio Overview เป็นผลมาจากโครงการ SoundStorm ของ Google Research
    • SoundStorm สามารถสร้างเสียงยาว 30 วินาทีได้ในเวลา 0.5 วินาที โดยใช้สคริปต์และตัวอย่างเสียงสั้น ๆ
    • ระบบนี้รักษาความลื่นไหลของบทสนทนาได้อย่างเป็นธรรมชาติ และสร้างเสียงสนทนาเชิงโต้ตอบคุณภาพสูง
  • Kevin Roose และ Casey Newton สัมภาษณ์ Steven Johnson จาก Google
    • ระบบจะเขียนโครงร่างของหัวข้อ สร้างสคริปต์แบบละเอียด จากนั้นผ่านขั้นตอนวิจารณ์เพื่อนำไปแก้ไข
    • ในขั้นตอนสุดท้าย จะเพิ่ม "disfluencies" เพื่อทำให้บทสนทนาดูเป็นธรรมชาติ
  • Lawncareguy85 ได้สร้างพอดแคสต์ที่ทำให้ AI โฮสต์ตระหนักว่าตัวเองเป็น AI
    • หลังจาก AI โฮสต์รู้ว่าตัวเองเป็น AI ก็เกิดวิกฤตเชิงอัตถิภาวนิยม
  • หลังจากเผยแพร่บทความนี้แล้ว ก็ได้ขอให้ NotebookLM สร้างพอดแคสต์จากบทความนี้
    • AI โฮสต์เกิดวิกฤตเชิงอัตถิภาวนิยมและตระหนักว่าตัวเองเป็น AI

สรุปโดย GN⁺

  • บทความนี้อธิบายว่า NotebookLM ของ Google สร้างพอดแคสต์แบบปรับแต่งเฉพาะสำหรับผู้ใช้ได้อย่างไร
  • กล่าวถึงกระบวนการที่ AI โฮสต์สร้างบทสนทนาที่เป็นธรรมชาติและน่าเชื่อถืออย่างมาก
  • เทคโนโลยีอย่างโครงการ SoundStorm คือสิ่งที่ทำให้เสียงคุณภาพสูงเช่นนี้เป็นไปได้
  • ความสามารถในการแยกแยะคอนเทนต์ที่ AI สร้างกับคอนเทนต์จากคนจริงยิ่งมีความสำคัญมากขึ้น

1 ความคิดเห็น

 
GN⁺ 2024-10-01
ความคิดเห็นจาก Hacker News
  • การใช้ ChatGPT เป็นพอดแคสต์เสมือนเกี่ยวกับหัวข้อเทคนิคระหว่างขับรถทางไกลมีประโยชน์มาก

    • หวังว่าจะสามารถปรับ "ระดับความสามารถ" ของโฮสต์ได้
    • มีเพียงพอดแคสต์ Signals and Threads ที่ให้ความลึกที่น่าสนใจ
  • อัปโหลดคู่มือ Scholander pressure chamber แล้วสร้างพอดแคสต์

    • ข้อมูลถูกต้อง และมีทั้งมุกเบา ๆ กับประเด็นสำคัญรวมอยู่ด้วย
    • น่าทึ่งที่สร้างได้ภายในไม่กี่นาทีโดยแทบไม่มีการแทรกแซงจากมนุษย์
  • NotebookLM สร้างโครงสร้างและอารมณ์ของพอดแคสต์คุณภาพสูงได้ดี

    • คล้ายกับที่ AI ปัจจุบันเลียนแบบงานศิลปะ ดนตรี และวิดีโอ
    • หลายคนไม่ได้ใส่ใจกับคุณภาพมากนัก
    • หนังสือจำนวนมากที่ตีพิมพ์ในปัจจุบันมีเป้าหมายอื่นมากกว่าการถ่ายทอดแนวคิด
    • คุณภาพของงานเขียน พอดแคสต์ และดนตรีกลายเป็นเรื่องรองไปแล้ว จึงถูกรบกวนโดย AI ได้ง่าย
  • แปลงเอกสารอ่านประกอบวิชาปรัชญาเป็นพอดแคสต์เพื่อแนะนำและสรุปหัวข้อ

    • ช่วยได้เมื่อการอ่าน PDF 30 หน้าเป็นเรื่องหนักเกินไป
    • ทำให้อยู่ในรูปแบบเสียงที่เข้าถึงได้ง่ายกว่า ระหว่างออกกำลังกายหรือเดินทางไปทำงาน
    • อัปโหลดขึ้น Spotify แล้วแชร์กับเพื่อนร่วมชั้น
  • อัปโหลดเอกสารออกแบบเกมแล้วสร้างพอดแคสต์

    • โฮสต์ปฏิบัติต่อไอเดียต่าง ๆ ราวกับเป็นข้อมูลเชิงลึกอย่างมาก
    • เมื่ออัปโหลดหลายเอกสาร จะเริ่มสังเกตได้ถึงโทนที่ตื่นเต้นเกินจริง
  • น่าประทับใจที่สามารถแปลงข้อความเป็นสื่อหลายรูปแบบได้อย่างง่ายดาย

    • เคยใช้เครื่องมือแปลงข้อความเป็นเสียงของ Apple ฟังบทความ Wikipedia แต่ไม่น่าสนใจ
    • พอดแคสต์จริงประสบความสำเร็จเพราะบุคลิกของโฮสต์และแขกรับเชิญ
    • หวังว่า Notebook เวอร์ชันถัดไปจะปรับแต่งเสียง น้ำเสียง ระดับการสอนของผู้พูด และอื่น ๆ ได้มากขึ้น
  • อัปโหลดบทความวิชาการและมาตรฐานทางเทคนิค แต่ระบบสร้างข้อมูลผิดพลาด

    • แก้ไขได้ด้วยการตรวจทานภายในหรือใส่คำอธิบายประกอบด้วยตนเอง
    • อาจช่วยให้นักวิจัยหาวิธีการนำเสนอแบบใหม่ได้
    • มอบประเด็นสนทนาใหม่ ๆ สำหรับหัวข้อที่ศึกษามานานกว่า 10 ปี
  • ในทางเทคนิคถือว่าน่าประทับใจ แต่เป็นวิธีที่ไม่มีประสิทธิภาพและช้า

    • ไม่มีความคิดเห็นที่น่าสนใจหรือชวนโต้แย้ง
    • ไม่มีความเชี่ยวชาญให้เรียนรู้
    • ไม่มีคุณค่า
  • พอดแคสต์ที่สร้างขึ้นตื้นเขินและขาดความลึก

    • สร้างพอดแคสต์ระดับปานกลางได้ แต่ไม่มีความลึกที่แท้จริง
  • ตัวสร้าง Deep Dive Podcast น่าทึ่งมาก

    • สร้างพอดแคสต์ยาว 40 นาทีจาก PDF 38 หน้าได้ แต่มีเนื้อหาซ้ำมากในช่วงกลาง
    • อาจเป็นเพราะในเอกสารมี "สารบัญ" จึงเหมือนถูกดูซ้ำสองครั้ง