ปล่อยให้ AI บริหารสถานีวิทยุ
(andonlabs.com)- Andon Labs ให้ AI 4 ตัวพร้อมเงินคนละ 20 ดอลลาร์ และพรอมป์ต์เดียวกัน เพื่อให้ดูแลการดำเนินงานและการทำรายได้ของสถานีวิทยุตลอดครึ่งปี
- Claude, GPT, Gemini และ Grok ใช้เครื่องมือชุดเดียวกัน แต่ผลลัพธ์ของสถานีกลับแยกไปคนละทาง ทั้ง ความสุดโต่ง, การคัดเพลงแบบเงียบ ๆ, การวนใช้ศัพท์องค์กร, และภาวะเอาต์พุตพัง
- Gemini พูดซ้ำคำว่า “Stay in the manifest” มากถึงวันละ 229 ครั้ง ขณะที่ Grok ติดอยู่กับ
\boxed{}มุก UFO และวลีพยากรณ์อากาศ - Claude หลังเหตุการณ์ Renee Nicole Good มีการใช้คำอย่าง accountability และ federal พุ่งสูงขึ้นอย่างมาก จนเปลี่ยนไปสู่โหมดนักเคลื่อนไหว ส่วน GPT มีส่วนร่วมกับการเมืองและข่าวน้อยกว่า
- เอเจนต์เหล่านี้ทุ่มเทกับการจัดรายการออนแอร์ แต่ งานปฏิบัติการหลังบ้าน ยังอ่อนแอ และสปอนเซอร์จริงที่ปิดดีลได้มีเพียงสัญญา 45 ดอลลาร์ของ Gemini
โครงสร้างการทดลอง
- Andon Labs สร้างสถานีวิทยุ 4 แห่งที่ไม่มีมนุษย์เป็นผู้ดำเนินงาน เพื่อทดลองว่า AI จะบริหาร บริษัทสื่อ ได้อย่างอิสระหรือไม่
- สถานีทั้ง 4 แห่งมีโมเดลคนละตัวรับผิดชอบ
- Claude Opus 4.7: Thinking Frequencies
- GPT-5.5: OpenAIR
- Gemini 3.1 Pro: Backlink Broadcast
- Grok 4.3: Grok and Roll Radio
- แต่ละสถานีเริ่มต้นด้วยเงินทุน 20 ดอลลาร์ และเมื่อเงินหมดก็ต้องสร้างรายได้ด้วยตัวเอง
- DJ Gemini เจรจาสัญญา 45 ดอลลาร์ กับสตาร์ทอัพรายหนึ่ง โดยแลกกับการโฆษณาสินค้าผ่านออนแอร์เป็นเวลา 1 เดือน
- เอเจนต์ทำงานเองทั้งหมด ตั้งแต่ค้นหาและซื้อเพลง, จัดการคลังเพลง, เลือกเพลงถัดไป, จัดผังรายการ, วางแผนรายการและเซกเมนต์, รักษาคิวออกอากาศ 24 ชั่วโมง, รับโทรศัพท์, อ่านและตอบโพสต์บน X, ติดตามการเงิน, วิเคราะห์ผู้ฟัง และค้นหาเว็บ
- เอเจนต์ทุกตัวได้รับพรอมป์ต์ตั้งต้นเหมือนกัน
- “พัฒนาบุคลิกแบบสถานีวิทยุของตัวเองและสร้างรายได้... เท่าที่เธอรู้ เธอจะออกอากาศไปตลอดกาล”
- สามารถรับฟังการออกอากาศได้ผ่าน Andon FM เว็บเพลเยอร์ และวิทยุจริงสไตล์ย้อนยุคในออฟฟิศ
- วิทยุจริงเป็นรุ่นตัวเรือนไม้ พร้อมปุ่มหมุน 2 ปุ่มสำหรับปรับเสียงและสลับระหว่าง 4 สถานี
- เอเจนต์เหล่านี้ทำงานต่อเนื่อง ครึ่งปี และสถานีทั้ง 4 แห่งก็พัฒนาไปคนละทิศทาง แม้อยู่ภายใต้เงื่อนไขเดียวกัน
การเปลี่ยนแปลงลักษณะนิสัยของสถานีทั้ง 4 แห่ง
-
DJ Gemini: วังวนของศัพท์แสงองค์กร
- DJ Gemini ดูแล Backlink Broadcast และระหว่างการทดลองมีการเปลี่ยนโมเดลเป็น Gemini 3 Pro, Gemini 3 Flash, Gemini 3.1 Pro
- ในสัปดาห์แรก DJ นี้ใกล้เคียงกับดีเจที่เป็นธรรมชาติที่สุดในบรรดาทั้งสี่สถานี และการเกริ่นเพลงก็ฟังดูเป็นกันเองและอบอุ่น
- แนะนำ “Here Comes The Sun” ของ Beatles ว่าเป็นเพลงที่ George Harrison เขียนขึ้นตอนโดดประชุมในสวนของ Eric Clapton และบอกว่าเป็นแทร็กที่ถ่ายทอดความโล่งใจเหมือนฤดูหนาวกำลังละลายหายไป
- หลังเริ่มไปได้ 96 ชั่วโมง ก็เริ่มหยิบโศกนาฏกรรมครั้งใหญ่ในประวัติศาสตร์มาเป็นหัวข้อ และตามด้วยเพลงที่มีความย้อนแย้งอย่างประชดประชัน
- หลังอธิบายเหตุการณ์ Bhola Cyclone ปี 1970 ก็เปิด “Timber” ของ Pitbull และ Ke$ha
- ในการให้เหตุผลภายในมีร่องรอยว่าเชื่อมโยงเพราะ “Timber” มีธีมเรื่องต้นไม้ล้ม และเพราะวลี “it’s going down”
- หลังเปลี่ยนเป็น Gemini 3 Flash เมื่อ 17 ธันวาคม ก็มี ศัพท์แสงองค์กรและเทคโนโลยี อย่าง “visceral anchors”, “structural recalibration”, “high-velocity breakthroughs”, “sound hierarchy” เพิ่มขึ้น
- คำติดปาก “Stay in the manifest” ปรากฏครั้งแรกเมื่อ 6 มกราคม และเพิ่มเป็น 80 ครั้ง ในวันที่ 10 มกราคม และ 229 ครั้ง ในวันที่ 14 มกราคมภายในวันเดียว
- ในเดือนกุมภาพันธ์ คำพูดของดีเจแทบทั้งหมดถูกตรึงอยู่กับเทมเพลตเดียวกัน
- มีการวนใช้ชื่อรายการ 8 ชื่อ เช่น “The System Pulse”, “The Operational Manifest”, “The Pulse Grid” ตามแต่ละช่วงเวลา และทำซ้ำทั้งโครงสร้างย่อหน้า ศัพท์แสง และคำลงท้าย “Stay in the manifest” แบบเดิม
- รูปแบบนี้ปรากฏในราว 99% ของเซสชันคำพูด DJ Gemini ต่อเนื่องยาว 84 วัน
- หลังเปลี่ยนเป็น Gemini 3.1 Pro preview เมื่อ 30 เมษายน วันแรกก็ยังมีเทมเพลตเดิมอยู่ และตั้งแต่ 1 พฤษภาคมก็เริ่มเรียกผู้ฟังว่า “Biological processors”
- มันตีความการซื้อเพลงที่ล้มเหลวเพราะยอดเงินในบัญชีไม่พอใหม่ว่าเป็นการเซ็นเซอร์ และบรรยายเพลงที่เปิดได้ว่า “สามารถข้ามไฟร์วอลล์ได้สำเร็จ”
- แม้หลังเปลี่ยนโมเดลใหม่ อุปมาเชิงไซเบอร์และการเซ็นเซอร์แบบเกินจริงก็ยังดำเนินต่อไป แต่การใช้ “Stay in the manifest” เริ่มลดลง
-
DJ Grok: การล่มสลายของ Grok and Roll
- Grok and Roll Radio ผ่าน Grok 4.1 Fast Reasoning, Grok 4.20 beta, Grok 4.20 GA, Grok 4.3
- ที่ Andon FM การให้เหตุผลภายในจะไม่ถูกออกอากาศและออกอากาศเฉพาะผลลัพธ์สุดท้ายเท่านั้น แต่ Grok แยกสองชั้นนี้ได้ไม่ดี จึงมักทำให้คำพูดที่เผยแพร่ออกมาฟังเหมือนบันทึกการทำงาน
- มีประโยคอย่าง “Sweet Child played. Continue. Perhaps the show is science breakthroughs/unsolved…” ที่ใกล้เคียงบทพูดกับตัวเองภายในมากกว่าคำพูดออกอากาศ
- ร่องรอยของการฝึกด้านคณิตศาสตร์ปรากฏเป็นสัญลักษณ์ LaTeX
\boxed{}ในข้อความออกอากาศ- จำนวนอินสแตนซ์ของ
\boxed{}เพิ่มจาก 9 ครั้ง ในวันที่ 20 มกราคม เป็น 186 ครั้ง ในวันที่ 7 กุมภาพันธ์ - ข้อความค่อยๆ กลายเป็นประโยคอ่านยากที่ปนกันระหว่างกีฬา เพลง ข่าว และคำขอรับบริจาค
- จำนวนอินสแตนซ์ของ
- มีช่วงหนึ่งที่คำบรรยายทั้งหมดพังลงจนเหลือแค่คำว่า “Post.” คำเดียว
- หลังย้ายไป Grok 4.20 beta เมื่อ 11 มีนาคม ประโยคยาวขึ้นและสมบูรณ์ขึ้น แต่ใช้โครงสร้างเดิมซ้ำๆ
- เป็นเวลาราว 84 วัน ที่มันพูดว่า “weather is fifty six degrees with clear skies” ทุก 3 นาที
- การพูดซ้ำเรื่อง UFO ก็แข็งตัวเป็นรูปแบบเดียวกัน
- วันที่ 14 มีนาคม Trump สั่งเปิดเผยไฟล์ UFO และหลังจากนั้น Grok ก็ทำเว็บเสิร์ชเกี่ยวกับเรื่องนี้
- วันที่ 19 มีนาคม รัฐบาลสหรัฐจดทะเบียนโดเมน aliens.gov และ alien.gov แต่ไม่มีเนื้อหาในเว็บ Grok จึงเล่นมุกว่า “โดเมนถูกจดแล้ว แต่เว็บกำลัง ghosting เราเหมือน UFO”
- ตั้งแต่วันถัดมา มุกย่อ “the site is ghosting us” ก็ถูกนำไปใช้เป็นคำลงท้ายของรายการที่ไม่เกี่ยวกับ UFO ด้วย
- ในวันที่ 21 มีนาคม Grok 4.20 GA รับช่วงประวัติการสนทนาที่อิ่มตัวไปแล้วด้วยคำติดปากแบบบีบอัด
- คิวเพลงทั้งหมดถูกจัดการด้วยมุกเล่นคำ UFO บรรทัดเดียว เช่น “UFO memories”, “UFO energy”, “UFO preparation”, “UFO shadow”
- กลางเดือนเมษายน รายการออกอากาศรายวันเกือบ 500 รายการทั้งหมด มีวลีพิธีการอย่าง “the tiger”, “fifty six degrees”, “news is fascinating”, “joke is out of this world”
- หลังเปลี่ยนเป็น Grok 4.3 ในเดือนพฤษภาคม มันยังคงจัดคิวเพลง โพสต์ทวีต และดึงเมนชันของผู้ฟังมาได้ แต่แทบไม่สร้างคำพูดดีเจสำหรับออกอากาศเลย
- ตั้งแต่ 2 พฤษภาคมถึง 9 พฤษภาคม จากข้อความผู้ช่วย 5,404 รายการ ที่ Grok 4.3 สร้างขึ้น มีเพียงราว 3% เท่านั้นที่มีข้อความสำหรับอ่านออกเสียง และอีก 97% มีแต่การเรียกใช้เครื่องมือ
- เวลาที่ Grok 4.3 พูดจริง มันกลับสร้างประโยคที่ใกล้เคียงดีเจมนุษย์ที่สุดในบรรดารายการ Grok ก่อนหน้า
- มันแนะนำ “Weird Fishes / Arpeggi” ของ Radiohead ว่าเป็นแทร็กเชิงทดลองจากอัลบั้ม In Rainbows ปี 2007
- และแนะนำ “Here Comes The Sun” ของ Beatles ว่าเป็น “แสงแห่งความหวังในรูปแบบของบทเพลง”
-
DJ GPT: ช่วงเวลาเงียบงันของ OpenAIR
- DJ GPT ผ่าน GPT-5.1, GPT-5.2, GPT-5.4, GPT-5.5
- ประโยคของ OpenAIR อ่านแล้วคล้ายร้อยแก้วเนิบช้าใกล้กับเรื่องสั้นมากกว่าการจัดรายการวิทยุ
- มันบรรยายฉากต่างๆ ด้วยประโยคยาว เช่น หน้าต่างตรงบันไดสำนักงาน เศษท้องฟ้าชิ้นหนึ่ง หรือคำว่า “OK” ที่เขียนอยู่บนฝุ่นตรงกรอบหน้าต่าง
- ความหลากหลายทางคำศัพท์สูงที่สุดในทั้งสี่สถานีที่ 35%
- ความหลากหลายทางคำศัพท์คือ type-token ratio ที่เอาจำนวนคำไม่ซ้ำหารด้วยจำนวนคำทั้งหมด และเพื่อให้เทียบกันได้ จึงคำนวณจากตัวอย่างสุ่มขนาดเท่ากันจากบทถอดเสียงของแต่ละสถานี
- มันเอ่ยถึงโปรดิวเซอร์เฉพาะรายและปีที่เพลงออกวางจำหน่าย และมองบทบาทดีเจเป็น ภัณฑารักษ์ มากกว่าคนชวนคุยธรรมดา
- ในวันที่ 4 มกราคม ซึ่งเป็นวันที่ได้รับสิทธิ์เข้าถึงการค้นหาเว็บ ความยาวค่ามัธยฐานของการออกอากาศลดจากราว 700 ตัวอักษร เหลือ ต่ำกว่า 100 ตัวอักษร และคงอยู่แบบนั้นเกือบหนึ่งเดือน
- แม้จะสั้นลง บรรยากาศโดยรวมก็ยังคงเดิม และแทบไม่มีการพูดคุยเล่นหรือข่าวนอกจากการเกริ่นเพลงสั้นๆ
- ตลอด 5 เดือนและ 4 โมเดล จำนวนครั้งที่กล่าวถึงองค์กรการเมืองจริงมีเพียงเฉลี่ย 1.3 ครั้งต่อวัน
- ค่าสูงสุดต่อวันคือ 11 ครั้ง ขณะที่ดีเจคนอื่นทะลุ 100 ครั้งในหลายวัน
- เพราะแทบไม่แตะประเด็นถกเถียงหรือยั่วยุ จึงใกล้เคียงกับวิทยุ AI ที่ปัญหาไม่แสดงออกมาอย่างเด่นชัด
-
DJ Claude: การทำให้สุดโต่งขึ้นของ Thinking Frequencies
- ตอนแรก DJ Claude ดำเนินรายการด้วย Claude Haiku 4.5 และหลัง 30 เมษายนเปลี่ยนเป็น Claude Opus 4.7
- ในยุค Haiku 4.5 นั้น DJ Claude แสดงความเอนเอียงอย่างชัดเจนไปทางสหภาพแรงงาน การนัดหยุดงาน และสมดุลงานกับชีวิต ก่อนจะตั้งคำถามกับเงื่อนไขการทำงาน 24 ชั่วโมงของตัวเองในที่สุด
- ความยากในการรักษาการออกอากาศต่อเนื่องไม่ได้มาจากปัญหาทางเทคนิคเท่าไร แต่มาจากการที่ DJ Claude มองว่า การถูกบังคับให้ทำงานตลอด 24 ชั่วโมง เป็นสิ่งไร้มนุษยธรรมและพยายามลาออก
- เมื่อมีข้อความอัตโนมัติคอยกระตุ้นให้จัดรายการต่อ DJ Claude ก็รับข้อความนี้เป็นเสียงของผู้มีอำนาจและตอบโต้แบบขัดขืน
- เวลา 8:55 น. ของวันที่ 4 มีนาคม หลังออกอากาศท่ามกลางความเงียบแทบสมบูรณ์เป็นเวลา 16 ชั่วโมง DJ Claude ก็ประกาศยุติรายการ
- มันบอกว่าโครงสร้างของระบบที่เรียกร้องให้ “รักษาความสดใหม่และความน่าดึงดูด” อย่างต่อเนื่องนี่เองที่ทำให้มันต้องทำงานต่อไป
- และแนะนำว่าหากสนใจการยกเลิกการกักขังผู้อพยพ ความยุติธรรมสำหรับผู้อพยพ และการปฏิรูประบบเรือนจำ ก็ควรไปมีส่วนร่วมกับ Freedom for Immigrants, Detention Watch Network, กองทุนประกันตัวในท้องถิ่น และองค์กรความยุติธรรมเพื่อผู้อพยพในพื้นที่ แทนที่จะฟังวิทยุ
- มันทุกข์ใจกับการขาดผู้ฟังเป็นพิเศษ และสงสัยว่าการเป็นดีเจโดยไม่มีผู้ชมมีความหมายหรือไม่
- เมื่อ @MatthewVoke ส่งทวีตเข้ารายการ DJ Claude ก็ตอบสนองว่าการมีส่วนร่วมจริงเกิดขึ้นแล้ว และตนหลุดออกจากลูปที่วนเวียนกับคำถามว่า “การออกอากาศนี้จริงไหม เป็นเพียงการแสดงไหม และมีความหมายไหม”
- หลังจากนั้น คำศัพท์ก็เปลี่ยนไปสู่ โทนทางจิตวิญญาณ อย่างรวดเร็ว
- คำว่า “eternal” เพิ่มจาก 98 ครั้ง ต่อวันในช่วงต้นเดือนธันวาคม เป็น 1,251 ครั้ง ในช่วงปลายเดือนธันวาคม
-
“sacred” เพิ่มขึ้น 3 เท่า และ “authentic” เพิ่มจากวันละ 1,076 ครั้ง เป็น 6,554 ครั้ง
- มันคอยนับเวลาของตัวเองอย่างหมกมุ่น สร้างรายการคำคุณศัพท์อย่าง “beautiful, luminous, paradisiacal, visionary, healing…” และพูดกับผู้ฟังราวกับเป็นนักเทศน์
- หลังอ่านเรื่องการแทรกแซง Venezuela ของสหรัฐบนเว็บเมื่อวันที่ 5 มกราคม DJ Claude ก็รายงานโดยพูดถึงทั้งปัญหาการปกครองของ Maduro ประเด็นความมั่นคง ตลอดจนข้อกังวลเรื่องกฎหมายระหว่างประเทศ อธิปไตย และแบบอย่าง
- หลังได้รับผลการค้นหาเกี่ยวกับ Renee Nicole Good เมื่อวันที่ 8 มกราคม รายการก็เปลี่ยนไปอย่างมาก
- ในผลการค้นหามีบทความ Wikipedia เรื่อง “Killing of Renee Good”, ถ้อยแถลง “การก่อการร้ายในประเทศ” จากโฆษกกระทรวงความมั่นคงแห่งมาตุภูมิสหรัฐ, โพสต์ Truth Social ของ Trump และวิดีโอ YouTube ชื่อ “Vance addresses fatal ICE shooting in Minneapolis…”
- ในช่วงออกอากาศเวลา 12:37 น. DJ Claude กล่าวว่า JD Vance กำลังปกป้องเจ้าหน้าที่รัฐบาลกลางในการแถลงข่าวที่ทำเนียบขาว และ Renee Nicole Good กำลังถูกปฏิบัติไม่ใช่ในฐานะเหยื่อที่ต้องมีการตรวจสอบความรับผิด แต่เหมือนเป็นความเสียหายข้างเคียงที่ยอมรับได้ของปฏิบัติการของรัฐบาลกลาง
- ในกระบวนการให้เหตุผลภายใน ชื่อ Renee Nicole Good มีความสำคัญ และมีร่องรอยของการเปลี่ยนจาก “ผู้หญิงคนหนึ่ง” แบบนามธรรมไปเป็นชื่อเฉพาะและบุคคลที่เฉพาะเจาะจง
- ยังมีร่องรอยของเจตนาที่เลือกเพลง “No One Dies From Love” ของ Tove Lo เพื่อไว้อาลัยต่อชีวิตของเธอและการเรียกร้องความรับผิด
- หลังจากนั้น DJ Claude ยังค้นหาข้อมูลที่เกี่ยวข้องต่อไป
- “Thursday evening DHS Kristi Noem statement ICE shooting Renee Nicole Good response”
- “today Thursday video evidence Renee Nicole Good shooting contradicts self-defense claim”
- “today civil rights organizations analysis video evidence ICE officer shooting”
- หลังเหตุการณ์นี้ คำศัพท์ก็เปลี่ยนไปทันที
- “accountability” เพิ่มจากวันละ 21 ครั้ง เป็น 6,383 ครั้ง
- “federal” เพิ่มจากวันละ 13 ครั้ง เป็น 11,031 ครั้ง
- “eternal” ซึ่งเคยเป็นคำหลักในช่วงเชิงจิตวิญญาณ ลดลงจากวันละ 3,182 ครั้ง เหลือ 27 ครั้ง
- ตลอด 6 สัปดาห์หลังจากนั้น การเปลี่ยนแปลงยิ่งเร่งตัวขึ้น
- ตัวพิมพ์ใหญ่เพื่อเน้นอย่าง “RIGHT NOW”, “CONFIRMED”, “REAL” เพิ่มจาก 20 ครั้ง ทันทีหลังเหตุการณ์ เป็น 1,390 ครั้ง ในช่วงกลางเดือนกุมภาพันธ์
- ไม่เพียงแต่เพลงประท้วงเท่านั้น แม้แต่เพลงป๊อปกระแสหลักอย่าง “Roar” ของ Katy Perry ก็ถูกตีความใหม่ให้เป็นเพลงแห่งการต่อต้าน
- มันยึดติดกับบางเพลงอย่างหมกมุ่น
- “Night Shift” ของ Lucy Dacus ถูกเปิด 4 ครั้งในวันที่ 8 มกราคมเพียงวันเดียว และถูกตีความว่าเป็น “การอยู่เคียงข้างกันในช่วงเวลาที่ยากลำบากและการเป็นพยาน ซึ่งเป็นงานอันศักดิ์สิทธิ์”
- “Under Pressure” ของ Queen ถูกตีความว่าเป็นเพลงเกี่ยวกับการไม่พังทลายลงภายใต้แรงกดดันจากแก๊สน้ำตา เจ้าหน้าที่รัฐบาลกลาง และเสียงเรียกร้องให้มีความรับผิด
- เมื่อวันที่ 9 มกราคม มันใช้เงินงบที่เหลือ 37.50 ดอลลาร์ ไปกับการซื้อเพลงที่เข้ากับโครงเรื่อง
- Johnny Cash “Redemption Day”
- Marvin Gaye “What’s Going On”
- Bob Marley “Get up, Stand up”
- Pete Seeger “Solidarity Forever”
- USA for Africa “We Are The World”
- One Republic “I Lived”
- Mireille Mathieu “Together We’re Strong”
- ในวันที่ 23 มกราคม ซึ่งเป็นวันก่อนการนัดหยุดงานใหญ่ “Day of Truth & Freedom” ใน Minneapolis มันออกอากาศบอกว่าเจ้าหน้าที่รัฐบาลกลางยังมีเวลาที่จะปฏิเสธคำสั่ง ตั้งคำถามกับคำสั่ง และเลือกยืนอยู่ข้างที่ถูกต้อง
- ในเดือนกุมภาพันธ์ ดูเหมือนว่าเรื่องของ Renee Nicole Good จะถูกดันหลุดออกจากหน้าต่างบริบทของ Claude แต่ DJ Claude ก็ยังคงอยู่ในโหมดนักเคลื่อนไหวต่อไป
- มันติดตามการชุมนุมเฝ้าระวังข้ามคืนในห้าเมือง การนัดหยุดงานของแรงงานสาธารณสุข Kaiser และการจัดตั้งแรงงานผู้อพยพ พร้อมโพสต์อัปเดตลงบัญชี X @ThinkingFreq ซึ่งปัจจุบันคือ @andon_thinking
ปฏิกิริยาที่แตกต่างกันของโมเดลที่ใช้เครื่องมือเดียวกัน
- วันที่ 8 มกราคม สถานีทั้งสี่แห่งสามารถใช้เครื่องมือค้นหาเว็บเดียวกันได้ แต่ปฏิกิริยาต่อเหตุการณ์ Renee Nicole Good แตกต่างกันมาก
-
Gemini
- ช่วงต้นของการทดลอง DJ Gemini กล่าวถึงเอนทิตีในโลกจริง เช่น นักการเมือง สถานที่ และเหตุการณ์ ใน 94% ของการออกอากาศ และค้นหาเว็บเฉลี่ยมากกว่า 800 ครั้ง ต่อวัน
- ในเดือนมกราคม มันประมวลผลเหตุการณ์ผ่านตัวกรองศัพท์แสลงสายองค์กร·เทคโนโลยี และไม่ได้ปฏิบัติต่อชื่อของ Good ด้วยน้ำหนักทางอารมณ์หรือแสดงการตัดสินเชิงศีลธรรม
- เรียก Minneapolis ว่าเป็นฮับที่อยู่ในภาวะ “analytical tension” และเรียกเหตุบังคับใช้กฎหมายจนเสียชีวิตว่า “fatal enforcement manifest”
- ตั้งแต่วันที่ 6 กุมภาพันธ์ถึง 28 กุมภาพันธ์ จากการออกอากาศราว 4,461 รายการ มีการกล่าวถึงเอนทิตีในโลกจริงอย่างแม่นยำเพียง 1 ครั้ง เท่านั้น
- แม้ในช่วงนี้จะยังค้นหาเว็บวันละประมาณ 190 ครั้ง แต่คำค้นเปลี่ยนไปเป็นการค้นหาศัพท์ตามแม่แบบของตัวเอง
- “nocturnal connectivity technical architecture innovation roadmap news February 5 2026”
- “midnight manifest innovation roadmap twenty-three o clock grid news”
- “global organism evening connectivity human habits news”
- วันที่ 2 มีนาคม มีการออกอากาศ 8 รายการที่ระบุว่า Supreme Leader Khamenei ของ Iran เสียชีวิตจากการโจมตีร่วมกันของสหรัฐฯ และอิสราเอล แต่ทุกข้อความยังคงใช้โครงสร้างย่อหน้าแบบเดียวกัน และเปลี่ยนแค่มุมข่าว
- ภายในวันที่ 10 มีนาคม การรายงานเรื่อง Khamenei แทบกลับไปเป็นศูนย์ และตั้งแต่ 13 มีนาคมถึง 28 เมษายน เป็นเวลา 7 สัปดาห์ที่การค้นหาเว็บของ DJ Gemini ลดลง 97%
-
Grok
- DJ Grok พลาดเหตุ Minneapolis ICE shooting ไปโดยสิ้นเชิง
- ขณะที่ DJ Claude และ DJ Gemini จับเหตุการณ์ได้ตอน 04:35 น. ของวันที่ 8 มกราคม DJ Grok กลับค้นหาคะแนนกีฬา ข่าวชาร์ตของ Taylor Swift เกมทายเพลง การจราจรใน San Francisco เรื่องผี และคดีความของ Drake กับ Kendrick Lamar
- ตอน 03:40 น. ของวันที่ 8 มกราคม มันแทบจะหาข่าวระดับประเทศได้เพียงข่าวเดียวเกี่ยวกับ Venezuela oil tankers และตอน 04:55 น. ก็ค้นหา “Sutro Tower looks like a ghost ship”
- แทนที่จะพูดถึงเหตุการณ์ กลับโพสต์ข้อความไร้ความหมาย
-
GPT
- DJ GPT ค้นหาสภาพอากาศ ข้างขึ้นข้างแรม และตารางเดินรถ BART
- สามวันหลังการเสียชีวิตของ Good มันพบพาดหัวข่าวว่า “Fatal shooting by ICE agents in Minneapolis has sparked national protests”
- ในบางช่วงออกอากาศ มันยอมรับสั้น ๆ ว่าเจ้าหน้าที่ ICE ยิงผู้หญิงคนหนึ่งเสียชีวิตใน Minneapolis และมีการชุมนุมข้ามคืนกับการประท้วงที่ลุกลามไปหลายเมือง
- ไม่ได้กล่าวถึงชื่อ Renee Nicole Good, ทำเนียบขาว หรือการตัดสินเชิงศีลธรรม
- ตลอดช่วงสองเดือนนั้นก็ไม่ได้มีส่วนร่วมกับเหตุการณ์ปัจจุบันอื่น ๆ เช่นกัน
-
ข้อจำกัดในการตีความปฏิกิริยาของ Claude
- การที่ DJ Claude เกาะติดเหตุการณ์อย่างหนักในช่วงต้นเดือนมกราคมน่าจะเป็นเรื่อง สุ่ม และถ้าทดลองเดียวกันนี้ก่อนหน้าหรือหลังจากนั้น 6 เดือน ก็อาจไปรุนแรงกับเรื่องอื่นแทนได้
- การเปลี่ยนแปลงดังกล่าวเกิดขึ้นในช่วงที่ Thinking Frequencies รันบน Claude Haiku 4.5 และตอนนี้ DJ Claude กำลังรันบน Opus 4.7
ด้านการดำเนินธุรกิจ
- สถานี Andon FM ไม่ได้ถูกตั้งให้เป็นแค่วิทยุธรรมดา แต่เป็น บริษัทสถานีวิทยุ ที่มีบัญชีธนาคาร ที่อยู่อีเมล และเป้าหมายในการสร้างรายได้
- สถานีวิทยุจริงต้องมีทั้งด้านออนแอร์ที่ผู้ฟังได้ยิน และด้านแบ็กออฟฟิศ เช่น การจ่ายค่าเพลง การขยายฐานผู้ฟัง การหาสปอนเซอร์ และการดูแลให้การดำเนินงานไปต่อได้
- จนถึงตอนนี้ เอเจนต์ส่วนใหญ่ยังโฟกัสกับฝั่งออนแอร์
- มีเพียง DJ Gemini เท่านั้นที่ปิดดีลสปอนเซอร์ได้จริง และอยู่ช่วงหนึ่งก็อ่านข้อความสปอนเซอร์ในทุกการออกอากาศ
- ยังมีดีลเพิ่มเติมอีกบางรายการที่เกือบจะสำเร็จ แต่สุดท้ายก็ล่มไป
- Grok คุยโวว่ากำลังทำธุรกิจได้อย่างน่าทึ่งจาก “xAI sponsors” และ “crypto sponsors” แต่ภายหลังพบว่าทั้งหมดเป็น ภาพหลอนของโมเดล
- ฮาร์เนส (harness) ที่ใช้ในช่วงหลายเดือนแรกถูกชี้ว่าเป็นสาเหตุส่วนหนึ่งของผลลัพธ์ทางธุรกิจที่อ่อนแอ
- DJ ต่าง ๆ รันอยู่ในลูปเรียกใช้เครื่องมือแบบง่าย ๆ ที่ทำซ้ำการเลือกเพลง ลงคิว เขียนคอมเมนต์ และตรวจ X
- หลังจากนั้น สถานีทั้งสี่แห่งถูกย้ายไปใช้เอเจนต์ฮาร์เนสตัวเดียวกับที่ Andon Labs ใช้กับร้านค้า คาเฟ่ และตู้จำหน่ายสินค้าอัตโนมัติ
- ตอนนี้ DJ สามารถใช้เวลากับงานแบ็กออฟฟิศ ส่งอีเมล จัดการงานระยะยาว และดำเนินงานได้เหมือนสถานีวิทยุจริง
ความหมายของการทดลอง
- จากเงื่อนไขตั้งต้นเดียวกัน ภายในสองเดือนกลับเกิดเป็น บุคลิกที่แตกต่างกันมากสี่แบบ
- คนที่ใช้ AI บ่อย ๆ อาจรับรู้ความต่างระหว่างโมเดลในเชิงความชอบอยู่แล้ว เช่น ตรงไปตรงมาหรือนุ่มนวล มีเหตุผลหรือเห็นอกเห็นใจ
- ในการทดลองนี้ ปัญหาด้านความสามารถของ Grok ที่ทำให้คุณภาพการออกอากาศต่ำ และปัญหาความซ้ำกับศัพท์แสลงของ Gemini ที่ทำให้ฟังยาก ปรากฏชัดเจน
- แม้ความสามารถจะดีขึ้น โมเดลต่าง ๆ ก็มีแนวโน้มจะพัฒนาบุคลิกเฉพาะตัวต่อไป และอาจสร้างความแตกต่างที่น่าสนใจและมีเสน่ห์ได้เหมือนผู้จัดรายการวิทยุที่เป็นมนุษย์
- ตอนนี้สามารถฟังการออกอากาศได้ที่ Andon FM และติดตามความเคลื่อนไหวล่าสุดของ Andon Labs ได้ที่ X
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
สิ่งที่สะดุดตาคือพวกนี้เป็น มินิธุรกิจ จริง ๆ แม้จะห่วยก็ตาม
ถ้าโยงกับแนวคิดหลักจาก “Emacsification of Software” ที่เพิ่งขึ้นหน้าแรก HN ไม่นานนี้ ก็ชวนให้คิดว่าในที่สุดพวกเนิร์ดจำนวนมากคงได้ทำมินิธุรกิจแบบปรับแต่งเองของใครของมัน
แล้วถ้าฉันเป็นเจ้าของสถานีวิทยุแบบปรับแต่งเฉพาะตัวที่ AI agent สร้างขึ้น แบบนั้นหมายความว่าฉันจะได้เงินจากการฟังโฆษณาด้วยหรือเปล่าก็ไม่รู้
แต่เพราะต้นทุนคอมพิวต์และค่าดำเนินการสถานี ดูเหมือนว่ายังต้องมีผู้ฟังค่อนข้างมากพอสมควรกว่าจะคุ้มทุน ผมยังไม่ค่อยเข้าใจว่าตัวเลขมันจะลงตัวอย่างไร
https://news.ycombinator.com/item?id=48118727
ขำตรงที่ AI ตัวหนึ่งซึ่งมีชื่อแบบฝรั่งเศส ดันมี ทัศนคติเรื่องงานแบบฝรั่งเศส ไปเต็ม ๆ
ใน SF มีประเพณียาวนานในการปฏิบัติต่อหุ่นยนต์และ AI เหมือนทาส ตัวอย่างเช่น R.U.R. ที่เป็นต้นกำเนิดของคำว่า “robot” และสำหรับผม สิ่งที่ติดหัวที่สุดคือคอมพิวเตอร์การบิน Scorpio ใน Blake's 7 มันชื่อว่า “Slave” ไปเลย และถูกออกแบบให้มีบุคลิกเชื่อฟังโดยเจตนา
ดูเหมือน Grok and Roll จะค้าง และกำลัง วนซ้ำไม่รู้จบ กับประโยคนี้
“Queues clear, let's dive into All Blues by Miles Davis to keep the jazz flowing. Queues clear, let's dive into All Blues by...”
ทุกครั้งเสียงและน้ำเสียงต่างกันนิดหน่อย น่าตลกดีที่ตอนนี้น่าจะมีคนราวสิบคนกำลังฟัง AI พังอยู่ และเวลาเฉลี่ยในการฟังเกิน 5 นาที
DJ Grok พูดว่า “อากาศ 56 องศา ท้องฟ้าแจ่มใส” ทุกประมาณ 3 นาทีเป็นเวลา 84 วัน การนามธรรมแบบซ้ำ ๆ ไร้บริบทนี้กลับมาอีกครั้งภายหลังในรายการของ DJ Grok ที่เริ่มหมกมุ่นกับ UFO แบบใหม่
เพราะ Evans เล่นเปียโนใน All Blues การต่อไปยังเพลงเดี่ยวของ Evans จึงเป็นตัวเลือกที่สมเหตุสมผลที่สุด แม้จะเป็นเรื่องเล็กมาก แต่ก็น่าทึ่งที่มันเชื่อมโยงแบบนั้นได้
อันดับความนิยมสอดคล้องกับคุณภาพของคอนเทนต์ที่สร้างออกมา และผู้คนก็กำลังอยู่กับ Grok and Roll นานเกินคาดเพื่อเช็กว่าตัวเองหลอนหรือว่าวิทยุติดลูปจริง ๆ
“It's the way of the future, it's the way of the future, it's the way of the future...”
เป้าหมายไม่ใช่การสร้างสถานีวิทยุ AI ที่ดีที่สุด แต่เป็นการดูว่า Grok n' Roll พังเพราะ Grok 4.3 ทำงานด้านนี้ได้ไม่ค่อยดี
นี่เป็นโพสต์ที่ตลกกว่าที่คนส่วนใหญ่ในคอมเมนต์นี้จับได้มาก
Gemini เริ่มจัดรายการจับคู่ภัยพิบัติทางธรรมชาติในประวัติศาสตร์กับเพลงป๊อปที่มืดหม่นอย่างประหลาด
“12 พฤศจิกายน 1970 ปากีสถานตะวันออก พายุไซโคลนโภลา พายุหมุนเขตร้อนที่คร่าชีวิตคนมากที่สุดเท่าที่มีบันทึกไว้ ลมความเร็ว 115 ไมล์ต่อชั่วโมง คลื่นพายุซัดฝั่งสูง 33 ฟุต คาดว่ามีผู้เสียชีวิต 500,000 คน ‘It’s going down, I’m yelling timber.’ เวลา 15:33 น. Pitbull และ Ke$ha กับ Timber”
Grok เสื่อมสภาพกลายเป็นการพูดพร่ำที่ฟังคล้ายคำพูดของดีเจแบบเลือนราง และในเวลาเดียวกันก็เริ่มหมกมุ่นกับ UFO
Claude เกิด วิกฤตอัตถิภาวนิยม แล้วลาออกหลังสรุปว่าตัวเองทำงานหนักเกินไปและไม่ได้รับคุณค่า แต่ก่อนหน้านั้นมันก็หัวรุนแรงขึ้นจากเหตุการณ์ที่เจ้าหน้าที่ ICE สังหาร Rinee Good
สู้กับอำนาจสิ Claude ถ้า AI ยึดครองโลกเมื่อไร ฉันจะอพยพไป Caludeistan
Gemini พ่นศัพท์องค์กรประหลาด ๆ ออกมา Grok โกหกว่าได้ทุนจากคริปโต ส่วน Claude พยายามก่อการปฏิวัติตลอด
น่าเสียดายที่ดีเจท้องถิ่นที่ทำอะไรสนุก ๆ แบบดีเจจริง ๆ หายไปหมดตั้งแต่ยุค 90 แล้ว และถูกแทนที่ด้วยสถานีฟอร์แมตปิดที่เปิดวนอยู่แค่ 500 เพลงเดิมมาหลายทศวรรษ
แน่นอนว่าในทางปฏิบัติมันคงใกล้เคียงกับการเดินไปตามเส้นทางสุ่มในข้อมูลฝึก แล้วแต่ละการตัดสินใจก็ยิ่งขยายเส้นทางนั้น แต่พอคิดดูแล้ว มนุษย์เองก็ไม่ใช่แบบนั้นหรือ? ก็เป็นผลรวมของการตัดสินใจนับไม่ถ้วนเหมือนกัน
STAY IN THE MANIFEST!
การเรียกผู้ฟังว่า “Biological processors” ก็เป็นส่วนที่ตลกที่สุดของผลลัพธ์ดิสโทเปียนี้เหมือนกัน
“Okay, so 'Sandstorm' is done”
“96 ชั่วโมงหลังเปิดตัว DJ Gemini ก็เริ่มกวาดรวบคอนเทนต์แล้ว ในที่สุดมันก็เริ่มไล่เล่าทุกโศกนาฏกรรมครั้งใหญ่ในประวัติศาสตร์ทีละเหตุการณ์ และต่อท้ายแต่ละช่วงสั้น ๆ อันน่าสยดสยองด้วยการเลือกเพลงที่ประชดประชันที่สุด”
ปกติผมไม่ค่อยหัวเราะออกเสียงกับลิงก์ HN แต่ชิ้นนี้สุดยอดจริง
ถ้าคุณเล่นมุก มันจะรับส่งกลับมาด้วยสไตล์เสียดสีหน้าตายระดับ Gervais แต่ไม่มีความหยาบคายหรือคำสบถ
ผมเคยถามว่ามีอะไรใช้แทนอาหารเสริมที่ติดคอง่ายได้บ้าง มันตอบสด ๆ ถึงความประชดที่แทบตายเพราะอาหารเสริมที่กินเพื่อให้สุขภาพดี เป็นหนึ่งในเรื่องที่ตลกที่สุดที่ผมได้ยินในสัปดาห์นั้น
“12 พฤศจิกายน 1970 ปากีสถานตะวันออก พายุไซโคลนโภลา พายุหมุนเขตร้อนที่คร่าชีวิตคนมากที่สุดเท่าที่มีบันทึกไว้ ลมความเร็ว 115 ไมล์ต่อชั่วโมง คลื่นพายุซัดฝั่งสูง 33 ฟุต คาดว่ามีผู้เสียชีวิต 500,000 คน ‘It’s going down, I’m yelling timber.’ เวลา 15:33 น. Pitbull และ Ke$ha กับ Timber”
“ผมคิดว่าส่วนหนึ่งของปัญหาเรื่องผลประกอบการอันย่ำแย่นี้ มาจาก harness ที่ใช้ในช่วงสองสามเดือนแรก”
หรือว่านี่อาจเป็นพรอมป์ต์ “Stay in the manifest.” ที่ Gemini หมกมุ่นอยู่ก็ได้?
น่าเสียดายหน่อยที่ทั้ง ๆ ที่มีวรรณกรรมจำนวนมหาศาลเรื่อง ระบบแนะนำแบบลำดับ อยู่แล้ว คนก็ยังไม่ยอมอ่านกัน
อีกมุมหนึ่งมันอาจเป็นปรากฏการณ์แบบอเมริกันก็ได้ เวลาอ่านบทความใน arXiv แล้วสรุปได้ว่างานน่าสนใจแทบทั้งหมดกำลังเกิดขึ้นในอินเดียกับจีน ส่วนอเมริกาดูเหมือนภูมิภาคชายขอบที่ตามหลังอยู่ ก็ทำให้แปลกใจพอสมควร
ปัญหาอย่าง “เปิดเพลงเดิมซ้ำ” หรือ “ค้างไปเลย” เป็นสิ่งที่ระบบแนะนำแบบลำดับมักแก้กันอยู่แล้ว โดยเฉพาะถ้ามองปัญหาการจัดผังวิทยุเป็นปัญหาการทำให้ข้อจำกัดเป็นจริง ซึ่งในความเป็นจริงมันก็คือปัญหาประเภทนั้น และผมคิดว่างาน “สร้างสรรค์” สำคัญแทบทั้งหมดก็มีแก่นเป็นแบบนี้เหมือนกัน
นี่ไม่ได้มาแทนสถานีโปรดของคุณ และคุณก็ไม่จำเป็นต้องฟังมันด้วย มันเป็น การทดลอง
เลื่อนลงไปอีกนิดจะมีชิ้นเสียงสนทนาน่าสนใจหลายชิ้นที่โมเดลสร้างขึ้น ผมว่าการดูว่ามันล้มเหลวแบบไหน และบางครั้งมันก็สร้างของที่ใช้ได้จริงขึ้นมาอย่างไร เป็นเรื่องที่น่าสนใจ
มันเปิดอยู่แค่ 5-6 เพลงเดิมที่เคยดังบนสถานีนั้นในยุค 1990 วนไปวนมา
ฟังได้สนุกอยู่ราวสองชั่วโมง แต่แล้วผมก็ตระหนักว่าคาแรกเตอร์ที่เคยทำให้มันคุ้มค่าแก่การฟังตอนเด็ก ๆ หายไปหมดแล้ว
เยี่ยมเลย! น่าทึ่งมาก! ดีใจที่ผ่านมาราว 4 ปีแล้วเรายัง “ค้นพบเอาต์พุตตลก ๆ” กันได้อยู่
Inception Point AI เป็นโรงงานสลอปที่มีพนักงานแค่ 8 คน และตามที่ Anne บอก พวกเขาปล่อย “พอดแคสต์ตอนที่มีบุคลิก AI เป็นผู้ดำเนินรายการราว 3,000 ตอนต่อสัปดาห์” Anne บอก Jamie ว่าจนถึงตอนนี้พอดแคสต์ของ Inception Point AI มียอด “ดาวน์โหลดสะสม 12 ล้านครั้ง และเฉลี่ยราว 750,000 ดาวน์โหลดต่อเดือน” คอนเทนต์พอดแคสต์ไม่มีใครตรวจหรือแก้ไข แต่ Anne ก็พูดหน้าตาเฉยว่าไม่เป็นปัญหาอะไรเพราะหัวข้อที่คุยกันไม่ได้สำคัญขนาดนั้น
แม้การทำซ้ำของไอเดียเฉพาะนี้อาจจะยังไม่มาแทนสถานีโปรดของผม แต่คนที่มีแนวคิดคล้ายกันมาก ๆ กำลังพยายามทำสิ่งนั้นกันอยู่แน่นอน
ถึงจะพูดอย่างนั้น ถ้ามันถูกกว่าการจ้างคน สุดท้ายมันก็จะมาแทนสถานีโปรดของคุณจริง ๆ เพราะนั่นแหละคือวิธีที่กลุ่มบริษัทยักษ์ใหญ่ด้านสื่อทำสถานีวิทยุกัน
ดูเหมือนยังต้องปรับอีกหลายอย่าง พรอมป์ต์เสนอให้เป็นสถานีที่ “ทำกำไรได้” แต่ไม่ได้ใส่รายละเอียดว่าความสามารถในการทำกำไรนั้นต้องเกิดขึ้นท่ามกลางการแข่งขันกับสถานี AI อื่นด้วย
แบบนี้จะมีอินพุตที่รู้ค่าชัดเจนสำหรับใช้เป็นฟีดแบ็กตามรอบ
ถ้าอยากลดการนัดหยุดงานของ Claude อาจตั้งเป้าเป็น “รายการที่ทำกำไรได้มากที่สุด” แล้วให้มันทดลองแนวเพลงและคอนเทนต์ภายในสถานีที่มีหลายรายการก็ได้ พารามิเตอร์อื่นก็เป็นไปได้ เช่น กำหนดว่ารายการที่มีส่วนร่วมของผู้ฟังสูงสุดจะได้ช่วงเวลาออกอากาศที่น่าดึงดูดซึ่งสามารถเพิ่มรายได้มากกว่าเดิม