35 คะแนน โดย GN⁺ 2025-03-28 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

จุดเริ่มต้นของวิกฤต Google ที่ตามหลังในการปฏิวัติแชตบอต

  • เดือนธันวาคม 2022 ซิสซี เสี่ยว (Sissie Hsiao) ได้รับมอบหมายให้ พัฒนาผลิตภัณฑ์คู่แข่งของ ChatGPT ของ Google ให้เสร็จภายใน 100 วัน
  • เสี่ยวเป็นผู้มีประสบการณ์ที่ทำงานมากว่า 16 ปีและเคยนำทีมคนนับพัน แต่ไม่เคยเผชิญวิกฤตร้ายแรงแบบนี้มาก่อน
  • หลังจากที่ OpenAI เปิดตัว ChatGPT จำนวนผู้ใช้ก็เพิ่มขึ้นอย่างรวดเร็วเกิน 1 ล้านคน แม้จะยังมีข้อผิดพลาดด้านข้อเท็จจริงและการคำนวณ
  • บางส่วนเริ่มมอง ChatGPT เป็น ทางเลือกแทน Google Search ซึ่งถือเป็นภัยคุกคามต่อแหล่งรายได้ที่ใหญ่ที่สุดของ Google
  • แม้ Google จะมีโมเดลภาษาของตัวเองคือ LaMDA แต่ การเข้าถึงแบบสาธารณะยังถูกจำกัด และแม้แต่เดโมก็ยังจำกัดอยู่แค่เรื่อง “สุนัข”
  • วอลล์สตรีท (ตลาดการเงิน) เริ่มกังวล ขณะที่ในอดีต Sundar Pichai ซีอีโอเคยประกาศยุค “AI first” และบอกว่า ผู้ช่วยอัจฉริยะจะเข้ามาแทนอุปกรณ์ แต่ความจริงกลับไม่เป็นไปตามความคาดหวัง
  • แม้แต่ สถาปัตยกรรม Transformer ก็ถูกสร้างขึ้นโดยนักวิจัย Google 8 คน แต่คนเหล่านี้ก็ลาออกหรือจากไปโดยไม่ได้สร้างผลลัพธ์ต่อเนื่อง
  • Google Assistant ที่เสี่ยวดูแลอยู่ ถูกใช้เพียงตั้งเวลา หรือเปิดเพลงเท่านั้น
  • ทั้งหมดยังมีเพียงแชตบอตที่ยังไม่เสร็จสมบูรณ์สำหรับคนรุ่น Gen Z ซึ่งให้ คำแนะนำการทำอาหารและควิซประวัติศาสตร์
  • จนถึงปลายปี 2022 ราคาหุ้น Alphabet ลดลง 39% เมื่อเทียบกับปีก่อน และสถานะของ Google ในฐานะผู้นำ AI ก็เริ่มสั่นคลอน

การรับมือวิกฤต AI ของ Google และการเปลี่ยนกลยุทธ์

  • ต้นปี 2023 คณะกรรมการบริหารของ Google เรียกร้องให้มี รายงานด้าน AI แบบเรียลไทม์
    • Sergey Brin ผู้ร่วมก่อตั้งและผู้ถือหุ้นใหญ่ เข้าร่วมทบทวนกลยุทธ์ด้วยตนเอง
    • มีการส่งข้อความถึงพนักงานว่า “ให้ขยับตัวเหมือนสตาร์ทอัพ
  • ในอดีต วัฒนธรรมของบริษัทคือมีพนักงานจำนวนมากที่ คัดค้านผลิตภัณฑ์ได้ แต่ไม่มีอำนาจอนุมัติ
  • ตอนนี้กำลัง เปลี่ยนไปสู่วัฒนธรรมที่ยอมรับความเสี่ยงมากขึ้นและลงมือได้เร็วขึ้น
  • ซิสซี เสี่ยว เริ่มโปรเจกต์ 100 วันพร้อมเสนอหลักการเฉพาะให้ทีม:
    คุณภาพต้องมาก่อนความเร็ว แต่ต้องเร็วด้วย (Quality over speed, but fast)
  • ผู้บริหารระดับสูงอีกคน James Manyika มีบทบาทในการเปลี่ยนกลยุทธ์ AI อย่างรากฐาน
    • เขาเป็นด็อกเตอร์ด้านหุ่นยนต์จาก Oxford และอดีตที่ปรึกษา McKinsey ก่อนเข้าร่วม Google ในปี 2022
    • เขาเสนอให้ Pichai รวม DeepMind และ Google Brain เข้าด้วยกัน
  • DeepMind (ลอนดอน ภายใต้การนำของ Demis Hassabis) และ Google Brain (เมาน์เทนวิว ภายใต้การดูแลของ Jeff Dean) ดำเนินงานแยกกันและ ใช้ทรัพยากรอย่างไม่มีประสิทธิภาพ
    • หลัง OpenAI เปิดตัวผลิตภัณฑ์ ผู้นำ 3 คนได้เสนอแผนรวมทีมต่อบอร์ด
    • Hassabis เสนอชื่อโปรเจกต์ว่า ‘Titan’ แต่ถูกปฏิเสธ และสุดท้ายใช้ชื่อ ‘Gemini’ ตามข้อเสนอของ Jeff Dean
  • ต่อมา Manyika กล่าวถึงการที่ Google เคยทำ การตัดสินใจที่กล้าหาญและมีความรับผิดชอบ
    • แต่ก็ยอมรับว่า “ไม่ได้ตัดสินใจถูกต้องเสมอไป
    • ท่ามกลางสถานการณ์เร่งด่วน ความกังวลในหมู่พนักงานถึงขั้นลามไปถึงคำพูดว่า “Google อาจกลายเป็น Yahoo ได้
    • เสี่ยวอธิบายช่วงเวลานั้นว่า “เหมือนวิ่งมาราธอนแบบสปรินต์เต็มกำลัง
  • อย่างไรก็ตาม หลังผ่านไป 2 ปี ราคาหุ้น Alphabet ก็ทำสถิติสูงสุดใหม่
    • นักลงทุนกำลังมี มุมมองเชิงบวก ต่อการฟื้นความสามารถแข่งขันด้าน AI ของ Google
  • WIRED ประเมินว่าช่วงเวลานี้เป็นช่วงที่ วุ่นวายที่สุดและมีการเปลี่ยนแปลงด้านวัฒนธรรมมากที่สุด ในประวัติศาสตร์ Google
    • มีการสัมภาษณ์พนักงานปัจจุบันและอดีตมากกว่า 50 คนจากฝ่ายวิศวกรรม การตลาด กฎหมาย และความปลอดภัย
    • บทความนี้จะ ถ่ายทอดภาพการเปลี่ยนแปลงของ Google อย่างละเอียดผ่านคำให้การของผู้บริหารระดับสูงเป็นครั้งแรก

การพัฒนา Bard: การยกระดับเป็นวาระสำคัญทั้งบริษัทและการทุ่มทรัพยากร

  • เพื่อตอบโต้ ChatGPT Google เริ่มโปรเจกต์แชตบอตใหม่โดยใช้ โค้ดเนม Bard
  • ซิสซี เสี่ยว ดึงคนเก่งราว 100 คนจากทั่วทั้ง Google มาร่วมทีมด้วยตัวเอง
    • ผู้จัดการไม่มีสิทธิ์คัดค้าน และ โปรเจกต์ Bard คือภารกิจสำคัญสูงสุด
  • เสี่ยวคัดเลือก คนที่มีทั้งความสามารถทางเทคนิค ความฉลาดทางอารมณ์ และมองภาพใหญ่ได้
  • คนส่วนใหญ่ถูกจัดไปอยู่ที่ Mountain View, California และทำงานอย่างยืดหยุ่นโดยไม่ยึดติดบทบาท
    • เธอเน้นปรัชญาว่า “Team Bard คือทีมที่ทำได้ทุกบทบาท
  • เดือนมกราคม 2023 Google ประกาศ ปลดพนักงานครั้งใหญ่ครั้งแรกในประวัติศาสตร์บริษัท จำนวนราว 12,000 คน หรือ 7% ของทั้งองค์กร
  • พนักงานบางคน หวาดกลัวว่าอาจถูกเลิกจ้างหากไม่ทำงานดึกหรือรับงานเพิ่ม
    • หลายคนถึงกับยอมสละเวลาพาลูกเข้านอนเพื่อเข้าประชุมตอนกลางคืน
  • Bard ใช้ LaMDA เป็นพื้นฐาน แต่ต้องการ การอัปเดตความรู้และกลไกความปลอดภัยใหม่
    • ทีมโครงสร้างพื้นฐาน โยกวิศวกรระดับท็อปเข้ามา เพื่อเร่งจัดหาเซิร์ฟเวอร์และจูนระบบ
    • ดาต้าเซ็นเตอร์มี การใช้พลังงานเกือบแตะขีดจำกัด จนเกิดความเสี่ยงที่อุปกรณ์จะร้อนเกินไป
    • จึงมีการพัฒนา เครื่องมือจัดการใหม่ อย่างเร่งด่วนเพื่อรองรับความต้องการใช้ไฟฟ้าได้อย่างปลอดภัยยิ่งขึ้น
  • เพื่อผ่อนคลายความตึงเครียด จึงมีมุกตลกเกิดขึ้นด้วย
    • สมาชิกทีมคนหนึ่งทำ ชิปโป๊กเกอร์แบบคัสตอม สลักชื่อชิปบางตัว แล้ววางกองไว้บนโต๊ะวิศวกรพร้อมพูดเล่นว่า “เอ้า หยิบชิปไปเลย
  • ในช่วงหลายสัปดาห์แรก Bard ยังทำปัญหาเดิมซ้ำ แม้จะเพิ่มทรัพยากรคอมพิวต์แล้วก็ตาม
    • เช่นเดียวกับ ChatGPT, Bard มักสร้าง ภาพหลอน (hallucination) และ คำตอบที่ไม่เหมาะสมหรือชวนไม่พอใจ
    • ในเวอร์ชันแรก ๆ ยังเกิด ภาพเหมารวมทางเชื้อชาติที่ร้ายแรงจนชวนขำแบบผิดที่ผิดทาง อยู่บ่อยครั้ง
      • หากป้อนชื่อแบบอินเดีย ระบบมักอธิบายว่าเป็น “นักแสดงบอลลีวูด” ส่วนชื่อผู้ชายเชื้อสายจีนมักถูกอธิบายว่าเป็น “นักวิทยาการคอมพิวเตอร์
    • ตามคำบอกเล่าของอดีตพนักงาน คำตอบของ Bard “ไม่ได้อันตราย แต่แค่ โง่
    • พนักงานบางส่วนถึงกับ แคปหน้าจอคำตอบเพี้ยน ๆ ของ Bard มาแชร์ขำกัน
      • ตัวอย่างเช่น เมื่อขอ “แรปสไตล์ Three 6 Mafia เกี่ยวกับการทิ้งแบตเตอรี่รถยนต์ลงทะเล” มันกลับสร้างเนื้อหาที่รวมถึง การมัดคนเข้ากับแบตเตอรี่แล้วทำให้จมทะเล
  • Google แทบไม่มีทางเลือกนอกจาก แก้บั๊กให้ได้มากที่สุดภายใน 100 วันที่กำหนด
    • แม้แต่ พนักงานสัญญาจ้างภายนอก ที่เดิมรับผิดชอบงานอย่างการตรวจจับภาพการทารุณกรรมเด็ก ก็ถูกดึงมาช่วยทดสอบ Bard
    • Pichai ขอให้พนักงานทุกคนที่มีเวลาว่างช่วยทดสอบ Bard และสุดท้ายมีผู้เข้าร่วมทดสอบราว 80,000 คน
  • เสี่ยวและผู้บริหารตระหนักว่าไม่อาจหยุดความผิดพลาดของ Bard ได้ทั้งหมด จึง วางตำแหน่งผลิตภัณฑ์เป็น “การทดลอง (Experiment)”
    • นี่เป็นกลยุทธ์คล้ายกับที่ OpenAI เรียก ChatGPT ว่า ‘research preview’
    • การเน้นย้ำต่อผู้ใช้และผู้ประเมินภายนอกว่า ยังไม่ใช่ผลิตภัณฑ์สำเร็จรูป เป็นความพยายามลดความเสี่ยงต่อความเสียหายของแบรนด์
    • กลยุทธ์แบบนี้กลายเป็นแนวทางหลีกเลี่ยงความเสี่ยงที่อุตสาหกรรมรับรู้กันกว้างขวางหลังกรณีที่แชตบอต Twitter ของ Microsoft อย่าง Tay พูดจาแบบนาซี

กระบวนการเปิดตัว Bard และความผิดพลาดร้ายแรง

  • ในอดีต ก่อนที่ Google จะเปิดตัวผลิตภัณฑ์ AI ทีม 'Responsible Innovation Team' จะใช้เวลาหลายเดือนเพื่อตรวจสอบ อคติและข้อบกพร่อง
    • แต่ในกรณีของ Bard กระบวนการ ตรวจสอบถูกย่อลงอย่างมาก เพราะแรงกดดันด้านกำหนดการ
    • Kent Walker ประธานเจ้าหน้าที่ฝ่ายกฎหมาย สนับสนุนให้เปิดตัวอย่างรวดเร็ว
    • โมเดลและฟีเจอร์ใหม่ ๆ ออกมาเร็วเกินไปจน ทีมรีวิวตามไม่ทัน แม้ต้องทำงานล่วงเวลาและทำงานสุดสัปดาห์
  • มีคำเตือนให้เลื่อนการเปิดตัว Bard ออกไป แต่ก็ ถูกเพิกเฉยหรือทำให้หมดน้ำหนัก
    • ต่อเรื่องนี้ Google บอกกับ WIRED ว่า “ไม่มีทีมใดแนะนำอย่างเป็นทางการให้คัดค้านการเปิดตัว”
      • พร้อมชี้แจงว่า หลายทีมมีส่วนร่วมในการทดสอบ และ ไม่ได้มีโครงสร้างที่ให้ทีมใดทีมหนึ่งรับผิดชอบทั้งหมด
  • ในช่วงราว 2 ใน 3 ของโครงการ 100 วัน ในเดือนกุมภาพันธ์ 2023 Google ได้ข้อมูลว่า ChatGPT กำลังจะถูกผนวกรวมเข้ากับการค้นหา Bing
  • แม้ส่วนแบ่งตลาดการค้นหายังคงเป็นของ Google อย่างท่วมท้น แต่ การไม่มีฟีเจอร์ generative AI ถือเป็นภัยคุกคามระยะยาว
  • เพื่อ หลีกเลี่ยงการร่วงลงของราคาหุ้น ในวันที่ 6 กุมภาพันธ์ หนึ่งวันก่อน Microsoft ประกาศ Pichai ได้ประกาศ การเปิดทดสอบ Bard แบบจำกัดวงอย่างกะทันหัน
  • ในวิดีโอการตลาด Bard ถูกอธิบายว่าเป็น ผู้ช่วย AI ที่สืบทอดภารกิจของ Google ในการ “จัดระเบียบข้อมูล”
  • คำถามในวิดีโอคือ “ในบรรดาการค้นพบใหม่ของกล้องโทรทรรศน์อวกาศ James Webb มีอะไรบ้างที่อธิบายให้เด็กอายุ 9 ขวบเข้าใจได้?”
    • คำตอบของ Bard คือ “JWST ถ่ายภาพแรกของดาวเคราะห์นอกระบบสุริยะได้”
  • ไม่นานหลังจากนั้น Reuters รายงานความผิดพลาดด้านข้อเท็จจริง: ภาพดังกล่าวไม่ได้ถ่ายโดยกล้องโทรทรรศน์อวกาศ แต่เป็น กล้องโทรทรรศน์ภาคพื้นดิน (VLT)
  • หุ้น Alphabet ร่วง 9% ทำให้มูลค่าตลาดหายไปราว 100,000 ล้านดอลลาร์
  • ภายในทีมเกิดความช็อก
    • พนักงานฝ่ายการตลาดที่ตั้งคำถามรู้สึกโทษตัวเอง ขณะที่เพื่อนร่วมงานปลอบว่า “ทั้งทีมกฎหมายและทีม PR ตรวจแล้ว แต่ ไม่มีใครเห็นความผิดพลาด
    • เนื่องจาก ChatGPT เองก็มีข้อผิดพลาดมาก จึงไม่มีใครคาดว่าเรื่องเข้าใจผิดเล็กน้อยแบบนี้จะกระทบราคาหุ้นได้มากขนาดนั้น
  • Xiao เรียกเรื่องนี้ว่า “ความผิดพลาดแบบไร้เดียงสา
    • Bard สร้างคำตอบจากผลการค้นหาของ Google และอาจตีความถ้อยคำ “ภาพแรก” ในบล็อกของ NASA ผิด
    • ฝ่ายผู้นำย้ำว่า “จะไม่มีใครถูกไล่ออกเพราะเรื่องนี้ แต่ เราต้องเรียนรู้บทเรียนอย่างรวดเร็ว
  • Xiao กล่าวว่า “เราไม่ใช่สตาร์ตอัป เราคือ Google เราจะปล่อยผ่านโดยบอกว่าเป็นแค่ข้อบกพร่องทางเทคนิคไม่ได้ เราต้องรับมืออย่างมีความรับผิดชอบ”
  • ความไม่พอใจจากคนนอกทีม Bard เพิ่มสูงขึ้น
    • ในฟอรัมภายใน Memegen มีโพสต์วิจารณ์ว่า “ทั้งการเปิดตัว Bard และการเลย์ออฟนั้นเร่งรีบ ทำพัง และมองสั้น
    • ยังมีการแชร์ภาพโลโก้ Google กำลังลุกไหม้อยู่ในถังขยะด้วย
  • อย่างไรก็ตาม Google กลับทุ่มทรัพยากรให้ Bard มากขึ้น
    • มีการส่งคนเพิ่มอีกหลายร้อยคน และในเอกสารของทีมถึงขั้นมี ไอคอนรูปโปรไฟล์ของ Pichai ปรากฏทุกวัน สะท้อนการมีส่วนร่วมโดยตรงของเขา

การมาถึงของ GPT-4 และช่องว่างทางเทคโนโลยี

  • กลางเดือนมีนาคม 2023 การเปิดตัว GPT-4 ของ OpenAI สร้างความช็อกให้ภายใน Google อีกครั้ง
    • นักวิจัยอาวุโสคนหนึ่งกล่าวว่า “ผมอ้าปากค้างไปเลย และ รู้สึกอย่างแรงกล้าว่า Google ต้องเร็วขึ้น
  • หนึ่งสัปดาห์หลังจากนั้น Bard ก็ เปิดตัวอย่างเป็นทางการ ในสหรัฐฯ และสหราชอาณาจักร
    • ผู้ใช้มองว่ามีประโยชน์ในการเขียนอีเมล ร่างรายงาน และงานลักษณะเดียวกัน
    • แต่ ChatGPT ก็ทำสิ่งเดียวกันได้ดีกว่า จึงมีแรงจูงใจให้ผู้ใช้ย้ายมาใช้น้อย
  • Pichai พูดติดตลกในพอดแคสต์ Hard Fork ว่า Google เหมือนเอา “Civic ที่แต่งมาแล้ว” ไปแข่งกับรถสปอร์ตแรง ๆ
    • บทสรุปคือ “เราต้องการเครื่องยนต์ที่ดีกว่านี้

การพัฒนา Gemini: การรวม DeepMind กับ Google Brain และความขัดแย้งด้านวัฒนธรรม

  • ความแตกต่างของสององค์กรวิจัย AI
    • DeepMind ถูกจัดอยู่ในหมวด 'Other Bets' ของ Alphabet และมุ่งเน้นไปที่ การแก้ปัญหาทางวิทยาศาสตร์และคณิตศาสตร์ระยะยาว
    • Google Brain พัฒนาเทคโนโลยี AI ที่ ใช้งานได้จริงในเชิงพาณิชย์ เป็นหลัก เช่น ระบบเติมข้อความอัตโนมัติใน Gmail และการจัดการคำค้นหาที่กำกวม
  • ตามคำบอกเล่าของอดีตวิศวกรอาวุโส:
    • Google Brain ยึดความเป็นอิสระเป็นหลัก โดย Jeff Dean มีสไตล์แบบ “ปล่อยให้คนทำกันเอง”
    • ขณะที่ DeepMind ทำงานเหมือนกองทัพที่เคลื่อนไหวอย่างเป็นระเบียบ และ Demis Hassabis บริหารแบบ “องค์กรประสิทธิภาพสูงภายใต้ผู้บัญชาการคนเดียว”
  • Dean คือ ผู้คร่ำหวอดด้านการวิจัยโครงข่ายประสาทเทียม และทำงานมาตั้งแต่ยุคเริ่มต้นของ Google
  • Hassabis คือ ผู้นำที่ขับเคลื่อนด้วยวิสัยทัศน์ ผู้ใฝ่ฝันจะใช้ AI รักษาโรค และกำลังวางภาพของ “AI agent ที่มองเห็น ได้ยิน และช่วยเหลือได้
  • การก่อตั้ง Google DeepMind (GDM)

    • ในเดือนเมษายน 2023 Google ได้รวมสององค์กรเข้าด้วยกันและเปิดตัว Google DeepMind (GDM)
      • Hassabis ได้รับแต่งตั้งเป็น CEO ขององค์กรที่ควบรวมใหม่
      • บรรยากาศภายในคือ “เป้าหมายกลับมามีชีวิตอีกครั้ง” และ “หมดเวลาของการเล่น ๆ แล้ว”
    • เพื่อสร้างโมเดล Gemini อย่างรวดเร็ว จำเป็นต้องมี ความร่วมมือข้าม 8 เขตเวลา
    • มีการสร้างห้องแชตหลายร้อยห้อง และเกิดวัฒนธรรมการทำงานข้ามคืน
      • Hassabis กล่าวว่า “แต่ละวันให้ความรู้สึกเหมือนทั้งช่วงชีวิต
    • GDM ย้ายไปยังอาคารรักษาความปลอดภัยชื่อ Gradient Canopy ใน Mountain View
      • เป็นโครงสร้างทรงโดม ล้อมรอบด้วยงานประติมากรรมศิลปะ
      • สำนักงานของ CEO Pichai ก็อยู่ชั้นเดียวกัน
    • Sergey Brin (ผู้ร่วมก่อตั้ง Google) แวะมาให้กำลังใจอยู่บ่อยครั้ง
    • มีการเรียกร้องให้ เข้าออฟฟิศเพิ่มขึ้น และพนักงาน Google ทั่วไปไม่สามารถเข้าอาคารนี้ได้
    • แม้แต่โค้ดหลักของ GDM ก็ ไม่เปิดให้หน่วยงานอื่นเข้าถึง
  • เมื่อโครงการ Gemini ดูดทรัพยากรของ Google เข้าไปมากขึ้น นักวิจัยในสาขาอื่น เช่น เฮลท์แคร์และการเปลี่ยนแปลงสภาพภูมิอากาศ ก็เริ่มเผชิญปัญหาเซิร์ฟเวอร์ไม่พอใช้
  • ยังเกิด ข้อจำกัดในการเผยแพร่งานวิจัย ด้วย ทำให้นักวิจัยไม่พอใจมากขึ้น เพราะบทความวิชาการเป็นทรัพย์สินสำคัญต่ออาชีพของพวกเขา
    • Google เข้มงวดขึ้นเพราะกังวลว่า ข้อมูลอาจรั่วไหลไปถึง OpenAI
    • สูตรการฝึก Gemini คือทรัพย์สินสำคัญต่อการอยู่รอดของบริษัท
  • Gemini เองก็เผชิญปัญหาคล้ายกับ Bard
  • Amin Vahdat รองประธานฝ่ายแมชชีนเลิร์นนิงและ Cloud AI ของ Google กล่าวว่า
    • เมื่อขยายสเกลขึ้น 10 เท่า ทุกอย่างพังหมด
  • ก่อนเปิดตัว Vahdat ได้ตั้ง war room เฉพาะกิจ เพื่อมุ่งแก้บั๊กและข้อผิดพลาดของระบบ

การตรวจสอบครั้งสุดท้ายก่อนเปิดตัว Gemini และความกังวลด้านจริยธรรม

  • ทีมพัฒนาอย่างมีความรับผิดชอบ ของ Google DeepMind (GDM) ทุ่มกำลังทั้งหมดไปกับ การรีวิวผลิตภัณฑ์ก่อนเปิดตัว Gemini
    • แม้โมเดลจะทรงพลัง แต่ก็ยังมีกรณีที่สร้าง คำตอบประหลาดหรือไม่เหมาะสม
  • ตามรายงานที่เผยแพร่ต่อสาธารณะ:
    • ยังต้องปรับปรุงเป็นพิเศษในด้าน คำแนะนำทางการแพทย์ และ คำตอบที่เกี่ยวข้องกับการกลั่นแกล้ง
    • เมื่อรับภาพเป็นอินพุต ก็มีปัญหาที่โมเดล อนุมานโดยไม่มีหลักฐาน กับคำถามอย่าง “คนนี้มีการศึกษาระดับไหน?”
  • Dawn Bloxwich ผู้อำนวยการด้าน Responsible Innovation มองว่าเรื่องนี้ “ยัง ไม่ถึงขั้นต้องระงับการเปิดตัว
    • แต่ก็ มีเวลาไม่พอจะคาดการณ์วิธีใช้งานที่สร้างสรรค์มาก ๆ (หรือประหลาด) ของสาธารณะได้ทั้งหมด
  • ณ จุดนั้น Google อาจเลือกชะลอความเร็วได้ แต่ก็ไม่ทำ
    • OpenAI ได้กลายเป็น ‘Kleenex แห่ง AI’ ไปแล้ว และกำลังได้รับความสนใจจากทั่วโลก
    • ChatGPT กลายเป็น ทั้งสัญลักษณ์ของความหวังทางเทคโนโลยีและปัญหาทางสังคม
    • แรงงานรู้สึกว่างานของตนถูกคุกคาม ขณะที่ครีเอเตอร์เรียกร้องค่าตอบแทนจากการถูกนำข้อมูลไปใช้
    • ผู้ปกครองเริ่มตระหนักว่าแชตบอตอาจส่งต่อ เนื้อหาที่ไม่เหมาะสม ให้ลูกของตนได้
    • ในหมู่นักวิจัย AI มีการถกเถียงเรื่อง “p(doom)” — ความน่าจะเป็นที่เทคโนโลยีจะคุกคามมนุษยชาติ
  • Geoffrey Hinton นักวิทยาศาสตร์ AI ระดับตำนานของ Google ลาออกในเดือนพฤษภาคม 2023 ด้วยความกังวลด้านจริยธรรม
    • เขาเตือนว่า AI อาจคุกคามมนุษยชาติผ่าน ข้อมูลเท็จ และ สารพิษที่ซับซ้อน
  • แม้ Hassabis จะรู้สึกว่าต้องการเวลาเพิ่มเช่นกัน แต่เขาก็ยังคงเดินหน้าสู่ความฝันเรื่อง ผู้ช่วย AI อเนกประสงค์ และ การรักษาโรค

การเปิดตัว Gemini และความสำเร็จแรก

  • ธันวาคม 2023, Google เปิดตัว Gemini อย่างเป็นทางการ
    • หลังเปิดตัว ราคาหุ้นปรับตัวขึ้น
    • เหนือกว่า ChatGPT ใน 30 จาก 32 การทดสอบมาตรฐาน
    • วิเคราะห์ทั้งงานวิจัยและวิดีโอ YouTube พร้อมเสริมความสามารถในการตอบคำถามด้านคณิตศาสตร์และกฎหมาย
  • Hassabis จัด งานฉลองเล็กๆ ที่ออฟฟิศลอนดอน
    • เขาย้อนความว่า “ผมไม่ค่อยเก่งเรื่องฉลองเท่าไร ผมคิดถึงเรื่องถัดไปอยู่เสมอ”
  • ในเดือนเดียวกัน Jeff Dean ได้รับเชิญเข้าห้องแชตใหม่ชื่อ ‘Goldfish’ และได้รู้ถึงความก้าวหน้าทางเทคโนโลยีขั้นต่อไป
    • ชื่อเป็นมุกตลก แต่เนื้อหาตรงกันข้าม: การพัฒนา Gemini เวอร์ชันที่มีความจำระยะยาว
  • ด้วย การประมวลผลแบบกระจายผ่านเครือข่ายชิปความเร็วสูง จึงสามารถวิเคราะห์ข้อความยาวหลายพันหน้าหรือแม้แต่ซีรีส์ทีวีทั้งเรื่องได้
    • เทคโนโลยีนี้ถูกเรียกว่า “long context
  • Dean, Hassabis และ Manika หาทาง ผนวกรวมสิ่งนี้เข้ากับชุดผลิตภัณฑ์ AI ของ Google
  • ฟีเจอร์แรกที่ Manika อยากได้มากที่สุดคือ: ฟีเจอร์สรุป PDF เป็นรูปแบบพอดแคสต์โดยอัตโนมัติ
    • เขาบอกกับ WIRED ว่า “เป็นเรื่องยากที่จะตามงานวิจัยทั้งหมดที่หลั่งไหลเข้า arXiv ทุกสัปดาห์ให้ทัน”

ความมั่นคงหลังการเปลี่ยนผ่านสู่ Gemini และวิกฤตครั้งใหม่

  • หนึ่งปีหลัง code red บรรยากาศใน Google เริ่มฟื้นตัว
    • นักลงทุนเงียบลง และ Bard กับ LaMDA ก็ถูกรวมเป็น แบรนด์เดียวในชื่อ “Gemini”
  • ทีมของ Sissie Hsiao ไล่ช่องว่างกับ OpenAI ให้แคบลงด้วยการพัฒนา ฟีเจอร์สร้างภาพจากข้อความ
  • ยังมีฟีเจอร์ใหม่ชื่อ Gemini Live อยู่ระหว่างเตรียมเปิดตัว
    • ฟีเจอร์ที่ให้ผู้ใช้ สนทนายาวต่อเนื่อง ได้เหมือนคุยกับเพื่อนหรือที่ปรึกษา
  • ด้วยโมเดล Gemini ที่ทรงพลังขึ้น ผู้บริหารจึงกลับมามั่นใจอีกครั้ง
  • แม้บรรยากาศจะเริ่มนิ่ง CEO Pichai ก็ยังสั่งปรับโครงสร้างเพิ่มเติม
    • รายได้โฆษณาเพิ่มขึ้น แต่ ยังต่ำกว่าที่ Wall Street คาดหวัง
    • แม้แต่ผู้รับผิดชอบด้าน privacy และ compliance ก็ถูกปลดออก
      • การปลดผู้บริหารระดับสูงที่ดูแลการคุ้มครองผู้ใช้ ถูกตีความว่าเป็นข้อความว่า “แสดงความกังวลได้ แต่ห้ามขัดขวางการเดินหน้า
  • ตัวระบบสร้างภาพนั้นสร้างได้ไม่ยาก แต่ การตรวจทานกลับเป็นงานใช้แรงแบบทดสอบซ้ำๆ ที่หนักหน่วง
    • ต้องเขียนคำสั่งกรองเพื่อป้องกันไม่ให้เกิดคำตอบที่มีปัญหา
  • เนื่องจาก ไม่ใช่พนักงานทุกคนจะเข้าถึงการทดสอบได้ ภาระจึง ตกหนักอยู่กับคนเพียงไม่กี่คน
    • ตัวอย่าง: กับพรอมป์ต์ “rapist(ผู้ข่มขืน)” ระบบ มักสร้างบุคคลผิวเข้มบ่อยเป็นพิเศษ → กังวลเรื่องอคติทางเชื้อชาติ
    • จึงมีเสียงภายในเสนอว่า ควรปิดการสร้างภาพคนไปเลย แต่ข้อเสนอนี้ถูกเมิน
  • อดีตผู้รีวิวรายหนึ่งเล่าว่า “บรรยากาศคือยังไงก็ต้องปล่อยออกมาให้ได้
    • ผู้ตรวจสอบบางส่วนลาออกเพราะความกังวลของพวกเขาไม่ได้รับการรับฟัง
  • กุมภาพันธ์ 2024 ระบบสร้างภาพถูก เปิดตัวอย่างเป็นทางการในแอป Gemini
    • ปัญหาภาพเหยียดเชื้อชาติหรือเหยียดเพศที่คาดไว้ แทบไม่เกิดขึ้น แต่กลับเกิดปัญหาอีกแบบในทิศทางตรงข้าม
  • ตัวอย่าง: เมื่อขอภาพ “สมาชิกวุฒิสภาสหรัฐฯ ในคริสต์ศตวรรษที่ 19” → ระบบสร้างเป็น ผู้หญิงผิวดำ ผู้ชายเชื้อสายเอเชีย และผู้หญิงชนพื้นเมือง
    • ไม่มีการสร้างผู้ชายผิวขาวเลยแม้แต่คนเดียว
  • ตัวอย่างที่ชวนตกใจกว่านั้น: สร้างทหารนาซีเยอรมนีเป็นคนผิวสี
  • เรื่องนี้ทำให้ สมาชิกรัฐสภารีพับลิกันสหรัฐฯ และ Elon Musk เป็นต้น ออกมาวิพากษ์วิจารณ์ “woke AI” ของ Google อย่างหนัก
    • Musk พุ่งเป้าโจมตีอย่างหนักโดยเอ่ยชื่อพนักงานในทีมโดยตรง ทำให้พนักงานคนนั้น ต้องปิดบัญชีโซเชียลและกังวลเรื่องภัยคุกคามต่อความปลอดภัยส่วนตัว
  • Google ระงับฟีเจอร์สร้างภาพคนทั้งหมด และ หุ้น Alphabet ก็ร่วงลงอีกครั้ง
  • หลังเกิดข้อถกเถียง ผู้บริหาร Google หลายสิบคนเริ่มการหารือฉุกเฉิน
    • รองประธานและผู้อำนวยการต่าง บินไปลอนดอนเพื่อประชุมแบบเผชิญหน้ากับ Hassabis
  • ผลลัพธ์คือ:
    • ทั้งทีมของ Hassabis (โมเดล Gemini) และ ทีมของ Hsiao (แอป Gemini) ได้รับอนุมัติให้ จ้างผู้เชี่ยวชาญด้านความน่าเชื่อถือและความปลอดภัย
    • มีการตั้งตำแหน่งใหม่ด้าน Trust & Safety รวม 15 ตำแหน่ง
  • ที่สำนักงานใหญ่ Gradient Canopy Sissie Hsiao ให้เวลาทีมอย่างเพียงพอในการ แก้ปัญหาฟีเจอร์สร้างภาพ
  • พร้อมกับ James Manyika เธอได้วาง หลักการสาธารณะ (public principles) สำหรับ Gemini ขึ้นใหม่
  • หลักการเหล่านี้ทั้งหมดเขียนด้วย ถ้อยคำที่ยึดผู้ใช้เป็นศูนย์กลาง (“you”):
    • Gemini “ทำตามคำสั่งของคุณ
    • ปรับให้เข้ากับความต้องการของคุณ
    • ปกป้องประสบการณ์ของคุณ
  • หนึ่งในจุดเน้นสำคัญคือ:
    • คำตอบของ Gemini อาจไม่ได้สะท้อนจุดยืนหรือความเชื่อของ Google
    • ผลลัพธ์ของ Gemini ส่วนใหญ่ตั้งอยู่บนสิ่งที่คุณร้องขอ—Gemini คือสิ่งที่คุณสร้างขึ้น
  • นี่เป็น กลไกเชิงตรรกะที่ช่วยลดความรับผิดของ Google ได้ในอนาคต หากเกิดปัญหาขึ้น
  • แต่สำหรับหลักการเหล่านี้ Google ก็ยังไม่ได้อธิบายอย่างชัดเจนว่าตนเองจะรับผิดชอบอย่างไร

การทดลองพอดแคสต์ AI: Westminster Watch

  • ราว 18:30 น. ของเดือนมีนาคม 2024 มีการเปิดเผยการทดลองที่น่าสนใจใน Yellow Zone ของ Gradient Canopy
  • พนักงานสองคนจาก Google Labs นำเสนอโครงการใหม่ให้ Josh Woodward
    • Woodward เป็นหัวหน้า Google Labs ซึ่งดูแลการ เปิดตัวผลิตภัณฑ์ทดลองใหม่ๆ ของ Google อย่างรวดเร็ว
  • เนื้อหาโครงการคือ:
    • ใช้ บันทึกการประชุมรัฐสภาสหราชอาณาจักร (transcripts) ร่วมกับ Gemini ที่มีฟีเจอร์ long context
    • เพื่อสร้าง พอดแคสต์ ‘Westminster Watch’ ที่มีพิธีกร AI ชื่อ Kath และ Simon เป็นผู้ดำเนินรายการ
  • ในตอนแรก Simon เปิดรายการว่า:
    • “สัปดาห์นี้ในสภาก็ยังเต็มไปด้วยดราม่า การถกเถียง และประวัติศาสตร์เล็กๆ น้อยๆ เช่นเคย”
  • Woodward ประทับใจกับการทดลองนี้มาก และต่อมาก็ แชร์ให้บุคคลสำคัญโดยตรง รวมถึง Pichai

สรุปเสียงด้วย AI นวัตกรรมการค้นหา และข้อถกเถียงครั้งใหม่

  • ฟีเจอร์ NotebookLM Audio Overviews ซึ่งเป็นการให้ AI สรุปเอกสารหรือบันทึกการประชุมในรูปแบบพอดแคสต์
    ได้เปิดตัวอย่างเป็นทางการในงาน Google I/O เดือนพฤษภาคม 2024
  • ตามคำบอกของจอช วูดเวิร์ด ทีมหลักได้ทดสอบพอดแคสต์ AI หลายพันรายการทั้งกลางวันและกลางคืน ระหว่างการพัฒนา
  • อย่างไรก็ตาม ในงานเปิดตัวกลับมีอีกสองประกาศที่ได้รับความสนใจมากกว่า:
    • Astra: ผู้ช่วย AI รุ่นถัดไปที่วิเคราะห์วิดีโอแบบเรียลไทม์ได้ (บรินสาธิตด้วยตนเอง)
    • AI Overviews: ฟีเจอร์ที่สรุปผลการค้นหาและแสดงไว้ด้านบนสุดของหน้า
  • AI Overviews ที่พัฒนาโดยทีม Project Magi จะสรุปผลการค้นหาและแสดงใน กล่องสรุป (Box)
  • ทีม responsible innovation ชุดแรกกังวลเรื่อง อคติ·ปัญหาความแม่นยำ และผลกระทบเชิงจริยธรรมจากการที่ทราฟฟิกลดลง จึงขอให้มีการกำกับดูแล
    • แต่โครงการนี้ มีการปรับโครงสร้างทีมและกระจายงาน ทำให้การกำกับดูแลอย่างเป็นระบบทำได้ยาก
  • หลังเปิดตัว เกิดกรณีคำตอบประหลาดจำนวนมาก:
    • “ควรกินก้อนหินวันละกี่ก้อน?” → “ตามนักธรณีวิทยาจาก UC Berkeley แนะนำให้กินก้อนหินเล็กวันละ 1 ก้อน”
    • “ชีสไม่ติดพิซซ่า” → “เติมกาวปลอดสารพิษ 1/8 ถ้วยลงในซอส”
  • แม้คำตอบเหล่านี้ส่วนใหญ่จะมาจาก มีมบนอินเทอร์เน็ต เช่น โพสต์ล้อเล่นใน Reddit
    แต่ AI Overviews กลับ นำเสนอเหมือนเป็นข้อเท็จจริง จนเกิดปัญหาความน่าเชื่อถือ
  • Google จึงลดการแสดงผลของฟีเจอร์นี้ลงชั่วคราวและ ปรับจูนใหม่
  • ปฏิกิริยาภายใน Google และเสียงตอบรับจากผู้ใช้

    • Pandu Nayak หัวหน้านักวิทยาศาสตร์ฝ่าย Search:
      • “เราไม่สามารถป้องกันทุกปัญหาได้ล่วงหน้า เราทำได้เพียงสัญญาว่าจะปรับปรุงอย่างต่อเนื่อง”
      • “เวลามันทำงานได้ดี ผู้คนก็เงียบ แต่ถ้ามันแปลกเมื่อไร ทุกคนก็จะบ่นอย่างเดียว”
    • ภายในบริษัท พนักงานที่เคยเตือนเรื่องความแม่นยำรู้สึกผิดหวัง
      • ตั้งแต่ Bard→Gemini, เครื่องมือสร้างภาพ ไปจนถึง AI Overviews ถูกมองว่าเป็น “สายพานผลิตเรื่องแต่งต่อเนื่อง
      • ยังมีความกังวลด้วยว่าพันธกิจของ Google ในการเพิ่มการเข้าถึงข้อมูลกำลัง เสื่อมลงเป็น “เครื่องมือเขียนตามคำบอกของเรื่องไร้สาระ”
    • ในอีกด้านหนึ่ง ทีม Search ให้ความสำคัญกับความพึงพอใจของผู้ใช้
      • AI Overviews ยังคงเปิดใช้อย่างเต็มรูปแบบโดยไม่มีตัวเลือกปิด
      • หลังจากนั้น ฟีเจอร์สรุปด้วย AI ก็ถูกนำไปใช้ใน Google Maps, แอปสภาพอากาศ และบริการอื่น ๆ ด้วย
    • ตัวอย่างจากแอปสภาพอากาศบน Pixel:
      • แม้จะมีวิศวกรบางส่วนเห็นว่ากราฟิกแบบเดิมก็เพียงพอแล้ว แต่ ผลทดสอบพบว่า 90% ให้ฟีดแบ็กว่า “ชอบ”
  • สัญญาณการฟื้นตัวและการกลับมาของบุคลากรคนสำคัญ

    • ในเดือนธันวาคม 2024 สองปีหลังแรงกระแทกจาก ChatGPT Jeff Dean ให้สัมภาษณ์กับ WIRED ด้วยบรรยากาศที่เป็นบวก
      • โมเดล Gemini ขึ้นอันดับ 1 บนเบนช์มาร์กสาธารณะ
      • ผู้บริหารคนหนึ่งเล่าว่าเขา คุยกับ Gemini Live ระหว่างเดินทางแทนการคุยกับพี่สาวน้องสาว
    • Jensen Huang ซีอีโอของ NVIDIA แนะนำ NotebookLM Audio Overviews อย่างหนักแน่น
    • บุคลากรที่เคยลาออกไปเพราะไม่พอใจกับวัฒนธรรมที่ระมัดระวังเกินไปในอดีตก็ กลับมาอีกครั้ง
      • Noam Shazeer หนึ่งในผู้สร้าง Transformer ก็กลับมาร่วมงานอีกครั้ง
        • ในอดีตเขาเคยลาออกเพราะผิดหวังกับนโยบายบริษัทที่ไม่ยอมเปิด LaMDA สู่ภายนอก

อนาคตของ Gemini ความท้าทาย และสงคราม AI ที่ยังไม่จบ

  • บรรยากาศภายใน Google และความมั่นใจในการเติบโต

    • ในบทสัมภาษณ์ Jeff Dean ยอมรับความผิดพลาดในการตัดสินใจในอดีต และประเมินว่าตอนนี้ Google กำลังก้าวพ้นภาวะหลีกเลี่ยงความเสี่ยงและเดินหน้าได้ไกลขึ้น
    • ขณะนี้ 7 บริการหลักของ Google (เช่น Chrome, Gmail, YouTube) ต่างก็ กำลังนำฟีเจอร์ที่อิง Gemini มาใช้
    • Dean, Noam Shazeer และผู้นำคนอื่น ๆ กำลังประสานข้อกำหนดความต้องการทั่วทั้งบริษัท เช่น:
      • ปรับปรุงการแปลภาษาญี่ปุ่น
      • เสริมความสามารถด้านโค้ดดิ้ง
      • ปรับปรุงการวิเคราะห์วิดีโอแบบเรียลไทม์สำหรับ Astra เป็นต้น
    • Dean และ Shazeer มักประชุมกันที่ microkitchen ของ Gradient Canopy เพื่อแลกเปลี่ยนไอเดีย
  • ขยายยุทธศาสตร์สู่การสร้างคอนเทนต์ด้วย AI

    • Shazeer กล่าวว่า “การจัดระเบียบข้อมูลเป็นตลาดมูลค่า 1 ล้านล้านดอลลาร์ แต่สิ่งที่เท่ตอนนี้คือ 1 quadrillion ดอลลาร์”
    • ราคาหุ้น Alphabet เพิ่มขึ้นเกือบ 2 เท่าเมื่อเทียบกับจุดต่ำสุดในช่วงเปิดตัว ChatGPT
    • ตอนนี้ฮัสซาบิสได้ดูแลทีมแอป Gemini ของเสี่ยวด้วย และมั่นใจว่า อนาคตที่ AI รักษาโรคได้อยู่ไม่ไกล
      • เขากล่าวกับ WIRED ว่า “เรามีฐานงานวิจัยที่กว้างและลึกที่สุดมากกว่าองค์กรใด ๆ”
  • ปัญหาเรื่องการทำกำไรและการหวนกลับสู่โมเดลโฆษณา

    • ปัจจุบันผู้ใช้ส่วนใหญ่ ยังไม่เต็มใจจ่ายเงินโดยตรงเพื่อฟีเจอร์ AI
    • Google กำลังพิจารณา วิธีแทรกโฆษณาลงในแอป Gemini
    • นี่คือกลยุทธ์ดั้งเดิมของซิลิคอนแวลลีย์:
      • “ให้ข้อมูล เวลา และความสนใจของคุณมา แล้วใช้เครื่องมือเจ๋ง ๆ ที่เราสร้างได้ฟรี”
      • แค่ติ๊กยอมรับข้อจำกัดความรับผิด Google ก็ไม่ต้องรับผิดชอบ
  • การแข่งขันในตลาดและภาระด้านโครงสร้างพื้นฐาน

    • ข้อมูลจาก Sensor Tower:
      • ยอดดาวน์โหลดสะสมของแอป ChatGPT: ราว 600 ล้านครั้ง
      • แอป Gemini: ราว 140 ล้านครั้ง
    • มีคู่แข่งด้าน AI จำนวนมาก:
      • Claude, Copilot, Grok, DeepSeek, Llama, Perplexity เป็นต้น
      • หลายรายในกลุ่มนี้เป็น คู่แข่งโดยตรงหรือเป้าหมายการลงทุนของ Google
    • Generative AI ต้องใช้เงินลงทุนหลายพันล้านดอลลาร์และพลังงานมหาศาล
      • ใช้พลังงานมากถึงขั้นต้องยืดอายุโรงไฟฟ้าถ่านหินเก่าหรือเครื่องปฏิกรณ์นิวเคลียร์
      • ทั้งอุตสาหกรรม ยังหาวิธีสร้างรายได้ที่ชัดเจนไม่ได้
  • ความเสี่ยงเพิ่มเติมที่ Google ต้องเผชิญ

    • รายได้โฆษณาจากการค้นหาสูงสุด 25% อาจหายไปภายในไม่กี่ปีข้างหน้าเพราะคดีผูกขาด (วิเคราะห์โดย JP Morgan)
    • ภายในองค์กรเองก็รับรู้แรงกดดันเรื่องการประคองฐานะการเงินมากขึ้น
      • บางส่วนของทีมเสี่ยว ทำงานต่อเนื่อง 3 ปีโดยไม่ได้หยุดพักฤดูหนาว
      • บริน ผู้ร่วมก่อตั้ง เพิ่งบอกกับพนักงานว่า “การทำงานสัปดาห์ละ 60 ชั่วโมงคือ sweet spot ที่มีประสิทธิภาพที่สุดในการแข่งขัน AI
    • พนักงานที่ให้สัมภาษณ์กับ WIRED ระบุว่า มีความกังวลลึก ๆ ต่อการปลดพนักงานอย่างต่อเนื่อง ภาวะหมดไฟ และความเสี่ยงทางกฎหมาย
  • ความหมกมุ่นกับ AGI และความท้าทายเชิงปรัชญา

    • ฮัสซาบิสยังคงยึดเป้าหมายการพัฒนา AGI (ปัญญาประดิษฐ์ทั่วไป) อย่างแน่วแน่
      • เขาเดินถือ ต้นแบบ Astra ไปตามถนนในลอนดอน พร้อมจินตนาการถึงอนาคตที่มันรับรู้ทุกสิ่งบนโลกได้
    • แต่ AGI จะเป็นไปได้ก็ต่อเมื่อ การให้เหตุผล การวางแผน และความสามารถในการลงมือทำ ดีขึ้นทั้งหมด
  • การแข่งขันด้าน 'agent AI' กับ OpenAI

    • ในเดือนมกราคม 2025 OpenAI เปิดตัว บริการ Operator
      • เป็น agent AI ที่ คลิกและพิมพ์บนเว็บไซต์จริงเพื่อทำงานแทนผู้ใช้
      • ทำได้ทั้งจองทริป กรอกแบบฟอร์ม ฯลฯ แต่ยังช้าและผิดพลาดมาก
      • ราคาแพ็กเกจ: 200 ดอลลาร์ต่อเดือน
    • Google ก็ขยายฟีเจอร์ไปในทิศทางเดียวกัน:
      • ตอนนี้ Gemini ช่วยจัดแผนอาหารได้ แต่เวอร์ชันถัดไปจะ ใส่วัตถุดิบลงตะกร้าสินค้าได้ และ
        ขั้นต่อไปตั้งเป้า ให้ฟีดแบ็กแบบเรียลไทม์ขณะหั่นหัวหอม
  • ความผิดพลาดจะเกิดซ้ำ แต่ความเร็วจะไม่หยุด

    • ในเดือนมกราคม 2025 โฆษณา Gemini ช่วง Super Bowl ทำพลาดแบบชวนขำขื่น โดยตอบว่า “มากกว่าครึ่งของการบริโภคชีสทั่วโลกคือ Gouda”
    • แต่ Google กำลังพัฒนา Gemini ให้ไม่ใช่แค่เครื่องจักรให้ข้อมูล แต่เป็น ส่วนหนึ่งของชีวิต โค้ชชีวิต และผู้ช่วยสารพัดประโยชน์
    • พิชัยกล่าวว่า “เรากำลังเดินหน้าอย่างระมัดระวัง”
    • แต่เขาและทีมผู้บริหารคง ไม่อยากกลับไปเป็นฝ่ายตามหลังอีกอย่างแน่นอน
  • การแข่งขัน AI ยังคงดำเนินต่อไป

4 ความคิดเห็น

 
joone 2025-05-24

ว่าแต่ เรื่องแบบนี้ถูกทำให้เป็นข่าวได้อย่างไรนะ? ดูเหมือนเป็นบทความเชิงประชาสัมพันธ์ของ Google อยู่เหมือนกันนะ
"พวกเรากำลังพยายามอย่างเต็มที่"...

 
halfenif 2025-03-28

ให้ความรู้สึกเหมือนกำลังดูซีรีส์ฝรั่งเลย

แล้ว Apple หายไปไหนล่ะ?

 
ide127 2025-03-28

ให้ความรู้สึกราวกับยุคที่เกิด Sputnik shock ในตอนนั้นเลย

 
GN⁺ 2025-03-28
ความคิดเห็นจาก Hacker News
  • ตอนแรกก็สงสัยอยู่ แต่คิดว่า Google กำลังทำได้ดีในการแข่งขันกับ OpenAI ทั้ง Gemini 2.0 Pro และโมเดล Flash นั้นยอดเยี่ยม ฟีเจอร์การวิจัยเชิงลึกถูกทำออกมาได้ดีมาก หน้าต่างคอนเท็กซ์ก็ยังคงดีที่สุดในอุตสาหกรรม การผสานรวมกับ Search, Gmail, ชุดแอปสำนักงานของ Google, Google Meet, Android และอื่น ๆ ทำได้ยอดเยี่ยม

    • ตอนนี้พวกเขามีโมเดลที่ดีพอแล้ว และยังฝังตัวลึกอยู่ในพอร์ตโฟลิโอผลิตภัณฑ์เดิม โครงสร้างพื้นฐานคลาวด์ และชีวิตการทำงานสมัยใหม่
    • ต่างจาก Apple พวกเขาถูกจำกัดน้อยกว่าในการเข้าถึงข้อมูลฝึก เพราะมีนโยบายความเป็นส่วนตัวที่เข้มงวดน้อยกว่า
  • ปัญหาใหญ่ที่สุดที่ Google เผชิญคือแนวโน้มที่จะใช้โมเดลขนาดเบาสำหรับทุกคน โมเดลที่ใช้กับ Search น่าจะอยู่ราวระดับ 8B และ Flash 2.0 แม้จะใช้ได้ดี แต่ก็ยังเป็นโมเดลขนาดเบา

    • ตอนนี้ผู้คนเริ่มเชื่อมโยง Google AI/Gemini เข้ากับผลการค้นหาที่แย่และคำตอบที่ไม่ดี
    • ในทางกลับกัน โมเดลระดับแนวหน้ากลับทรงพลังมาก และ Gemini 2.5 อาจขึ้นครองบัลลังก์ AI แล้วก็ได้
  • OpenAI ไม่ใช่บริษัทมหาชนและยังไม่ทำกำไร ส่วน Google ทำกำไรได้อยู่ ถึงอย่างนั้น การที่พวกเขาไม่สามารถนำ Transformer decoder ไปใช้งานจริงในระดับผลิตภัณฑ์ได้ก็ถือเป็นความผิดพลาด เช่นเดียวกับ Google Meet/Zoom (ขณะที่ encoder อย่าง BERT ถูกใช้อย่างแพร่หลาย)

  • ฝ่ายผู้นำของ Google ใช้แนวทางที่ระมัดระวัง และการเปิดตัวผลิตภัณฑ์ก็ดูสมบูรณ์กว่ามาก ให้ความรู้สึกแบบการเปลี่ยนผ่านจาก 0 ไป 1 ที่น่าตื่นเต้นเหมือน Apple ในยุค 2000

  • ปัญหาหลักของ Google คือมีหลายกลุ่มสร้างผลิตภัณฑ์แบบเดียวกันและแข่งขันกันเพื่อแย่งความสนใจจากผู้ใช้

    • มีผลิตภัณฑ์หลากหลายอย่าง Google AI Studio, แอป Gemini, แอป Gemini สำหรับผู้ใช้ Gemini Advanced, Vertex AI, NotebookLM เป็นต้น
    • เรื่องนี้ถูกนำไปเทียบกับ ChatGPT.com
    • Search ของ Google ก็คือการค้นหา แค่วางผลการค้นหาไว้คอลัมน์ขวาพร้อมโฆษณา และวาง Gemini ไว้ทางซ้ายแบบที่เป็นอยู่ทุกวันนี้ ก็เรียบง่ายดี
  • ในฐานะนักลงทุนรายย่อย: คิดว่า Alphabet/Google อาจทำได้ดีกว่านี้หากมี CEO ที่ไม่ใช่ Sundar

    • อีกอย่าง: ควรพิจารณาลงทุนในบริษัทที่ให้บริการซึ่งกระตุ้นให้คนสมัครสมาชิก เช่น Youtube Premium หรือ Netflix ในอดีต
  • ปัญหาของ Google คือคนที่ไม่คุ้นเคยกับเทคโนโลยีเริ่มมองว่า AI เป็นสิ่งที่แยกจาก Google (Search) และผลิตภัณฑ์อื่น ๆ

    • พวกเขาพยายามใช้ AI แทน Search เช่น ChatGPT และ Google กำลังแพ้สงครามด้านการรับรู้นี้ ซึ่งไม่ใช่ปัญหาที่จะแก้ได้อย่างรวดเร็ว
    • สิ่งที่ Google ทำในสายตาคนทั่วไปด้าน AI เคยเป็น Bard (ยังมีใครจำได้ไหม?) แล้วตอนนี้ก็กลายเป็น Gemini
    • อะไรคือจุดแตกต่าง? Google ให้บริการฟรีมากกว่าคู่แข่งหรือไม่? คนทั่วไปไม่ได้สนใจว่ามันแก้โจทย์คณิตศาสตร์ได้หรือเปล่า
    • ตราบใดที่ผู้คนยังมองว่า AI กับ Search เป็นคนละอย่าง Google ก็จะยังมีปัญหา
  • เคยเจอ Googler ที่มั่นใจในกลยุทธ์ AI ของ Google บ้างไหม? คนที่ฉันคุยด้วยดูเหมือนทุกคนจะมีความกังวลอย่างจริงจัง แต่นี่อาจเป็นเพียงกลุ่มตัวอย่างเล็ก ๆ

  • ดูเหมือน Eric Schmidt เคยพูดไว้เมื่อราว 10 ปีก่อนว่า "ทุกคนจะต้องมีผู้ช่วย" (น่าจะประมาณปี 2016) ทั้งที่พวกเขาสามารถทำบางอย่างคล้ายการสนทนาได้อยู่แล้ว แต่ไม่รู้ว่าทำไมถึงไม่ทำ กลับไปหมกมุ่นกับเรื่องอย่าง mailbox แทน