จุดเริ่มต้นของวิกฤต Google ที่ตามหลังในการปฏิวัติแชตบอต
- เดือนธันวาคม 2022 ซิสซี เสี่ยว (Sissie Hsiao) ได้รับมอบหมายให้ พัฒนาผลิตภัณฑ์คู่แข่งของ ChatGPT ของ Google ให้เสร็จภายใน 100 วัน
- เสี่ยวเป็นผู้มีประสบการณ์ที่ทำงานมากว่า 16 ปีและเคยนำทีมคนนับพัน แต่ไม่เคยเผชิญวิกฤตร้ายแรงแบบนี้มาก่อน
- หลังจากที่ OpenAI เปิดตัว ChatGPT จำนวนผู้ใช้ก็เพิ่มขึ้นอย่างรวดเร็วเกิน 1 ล้านคน แม้จะยังมีข้อผิดพลาดด้านข้อเท็จจริงและการคำนวณ
- บางส่วนเริ่มมอง ChatGPT เป็น ทางเลือกแทน Google Search ซึ่งถือเป็นภัยคุกคามต่อแหล่งรายได้ที่ใหญ่ที่สุดของ Google
- แม้ Google จะมีโมเดลภาษาของตัวเองคือ LaMDA แต่ การเข้าถึงแบบสาธารณะยังถูกจำกัด และแม้แต่เดโมก็ยังจำกัดอยู่แค่เรื่อง “สุนัข”
- วอลล์สตรีท (ตลาดการเงิน) เริ่มกังวล ขณะที่ในอดีต Sundar Pichai ซีอีโอเคยประกาศยุค “AI first” และบอกว่า ผู้ช่วยอัจฉริยะจะเข้ามาแทนอุปกรณ์ แต่ความจริงกลับไม่เป็นไปตามความคาดหวัง
- แม้แต่ สถาปัตยกรรม Transformer ก็ถูกสร้างขึ้นโดยนักวิจัย Google 8 คน แต่คนเหล่านี้ก็ลาออกหรือจากไปโดยไม่ได้สร้างผลลัพธ์ต่อเนื่อง
- Google Assistant ที่เสี่ยวดูแลอยู่ ถูกใช้เพียงตั้งเวลา หรือเปิดเพลงเท่านั้น
- ทั้งหมดยังมีเพียงแชตบอตที่ยังไม่เสร็จสมบูรณ์สำหรับคนรุ่น Gen Z ซึ่งให้ คำแนะนำการทำอาหารและควิซประวัติศาสตร์
- จนถึงปลายปี 2022 ราคาหุ้น Alphabet ลดลง 39% เมื่อเทียบกับปีก่อน และสถานะของ Google ในฐานะผู้นำ AI ก็เริ่มสั่นคลอน
การรับมือวิกฤต AI ของ Google และการเปลี่ยนกลยุทธ์
- ต้นปี 2023 คณะกรรมการบริหารของ Google เรียกร้องให้มี รายงานด้าน AI แบบเรียลไทม์
- Sergey Brin ผู้ร่วมก่อตั้งและผู้ถือหุ้นใหญ่ เข้าร่วมทบทวนกลยุทธ์ด้วยตนเอง
- มีการส่งข้อความถึงพนักงานว่า “ให้ขยับตัวเหมือนสตาร์ทอัพ”
- ในอดีต วัฒนธรรมของบริษัทคือมีพนักงานจำนวนมากที่ คัดค้านผลิตภัณฑ์ได้ แต่ไม่มีอำนาจอนุมัติ
- ตอนนี้กำลัง เปลี่ยนไปสู่วัฒนธรรมที่ยอมรับความเสี่ยงมากขึ้นและลงมือได้เร็วขึ้น
- ซิสซี เสี่ยว เริ่มโปรเจกต์ 100 วันพร้อมเสนอหลักการเฉพาะให้ทีม:
“คุณภาพต้องมาก่อนความเร็ว แต่ต้องเร็วด้วย (Quality over speed, but fast)”
- ผู้บริหารระดับสูงอีกคน James Manyika มีบทบาทในการเปลี่ยนกลยุทธ์ AI อย่างรากฐาน
- เขาเป็นด็อกเตอร์ด้านหุ่นยนต์จาก Oxford และอดีตที่ปรึกษา McKinsey ก่อนเข้าร่วม Google ในปี 2022
- เขาเสนอให้ Pichai รวม DeepMind และ Google Brain เข้าด้วยกัน
- DeepMind (ลอนดอน ภายใต้การนำของ Demis Hassabis) และ Google Brain (เมาน์เทนวิว ภายใต้การดูแลของ Jeff Dean) ดำเนินงานแยกกันและ ใช้ทรัพยากรอย่างไม่มีประสิทธิภาพ
- หลัง OpenAI เปิดตัวผลิตภัณฑ์ ผู้นำ 3 คนได้เสนอแผนรวมทีมต่อบอร์ด
- Hassabis เสนอชื่อโปรเจกต์ว่า ‘Titan’ แต่ถูกปฏิเสธ และสุดท้ายใช้ชื่อ ‘Gemini’ ตามข้อเสนอของ Jeff Dean
- ต่อมา Manyika กล่าวถึงการที่ Google เคยทำ การตัดสินใจที่กล้าหาญและมีความรับผิดชอบ
- แต่ก็ยอมรับว่า “ไม่ได้ตัดสินใจถูกต้องเสมอไป”
- ท่ามกลางสถานการณ์เร่งด่วน ความกังวลในหมู่พนักงานถึงขั้นลามไปถึงคำพูดว่า “Google อาจกลายเป็น Yahoo ได้”
- เสี่ยวอธิบายช่วงเวลานั้นว่า “เหมือนวิ่งมาราธอนแบบสปรินต์เต็มกำลัง”
- อย่างไรก็ตาม หลังผ่านไป 2 ปี ราคาหุ้น Alphabet ก็ทำสถิติสูงสุดใหม่
- นักลงทุนกำลังมี มุมมองเชิงบวก ต่อการฟื้นความสามารถแข่งขันด้าน AI ของ Google
- WIRED ประเมินว่าช่วงเวลานี้เป็นช่วงที่ วุ่นวายที่สุดและมีการเปลี่ยนแปลงด้านวัฒนธรรมมากที่สุด ในประวัติศาสตร์ Google
- มีการสัมภาษณ์พนักงานปัจจุบันและอดีตมากกว่า 50 คนจากฝ่ายวิศวกรรม การตลาด กฎหมาย และความปลอดภัย
- บทความนี้จะ ถ่ายทอดภาพการเปลี่ยนแปลงของ Google อย่างละเอียดผ่านคำให้การของผู้บริหารระดับสูงเป็นครั้งแรก
การพัฒนา Bard: การยกระดับเป็นวาระสำคัญทั้งบริษัทและการทุ่มทรัพยากร
- เพื่อตอบโต้ ChatGPT Google เริ่มโปรเจกต์แชตบอตใหม่โดยใช้ โค้ดเนม Bard
- ซิสซี เสี่ยว ดึงคนเก่งราว 100 คนจากทั่วทั้ง Google มาร่วมทีมด้วยตัวเอง
- ผู้จัดการไม่มีสิทธิ์คัดค้าน และ โปรเจกต์ Bard คือภารกิจสำคัญสูงสุด
- เสี่ยวคัดเลือก คนที่มีทั้งความสามารถทางเทคนิค ความฉลาดทางอารมณ์ และมองภาพใหญ่ได้
- คนส่วนใหญ่ถูกจัดไปอยู่ที่ Mountain View, California และทำงานอย่างยืดหยุ่นโดยไม่ยึดติดบทบาท
- เธอเน้นปรัชญาว่า “Team Bard คือทีมที่ทำได้ทุกบทบาท”
- เดือนมกราคม 2023 Google ประกาศ ปลดพนักงานครั้งใหญ่ครั้งแรกในประวัติศาสตร์บริษัท จำนวนราว 12,000 คน หรือ 7% ของทั้งองค์กร
- พนักงานบางคน หวาดกลัวว่าอาจถูกเลิกจ้างหากไม่ทำงานดึกหรือรับงานเพิ่ม
- หลายคนถึงกับยอมสละเวลาพาลูกเข้านอนเพื่อเข้าประชุมตอนกลางคืน
- Bard ใช้ LaMDA เป็นพื้นฐาน แต่ต้องการ การอัปเดตความรู้และกลไกความปลอดภัยใหม่
- ทีมโครงสร้างพื้นฐาน โยกวิศวกรระดับท็อปเข้ามา เพื่อเร่งจัดหาเซิร์ฟเวอร์และจูนระบบ
- ดาต้าเซ็นเตอร์มี การใช้พลังงานเกือบแตะขีดจำกัด จนเกิดความเสี่ยงที่อุปกรณ์จะร้อนเกินไป
- จึงมีการพัฒนา เครื่องมือจัดการใหม่ อย่างเร่งด่วนเพื่อรองรับความต้องการใช้ไฟฟ้าได้อย่างปลอดภัยยิ่งขึ้น
- เพื่อผ่อนคลายความตึงเครียด จึงมีมุกตลกเกิดขึ้นด้วย
- สมาชิกทีมคนหนึ่งทำ ชิปโป๊กเกอร์แบบคัสตอม สลักชื่อชิปบางตัว แล้ววางกองไว้บนโต๊ะวิศวกรพร้อมพูดเล่นว่า “เอ้า หยิบชิปไปเลย”
- ในช่วงหลายสัปดาห์แรก Bard ยังทำปัญหาเดิมซ้ำ แม้จะเพิ่มทรัพยากรคอมพิวต์แล้วก็ตาม
- เช่นเดียวกับ ChatGPT, Bard มักสร้าง ภาพหลอน (hallucination) และ คำตอบที่ไม่เหมาะสมหรือชวนไม่พอใจ
- ในเวอร์ชันแรก ๆ ยังเกิด ภาพเหมารวมทางเชื้อชาติที่ร้ายแรงจนชวนขำแบบผิดที่ผิดทาง อยู่บ่อยครั้ง
- หากป้อนชื่อแบบอินเดีย ระบบมักอธิบายว่าเป็น “นักแสดงบอลลีวูด” ส่วนชื่อผู้ชายเชื้อสายจีนมักถูกอธิบายว่าเป็น “นักวิทยาการคอมพิวเตอร์”
- ตามคำบอกเล่าของอดีตพนักงาน คำตอบของ Bard “ไม่ได้อันตราย แต่แค่ โง่”
- พนักงานบางส่วนถึงกับ แคปหน้าจอคำตอบเพี้ยน ๆ ของ Bard มาแชร์ขำกัน
- ตัวอย่างเช่น เมื่อขอ “แรปสไตล์ Three 6 Mafia เกี่ยวกับการทิ้งแบตเตอรี่รถยนต์ลงทะเล” มันกลับสร้างเนื้อหาที่รวมถึง การมัดคนเข้ากับแบตเตอรี่แล้วทำให้จมทะเล
- Google แทบไม่มีทางเลือกนอกจาก แก้บั๊กให้ได้มากที่สุดภายใน 100 วันที่กำหนด
- แม้แต่ พนักงานสัญญาจ้างภายนอก ที่เดิมรับผิดชอบงานอย่างการตรวจจับภาพการทารุณกรรมเด็ก ก็ถูกดึงมาช่วยทดสอบ Bard
- Pichai ขอให้พนักงานทุกคนที่มีเวลาว่างช่วยทดสอบ Bard และสุดท้ายมีผู้เข้าร่วมทดสอบราว 80,000 คน
- เสี่ยวและผู้บริหารตระหนักว่าไม่อาจหยุดความผิดพลาดของ Bard ได้ทั้งหมด จึง วางตำแหน่งผลิตภัณฑ์เป็น “การทดลอง (Experiment)”
- นี่เป็นกลยุทธ์คล้ายกับที่ OpenAI เรียก ChatGPT ว่า ‘research preview’
- การเน้นย้ำต่อผู้ใช้และผู้ประเมินภายนอกว่า ยังไม่ใช่ผลิตภัณฑ์สำเร็จรูป เป็นความพยายามลดความเสี่ยงต่อความเสียหายของแบรนด์
- กลยุทธ์แบบนี้กลายเป็นแนวทางหลีกเลี่ยงความเสี่ยงที่อุตสาหกรรมรับรู้กันกว้างขวางหลังกรณีที่แชตบอต Twitter ของ Microsoft อย่าง Tay พูดจาแบบนาซี
กระบวนการเปิดตัว Bard และความผิดพลาดร้ายแรง
- ในอดีต ก่อนที่ Google จะเปิดตัวผลิตภัณฑ์ AI ทีม 'Responsible Innovation Team' จะใช้เวลาหลายเดือนเพื่อตรวจสอบ อคติและข้อบกพร่อง
- แต่ในกรณีของ Bard กระบวนการ ตรวจสอบถูกย่อลงอย่างมาก เพราะแรงกดดันด้านกำหนดการ
- Kent Walker ประธานเจ้าหน้าที่ฝ่ายกฎหมาย สนับสนุนให้เปิดตัวอย่างรวดเร็ว
- โมเดลและฟีเจอร์ใหม่ ๆ ออกมาเร็วเกินไปจน ทีมรีวิวตามไม่ทัน แม้ต้องทำงานล่วงเวลาและทำงานสุดสัปดาห์
- มีคำเตือนให้เลื่อนการเปิดตัว Bard ออกไป แต่ก็ ถูกเพิกเฉยหรือทำให้หมดน้ำหนัก
- ต่อเรื่องนี้ Google บอกกับ WIRED ว่า “ไม่มีทีมใดแนะนำอย่างเป็นทางการให้คัดค้านการเปิดตัว”
- พร้อมชี้แจงว่า หลายทีมมีส่วนร่วมในการทดสอบ และ ไม่ได้มีโครงสร้างที่ให้ทีมใดทีมหนึ่งรับผิดชอบทั้งหมด
- ในช่วงราว 2 ใน 3 ของโครงการ 100 วัน ในเดือนกุมภาพันธ์ 2023 Google ได้ข้อมูลว่า ChatGPT กำลังจะถูกผนวกรวมเข้ากับการค้นหา Bing
- แม้ส่วนแบ่งตลาดการค้นหายังคงเป็นของ Google อย่างท่วมท้น แต่ การไม่มีฟีเจอร์ generative AI ถือเป็นภัยคุกคามระยะยาว
- เพื่อ หลีกเลี่ยงการร่วงลงของราคาหุ้น ในวันที่ 6 กุมภาพันธ์ หนึ่งวันก่อน Microsoft ประกาศ Pichai ได้ประกาศ การเปิดทดสอบ Bard แบบจำกัดวงอย่างกะทันหัน
- ในวิดีโอการตลาด Bard ถูกอธิบายว่าเป็น ผู้ช่วย AI ที่สืบทอดภารกิจของ Google ในการ “จัดระเบียบข้อมูล”
- คำถามในวิดีโอคือ “ในบรรดาการค้นพบใหม่ของกล้องโทรทรรศน์อวกาศ James Webb มีอะไรบ้างที่อธิบายให้เด็กอายุ 9 ขวบเข้าใจได้?”
- คำตอบของ Bard คือ “JWST ถ่ายภาพแรกของดาวเคราะห์นอกระบบสุริยะได้”
- ไม่นานหลังจากนั้น Reuters รายงานความผิดพลาดด้านข้อเท็จจริง: ภาพดังกล่าวไม่ได้ถ่ายโดยกล้องโทรทรรศน์อวกาศ แต่เป็น กล้องโทรทรรศน์ภาคพื้นดิน (VLT)
- หุ้น Alphabet ร่วง 9% ทำให้มูลค่าตลาดหายไปราว 100,000 ล้านดอลลาร์
- ภายในทีมเกิดความช็อก
- พนักงานฝ่ายการตลาดที่ตั้งคำถามรู้สึกโทษตัวเอง ขณะที่เพื่อนร่วมงานปลอบว่า “ทั้งทีมกฎหมายและทีม PR ตรวจแล้ว แต่ ไม่มีใครเห็นความผิดพลาด”
- เนื่องจาก ChatGPT เองก็มีข้อผิดพลาดมาก จึงไม่มีใครคาดว่าเรื่องเข้าใจผิดเล็กน้อยแบบนี้จะกระทบราคาหุ้นได้มากขนาดนั้น
- Xiao เรียกเรื่องนี้ว่า “ความผิดพลาดแบบไร้เดียงสา”
- Bard สร้างคำตอบจากผลการค้นหาของ Google และอาจตีความถ้อยคำ “ภาพแรก” ในบล็อกของ NASA ผิด
- ฝ่ายผู้นำย้ำว่า “จะไม่มีใครถูกไล่ออกเพราะเรื่องนี้ แต่ เราต้องเรียนรู้บทเรียนอย่างรวดเร็ว”
- Xiao กล่าวว่า “เราไม่ใช่สตาร์ตอัป เราคือ Google เราจะปล่อยผ่านโดยบอกว่าเป็นแค่ข้อบกพร่องทางเทคนิคไม่ได้ เราต้องรับมืออย่างมีความรับผิดชอบ”
- ความไม่พอใจจากคนนอกทีม Bard เพิ่มสูงขึ้น
- ในฟอรัมภายใน Memegen มีโพสต์วิจารณ์ว่า “ทั้งการเปิดตัว Bard และการเลย์ออฟนั้นเร่งรีบ ทำพัง และมองสั้น”
- ยังมีการแชร์ภาพโลโก้ Google กำลังลุกไหม้อยู่ในถังขยะด้วย
- อย่างไรก็ตาม Google กลับทุ่มทรัพยากรให้ Bard มากขึ้น
- มีการส่งคนเพิ่มอีกหลายร้อยคน และในเอกสารของทีมถึงขั้นมี ไอคอนรูปโปรไฟล์ของ Pichai ปรากฏทุกวัน สะท้อนการมีส่วนร่วมโดยตรงของเขา
การมาถึงของ GPT-4 และช่องว่างทางเทคโนโลยี
- กลางเดือนมีนาคม 2023 การเปิดตัว GPT-4 ของ OpenAI สร้างความช็อกให้ภายใน Google อีกครั้ง
- นักวิจัยอาวุโสคนหนึ่งกล่าวว่า “ผมอ้าปากค้างไปเลย และ รู้สึกอย่างแรงกล้าว่า Google ต้องเร็วขึ้น”
- หนึ่งสัปดาห์หลังจากนั้น Bard ก็ เปิดตัวอย่างเป็นทางการ ในสหรัฐฯ และสหราชอาณาจักร
- ผู้ใช้มองว่ามีประโยชน์ในการเขียนอีเมล ร่างรายงาน และงานลักษณะเดียวกัน
- แต่ ChatGPT ก็ทำสิ่งเดียวกันได้ดีกว่า จึงมีแรงจูงใจให้ผู้ใช้ย้ายมาใช้น้อย
- Pichai พูดติดตลกในพอดแคสต์ Hard Fork ว่า Google เหมือนเอา “Civic ที่แต่งมาแล้ว” ไปแข่งกับรถสปอร์ตแรง ๆ
- บทสรุปคือ “เราต้องการเครื่องยนต์ที่ดีกว่านี้”
การพัฒนา Gemini: การรวม DeepMind กับ Google Brain และความขัดแย้งด้านวัฒนธรรม
- ความแตกต่างของสององค์กรวิจัย AI
- DeepMind ถูกจัดอยู่ในหมวด 'Other Bets' ของ Alphabet และมุ่งเน้นไปที่ การแก้ปัญหาทางวิทยาศาสตร์และคณิตศาสตร์ระยะยาว
- Google Brain พัฒนาเทคโนโลยี AI ที่ ใช้งานได้จริงในเชิงพาณิชย์ เป็นหลัก เช่น ระบบเติมข้อความอัตโนมัติใน Gmail และการจัดการคำค้นหาที่กำกวม
- ตามคำบอกเล่าของอดีตวิศวกรอาวุโส:
- Google Brain ยึดความเป็นอิสระเป็นหลัก โดย Jeff Dean มีสไตล์แบบ “ปล่อยให้คนทำกันเอง”
- ขณะที่ DeepMind ทำงานเหมือนกองทัพที่เคลื่อนไหวอย่างเป็นระเบียบ และ Demis Hassabis บริหารแบบ “องค์กรประสิทธิภาพสูงภายใต้ผู้บัญชาการคนเดียว”
- Dean คือ ผู้คร่ำหวอดด้านการวิจัยโครงข่ายประสาทเทียม และทำงานมาตั้งแต่ยุคเริ่มต้นของ Google
- Hassabis คือ ผู้นำที่ขับเคลื่อนด้วยวิสัยทัศน์ ผู้ใฝ่ฝันจะใช้ AI รักษาโรค และกำลังวางภาพของ “AI agent ที่มองเห็น ได้ยิน และช่วยเหลือได้”
-
การก่อตั้ง Google DeepMind (GDM)
- ในเดือนเมษายน 2023 Google ได้รวมสององค์กรเข้าด้วยกันและเปิดตัว Google DeepMind (GDM)
- Hassabis ได้รับแต่งตั้งเป็น CEO ขององค์กรที่ควบรวมใหม่
- บรรยากาศภายในคือ “เป้าหมายกลับมามีชีวิตอีกครั้ง” และ “หมดเวลาของการเล่น ๆ แล้ว”
- เพื่อสร้างโมเดล Gemini อย่างรวดเร็ว จำเป็นต้องมี ความร่วมมือข้าม 8 เขตเวลา
- มีการสร้างห้องแชตหลายร้อยห้อง และเกิดวัฒนธรรมการทำงานข้ามคืน
- Hassabis กล่าวว่า “แต่ละวันให้ความรู้สึกเหมือนทั้งช่วงชีวิต”
- GDM ย้ายไปยังอาคารรักษาความปลอดภัยชื่อ Gradient Canopy ใน Mountain View
- เป็นโครงสร้างทรงโดม ล้อมรอบด้วยงานประติมากรรมศิลปะ
- สำนักงานของ CEO Pichai ก็อยู่ชั้นเดียวกัน
- Sergey Brin (ผู้ร่วมก่อตั้ง Google) แวะมาให้กำลังใจอยู่บ่อยครั้ง
- มีการเรียกร้องให้ เข้าออฟฟิศเพิ่มขึ้น และพนักงาน Google ทั่วไปไม่สามารถเข้าอาคารนี้ได้
- แม้แต่โค้ดหลักของ GDM ก็ ไม่เปิดให้หน่วยงานอื่นเข้าถึง
- เมื่อโครงการ Gemini ดูดทรัพยากรของ Google เข้าไปมากขึ้น นักวิจัยในสาขาอื่น เช่น เฮลท์แคร์และการเปลี่ยนแปลงสภาพภูมิอากาศ ก็เริ่มเผชิญปัญหาเซิร์ฟเวอร์ไม่พอใช้
- ยังเกิด ข้อจำกัดในการเผยแพร่งานวิจัย ด้วย ทำให้นักวิจัยไม่พอใจมากขึ้น เพราะบทความวิชาการเป็นทรัพย์สินสำคัญต่ออาชีพของพวกเขา
- Google เข้มงวดขึ้นเพราะกังวลว่า ข้อมูลอาจรั่วไหลไปถึง OpenAI
- สูตรการฝึก Gemini คือทรัพย์สินสำคัญต่อการอยู่รอดของบริษัท
- Gemini เองก็เผชิญปัญหาคล้ายกับ Bard
- Amin Vahdat รองประธานฝ่ายแมชชีนเลิร์นนิงและ Cloud AI ของ Google กล่าวว่า
- “เมื่อขยายสเกลขึ้น 10 เท่า ทุกอย่างพังหมด”
- ก่อนเปิดตัว Vahdat ได้ตั้ง war room เฉพาะกิจ เพื่อมุ่งแก้บั๊กและข้อผิดพลาดของระบบ
การตรวจสอบครั้งสุดท้ายก่อนเปิดตัว Gemini และความกังวลด้านจริยธรรม
- ทีมพัฒนาอย่างมีความรับผิดชอบ ของ Google DeepMind (GDM) ทุ่มกำลังทั้งหมดไปกับ การรีวิวผลิตภัณฑ์ก่อนเปิดตัว Gemini
- แม้โมเดลจะทรงพลัง แต่ก็ยังมีกรณีที่สร้าง คำตอบประหลาดหรือไม่เหมาะสม
- ตามรายงานที่เผยแพร่ต่อสาธารณะ:
- ยังต้องปรับปรุงเป็นพิเศษในด้าน คำแนะนำทางการแพทย์ และ คำตอบที่เกี่ยวข้องกับการกลั่นแกล้ง
- เมื่อรับภาพเป็นอินพุต ก็มีปัญหาที่โมเดล อนุมานโดยไม่มีหลักฐาน กับคำถามอย่าง “คนนี้มีการศึกษาระดับไหน?”
- Dawn Bloxwich ผู้อำนวยการด้าน Responsible Innovation มองว่าเรื่องนี้ “ยัง ไม่ถึงขั้นต้องระงับการเปิดตัว”
- แต่ก็ มีเวลาไม่พอจะคาดการณ์วิธีใช้งานที่สร้างสรรค์มาก ๆ (หรือประหลาด) ของสาธารณะได้ทั้งหมด
- ณ จุดนั้น Google อาจเลือกชะลอความเร็วได้ แต่ก็ไม่ทำ
- OpenAI ได้กลายเป็น ‘Kleenex แห่ง AI’ ไปแล้ว และกำลังได้รับความสนใจจากทั่วโลก
- ChatGPT กลายเป็น ทั้งสัญลักษณ์ของความหวังทางเทคโนโลยีและปัญหาทางสังคม
- แรงงานรู้สึกว่างานของตนถูกคุกคาม ขณะที่ครีเอเตอร์เรียกร้องค่าตอบแทนจากการถูกนำข้อมูลไปใช้
- ผู้ปกครองเริ่มตระหนักว่าแชตบอตอาจส่งต่อ เนื้อหาที่ไม่เหมาะสม ให้ลูกของตนได้
- ในหมู่นักวิจัย AI มีการถกเถียงเรื่อง “p(doom)” — ความน่าจะเป็นที่เทคโนโลยีจะคุกคามมนุษยชาติ
- Geoffrey Hinton นักวิทยาศาสตร์ AI ระดับตำนานของ Google ลาออกในเดือนพฤษภาคม 2023 ด้วยความกังวลด้านจริยธรรม
- เขาเตือนว่า AI อาจคุกคามมนุษยชาติผ่าน ข้อมูลเท็จ และ สารพิษที่ซับซ้อน
- แม้ Hassabis จะรู้สึกว่าต้องการเวลาเพิ่มเช่นกัน แต่เขาก็ยังคงเดินหน้าสู่ความฝันเรื่อง ผู้ช่วย AI อเนกประสงค์ และ การรักษาโรค
การเปิดตัว Gemini และความสำเร็จแรก
- ธันวาคม 2023, Google เปิดตัว Gemini อย่างเป็นทางการ
- หลังเปิดตัว ราคาหุ้นปรับตัวขึ้น
- เหนือกว่า ChatGPT ใน 30 จาก 32 การทดสอบมาตรฐาน
- วิเคราะห์ทั้งงานวิจัยและวิดีโอ YouTube พร้อมเสริมความสามารถในการตอบคำถามด้านคณิตศาสตร์และกฎหมาย
- Hassabis จัด งานฉลองเล็กๆ ที่ออฟฟิศลอนดอน
- เขาย้อนความว่า “ผมไม่ค่อยเก่งเรื่องฉลองเท่าไร ผมคิดถึงเรื่องถัดไปอยู่เสมอ”
- ในเดือนเดียวกัน Jeff Dean ได้รับเชิญเข้าห้องแชตใหม่ชื่อ ‘Goldfish’ และได้รู้ถึงความก้าวหน้าทางเทคโนโลยีขั้นต่อไป
- ชื่อเป็นมุกตลก แต่เนื้อหาตรงกันข้าม: การพัฒนา Gemini เวอร์ชันที่มีความจำระยะยาว
- ด้วย การประมวลผลแบบกระจายผ่านเครือข่ายชิปความเร็วสูง จึงสามารถวิเคราะห์ข้อความยาวหลายพันหน้าหรือแม้แต่ซีรีส์ทีวีทั้งเรื่องได้
- เทคโนโลยีนี้ถูกเรียกว่า “long context”
- Dean, Hassabis และ Manika หาทาง ผนวกรวมสิ่งนี้เข้ากับชุดผลิตภัณฑ์ AI ของ Google
- ฟีเจอร์แรกที่ Manika อยากได้มากที่สุดคือ: ฟีเจอร์สรุป PDF เป็นรูปแบบพอดแคสต์โดยอัตโนมัติ
- เขาบอกกับ WIRED ว่า “เป็นเรื่องยากที่จะตามงานวิจัยทั้งหมดที่หลั่งไหลเข้า arXiv ทุกสัปดาห์ให้ทัน”
ความมั่นคงหลังการเปลี่ยนผ่านสู่ Gemini และวิกฤตครั้งใหม่
- หนึ่งปีหลัง code red บรรยากาศใน Google เริ่มฟื้นตัว
- นักลงทุนเงียบลง และ Bard กับ LaMDA ก็ถูกรวมเป็น แบรนด์เดียวในชื่อ “Gemini”
- ทีมของ Sissie Hsiao ไล่ช่องว่างกับ OpenAI ให้แคบลงด้วยการพัฒนา ฟีเจอร์สร้างภาพจากข้อความ
- ยังมีฟีเจอร์ใหม่ชื่อ Gemini Live อยู่ระหว่างเตรียมเปิดตัว
- ฟีเจอร์ที่ให้ผู้ใช้ สนทนายาวต่อเนื่อง ได้เหมือนคุยกับเพื่อนหรือที่ปรึกษา
- ด้วยโมเดล Gemini ที่ทรงพลังขึ้น ผู้บริหารจึงกลับมามั่นใจอีกครั้ง
- แม้บรรยากาศจะเริ่มนิ่ง CEO Pichai ก็ยังสั่งปรับโครงสร้างเพิ่มเติม
- รายได้โฆษณาเพิ่มขึ้น แต่ ยังต่ำกว่าที่ Wall Street คาดหวัง
- แม้แต่ผู้รับผิดชอบด้าน privacy และ compliance ก็ถูกปลดออก
- การปลดผู้บริหารระดับสูงที่ดูแลการคุ้มครองผู้ใช้ ถูกตีความว่าเป็นข้อความว่า “แสดงความกังวลได้ แต่ห้ามขัดขวางการเดินหน้า”
- ตัวระบบสร้างภาพนั้นสร้างได้ไม่ยาก แต่ การตรวจทานกลับเป็นงานใช้แรงแบบทดสอบซ้ำๆ ที่หนักหน่วง
- ต้องเขียนคำสั่งกรองเพื่อป้องกันไม่ให้เกิดคำตอบที่มีปัญหา
- เนื่องจาก ไม่ใช่พนักงานทุกคนจะเข้าถึงการทดสอบได้ ภาระจึง ตกหนักอยู่กับคนเพียงไม่กี่คน
- ตัวอย่าง: กับพรอมป์ต์ “rapist(ผู้ข่มขืน)” ระบบ มักสร้างบุคคลผิวเข้มบ่อยเป็นพิเศษ → กังวลเรื่องอคติทางเชื้อชาติ
- จึงมีเสียงภายในเสนอว่า ควรปิดการสร้างภาพคนไปเลย แต่ข้อเสนอนี้ถูกเมิน
- อดีตผู้รีวิวรายหนึ่งเล่าว่า “บรรยากาศคือยังไงก็ต้องปล่อยออกมาให้ได้”
- ผู้ตรวจสอบบางส่วนลาออกเพราะความกังวลของพวกเขาไม่ได้รับการรับฟัง
- กุมภาพันธ์ 2024 ระบบสร้างภาพถูก เปิดตัวอย่างเป็นทางการในแอป Gemini
- ปัญหาภาพเหยียดเชื้อชาติหรือเหยียดเพศที่คาดไว้ แทบไม่เกิดขึ้น แต่กลับเกิดปัญหาอีกแบบในทิศทางตรงข้าม
- ตัวอย่าง: เมื่อขอภาพ “สมาชิกวุฒิสภาสหรัฐฯ ในคริสต์ศตวรรษที่ 19” → ระบบสร้างเป็น ผู้หญิงผิวดำ ผู้ชายเชื้อสายเอเชีย และผู้หญิงชนพื้นเมือง
- ไม่มีการสร้างผู้ชายผิวขาวเลยแม้แต่คนเดียว
- ตัวอย่างที่ชวนตกใจกว่านั้น: สร้างทหารนาซีเยอรมนีเป็นคนผิวสี
- เรื่องนี้ทำให้ สมาชิกรัฐสภารีพับลิกันสหรัฐฯ และ Elon Musk เป็นต้น ออกมาวิพากษ์วิจารณ์ “woke AI” ของ Google อย่างหนัก
- Musk พุ่งเป้าโจมตีอย่างหนักโดยเอ่ยชื่อพนักงานในทีมโดยตรง ทำให้พนักงานคนนั้น ต้องปิดบัญชีโซเชียลและกังวลเรื่องภัยคุกคามต่อความปลอดภัยส่วนตัว
- Google ระงับฟีเจอร์สร้างภาพคนทั้งหมด และ หุ้น Alphabet ก็ร่วงลงอีกครั้ง
- หลังเกิดข้อถกเถียง ผู้บริหาร Google หลายสิบคนเริ่มการหารือฉุกเฉิน
- รองประธานและผู้อำนวยการต่าง บินไปลอนดอนเพื่อประชุมแบบเผชิญหน้ากับ Hassabis
- ผลลัพธ์คือ:
- ทั้งทีมของ Hassabis (โมเดล Gemini) และ ทีมของ Hsiao (แอป Gemini) ได้รับอนุมัติให้ จ้างผู้เชี่ยวชาญด้านความน่าเชื่อถือและความปลอดภัย
- มีการตั้งตำแหน่งใหม่ด้าน Trust & Safety รวม 15 ตำแหน่ง
- ที่สำนักงานใหญ่ Gradient Canopy Sissie Hsiao ให้เวลาทีมอย่างเพียงพอในการ แก้ปัญหาฟีเจอร์สร้างภาพ
- พร้อมกับ James Manyika เธอได้วาง หลักการสาธารณะ (public principles) สำหรับ Gemini ขึ้นใหม่
- หลักการเหล่านี้ทั้งหมดเขียนด้วย ถ้อยคำที่ยึดผู้ใช้เป็นศูนย์กลาง (“you”):
- Gemini “ทำตามคำสั่งของคุณ”
- “ปรับให้เข้ากับความต้องการของคุณ”
- “ปกป้องประสบการณ์ของคุณ”
- หนึ่งในจุดเน้นสำคัญคือ:
- “คำตอบของ Gemini อาจไม่ได้สะท้อนจุดยืนหรือความเชื่อของ Google”
- “ผลลัพธ์ของ Gemini ส่วนใหญ่ตั้งอยู่บนสิ่งที่คุณร้องขอ—Gemini คือสิ่งที่คุณสร้างขึ้น”
- นี่เป็น กลไกเชิงตรรกะที่ช่วยลดความรับผิดของ Google ได้ในอนาคต หากเกิดปัญหาขึ้น
- แต่สำหรับหลักการเหล่านี้ Google ก็ยังไม่ได้อธิบายอย่างชัดเจนว่าตนเองจะรับผิดชอบอย่างไร
การทดลองพอดแคสต์ AI: Westminster Watch
- ราว 18:30 น. ของเดือนมีนาคม 2024 มีการเปิดเผยการทดลองที่น่าสนใจใน Yellow Zone ของ Gradient Canopy
- พนักงานสองคนจาก Google Labs นำเสนอโครงการใหม่ให้ Josh Woodward
- Woodward เป็นหัวหน้า Google Labs ซึ่งดูแลการ เปิดตัวผลิตภัณฑ์ทดลองใหม่ๆ ของ Google อย่างรวดเร็ว
- เนื้อหาโครงการคือ:
- ใช้ บันทึกการประชุมรัฐสภาสหราชอาณาจักร (transcripts) ร่วมกับ Gemini ที่มีฟีเจอร์ long context
- เพื่อสร้าง พอดแคสต์ ‘Westminster Watch’ ที่มีพิธีกร AI ชื่อ Kath และ Simon เป็นผู้ดำเนินรายการ
- ในตอนแรก Simon เปิดรายการว่า:
- “สัปดาห์นี้ในสภาก็ยังเต็มไปด้วยดราม่า การถกเถียง และประวัติศาสตร์เล็กๆ น้อยๆ เช่นเคย”
- Woodward ประทับใจกับการทดลองนี้มาก และต่อมาก็ แชร์ให้บุคคลสำคัญโดยตรง รวมถึง Pichai
สรุปเสียงด้วย AI นวัตกรรมการค้นหา และข้อถกเถียงครั้งใหม่
- ฟีเจอร์ NotebookLM Audio Overviews ซึ่งเป็นการให้ AI สรุปเอกสารหรือบันทึกการประชุมในรูปแบบพอดแคสต์
ได้เปิดตัวอย่างเป็นทางการในงาน Google I/O เดือนพฤษภาคม 2024
- ตามคำบอกของจอช วูดเวิร์ด ทีมหลักได้ทดสอบพอดแคสต์ AI หลายพันรายการทั้งกลางวันและกลางคืน ระหว่างการพัฒนา
- อย่างไรก็ตาม ในงานเปิดตัวกลับมีอีกสองประกาศที่ได้รับความสนใจมากกว่า:
- Astra: ผู้ช่วย AI รุ่นถัดไปที่วิเคราะห์วิดีโอแบบเรียลไทม์ได้ (บรินสาธิตด้วยตนเอง)
- AI Overviews: ฟีเจอร์ที่สรุปผลการค้นหาและแสดงไว้ด้านบนสุดของหน้า
- AI Overviews ที่พัฒนาโดยทีม Project Magi จะสรุปผลการค้นหาและแสดงใน กล่องสรุป (Box)
- ทีม responsible innovation ชุดแรกกังวลเรื่อง อคติ·ปัญหาความแม่นยำ และผลกระทบเชิงจริยธรรมจากการที่ทราฟฟิกลดลง จึงขอให้มีการกำกับดูแล
- แต่โครงการนี้ มีการปรับโครงสร้างทีมและกระจายงาน ทำให้การกำกับดูแลอย่างเป็นระบบทำได้ยาก
- หลังเปิดตัว เกิดกรณีคำตอบประหลาดจำนวนมาก:
- “ควรกินก้อนหินวันละกี่ก้อน?” → “ตามนักธรณีวิทยาจาก UC Berkeley แนะนำให้กินก้อนหินเล็กวันละ 1 ก้อน”
- “ชีสไม่ติดพิซซ่า” → “เติมกาวปลอดสารพิษ 1/8 ถ้วยลงในซอส”
- แม้คำตอบเหล่านี้ส่วนใหญ่จะมาจาก มีมบนอินเทอร์เน็ต เช่น โพสต์ล้อเล่นใน Reddit
แต่ AI Overviews กลับ นำเสนอเหมือนเป็นข้อเท็จจริง จนเกิดปัญหาความน่าเชื่อถือ
- Google จึงลดการแสดงผลของฟีเจอร์นี้ลงชั่วคราวและ ปรับจูนใหม่
-
ปฏิกิริยาภายใน Google และเสียงตอบรับจากผู้ใช้
- Pandu Nayak หัวหน้านักวิทยาศาสตร์ฝ่าย Search:
- “เราไม่สามารถป้องกันทุกปัญหาได้ล่วงหน้า เราทำได้เพียงสัญญาว่าจะปรับปรุงอย่างต่อเนื่อง”
- “เวลามันทำงานได้ดี ผู้คนก็เงียบ แต่ถ้ามันแปลกเมื่อไร ทุกคนก็จะบ่นอย่างเดียว”
- ภายในบริษัท พนักงานที่เคยเตือนเรื่องความแม่นยำรู้สึกผิดหวัง
- ตั้งแต่ Bard→Gemini, เครื่องมือสร้างภาพ ไปจนถึง AI Overviews ถูกมองว่าเป็น “สายพานผลิตเรื่องแต่งต่อเนื่อง”
- ยังมีความกังวลด้วยว่าพันธกิจของ Google ในการเพิ่มการเข้าถึงข้อมูลกำลัง เสื่อมลงเป็น “เครื่องมือเขียนตามคำบอกของเรื่องไร้สาระ”
- ในอีกด้านหนึ่ง ทีม Search ให้ความสำคัญกับความพึงพอใจของผู้ใช้
- AI Overviews ยังคงเปิดใช้อย่างเต็มรูปแบบโดยไม่มีตัวเลือกปิด
- หลังจากนั้น ฟีเจอร์สรุปด้วย AI ก็ถูกนำไปใช้ใน Google Maps, แอปสภาพอากาศ และบริการอื่น ๆ ด้วย
- ตัวอย่างจากแอปสภาพอากาศบน Pixel:
- แม้จะมีวิศวกรบางส่วนเห็นว่ากราฟิกแบบเดิมก็เพียงพอแล้ว แต่ ผลทดสอบพบว่า 90% ให้ฟีดแบ็กว่า “ชอบ”
-
สัญญาณการฟื้นตัวและการกลับมาของบุคลากรคนสำคัญ
- ในเดือนธันวาคม 2024 สองปีหลังแรงกระแทกจาก ChatGPT Jeff Dean ให้สัมภาษณ์กับ WIRED ด้วยบรรยากาศที่เป็นบวก
- โมเดล Gemini ขึ้นอันดับ 1 บนเบนช์มาร์กสาธารณะ
- ผู้บริหารคนหนึ่งเล่าว่าเขา คุยกับ Gemini Live ระหว่างเดินทางแทนการคุยกับพี่สาวน้องสาว
- Jensen Huang ซีอีโอของ NVIDIA แนะนำ NotebookLM Audio Overviews อย่างหนักแน่น
- บุคลากรที่เคยลาออกไปเพราะไม่พอใจกับวัฒนธรรมที่ระมัดระวังเกินไปในอดีตก็ กลับมาอีกครั้ง
- Noam Shazeer หนึ่งในผู้สร้าง Transformer ก็กลับมาร่วมงานอีกครั้ง
- ในอดีตเขาเคยลาออกเพราะผิดหวังกับนโยบายบริษัทที่ไม่ยอมเปิด LaMDA สู่ภายนอก
อนาคตของ Gemini ความท้าทาย และสงคราม AI ที่ยังไม่จบ
-
บรรยากาศภายใน Google และความมั่นใจในการเติบโต
- ในบทสัมภาษณ์ Jeff Dean ยอมรับความผิดพลาดในการตัดสินใจในอดีต และประเมินว่าตอนนี้ Google กำลังก้าวพ้นภาวะหลีกเลี่ยงความเสี่ยงและเดินหน้าได้ไกลขึ้น
- ขณะนี้ 7 บริการหลักของ Google (เช่น Chrome, Gmail, YouTube) ต่างก็ กำลังนำฟีเจอร์ที่อิง Gemini มาใช้
- Dean, Noam Shazeer และผู้นำคนอื่น ๆ กำลังประสานข้อกำหนดความต้องการทั่วทั้งบริษัท เช่น:
- ปรับปรุงการแปลภาษาญี่ปุ่น
- เสริมความสามารถด้านโค้ดดิ้ง
- ปรับปรุงการวิเคราะห์วิดีโอแบบเรียลไทม์สำหรับ Astra เป็นต้น
- Dean และ Shazeer มักประชุมกันที่ microkitchen ของ Gradient Canopy เพื่อแลกเปลี่ยนไอเดีย
-
ขยายยุทธศาสตร์สู่การสร้างคอนเทนต์ด้วย AI
- Shazeer กล่าวว่า “การจัดระเบียบข้อมูลเป็นตลาดมูลค่า 1 ล้านล้านดอลลาร์ แต่สิ่งที่เท่ตอนนี้คือ 1 quadrillion ดอลลาร์”
- ราคาหุ้น Alphabet เพิ่มขึ้นเกือบ 2 เท่าเมื่อเทียบกับจุดต่ำสุดในช่วงเปิดตัว ChatGPT
- ตอนนี้ฮัสซาบิสได้ดูแลทีมแอป Gemini ของเสี่ยวด้วย และมั่นใจว่า อนาคตที่ AI รักษาโรคได้อยู่ไม่ไกล
- เขากล่าวกับ WIRED ว่า “เรามีฐานงานวิจัยที่กว้างและลึกที่สุดมากกว่าองค์กรใด ๆ”
-
ปัญหาเรื่องการทำกำไรและการหวนกลับสู่โมเดลโฆษณา
- ปัจจุบันผู้ใช้ส่วนใหญ่ ยังไม่เต็มใจจ่ายเงินโดยตรงเพื่อฟีเจอร์ AI
- Google กำลังพิจารณา วิธีแทรกโฆษณาลงในแอป Gemini
- นี่คือกลยุทธ์ดั้งเดิมของซิลิคอนแวลลีย์:
- “ให้ข้อมูล เวลา และความสนใจของคุณมา แล้วใช้เครื่องมือเจ๋ง ๆ ที่เราสร้างได้ฟรี”
- แค่ติ๊กยอมรับข้อจำกัดความรับผิด Google ก็ไม่ต้องรับผิดชอบ
-
การแข่งขันในตลาดและภาระด้านโครงสร้างพื้นฐาน
- ข้อมูลจาก Sensor Tower:
- ยอดดาวน์โหลดสะสมของแอป ChatGPT: ราว 600 ล้านครั้ง
- แอป Gemini: ราว 140 ล้านครั้ง
- มีคู่แข่งด้าน AI จำนวนมาก:
- Claude, Copilot, Grok, DeepSeek, Llama, Perplexity เป็นต้น
- หลายรายในกลุ่มนี้เป็น คู่แข่งโดยตรงหรือเป้าหมายการลงทุนของ Google
- Generative AI ต้องใช้เงินลงทุนหลายพันล้านดอลลาร์และพลังงานมหาศาล
- ใช้พลังงานมากถึงขั้นต้องยืดอายุโรงไฟฟ้าถ่านหินเก่าหรือเครื่องปฏิกรณ์นิวเคลียร์
- ทั้งอุตสาหกรรม ยังหาวิธีสร้างรายได้ที่ชัดเจนไม่ได้
-
ความเสี่ยงเพิ่มเติมที่ Google ต้องเผชิญ
- รายได้โฆษณาจากการค้นหาสูงสุด 25% อาจหายไปภายในไม่กี่ปีข้างหน้าเพราะคดีผูกขาด (วิเคราะห์โดย JP Morgan)
- ภายในองค์กรเองก็รับรู้แรงกดดันเรื่องการประคองฐานะการเงินมากขึ้น
- บางส่วนของทีมเสี่ยว ทำงานต่อเนื่อง 3 ปีโดยไม่ได้หยุดพักฤดูหนาว
- บริน ผู้ร่วมก่อตั้ง เพิ่งบอกกับพนักงานว่า “การทำงานสัปดาห์ละ 60 ชั่วโมงคือ sweet spot ที่มีประสิทธิภาพที่สุดในการแข่งขัน AI”
- พนักงานที่ให้สัมภาษณ์กับ WIRED ระบุว่า มีความกังวลลึก ๆ ต่อการปลดพนักงานอย่างต่อเนื่อง ภาวะหมดไฟ และความเสี่ยงทางกฎหมาย
-
ความหมกมุ่นกับ AGI และความท้าทายเชิงปรัชญา
- ฮัสซาบิสยังคงยึดเป้าหมายการพัฒนา AGI (ปัญญาประดิษฐ์ทั่วไป) อย่างแน่วแน่
- เขาเดินถือ ต้นแบบ Astra ไปตามถนนในลอนดอน พร้อมจินตนาการถึงอนาคตที่มันรับรู้ทุกสิ่งบนโลกได้
- แต่ AGI จะเป็นไปได้ก็ต่อเมื่อ การให้เหตุผล การวางแผน และความสามารถในการลงมือทำ ดีขึ้นทั้งหมด
-
การแข่งขันด้าน 'agent AI' กับ OpenAI
- ในเดือนมกราคม 2025 OpenAI เปิดตัว บริการ Operator
- เป็น agent AI ที่ คลิกและพิมพ์บนเว็บไซต์จริงเพื่อทำงานแทนผู้ใช้
- ทำได้ทั้งจองทริป กรอกแบบฟอร์ม ฯลฯ แต่ยังช้าและผิดพลาดมาก
- ราคาแพ็กเกจ: 200 ดอลลาร์ต่อเดือน
- Google ก็ขยายฟีเจอร์ไปในทิศทางเดียวกัน:
- ตอนนี้ Gemini ช่วยจัดแผนอาหารได้ แต่เวอร์ชันถัดไปจะ ใส่วัตถุดิบลงตะกร้าสินค้าได้ และ
ขั้นต่อไปตั้งเป้า ให้ฟีดแบ็กแบบเรียลไทม์ขณะหั่นหัวหอม
-
ความผิดพลาดจะเกิดซ้ำ แต่ความเร็วจะไม่หยุด
- ในเดือนมกราคม 2025 โฆษณา Gemini ช่วง Super Bowl ทำพลาดแบบชวนขำขื่น โดยตอบว่า “มากกว่าครึ่งของการบริโภคชีสทั่วโลกคือ Gouda”
- แต่ Google กำลังพัฒนา Gemini ให้ไม่ใช่แค่เครื่องจักรให้ข้อมูล แต่เป็น ส่วนหนึ่งของชีวิต โค้ชชีวิต และผู้ช่วยสารพัดประโยชน์
- พิชัยกล่าวว่า “เรากำลังเดินหน้าอย่างระมัดระวัง”
- แต่เขาและทีมผู้บริหารคง ไม่อยากกลับไปเป็นฝ่ายตามหลังอีกอย่างแน่นอน
- การแข่งขัน AI ยังคงดำเนินต่อไป
4 ความคิดเห็น
ว่าแต่ เรื่องแบบนี้ถูกทำให้เป็นข่าวได้อย่างไรนะ? ดูเหมือนเป็นบทความเชิงประชาสัมพันธ์ของ Google อยู่เหมือนกันนะ
"พวกเรากำลังพยายามอย่างเต็มที่"...
ให้ความรู้สึกเหมือนกำลังดูซีรีส์ฝรั่งเลย
แล้ว Apple หายไปไหนล่ะ?
ให้ความรู้สึกราวกับยุคที่เกิด Sputnik shock ในตอนนั้นเลย
ความคิดเห็นจาก Hacker News
ตอนแรกก็สงสัยอยู่ แต่คิดว่า Google กำลังทำได้ดีในการแข่งขันกับ OpenAI ทั้ง Gemini 2.0 Pro และโมเดล Flash นั้นยอดเยี่ยม ฟีเจอร์การวิจัยเชิงลึกถูกทำออกมาได้ดีมาก หน้าต่างคอนเท็กซ์ก็ยังคงดีที่สุดในอุตสาหกรรม การผสานรวมกับ Search, Gmail, ชุดแอปสำนักงานของ Google, Google Meet, Android และอื่น ๆ ทำได้ยอดเยี่ยม
ปัญหาใหญ่ที่สุดที่ Google เผชิญคือแนวโน้มที่จะใช้โมเดลขนาดเบาสำหรับทุกคน โมเดลที่ใช้กับ Search น่าจะอยู่ราวระดับ 8B และ Flash 2.0 แม้จะใช้ได้ดี แต่ก็ยังเป็นโมเดลขนาดเบา
OpenAI ไม่ใช่บริษัทมหาชนและยังไม่ทำกำไร ส่วน Google ทำกำไรได้อยู่ ถึงอย่างนั้น การที่พวกเขาไม่สามารถนำ Transformer decoder ไปใช้งานจริงในระดับผลิตภัณฑ์ได้ก็ถือเป็นความผิดพลาด เช่นเดียวกับ Google Meet/Zoom (ขณะที่ encoder อย่าง BERT ถูกใช้อย่างแพร่หลาย)
ฝ่ายผู้นำของ Google ใช้แนวทางที่ระมัดระวัง และการเปิดตัวผลิตภัณฑ์ก็ดูสมบูรณ์กว่ามาก ให้ความรู้สึกแบบการเปลี่ยนผ่านจาก 0 ไป 1 ที่น่าตื่นเต้นเหมือน Apple ในยุค 2000
ปัญหาหลักของ Google คือมีหลายกลุ่มสร้างผลิตภัณฑ์แบบเดียวกันและแข่งขันกันเพื่อแย่งความสนใจจากผู้ใช้
ในฐานะนักลงทุนรายย่อย: คิดว่า Alphabet/Google อาจทำได้ดีกว่านี้หากมี CEO ที่ไม่ใช่ Sundar
ปัญหาของ Google คือคนที่ไม่คุ้นเคยกับเทคโนโลยีเริ่มมองว่า AI เป็นสิ่งที่แยกจาก Google (Search) และผลิตภัณฑ์อื่น ๆ
เคยเจอ Googler ที่มั่นใจในกลยุทธ์ AI ของ Google บ้างไหม? คนที่ฉันคุยด้วยดูเหมือนทุกคนจะมีความกังวลอย่างจริงจัง แต่นี่อาจเป็นเพียงกลุ่มตัวอย่างเล็ก ๆ
ดูเหมือน Eric Schmidt เคยพูดไว้เมื่อราว 10 ปีก่อนว่า "ทุกคนจะต้องมีผู้ช่วย" (น่าจะประมาณปี 2016) ทั้งที่พวกเขาสามารถทำบางอย่างคล้ายการสนทนาได้อยู่แล้ว แต่ไม่รู้ว่าทำไมถึงไม่ทำ กลับไปหมกมุ่นกับเรื่องอย่าง mailbox แทน