บทเรียนที่ได้จากภายในห้องแล็บ AI ของจีน
(interconnects.ai)- รายงานภาคสนามที่วิเคราะห์ ความแตกต่างทางวัฒนธรรม ของระบบนิเวศ AI จีน-สหรัฐ และผลกระทบต่อการพัฒนาโมเดล จากประสบการณ์ไปเยี่ยมสถาบันวิจัย AI ชั้นนำของจีนด้วยตนเองและพูดคุยกับนักวิจัย
- นักวิจัยชาวจีนมีแนวโน้มทางวัฒนธรรมที่มุ่งเน้น การปรับคุณภาพของโมเดลสุดท้ายให้เหมาะที่สุด มากกว่าชื่อเสียงส่วนบุคคล และผู้มีส่วนร่วมหลักจำนวนมากยังเป็นนักศึกษาที่กำลังเรียนอยู่
- บริษัท AI ของจีนมีความรู้สึกเป็นเจ้าของอย่างแรงกล้าที่จะ ควบคุมเทคโนโลยีสแต็กของตนเอง มากกว่าซื้อบริการจากภายนอก และการเปิดโอเพนซอร์สก็อิงจากการตัดสินใจเชิงปฏิบัติ
- นักพัฒนา AI ในจีนส่วนใหญ่ใช้ Claude และมีความเป็นไปได้ที่ อุปสงค์ AI ระดับองค์กร จะเดินตามเส้นทางของตลาดคลาวด์ ไม่ใช่ SaaS
- ระบบนิเวศ AI ของสหรัฐและจีนทำงานด้วยโครงสร้างที่ต่างกันโดยพื้นฐาน และการ แมปอุตสาหกรรม AI จีนแบบตรง ๆ ด้วยกรอบคิดตะวันตกอาจก่อให้เกิด category error
วิธีคิดของนักวิจัยจีน
- บริษัทพัฒนา LLM ของจีนผสานประเพณีทางวัฒนธรรมอันยาวนานด้านการศึกษาและการทำงานเข้ากับความแตกต่างเชิงละเอียดอ่อนของการบริหารบริษัทเทคโนโลยี ทำให้มีโครงสร้างที่เหมาะสมอย่างยิ่งในฐานะ ผู้ไล่ตามอย่างรวดเร็ว (fast-follower)
- การสร้าง LLM สมัยใหม่มีหัวใจอยู่ที่ งานละเอียดตลอดทั้งสแต็ก ไม่ว่าจะเป็นข้อมูล รายละเอียดสถาปัตยกรรม หรือการทำ RL algorithm implementation และเป็นกระบวนการซับซ้อนที่ผลลัพธ์ของผู้มีส่วนร่วมรายบุคคลต้องยอมถอยเพื่อการเพิ่มประสิทธิภาพแบบหลายเป้าหมายของโมเดลโดยรวม
- นักวิจัยอเมริกันมีวัฒนธรรมในการโปรโมตผลงานของตนอย่างแข็งขัน และการแสวงหาชื่อเสียงในฐานะ "นักวิทยาศาสตร์ AI ชั้นนำ" ก่อให้เกิดความขัดแย้งภายในองค์กร
- มีข่าวลือแพร่หลายว่าองค์กร Llama ล่มสลายลงจากน้ำหนักของผลประโยชน์ทางการเมืองลักษณะนี้
- ยังมีเรื่องเล่าว่าในบางสถาบันต้อง จ่ายค่าตอบแทนให้นักวิจัยระดับท็อป ที่ไม่พอใจเพราะไอเดียของตนไม่ได้ถูกสะท้อนในโมเดลสุดท้าย
- ผู้มีส่วนร่วมหลักจำนวนมากในแล็บจีนยังเป็น นักศึกษาที่กำลังเรียนอยู่ และตัวสถาบันเองก็เป็นองค์กรที่อายุน้อยมาก
- สิ่งนี้คล้ายกับโครงสร้างของ Ai2 ที่ปฏิบัติต่อนักศึกษาในฐานะเพื่อนร่วมงานและรวมเข้ากับทีม LLM โดยตรง
- ในทางกลับกัน OpenAI, Anthropic, Cursor ในสหรัฐ ไม่ได้เปิดอินเทิร์นชิป และแม้แต่อินเทิร์นชิปที่เกี่ยวข้องกับ Gemini ของ Google ก็มีความเสี่ยงที่จะถูกแยกออกจากงานจริง
- ปัจจัยเชิงวัฒนธรรมที่ช่วยเพิ่มความสามารถในการสร้างโมเดลอย่างเป็นรูปธรรม ได้แก่:
- การยอมรับสูงต่อ งานที่ไม่เป็นจุดสนใจ เพื่อยกระดับโมเดลสุดท้าย
- บุคลากร AI รุ่นใหม่ไม่ถูกผูกติดกับ hype cycle ก่อนหน้า จึงปรับตัวกับเทคโนโลยีสมัยใหม่ได้เร็วกว่า
- อีโก้น้อยกว่า ทำให้โครงสร้างองค์กร ขยายตัวได้ มากกว่าเล็กน้อย และมีการเล่นเกมกับระบบน้อยกว่า
- มีพูลบุคลากรขนาดใหญ่ที่เหมาะกับการแก้ปัญหาซึ่งพิสูจน์แนวคิดมาจากที่อื่นแล้ว
- จุดแข็งเหล่านี้ตัดกับภาพเหมารวมที่รู้กันว่าฝั่งจีนผลิต งานวิจัยเชิงวิชาการสไตล์ 0-to-1 ที่สร้างสรรค์และบุกเบิกสาขา ได้น้อยกว่า
- ผู้นำของสถาบันวิจัยเชิงวิชาการกำลังพยายามบ่มเพาะวัฒนธรรมการวิจัยที่ทะเยอทะยานยิ่งขึ้น
- ผู้นำด้านเทคนิคบางรายยังสงสัย เพราะมองว่าการออกแบบระบบการศึกษาและแรงจูงใจใหม่เป็น โจทย์ที่ใหญ่เกินไป จะทำได้ภายใต้ดุลยภาพทางเศรษฐกิจปัจจุบัน
ลักษณะเฉพาะของนักวิจัยนักศึกษา
- ในจีนก็เกิดปรากฏการณ์ สมองไหล คล้ายกับสหรัฐ และหลายคนที่ก่อนหน้านี้เคยพิจารณาเส้นทางวิชาการกำลังหันมาอยู่ในภาคอุตสาหกรรม
- นักวิจัยคนหนึ่งบอกว่าเคยสนใจตำแหน่งอาจารย์ แต่กล่าวว่า "การสอนถูกแก้ด้วย LLM แล้ว — แล้วนักศึกษาจะมาถามผมทำไม"
- นักศึกษามีข้อได้เปรียบคือเข้าหา LLM แบบ ไม่มีอคติเดิม
- ในไม่กี่ปีที่ผ่านมา กระบวนทัศน์หลักของ LLM เปลี่ยนจาก MoE scaling → RL scaling → การใช้ agent
- การจะทำทั้งหมดนี้ให้ดีต้องดูดซับบริบททั้งจากวรรณกรรมและเทคโนโลยีสแต็กอย่างรวดเร็ว ซึ่งนักศึกษาคุ้นเคยและมีความกระตือรือร้นกับงานลักษณะนี้
- นักวิจัยนักศึกษาชาวจีน มีส่วนร่วมกับวาทกรรมเชิงปรัชญาน้อยกว่า และมีความตรงไปตรงมามาก
- นักวิจัยจีนที่มีความเห็นซับซ้อนเรื่องเศรษฐศาสตร์ของโมเดลหรือความเสี่ยงทางสังคมระยะยาวมีน้อยกว่าสหรัฐมาก
- นักวิจัยคนหนึ่งอ้างสมมติฐานชื่อดังของ Dan Wang ว่า "จีนนั้น ถูกขับเคลื่อนโดยวิศวกร ส่วนสหรัฐนั้น ถูกขับเคลื่อนโดยทนายความ"
- ในจีนไม่มีเส้นทางแบบเป็นระบบในการสร้างพลังความเป็นดาวของนักวิทยาศาสตร์ผ่าน พอดแคสต์กระแสหลักขนาดใหญ่ อย่าง Dwarkesh หรือ Lex
- เมื่อถูกถามถึงความไม่แน่นอนทางเศรษฐกิจที่ AI จะก่อขึ้น คำถามที่ไกลกว่า AGI หรือการถกเถียงเชิงศีลธรรมเกี่ยวกับพฤติกรรมของโมเดล นักวิทยาศาสตร์จีนสะท้อนลักษณะของการเติบโตมาใน ระบบที่ไม่ได้ส่งเสริม ความเห็นต่อการถกเถียงและโครงสร้างทางสังคม
บรรยากาศภาคสนามในปักกิ่งและระบบนิเวศ AI ของจีน
- ปักกิ่งให้ความรู้สึกคล้าย Bay Area มาก โดยแล็บคู่แข่งตั้งอยู่ในระยะ เดินหรือเดินทางสั้น ๆ ถึงกัน
- ภายใน 36 ชั่วโมง ได้ไปเยือน Z.ai, Moonshot AI, มหาวิทยาลัยชิงหัว, Meituan, Xiaomi, 01.ai
- เดินทางด้วย Didi ได้สะดวก และรถ XL ในจีนมักเป็น มินิแวนไฟฟ้าพร้อมเก้าอี้นวด
- การ แย่งชิงตัวนักวิจัย คล้ายกับสหรัฐมาก นักวิจัยย้ายงานกันเป็นเรื่องปกติ และเกณฑ์ตัดสินคือ ที่ไหนบรรยากาศดีที่สุดในตอนนั้น
- คอมมูนิตี้ LLM ของจีนให้ความรู้สึกใกล้เคียงกับ ระบบนิเวศ มากกว่าจะเป็นชนเผ่าคู่แข่ง
- ทุกแล็บในจีนจับตา ByteDance ซึ่งมีโมเดล Doubao ที่ได้รับความนิยม
- ByteDance เป็นแล็บฟรอนเทียร์แบบปิดเพียงแห่งเดียวของจีน
- ทุกแล็บต่างยกย่อง DeepSeek ว่าเป็นผู้นำด้านเทคนิคที่มีสัญชาตญาณการวิจัยยอดเยี่ยมที่สุดในเชิงการลงมือทำ
- ตรงข้ามกับในสหรัฐที่เมื่อพบสมาชิกแล็บนอกทางการ มักเกิด บรรยากาศปะทะกัน อย่างรวดเร็ว
- สิ่งที่น่าประทับใจที่สุดอย่างหนึ่งเกี่ยวกับความถ่อมตัวของนักวิจัยจีนคือท่าทีไม่สนใจเรื่องฝั่งธุรกิจ โดยมองว่า "ไม่ใช่ปัญหาของตัวเอง"
- ในสหรัฐ ทุกคนหมกมุ่นกับ เทรนด์อุตสาหกรรมระดับระบบนิเวศ ไม่ว่าจะเป็นผู้ขายข้อมูล คอมพิวต์ หรือการระดมทุน
ความแตกต่างและความเหมือนของอุตสาหกรรม AI จีน
- ปัจจุบันการสร้างโมเดล AI ไม่ได้เป็นแค่ผลลัพธ์ทางวิศวกรรมของนักวิจัยเก่ง ๆ อีกต่อไป แต่เปลี่ยนเป็นกิจกรรมผสมผสานที่รวม การสร้าง การดีพลอย การระดมทุน และการยอมรับใช้งาน
- ความแตกต่างหลัก 6 ประการจากระบบนิเวศตะวันตก:
-
1. สัญญาณเริ่มต้นของอุปสงค์ AI ภายในประเทศ
- มีสมมติฐานว่าบริษัทจีนไม่ยอมจ่ายเงินให้ซอฟต์แวร์ จึงอาจไม่เกิดตลาด inference ขนาดใหญ่
- แต่นั่นเป็นความจริงที่ใช้ได้กับเพียง ระบบนิเวศ SaaS ที่มีขนาดเล็กมากในจีนตามประวัติศาสตร์ ขณะที่จีนยังคงมี ตลาดคลาวด์ ขนาดใหญ่
- คำถามสำคัญที่ยังไม่คลี่คลายคือ การใช้จ่ายด้าน AI ขององค์กรจะเดินตามตลาด SaaS (เล็ก) หรือ ตลาดคลาวด์ (เป็นพื้นฐาน)
- โดยรวมแล้ว AI ดูจะมี เส้นทางใกล้เคียงคลาวด์มากกว่า และไม่มีใครกังวลอย่างจริงจังว่าตลาดจะไม่เติบโตรอบเครื่องมือใหม่เหล่านี้
-
2. นักพัฒนาส่วนใหญ่ใช้ Claude
- นักพัฒนา AI ในจีนส่วนใหญ่คลั่งไคล้ Claude และสนใจว่า Claude เปลี่ยนวิธีสร้างซอฟต์แวร์อย่างไร
- มีการใช้งานทั้งที่ในเชิงนโยบายแล้ว Claude ถูกแบนในจีน
- นักวิจัยบางคนพูดถึงการใช้ เครื่องมือของตนเอง อย่าง Kimi หรือ GLM CLI แต่ทุกคนต่างพูดถึงการใช้ Claude
- กลับแทบไม่มีการพูดถึง Codex ซึ่งกำลังได้รับความนิยมสูงขึ้นใน Bay Area อย่างน่าประหลาดใจ
- แม้จีนจะมีประวัติไม่ค่อยยอมซื้อซอฟต์แวร์ แต่ก็ ไม่ได้ให้ความรู้สึก ว่าจะไม่มีการพุ่งขึ้นครั้งใหญ่ของอุปสงค์ด้าน inference
-
3. ความรู้สึกเป็นเจ้าของเทคโนโลยี
- วัฒนธรรมจีนเมื่อรวมกับเครื่องยนต์เศรษฐกิจที่มีพลัง ได้สร้าง ผลลัพธ์ที่คาดเดายาก
- โมเดล AI จำนวนมากสะท้อน ดุลยภาพเชิงปฏิบัติและเฉพาะหน้าของบริษัทเทคโนโลยีจำนวนมาก มากกว่าจะเป็น master plan
- อุตสาหกรรมนี้ให้ความเคารพต่อบรรดา incumbent โดยคาดว่า ByteDance และ Alibaba จะชนะในตลาดส่วนใหญ่จากทรัพยากรที่มีอยู่มาก
- DeepSeek เป็นผู้นำด้านเทคนิคที่ได้รับความเคารพ แต่ยัง ห่างจากการเป็นผู้นำตลาด คือเป็นผู้กำหนดทิศทางแต่ไม่ได้อยู่ในโครงสร้างที่จะชนะเชิงเศรษฐกิจ
- บริษัทอย่าง Meituan (บริการส่งอาหาร) หรือ Ant Group ที่สร้างโมเดลอาจดูน่าแปลกในโลกตะวันตก แต่เหตุผลคือ LLM จะเป็นแกนกลางของผลิตภัณฑ์เทคโนโลยีในอนาคต จึงต้องมี ฐานรากที่แข็งแรง
- การนำโมเดลทั่วไปมาทำ fine-tune ช่วยเสริมความแข็งแรงให้สแต็กผ่าน feedback จากคอมมูนิตี้เปิด และยังคงรักษา เวอร์ชัน fine-tune ภายใน สำหรับผลิตภัณฑ์ของบริษัทเองได้
- แนวคิดแบบ "open-first" ตั้งอยู่บนความเป็นประโยชน์ใช้สอย: ได้ feedback ต่อโมเดลที่แข็งแรง มีส่วนร่วมกับคอมมูนิตี้โอเพนซอร์ส และเสริมความแข็งแรงให้ภารกิจ
-
4. การสนับสนุนจากรัฐมีอยู่จริง แต่ขนาดยังไม่ชัดเจน
- มักมีการกล่าวอ้างว่ารัฐบาลจีนสนับสนุนการแข่งขัน open LLM อย่างจริงจัง
- รัฐบาลมีการกระจายอำนาจหลายระดับ และไม่มี คู่มือที่ชัดเจน ว่าแต่ละระดับทำอะไรอย่างแน่ชัด
- เขตย่อยต่าง ๆ ในปักกิ่ง แข่งขันกัน เพื่อดึงดูดสำนักงานของบริษัทเทคโนโลยี
- "ความช่วยเหลือ" ที่ให้มานั้นแทบจะแน่นอนว่ารวมถึง การทำขั้นตอนราชการอย่างใบอนุญาตให้ง่ายขึ้น แต่ยังไม่ชัดว่าครอบคลุมถึงการดึงดูดบุคลากรหรือแม้แต่การลักลอบนำเข้าชิปหรือไม่
- ระหว่างการเยือนมีการพูดถึงความสนใจหรือความช่วยเหลือจากรัฐหลายครั้ง แต่ยัง มีรายละเอียดน้อยเกินไป ที่จะรายงานอย่างฟันธง
- ไม่มี สัญญาณแม้แต่น้อย ว่าระดับสูงสุดของรัฐบาลจีนมีอิทธิพลต่อการตัดสินใจทางเทคนิคของโมเดล
-
5. อุตสาหกรรมข้อมูลพัฒนาน้อยกว่ามาก
- เนื่องจากได้ยินข้อมูลว่า Anthropic หรือ OpenAI ใช้เงิน มากกว่า 10 ล้านดอลลาร์ในสภาพแวดล้อมเดียว และใช้ระดับหลายร้อยล้านดอลลาร์ต่อปีเพื่อขยาย frontier ของ RL จึงอยากตรวจสอบว่าแล็บจีนซื้อสภาพแวดล้อมแบบเดียวกันจากบริษัทอเมริกันหรือได้รับการสนับสนุนจากระบบนิเวศในประเทศหรือไม่
- ไม่ใช่ว่าอุตสาหกรรมข้อมูลไม่มีอยู่เลย แต่ คุณภาพค่อนข้างต่ำกว่า จนหลายครั้งการสร้างสภาพแวดล้อมหรือข้อมูลขึ้นเองดีกว่า
- นักวิจัยจึงทุ่มเวลาจำนวนมากไปกับ การสร้างสภาพแวดล้อมสำหรับฝึก RL ด้วยตนเอง
- บริษัทใหญ่เช่น ByteDance และ Alibaba มี ทีมติดป้ายกำกับข้อมูลภายในองค์กร เพื่อรองรับเรื่องนี้
- ทั้งหมดนี้สะท้อนแนวคิด สร้างเองแทนการซื้อ จากข้อก่อนหน้า
-
6. ความต้องการชิป Nvidia อย่างเร่งด่วน
- Nvidia compute คือมาตรฐานทองคำของการฝึก และทุกแล็บต่างถูกจำกัดการพัฒนาเพราะขาดสิ่งนี้
- หากมีอุปทาน ก็ ชัดเจนว่าจะมีคนซื้อ
- accelerator อื่น ๆ รวมถึง Huawei ได้รับ การประเมินเชิงบวกสำหรับงาน inference และมีแล็บจำนวนมากที่เข้าถึงชิป Huawei ได้
- ประเด็นเหล่านี้แสดงภาพของระบบนิเวศ AI ที่แตกต่างอย่างมาก ซึ่งการนำวิธีดำเนินงานของแล็บตะวันตกมาแมปกับจีนอย่างรวดเร็วจะก่อให้เกิด category error
- คำถามสำคัญคือ ระบบนิเวศที่ต่างกันเหล่านี้จะ ผลิตโมเดลที่แตกต่างกันอย่างมีนัยสำคัญหรือไม่ หรือท้ายที่สุดแล้วโมเดลจีนจะยังถูกอธิบายได้ว่าเป็นเพียงเวอร์ชันย้อนหลัง 3–9 เดือนของโมเดลฟรอนเทียร์สหรัฐ
ดุลยภาพระดับโลก
- จีนไม่ใช่สถานที่ที่อธิบายได้ด้วยกฎหรือสูตรตายตัว แต่เป็นพื้นที่ที่มี พลวัตและเคมี ที่แตกต่างอย่างมาก
- วัฒนธรรมมีความเก่าแก่และลึกมาก และ พันเกี่ยวอย่างสมบูรณ์ กับวิธีสร้างเทคโนโลยีภายในประเทศ
- โครงสร้างอำนาจปัจจุบันของสหรัฐใช้โลกทัศน์ต่อจีนเป็น กลไกหลักของการตัดสินใจ แต่จีนมีคุณลักษณะและสัญชาตญาณที่ยากมากจะจำลองด้วยกรอบการตัดสินใจแบบตะวันตก
- แม้จะถามโดยตรงว่าทำไมแล็บเหล่านี้จึงเปิดเผยโมเดลชั้นนำแบบ open แต่ จุดตัดระหว่างความเป็นเจ้าของกับการสนับสนุนระบบนิเวศอย่างแท้จริง ก็ยังเชื่อมโยงได้ยาก
- แทบทุกบริษัทเทคโนโลยีใหญ่ของจีนกำลังสร้าง LLM ทั่วไปของตัวเอง
- Meituan (บริการส่งอาหาร), Xiaomi (บริษัทเทคโนโลยีผู้บริโภคขนาดใหญ่) และรายอื่น ๆ ต่างเผยแพร่โมเดล open weights
- หากเป็นบริษัทที่เทียบเคียงกันในสหรัฐ พวกเขาคงแค่ ซื้อบริการ
- เหตุผลที่บริษัทเหล่านี้สร้าง LLM ไม่ใช่เพราะต้องการตามเทรนด์ร้อนแรง แต่เป็นเพราะแรงปรารถนาพื้นฐานอย่างลึกซึ้งที่จะ ควบคุมสแต็กของตัวเองและพัฒนาเทคโนโลยีที่สำคัญที่สุดของยุค
- ความเป็นมนุษย์ เสน่ห์ และความอบอุ่นอย่างจริงใจของนักวิจัยจีนเป็นประสบการณ์ที่ เป็นมนุษย์อย่างมาก
- บทสนทนาทางภูมิรัฐศาสตร์อันแข็งกระด้างที่คุ้นเคยในสหรัฐไม่ได้ซึมซับเข้าไปในตัวพวกเขาเลย
- หากระบบนิเวศแบบเปิดรุ่งเรืองทั่วโลก ก็อาจสร้าง AI ที่ปลอดภัย เข้าถึงได้ และมีประโยชน์มากขึ้น และคำถามในตอนนี้คือแล็บอเมริกันจะดำเนินการเพื่อยึด ตำแหน่งผู้นำ นั้นหรือไม่
- กำลังมีข่าวลือมากขึ้นเกี่ยวกับ คำสั่งฝ่ายบริหารที่กระทบต่อโมเดลเปิด ซึ่งอาจทำให้ความสอดประสานระหว่างภาวะผู้นำของสหรัฐกับระบบนิเวศโลกซับซ้อนยิ่งขึ้น
2 ความคิดเห็น
บางครั้งผมก็กังวลว่า ความหมกมุ่นกับจีนอย่างเกินเลยและไร้เหตุผล
อาจกำลังสร้างสัตว์ประหลาดในตัวพวกเราเองขึ้นมา
ก็เหมือนกับที่หนึ่งในข้ออ้างในการขึ้นสู่อำนาจของนาซีคือการต่อต้านคอมมิวนิสต์นั่นแหละครับ
มีจีนเพียงหนึ่งเดียว...!