11 คะแนน โดย GN⁺ 4 시간 전 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • รายงานภาคสนามที่วิเคราะห์ ความแตกต่างทางวัฒนธรรม ของระบบนิเวศ AI จีน-สหรัฐ และผลกระทบต่อการพัฒนาโมเดล จากประสบการณ์ไปเยี่ยมสถาบันวิจัย AI ชั้นนำของจีนด้วยตนเองและพูดคุยกับนักวิจัย
  • นักวิจัยชาวจีนมีแนวโน้มทางวัฒนธรรมที่มุ่งเน้น การปรับคุณภาพของโมเดลสุดท้ายให้เหมาะที่สุด มากกว่าชื่อเสียงส่วนบุคคล และผู้มีส่วนร่วมหลักจำนวนมากยังเป็นนักศึกษาที่กำลังเรียนอยู่
  • บริษัท AI ของจีนมีความรู้สึกเป็นเจ้าของอย่างแรงกล้าที่จะ ควบคุมเทคโนโลยีสแต็กของตนเอง มากกว่าซื้อบริการจากภายนอก และการเปิดโอเพนซอร์สก็อิงจากการตัดสินใจเชิงปฏิบัติ
  • นักพัฒนา AI ในจีนส่วนใหญ่ใช้ Claude และมีความเป็นไปได้ที่ อุปสงค์ AI ระดับองค์กร จะเดินตามเส้นทางของตลาดคลาวด์ ไม่ใช่ SaaS
  • ระบบนิเวศ AI ของสหรัฐและจีนทำงานด้วยโครงสร้างที่ต่างกันโดยพื้นฐาน และการ แมปอุตสาหกรรม AI จีนแบบตรง ๆ ด้วยกรอบคิดตะวันตกอาจก่อให้เกิด category error

วิธีคิดของนักวิจัยจีน

  • บริษัทพัฒนา LLM ของจีนผสานประเพณีทางวัฒนธรรมอันยาวนานด้านการศึกษาและการทำงานเข้ากับความแตกต่างเชิงละเอียดอ่อนของการบริหารบริษัทเทคโนโลยี ทำให้มีโครงสร้างที่เหมาะสมอย่างยิ่งในฐานะ ผู้ไล่ตามอย่างรวดเร็ว (fast-follower)
  • การสร้าง LLM สมัยใหม่มีหัวใจอยู่ที่ งานละเอียดตลอดทั้งสแต็ก ไม่ว่าจะเป็นข้อมูล รายละเอียดสถาปัตยกรรม หรือการทำ RL algorithm implementation และเป็นกระบวนการซับซ้อนที่ผลลัพธ์ของผู้มีส่วนร่วมรายบุคคลต้องยอมถอยเพื่อการเพิ่มประสิทธิภาพแบบหลายเป้าหมายของโมเดลโดยรวม
  • นักวิจัยอเมริกันมีวัฒนธรรมในการโปรโมตผลงานของตนอย่างแข็งขัน และการแสวงหาชื่อเสียงในฐานะ "นักวิทยาศาสตร์ AI ชั้นนำ" ก่อให้เกิดความขัดแย้งภายในองค์กร
    • มีข่าวลือแพร่หลายว่าองค์กร Llama ล่มสลายลงจากน้ำหนักของผลประโยชน์ทางการเมืองลักษณะนี้
    • ยังมีเรื่องเล่าว่าในบางสถาบันต้อง จ่ายค่าตอบแทนให้นักวิจัยระดับท็อป ที่ไม่พอใจเพราะไอเดียของตนไม่ได้ถูกสะท้อนในโมเดลสุดท้าย
  • ผู้มีส่วนร่วมหลักจำนวนมากในแล็บจีนยังเป็น นักศึกษาที่กำลังเรียนอยู่ และตัวสถาบันเองก็เป็นองค์กรที่อายุน้อยมาก
    • สิ่งนี้คล้ายกับโครงสร้างของ Ai2 ที่ปฏิบัติต่อนักศึกษาในฐานะเพื่อนร่วมงานและรวมเข้ากับทีม LLM โดยตรง
    • ในทางกลับกัน OpenAI, Anthropic, Cursor ในสหรัฐ ไม่ได้เปิดอินเทิร์นชิป และแม้แต่อินเทิร์นชิปที่เกี่ยวข้องกับ Gemini ของ Google ก็มีความเสี่ยงที่จะถูกแยกออกจากงานจริง
  • ปัจจัยเชิงวัฒนธรรมที่ช่วยเพิ่มความสามารถในการสร้างโมเดลอย่างเป็นรูปธรรม ได้แก่:
    • การยอมรับสูงต่อ งานที่ไม่เป็นจุดสนใจ เพื่อยกระดับโมเดลสุดท้าย
    • บุคลากร AI รุ่นใหม่ไม่ถูกผูกติดกับ hype cycle ก่อนหน้า จึงปรับตัวกับเทคโนโลยีสมัยใหม่ได้เร็วกว่า
    • อีโก้น้อยกว่า ทำให้โครงสร้างองค์กร ขยายตัวได้ มากกว่าเล็กน้อย และมีการเล่นเกมกับระบบน้อยกว่า
    • มีพูลบุคลากรขนาดใหญ่ที่เหมาะกับการแก้ปัญหาซึ่งพิสูจน์แนวคิดมาจากที่อื่นแล้ว
  • จุดแข็งเหล่านี้ตัดกับภาพเหมารวมที่รู้กันว่าฝั่งจีนผลิต งานวิจัยเชิงวิชาการสไตล์ 0-to-1 ที่สร้างสรรค์และบุกเบิกสาขา ได้น้อยกว่า
    • ผู้นำของสถาบันวิจัยเชิงวิชาการกำลังพยายามบ่มเพาะวัฒนธรรมการวิจัยที่ทะเยอทะยานยิ่งขึ้น
    • ผู้นำด้านเทคนิคบางรายยังสงสัย เพราะมองว่าการออกแบบระบบการศึกษาและแรงจูงใจใหม่เป็น โจทย์ที่ใหญ่เกินไป จะทำได้ภายใต้ดุลยภาพทางเศรษฐกิจปัจจุบัน

ลักษณะเฉพาะของนักวิจัยนักศึกษา

  • ในจีนก็เกิดปรากฏการณ์ สมองไหล คล้ายกับสหรัฐ และหลายคนที่ก่อนหน้านี้เคยพิจารณาเส้นทางวิชาการกำลังหันมาอยู่ในภาคอุตสาหกรรม
    • นักวิจัยคนหนึ่งบอกว่าเคยสนใจตำแหน่งอาจารย์ แต่กล่าวว่า "การสอนถูกแก้ด้วย LLM แล้ว — แล้วนักศึกษาจะมาถามผมทำไม"
  • นักศึกษามีข้อได้เปรียบคือเข้าหา LLM แบบ ไม่มีอคติเดิม
    • ในไม่กี่ปีที่ผ่านมา กระบวนทัศน์หลักของ LLM เปลี่ยนจาก MoE scaling → RL scaling → การใช้ agent
    • การจะทำทั้งหมดนี้ให้ดีต้องดูดซับบริบททั้งจากวรรณกรรมและเทคโนโลยีสแต็กอย่างรวดเร็ว ซึ่งนักศึกษาคุ้นเคยและมีความกระตือรือร้นกับงานลักษณะนี้
  • นักวิจัยนักศึกษาชาวจีน มีส่วนร่วมกับวาทกรรมเชิงปรัชญาน้อยกว่า และมีความตรงไปตรงมามาก
    • นักวิจัยจีนที่มีความเห็นซับซ้อนเรื่องเศรษฐศาสตร์ของโมเดลหรือความเสี่ยงทางสังคมระยะยาวมีน้อยกว่าสหรัฐมาก
    • นักวิจัยคนหนึ่งอ้างสมมติฐานชื่อดังของ Dan Wang ว่า "จีนนั้น ถูกขับเคลื่อนโดยวิศวกร ส่วนสหรัฐนั้น ถูกขับเคลื่อนโดยทนายความ"
    • ในจีนไม่มีเส้นทางแบบเป็นระบบในการสร้างพลังความเป็นดาวของนักวิทยาศาสตร์ผ่าน พอดแคสต์กระแสหลักขนาดใหญ่ อย่าง Dwarkesh หรือ Lex
  • เมื่อถูกถามถึงความไม่แน่นอนทางเศรษฐกิจที่ AI จะก่อขึ้น คำถามที่ไกลกว่า AGI หรือการถกเถียงเชิงศีลธรรมเกี่ยวกับพฤติกรรมของโมเดล นักวิทยาศาสตร์จีนสะท้อนลักษณะของการเติบโตมาใน ระบบที่ไม่ได้ส่งเสริม ความเห็นต่อการถกเถียงและโครงสร้างทางสังคม

บรรยากาศภาคสนามในปักกิ่งและระบบนิเวศ AI ของจีน

  • ปักกิ่งให้ความรู้สึกคล้าย Bay Area มาก โดยแล็บคู่แข่งตั้งอยู่ในระยะ เดินหรือเดินทางสั้น ๆ ถึงกัน
    • ภายใน 36 ชั่วโมง ได้ไปเยือน Z.ai, Moonshot AI, มหาวิทยาลัยชิงหัว, Meituan, Xiaomi, 01.ai
    • เดินทางด้วย Didi ได้สะดวก และรถ XL ในจีนมักเป็น มินิแวนไฟฟ้าพร้อมเก้าอี้นวด
  • การ แย่งชิงตัวนักวิจัย คล้ายกับสหรัฐมาก นักวิจัยย้ายงานกันเป็นเรื่องปกติ และเกณฑ์ตัดสินคือ ที่ไหนบรรยากาศดีที่สุดในตอนนั้น
  • คอมมูนิตี้ LLM ของจีนให้ความรู้สึกใกล้เคียงกับ ระบบนิเวศ มากกว่าจะเป็นชนเผ่าคู่แข่ง
    • ทุกแล็บในจีนจับตา ByteDance ซึ่งมีโมเดล Doubao ที่ได้รับความนิยม
    • ByteDance เป็นแล็บฟรอนเทียร์แบบปิดเพียงแห่งเดียวของจีน
    • ทุกแล็บต่างยกย่อง DeepSeek ว่าเป็นผู้นำด้านเทคนิคที่มีสัญชาตญาณการวิจัยยอดเยี่ยมที่สุดในเชิงการลงมือทำ
    • ตรงข้ามกับในสหรัฐที่เมื่อพบสมาชิกแล็บนอกทางการ มักเกิด บรรยากาศปะทะกัน อย่างรวดเร็ว
  • สิ่งที่น่าประทับใจที่สุดอย่างหนึ่งเกี่ยวกับความถ่อมตัวของนักวิจัยจีนคือท่าทีไม่สนใจเรื่องฝั่งธุรกิจ โดยมองว่า "ไม่ใช่ปัญหาของตัวเอง"
    • ในสหรัฐ ทุกคนหมกมุ่นกับ เทรนด์อุตสาหกรรมระดับระบบนิเวศ ไม่ว่าจะเป็นผู้ขายข้อมูล คอมพิวต์ หรือการระดมทุน

ความแตกต่างและความเหมือนของอุตสาหกรรม AI จีน

  • ปัจจุบันการสร้างโมเดล AI ไม่ได้เป็นแค่ผลลัพธ์ทางวิศวกรรมของนักวิจัยเก่ง ๆ อีกต่อไป แต่เปลี่ยนเป็นกิจกรรมผสมผสานที่รวม การสร้าง การดีพลอย การระดมทุน และการยอมรับใช้งาน
  • ความแตกต่างหลัก 6 ประการจากระบบนิเวศตะวันตก:
  • 1. สัญญาณเริ่มต้นของอุปสงค์ AI ภายในประเทศ

    • มีสมมติฐานว่าบริษัทจีนไม่ยอมจ่ายเงินให้ซอฟต์แวร์ จึงอาจไม่เกิดตลาด inference ขนาดใหญ่
    • แต่นั่นเป็นความจริงที่ใช้ได้กับเพียง ระบบนิเวศ SaaS ที่มีขนาดเล็กมากในจีนตามประวัติศาสตร์ ขณะที่จีนยังคงมี ตลาดคลาวด์ ขนาดใหญ่
    • คำถามสำคัญที่ยังไม่คลี่คลายคือ การใช้จ่ายด้าน AI ขององค์กรจะเดินตามตลาด SaaS (เล็ก) หรือ ตลาดคลาวด์ (เป็นพื้นฐาน)
    • โดยรวมแล้ว AI ดูจะมี เส้นทางใกล้เคียงคลาวด์มากกว่า และไม่มีใครกังวลอย่างจริงจังว่าตลาดจะไม่เติบโตรอบเครื่องมือใหม่เหล่านี้
  • 2. นักพัฒนาส่วนใหญ่ใช้ Claude

    • นักพัฒนา AI ในจีนส่วนใหญ่คลั่งไคล้ Claude และสนใจว่า Claude เปลี่ยนวิธีสร้างซอฟต์แวร์อย่างไร
    • มีการใช้งานทั้งที่ในเชิงนโยบายแล้ว Claude ถูกแบนในจีน
    • นักวิจัยบางคนพูดถึงการใช้ เครื่องมือของตนเอง อย่าง Kimi หรือ GLM CLI แต่ทุกคนต่างพูดถึงการใช้ Claude
    • กลับแทบไม่มีการพูดถึง Codex ซึ่งกำลังได้รับความนิยมสูงขึ้นใน Bay Area อย่างน่าประหลาดใจ
    • แม้จีนจะมีประวัติไม่ค่อยยอมซื้อซอฟต์แวร์ แต่ก็ ไม่ได้ให้ความรู้สึก ว่าจะไม่มีการพุ่งขึ้นครั้งใหญ่ของอุปสงค์ด้าน inference
  • 3. ความรู้สึกเป็นเจ้าของเทคโนโลยี

    • วัฒนธรรมจีนเมื่อรวมกับเครื่องยนต์เศรษฐกิจที่มีพลัง ได้สร้าง ผลลัพธ์ที่คาดเดายาก
    • โมเดล AI จำนวนมากสะท้อน ดุลยภาพเชิงปฏิบัติและเฉพาะหน้าของบริษัทเทคโนโลยีจำนวนมาก มากกว่าจะเป็น master plan
    • อุตสาหกรรมนี้ให้ความเคารพต่อบรรดา incumbent โดยคาดว่า ByteDance และ Alibaba จะชนะในตลาดส่วนใหญ่จากทรัพยากรที่มีอยู่มาก
    • DeepSeek เป็นผู้นำด้านเทคนิคที่ได้รับความเคารพ แต่ยัง ห่างจากการเป็นผู้นำตลาด คือเป็นผู้กำหนดทิศทางแต่ไม่ได้อยู่ในโครงสร้างที่จะชนะเชิงเศรษฐกิจ
    • บริษัทอย่าง Meituan (บริการส่งอาหาร) หรือ Ant Group ที่สร้างโมเดลอาจดูน่าแปลกในโลกตะวันตก แต่เหตุผลคือ LLM จะเป็นแกนกลางของผลิตภัณฑ์เทคโนโลยีในอนาคต จึงต้องมี ฐานรากที่แข็งแรง
    • การนำโมเดลทั่วไปมาทำ fine-tune ช่วยเสริมความแข็งแรงให้สแต็กผ่าน feedback จากคอมมูนิตี้เปิด และยังคงรักษา เวอร์ชัน fine-tune ภายใน สำหรับผลิตภัณฑ์ของบริษัทเองได้
    • แนวคิดแบบ "open-first" ตั้งอยู่บนความเป็นประโยชน์ใช้สอย: ได้ feedback ต่อโมเดลที่แข็งแรง มีส่วนร่วมกับคอมมูนิตี้โอเพนซอร์ส และเสริมความแข็งแรงให้ภารกิจ
  • 4. การสนับสนุนจากรัฐมีอยู่จริง แต่ขนาดยังไม่ชัดเจน

    • มักมีการกล่าวอ้างว่ารัฐบาลจีนสนับสนุนการแข่งขัน open LLM อย่างจริงจัง
    • รัฐบาลมีการกระจายอำนาจหลายระดับ และไม่มี คู่มือที่ชัดเจน ว่าแต่ละระดับทำอะไรอย่างแน่ชัด
    • เขตย่อยต่าง ๆ ในปักกิ่ง แข่งขันกัน เพื่อดึงดูดสำนักงานของบริษัทเทคโนโลยี
    • "ความช่วยเหลือ" ที่ให้มานั้นแทบจะแน่นอนว่ารวมถึง การทำขั้นตอนราชการอย่างใบอนุญาตให้ง่ายขึ้น แต่ยังไม่ชัดว่าครอบคลุมถึงการดึงดูดบุคลากรหรือแม้แต่การลักลอบนำเข้าชิปหรือไม่
    • ระหว่างการเยือนมีการพูดถึงความสนใจหรือความช่วยเหลือจากรัฐหลายครั้ง แต่ยัง มีรายละเอียดน้อยเกินไป ที่จะรายงานอย่างฟันธง
    • ไม่มี สัญญาณแม้แต่น้อย ว่าระดับสูงสุดของรัฐบาลจีนมีอิทธิพลต่อการตัดสินใจทางเทคนิคของโมเดล
  • 5. อุตสาหกรรมข้อมูลพัฒนาน้อยกว่ามาก

    • เนื่องจากได้ยินข้อมูลว่า Anthropic หรือ OpenAI ใช้เงิน มากกว่า 10 ล้านดอลลาร์ในสภาพแวดล้อมเดียว และใช้ระดับหลายร้อยล้านดอลลาร์ต่อปีเพื่อขยาย frontier ของ RL จึงอยากตรวจสอบว่าแล็บจีนซื้อสภาพแวดล้อมแบบเดียวกันจากบริษัทอเมริกันหรือได้รับการสนับสนุนจากระบบนิเวศในประเทศหรือไม่
    • ไม่ใช่ว่าอุตสาหกรรมข้อมูลไม่มีอยู่เลย แต่ คุณภาพค่อนข้างต่ำกว่า จนหลายครั้งการสร้างสภาพแวดล้อมหรือข้อมูลขึ้นเองดีกว่า
    • นักวิจัยจึงทุ่มเวลาจำนวนมากไปกับ การสร้างสภาพแวดล้อมสำหรับฝึก RL ด้วยตนเอง
    • บริษัทใหญ่เช่น ByteDance และ Alibaba มี ทีมติดป้ายกำกับข้อมูลภายในองค์กร เพื่อรองรับเรื่องนี้
    • ทั้งหมดนี้สะท้อนแนวคิด สร้างเองแทนการซื้อ จากข้อก่อนหน้า
  • 6. ความต้องการชิป Nvidia อย่างเร่งด่วน

    • Nvidia compute คือมาตรฐานทองคำของการฝึก และทุกแล็บต่างถูกจำกัดการพัฒนาเพราะขาดสิ่งนี้
    • หากมีอุปทาน ก็ ชัดเจนว่าจะมีคนซื้อ
    • accelerator อื่น ๆ รวมถึง Huawei ได้รับ การประเมินเชิงบวกสำหรับงาน inference และมีแล็บจำนวนมากที่เข้าถึงชิป Huawei ได้
  • ประเด็นเหล่านี้แสดงภาพของระบบนิเวศ AI ที่แตกต่างอย่างมาก ซึ่งการนำวิธีดำเนินงานของแล็บตะวันตกมาแมปกับจีนอย่างรวดเร็วจะก่อให้เกิด category error
  • คำถามสำคัญคือ ระบบนิเวศที่ต่างกันเหล่านี้จะ ผลิตโมเดลที่แตกต่างกันอย่างมีนัยสำคัญหรือไม่ หรือท้ายที่สุดแล้วโมเดลจีนจะยังถูกอธิบายได้ว่าเป็นเพียงเวอร์ชันย้อนหลัง 3–9 เดือนของโมเดลฟรอนเทียร์สหรัฐ

ดุลยภาพระดับโลก

  • จีนไม่ใช่สถานที่ที่อธิบายได้ด้วยกฎหรือสูตรตายตัว แต่เป็นพื้นที่ที่มี พลวัตและเคมี ที่แตกต่างอย่างมาก
    • วัฒนธรรมมีความเก่าแก่และลึกมาก และ พันเกี่ยวอย่างสมบูรณ์ กับวิธีสร้างเทคโนโลยีภายในประเทศ
  • โครงสร้างอำนาจปัจจุบันของสหรัฐใช้โลกทัศน์ต่อจีนเป็น กลไกหลักของการตัดสินใจ แต่จีนมีคุณลักษณะและสัญชาตญาณที่ยากมากจะจำลองด้วยกรอบการตัดสินใจแบบตะวันตก
  • แม้จะถามโดยตรงว่าทำไมแล็บเหล่านี้จึงเปิดเผยโมเดลชั้นนำแบบ open แต่ จุดตัดระหว่างความเป็นเจ้าของกับการสนับสนุนระบบนิเวศอย่างแท้จริง ก็ยังเชื่อมโยงได้ยาก
  • แทบทุกบริษัทเทคโนโลยีใหญ่ของจีนกำลังสร้าง LLM ทั่วไปของตัวเอง
    • Meituan (บริการส่งอาหาร), Xiaomi (บริษัทเทคโนโลยีผู้บริโภคขนาดใหญ่) และรายอื่น ๆ ต่างเผยแพร่โมเดล open weights
    • หากเป็นบริษัทที่เทียบเคียงกันในสหรัฐ พวกเขาคงแค่ ซื้อบริการ
    • เหตุผลที่บริษัทเหล่านี้สร้าง LLM ไม่ใช่เพราะต้องการตามเทรนด์ร้อนแรง แต่เป็นเพราะแรงปรารถนาพื้นฐานอย่างลึกซึ้งที่จะ ควบคุมสแต็กของตัวเองและพัฒนาเทคโนโลยีที่สำคัญที่สุดของยุค
  • ความเป็นมนุษย์ เสน่ห์ และความอบอุ่นอย่างจริงใจของนักวิจัยจีนเป็นประสบการณ์ที่ เป็นมนุษย์อย่างมาก
    • บทสนทนาทางภูมิรัฐศาสตร์อันแข็งกระด้างที่คุ้นเคยในสหรัฐไม่ได้ซึมซับเข้าไปในตัวพวกเขาเลย
  • หากระบบนิเวศแบบเปิดรุ่งเรืองทั่วโลก ก็อาจสร้าง AI ที่ปลอดภัย เข้าถึงได้ และมีประโยชน์มากขึ้น และคำถามในตอนนี้คือแล็บอเมริกันจะดำเนินการเพื่อยึด ตำแหน่งผู้นำ นั้นหรือไม่
  • กำลังมีข่าวลือมากขึ้นเกี่ยวกับ คำสั่งฝ่ายบริหารที่กระทบต่อโมเดลเปิด ซึ่งอาจทำให้ความสอดประสานระหว่างภาวะผู้นำของสหรัฐกับระบบนิเวศโลกซับซ้อนยิ่งขึ้น

2 ความคิดเห็น

 
jjw9512151 4 분 전

บางครั้งผมก็กังวลว่า ความหมกมุ่นกับจีนอย่างเกินเลยและไร้เหตุผล
อาจกำลังสร้างสัตว์ประหลาดในตัวพวกเราเองขึ้นมา

ก็เหมือนกับที่หนึ่งในข้ออ้างในการขึ้นสู่อำนาจของนาซีคือการต่อต้านคอมมิวนิสต์นั่นแหละครับ

 
kaydash 13 분 전

มีจีนเพียงหนึ่งเดียว...!