- Anthropic ประกาศขยายขีดจำกัดการใช้งานของ Claude Code และ Claude API ผ่านความร่วมมือกับ SpaceX และข้อตกลงด้านคอมพิวต์หลายฉบับที่เพิ่งลงนามล่าสุด
- ขีดจำกัดการใช้งาน 5 ชั่วโมง ของ Claude Code เพิ่มขึ้นเป็น 2 เท่าแล้ว (สำหรับแพ็กเกจ Pro, Max, Team และ Enterprise แบบคิดตามจำนวนที่นั่ง) และยกเลิก การลดเพดานการใช้งานในช่วงเวลาที่มีผู้ใช้หนาแน่น สำหรับบัญชี Pro และ Max
- API rate limits ของโมเดล Claude Opus ถูกปรับเพิ่มขึ้นอย่างมาก และความจุเพิ่มเติมนี้ช่วยเพิ่มปริมาณการใช้งานที่พร้อมให้บริการแก่ผู้สมัครสมาชิก Claude Pro และ Claude Max โดยตรง
- Anthropic ทำสัญญาใช้ความจุคอมพิวต์ทั้งหมดของ ศูนย์ข้อมูล Colossus 1 ของ SpaceX ทำให้ภายในหนึ่งเดือนจะสามารถเข้าถึงความจุใหม่มากกว่า 300MW และ NVIDIA GPU มากกว่า 220,000 ตัว
- การขยายคอมพิวต์ของ Anthropic เดินหน้าเพิ่มเติมจากข้อตกลงกับ Amazon, Google และ Broadcom, Microsoft และ NVIDIA รวมถึง Fluidstack โดยคำนึงถึงโครงสร้างพื้นฐานภายในภูมิภาค ภาระต้นทุนไฟฟ้า และการลงทุนในชุมชนท้องถิ่นควบคู่กันไป
การขยายขีดจำกัดการใช้งาน Claude
- Anthropic เพิ่มขีดจำกัดการใช้งานของ Claude Code และ Claude API ผ่านความร่วมมือกับ SpaceX และข้อตกลงด้านคอมพิวต์หลายฉบับที่เพิ่งทำขึ้น
- การเปลี่ยนแปลงทั้ง 3 รายการมีผลตั้งแต่วันประกาศ
- ขีดจำกัดการใช้งาน 5 ชั่วโมง ของ Claude Code เพิ่มขึ้นเป็น 2 เท่าสำหรับแพ็กเกจ Pro, Max, Team และ Enterprise แบบคิดตามจำนวนที่นั่ง
- สำหรับบัญชี Pro และ Max ได้ยกเลิก การลดเพดานการใช้งานในช่วงเวลาที่มีผู้ใช้หนาแน่น ของ Claude Code
- API rate limits ของโมเดล Claude Opus ก็ถูกปรับเพิ่มขึ้นอย่างมากเช่นกัน
พันธมิตรคอมพิวต์รายใหม่กับ SpaceX
- Anthropic ทำสัญญาใช้ความจุคอมพิวต์ทั้งหมดของ ศูนย์ข้อมูล Colossus 1 ของ SpaceX
- ข้อตกลงนี้ทำให้ภายในหนึ่งเดือนสามารถเข้าถึงความจุใหม่มากกว่า 300MW และ NVIDIA GPU มากกว่า 220,000 ตัว
- ความจุเพิ่มเติมนี้ช่วยเพิ่มปริมาณการใช้งานที่พร้อมให้บริการแก่ผู้สมัครสมาชิก Claude Pro และ Claude Max โดยตรง
- ข้อตกลงครั้งนี้เป็นการต่อยอดจากการประกาศขยายคอมพิวต์ครั้งสำคัญก่อนหน้าของ Anthropic
- ข้อตกลงกับ Amazon สูงสุด 5GW: รวมความจุใหม่ราว 1GW ภายในสิ้นปี 2026
- ข้อตกลง 5GW กับ Google และ Broadcom: มีกำหนดเริ่มดำเนินการตั้งแต่ปี 2027
- ความร่วมมือเชิงกลยุทธ์ กับ Microsoft และ NVIDIA: รวมความจุ Azure มูลค่า 3 หมื่นล้านดอลลาร์
- การลงทุน $50 billion ในโครงสร้างพื้นฐาน AI ของสหรัฐร่วมกับ Fluidstack
- การฝึกและการรัน Claude ใช้ฮาร์ดแวร์ AI หลายประเภท เช่น AWS Trainium, Google TPUs และ NVIDIA GPUs
- Anthropic ยังคงมองหาโอกาสในการเพิ่มความจุออนไลน์เพิ่มเติมอย่างต่อเนื่อง
- ในฐานะส่วนหนึ่งของข้อตกลงกับ SpaceX บริษัทแสดงความสนใจที่จะร่วมมือกับ SpaceX ในการพัฒนา ความจุคอมพิวต์ AI ในวงโคจร ระดับหลาย GW ด้วย
การขยายตัวระหว่างประเทศและโครงสร้างพื้นฐานภายในภูมิภาค
- ลูกค้าองค์กรในอุตสาหกรรมที่มีการกำกับดูแลเข้มงวด เช่น บริการการเงิน การแพทย์ และภาครัฐ ต้องการ โครงสร้างพื้นฐานภายในภูมิภาค มากขึ้นเรื่อย ๆ เพื่อให้เป็นไปตามข้อกำหนดด้านคอมพลายแอนซ์และการเก็บข้อมูลตามถิ่นที่อยู่ของข้อมูล
- ด้วยเหตุนี้ การขยายความจุบางส่วนของ Anthropic จึงดำเนินไปในระดับนานาชาติ
- ความร่วมมือ กับ Amazon ที่เพิ่งประกาศล่าสุด รวมถึงความจุสำหรับการอนุมานเพิ่มเติมในเอเชียและยุโรป
- ภูมิภาคที่จะเพิ่มความจุถูกคัดเลือกอย่างระมัดระวัง โดยร่วมมือกับประเทศประชาธิปไตยที่มีกรอบกฎหมายและกฎระเบียบซึ่งสามารถรองรับการลงทุนขนาดใหญ่ได้
- อีกเกณฑ์สำคัญคือสถานที่ที่มีความปลอดภัยของซัพพลายเชนด้านฮาร์ดแวร์ ระบบเครือข่าย และสิ่งอำนวยความสะดวกที่จำเป็นต่อการคอมพิวต์
ต้นทุนไฟฟ้าและการลงทุนในชุมชนท้องถิ่น
- Anthropic เพิ่งประกาศคำมั่นสัญญา ว่าจะรับภาระค่าไฟฟ้าที่เพิ่มขึ้น หากศูนย์ข้อมูลในสหรัฐทำให้ค่าไฟของผู้บริโภคสูงขึ้น
- ในฐานะส่วนหนึ่งของการขยายตัวระหว่างประเทศ บริษัทกำลังพิจารณาขยายคำมั่นนี้ไปยังเขตอำนาจศาลใหม่ ๆ
- บริษัทยังเดินหน้าหารือวิธีทำงานร่วมกับผู้นำท้องถิ่น เพื่อนำการลงทุนกลับคืนสู่ชุมชนที่เป็นที่ตั้งของสิ่งอำนวยความสะดวกเหล่านี้
2 ความคิดเห็น
ผมก็อยากลองใช้ mythos เร็ว ๆ เหมือนกันครับ
ความคิดเห็นจาก Hacker News
ในทางกลับกัน training จะยังคงแพงต่อไป ทำให้ Anthropic/OpenAI ไปอยู่ฝั่งธุรกิจการฝึกโมเดล
โมเดลจะกลายเป็นสินทรัพย์ที่เช่าเป็นหน่วยหรือซื้อขาดได้ และผู้ใช้ก็จะรันบนฮาร์ดแวร์ inference เอง หรือเช่า หรือเป็นเจ้าของมัน
หรือไม่ก็จ่ายพรีเมียมให้บริษัทที่จัดการทั้งหมดนี้แทน
สงสัยว่ามีบล็อกโพสต์หรืออะไรทำนองนั้นที่อธิบายว่าแม้แต่ฝั่ง inference ของโมเดลใหม่อย่าง Opus ใช้อินฟราสตรักเจอร์แบบไหนอยู่หรือเปล่า
เดาว่าน่าจะเป็นความลับ แต่ถ้าใช้งานโมเดลได้ตรงผ่าน AWS Bedrock ก็น่าจะเป็นเบาะแสบางอย่างได้ไหม
ดาต้าเซ็นเตอร์บางแห่งเดินระบบแบบไม่ค่อยฉลาด เพราะความเร็วในการขยายการดำเนินงานสำคัญกว่าต้นทุน
มีทั้งข้อกำกับจากบริษัทไฟฟ้า และเรื่องอย่างอัตรา ramp rate เพื่อไม่ให้ทำร้ายโครงข่ายไฟฟ้า ซึ่งมีคำอธิบายว่าดาต้าเซ็นเตอร์กำลังละเมิดหนักมาก
โหลดมีความผันผวนสูง จึงใช้โรงไฟฟ้าก๊าซธรรมชาติหลังมิเตอร์เพื่อจ่ายไฟ และเพลาที่เดิมควรอยู่ได้ 7 ปีกลับทนได้แค่ 10 เดือนเพราะสตาร์ต-หยุดซ้ำ ๆ
https://www.volts.wtf/p/doing-data-centers-the-not-dumb-way
ฝั่งคอมพิวต์นั้น NVIDIA มี standard reference design อยู่
https://www.nvidia.com/en-us/technologies/enterprise-referen...
ยังไม่ได้ดูละเอียด แต่คงมีเครือข่ายระหว่าง GPU ของ Mellanox, โค้ดคัสตอมขนาดใหญ่สำหรับแบ่ง tensor ไปยัง GPU และโค้ดสำหรับย้าย activation ระหว่างโหนด GPU
Anthropic โฮสต์โมเดลของตัวเองเป็น managed service ภายใน AWS Bedrock และลูกค้าก็เรียก LLM เหมือนเรียก API อื่น ๆ
จะมองไม่เห็นว่า request ของ API นั้นถูกประมวลผลบนอินฟราสตรักเจอร์ AWS แบบไหน
พวกเขากำลังเปลี่ยนสินทรัพย์ที่สร้างไว้ให้ Grok ซึ่งเป็นตัวเผาเงินมหาศาล ให้กลายเป็น แหล่งรายได้ ก้อนใหญ่ก่อน IPO
และในเวลาเดียวกันก็เป็นเครื่องมือโยนหนี้ของ Twitter ออกไปให้สาธารณะด้วย นักบัญชีคงเก่งจริง ๆ
Anthropic ได้คอมพิวต์ที่จำเป็นอย่างยิ่งต่อการเติบโตต่อไป ส่วน Elon ก็ปล่อยเช่าคอมพิวต์ที่ xAI ใช้ไม่คุ้มเพราะความต้องการ Grok ต่ำ และ SpaceX ก็สามารถบันทึกรายได้ลงบัญชีสำหรับ IPO ได้
ประโยคที่ว่า “เราจะเพิ่มกำลังการผลิตอย่างรอบคอบโดยร่วมมือกับประเทศประชาธิปไตยที่มีกรอบกฎหมายและกำกับดูแลรองรับการลงทุนขนาดนี้” ถ้าแปลเป็นภาษาความจริงก็ใกล้เคียงกับ “เราจะให้กำไรสำคัญที่สุด”
Elon เป็นคนขวาจัดที่สนับสนุน Trump และ Trump เองก็ไม่ได้เป็นประชาธิปไตยนัก แต่ความหมายคือเราต้องการเงินเพิ่มจริง ๆ
ยังดูเหมือนพยายามให้คนลืมด้วยว่า xAI รับเงินจากรัฐบาลตะวันออกกลางที่ไม่เป็นประชาธิปไตย และถ้าขายโมเดล Anthropic ได้ก็คงซื้อคอมพิวต์จากจีนเหมือนกัน
ดาต้าเซ็นเตอร์ไม่ใช่อุปกรณ์แบบ plug-and-play ที่มีสเปกเขียนมาดีและใช้อินเทอร์เฟซมาตรฐานสากลเสียหน่อย
ถ้า Elon อยากสร้างดาต้าเซ็นเตอร์ในวงโคจร Anthropic ก็คงยินดีรันโมเดลบนนั้น
แทบไม่ต้องสงสัยเลยว่า Elon สร้างดาต้าเซ็นเตอร์วงโคจรได้ไหม คำถามคือมัน คุ้มค่าทางเศรษฐกิจหรือไม่ เมื่อเทียบกับแบบภาคพื้นดิน
ถ้าเกิดขึ้นได้ก็ดี ไม่ได้ก็ไม่เป็นไร
เป็นส่วนหนึ่งของดีลเพื่อให้ได้สิทธิ์เข้าถึงดาต้าเซ็นเตอร์บนพื้นดิน โดยช่วยทำให้คอมพิวต์วงโคจรในอวกาศที่เห็นได้ชัดว่าเพ้อฝัน ดูเหมือนจริงจังกว่าที่เป็น
เชื่อว่าสักวันหนึ่งของแบบนี้อาจมีได้ แต่ก็ยังไม่ใกล้ความเป็นจริงเลย เหมือน FSD
ต้นทุนของการพูดแบบนั้นแทบเป็นศูนย์ และทีหลังก็อ้างได้ว่าเปลี่ยนใจแล้ว
ถ้ามีต้นทุนก็คงเป็นเรื่องชื่อเสียงเล็กน้อย
มันยังเพิ่มความต้องการไฟฟ้าในโครงข่าย และอาจทำให้เกิดไฟดับครั้งใหญ่ในช่วงสภาพอากาศสุดขั้ว ซึ่งทำให้คนในพื้นที่เสี่ยงมากขึ้น
https://en.wikipedia.org/wiki/Colossus_(supercomputer)#Envir...
ดังนั้น Anthropic แม้จะพูดเรื่องความปลอดภัยมาก แต่ก็คงจัดเข้ากลุ่ม บริษัทที่ให้กำไรมาก่อนความปลอดภัย ได้เหมือนกัน
แม้แต่ลิงก์วิกิที่แนบมาก็แค่บอกว่าอาจมีความคลุมเครือด้านใบอนุญาต แต่ผมไม่เห็นตรงไหนที่อ้างว่าไฟฟ้านั้น “ผิดกฎหมาย”
มันไม่ได้ผลิตสารเคมีหรือทำอะไรแบบนั้น
เราควรระแวงกับข้อกล่าวหาแบบนี้มาก โดยเฉพาะเมื่อมีบริษัทเงินหนาเกี่ยวข้อง เพราะแค่ข้ออ้างความเสียหายที่ “ฟังดูน่าเชื่อและตามติดไม่เลิก” ก็อาจพาไปสู่การถูกฟ้องหรือถูกกดดันให้ยอมความได้แล้ว
ถ้าจริงก็เป็น ช่องโหว่ภาษี ขนาดมหึมา และก็ไม่น่าแปลกใจที่การลงทุนทุนในดาต้าเซ็นเตอร์จะสูงมาก
[0] https://www.datacenterknowledge.com/regulations/how-are-data...
เพราะมันแค่หมายความว่าคุณจะไปชนเพดานรายสัปดาห์ได้ใน 3 วันแทนที่จะเป็น 5 วัน
ในสัปดาห์ที่ใช้หนัก ผมใช้ต่อเนื่องเกิน 6 ชั่วโมงต่อวันเป็นประจำ
แต่ก็เคร่งมากเรื่องคุมทุก session ให้อยู่ต่ำกว่า 200k~250k token เสมอ
ใช้ประมาณ 3-5 session ต่อสัปดาห์
ถ้าทำงานที่ซับซ้อนขึ้นจะเผา window 5 ชั่วโมงหมดเร็วมากซึ่งน่าหงุดหงิด แต่ก็ยังไม่เคยถึงเพดานรายสัปดาห์
คิดว่าน่าจะมีคนแบบผมเยอะพอสมควร
ถ้าจะโหมจริง ๆ แม้แต่เพดานรายสัปดาห์ของแพ็กเกจ Max $200 ต่อเดือนก็ใช้หมดได้ง่าย ๆ ในวันเดียว
ในหัวผมเลยคิด usage รายสัปดาห์เป็นแบบรายวัน คือวันละประมาณ 14% แล้วพยายามใช้ให้น้อยช่วงต้นสัปดาห์และปล่อยช่วงท้ายสัปดาห์มากขึ้น
แล้วสุดท้ายสองวันท้ายก็มานั่งคิดว่าจะใช้โควต้าที่เก็บไว้ยังไงให้หมด
window 5 ชั่วโมงทำให้เรื่องนี้ยากขึ้น และในวันสุดท้ายของสัปดาห์ก็ต้องพยายามยัด 10% เข้าไปทุก ๆ window 5 ชั่วโมงตลอดเวลาที่ตื่นอยู่ ซึ่งเกลียดมาก
ผมอยากทำงานตอนที่ตัวเอง productive ที่สุด ไม่ใช่ตามหน้าต่างเวลาไร้สาระแบบนี้
ผมไม่อยากต้องคิดว่า “น่าจะใช้ Claude หนักสุดตอน 11 โมง งั้นต้องส่งข้อความโง่ ๆ ไปให้ Haiku ตอน 7:30 เพื่อเริ่ม window 5 ชั่วโมง แล้วจะได้ข้ามไปอีกทีตอน 12:30”
เพราะงั้นผมดีใจกับการเปลี่ยนแปลงนี้ แต่ก็เป็นแค่การบรรเทาปัญหาที่พวกเขาสร้างขึ้นเอง 100% แล้วทำเหมือนกำลังใจดีกับผู้ใช้
ผมเข้าใจว่าพวกเขาอยากลดการใช้งานช่วงพีค แต่ก็ยังไม่ชอบอยู่ดี
สุดท้ายมันเลยดูเหมือนว่า Elon ยอมแพ้กับ xAI แล้วหันไป ขายคอมพิวต์ แทน
Grok 4.1 Fast เคยเป็นวิธีที่ถูกที่สุดในการทำรีเสิร์ชบน X และยังถูกกว่า X API ด้วย แต่หายไปเมื่อวันที่ 15 พฤษภาคม
https://docs.x.ai/developers/models
อาจกำลังเคลียร์คอมพิวต์ออกมาเพื่อเอาไปขายก็ได้
แต่โมเดล โอเพนซอร์ส อย่าง Gemma และ Qwen พัฒนาดีขึ้นเร็วมาก จนแม้แต่ Anthropic เองก็คงมองว่าในระยะยาวมันเป็นความเสี่ยงจริงต่อมูลค่าของโมเดลและเครื่องมือของตน
ถ้าเป็นผมและเป็น Anthropic หรือ xAI ก็คงพยายามสร้างรายได้จากทุกทางที่ทำได้ แล้วดูว่าอะไรจะรอด
ในสถานการณ์ที่ทุกอย่างผันผวนขนาดนี้ การหวังครองตลาดแบบเบ็ดเสร็จไม่มีค่าพอ
มันอาจเป็นแค่เวลา GPU ที่เคยเสียเปล่า หรืออาจเป็นเพราะ Anthropic ยื่นข้อเสนอที่ยากจะปฏิเสธก็ได้
เดาเล่น ๆ ว่าถ้าเป็นข้อเสนอที่ Elon ปฏิเสธไม่ได้ ก็อาจเป็นกรณีที่ Anthropic ยอมให้ ข้อมูลฝึกหรือเทคโนโลยี บางส่วน
xAI ดูไม่ค่อยเหมือนแล็บวิจัยจริงจังนัก
เขาจะได้ข้อมูลภายในเกี่ยวกับการทำงานของ Claude และยังได้กระแสข้อมูลการใช้งาน Claude ปริมาณมหาศาลอีกด้วย
ทั้งหมดนี้น่าจะถูกนำไปสะท้อนใน การพัฒนา Grok ต่อจากนี้
ผมลองใช้ Claude Code อยู่หลายวันแล้วชนเพดานตลอด เลยพยายามอัปเกรดเป็น Max แต่ในขั้นตอนอัปเกรดกลับถูกขอ ยืนยันตัวตน ผ่าน Persona
ผมคิดว่าโอเค งั้นยกเลิกการอัปเกรดก็ได้ แต่กลับโดนบล็อกการเข้าถึง Claude Code ของแพ็กเกจเดิมไปทั้งหมด และจะปลดได้ก็ต่อเมื่อทำการยืนยันตัวตนให้เสร็จ
ซึ่งผมไม่มีวันทำแน่ ๆ และมันเป็นประสบการณ์ที่แย่มาก
อย่างน้อยมันก็ทำให้รู้ว่า Deepseek ถูกกว่ามาก และสำหรับงาน reverse engineering ก็ให้ผลพอ ๆ กัน
เป็นข่าวดีนะ แต่ผมจะไม่กลับไปแล้ว
Anthropic ทำพลาดมากเกินไปในเวลาสั้นเกินไปจนเสียผมไปแล้ว
Opus ถูกแทนที่ด้วย GPT 5.5, DeepSeek, Kimi และ Qwen ซึ่งทั้งหมดทำให้ผมสลับโมเดลได้ง่ายด้วย harness เดียวของผม
ถ้าตัวไหนเริ่มทำแบบเดียวกัน ผมก็เปลี่ยนได้ทันที