ผมก็ทำแบบนี้เหมือนกันครับ ถ้าลงรายละเอียดเพิ่มอีกหน่อยคือ ผมตั้ง Claude ไว้ที่แพ็กเกจ 100 ดอลลาร์ และ Codex ที่ 200 ดอลลาร์ แล้วให้ Claude Code Opus วางแผน -> Sonnet ลงมือทำ -> Codex รีวิว -> Opus ตรวจยืนยันผลรีวิว -> Sonnet ลงมือทำอีกครั้ง -> Codex รีวิว (วนซ้ำแบบนี้ไปเรื่อย ๆ) ผมถึงขั้นทำเป็นสกิลไว้ให้มันรันต่อเนื่องแบบนี้เลย และก็พอใจกับผลลัพธ์ครับ

 

เมื่อใช้ model_context_window=800000 จะมีปัญหาที่ตั้งแต่จุดที่ใช้ context ไป 50% คำตอบของคำถามจะเริ่มกลายเป็นการตอบคำถามก่อนหน้าแทน โปรดทราบไว้ด้วยครับ

 

เห็นด้วยว่า Codex ละเอียดรอบคอบ แนะนำให้เขียนด้วย Claude แล้วใช้ Codex รีวิว แม้จะใช้เวลามาก แต่ถ้าปล่อยรันไว้ก่อนไปเข้าห้องน้ำหรือก่อนเข้าประชุม อัตราที่งานเสร็จก็สูงเหมือนกันครับ

 

AI รู้ดีว่า 'ทำอย่างไร (How)' แต่ไม่รู้ว่าควรต้องทำไป 'ทำไม' ความใฝ่รู้ที่จะพยายามเข้าใจเป้าหมายพื้นฐานของงาน กล้ายอมรับการลองผิดลองถูกเพื่อค้นหาเส้นทางใหม่ และการตัดสินใจกำหนดทิศทางไปสู่เป้าหมายนั้น เป็นสิ่งที่มีเพียงมนุษย์เท่านั้นที่ทำได้ ความรับผิดชอบไม่ใช่การมุ่งแค่ผลลัพธ์ แต่คือท่าทีที่ไม่ละทิ้งเป้าหมายระหว่างกระบวนการ คอยตั้งคำถามและสำรวจค้นหาอย่างต่อเนื่อง

 

ผมใช้งาน Oracle Cloud free tier อยู่ครับ ได้ 4 vCPU, RAM 24GB, 200GB และเพราะเป็นพื้นฐาน ARM เลยมีบางอย่างที่ใช้งานร่วมกันไม่ได้เป็นครั้งคราว นอกนั้นถือว่าเหมาะเอามาเป็นของเล่นมากครับ

 

ความสามารถในการค้นหาวิธีอื่นอย่างสร้างสรรค์นอกเหนือจากคู่มือและคำสั่ง ก็มีรากฐานมาจากทัศนคติที่มีความรับผิดชอบเช่นกัน

 

เวลาเราประเมินความสามารถในการทำงานของคน จะมีองค์ประกอบที่เรียกว่า 'ทัศนคติ' อยู่ นอกเหนือจากแนวทางการทำงานและคำสั่งของหัวหน้าแล้ว ทัศนคติที่เจ้าตัวมีต่องานด้วยตัวเองก็สำคัญ ทัศนคตินั้นแสดงออกผ่านความสนใจอย่างต่อเนื่องต่อการทำงาน วิสัยทัศน์เชิงลึก และความรับผิดชอบ ในบรรดาสิ่งเหล่านี้ ความรับผิดชอบสำคัญที่สุด ปัญญาประดิษฐ์อาจเลียนแบบอย่างอื่นได้ แต่ไม่มีความรับผิดชอบ ปัญญาประดิษฐ์อาจประเมินผลลัพธ์ได้ แต่ไม่อาจประเมินความรับผิดชอบในกระบวนการได้

 

โฆษณา Google น่าจะต้องจัดการพวกโฆษณา NSFW ก่อนสักหน่อยไหม -_-?

 

ดิสนีย์น่าจะเป็นเรื่องตัวละครมากกว่ารายได้จากสื่อหรือเปล่า?

 

ผมลองใช้ทั้งสองตัวแล้ว และคิดว่าตรงกันข้ามนะ แต่ดูเหมือนจะไม่ใช่อย่างนั้นแฮะ
ตอนที่ผมใช้ Codex มักมีหลายครั้งที่มันไม่ทำตามคำสั่ง
ช่วงหลังมานี้ก็เหมือน Anthropic จะลดประสิทธิภาพของ 4.6 opus ลง เลยอาจจะเปลี่ยนไปก็ได้

 

ได้ยินมาว่าเทคโนโลยีสำหรับค้นหาช่องโหว่ด้านความปลอดภัยก็พัฒนาไปอย่างก้าวกระโดดเช่นกัน
การค้นพบช่องโหว่เหล่านั้นก็ยิ่งทำให้เกิดความจำเป็นในการหาวิธีป้องกันให้มากขึ้น
จึงดูว่าวิธีการด้านความปลอดภัยก็น่าจะได้รับการปรับปรุงตามไปด้วยครับ

 

ปัญหาเรื้อรังของ Claude Code นี่คุณคงยังไม่เคยเจอสินะ บน Reddit ก็เป็นประเด็นกันตลอดเลย

 

สำหรับผม codex เป็นประสบการณ์ที่ดีกว่าครับ

 

พอเห็นชื่อ OpenBMB ก็รู้สึกคุ้น ๆ ว่าเคยได้ยินจากที่ไหน ที่แท้ก็เป็นที่เดียวกับที่ทำโมเดล MiniCPM-o นี่เอง
โมเดล MiniCPM-o เป็นโมเดลแบบออมนิคล้าย ๆ GPT 4o และประสิทธิภาพก็ค่อนข้างดีมาก

ลองดู วิดีโอเดโมของ MiniCPM-o กันได้ครับ

เป็นโมเดลที่ผมประทับใจมากพอสมควร เลยทำให้คาดหวังกับโมเดลโคลนเสียงตัวใหม่นี้ด้วยครับ

 

ถ้าฟรีจริงและความปลอดภัยดี ก็ใช้แน่นอนครับ 555

พอเห็นอะไรแบบนี้ก็พอจะนึกภาพคร่าว ๆ ได้เลยว่า devops จะเปลี่ยนไปในทิศทางไหน

 

ไม่ว่าจะเป็นตัวไหนก็ต้องมี HITL อยู่ดี (อย่างน้อยก็จนถึงวันนี้)
ได้โปรดอย่าพูดอะไรทำนอง Ralph Loop แบบนั้นเลย

 

ก็อย่างที่รู้กันอยู่แล้ว... แค่ลองค้นหา OPENAI_API_KEY บน GitHub ก็เจออะไรหลุดมาเพียบแล้ว...

 

อ้อ เข้าใจแล้วครับ งั้นผมขอพอใจกับแบบสแตติกก็แล้วกัน 555

 

คุณใช้ผู้ให้บริการอินเทอร์เน็ตรายไหนอยู่ เขาปิดพอร์ตไว้หรือเปล่าครับ?