Codex สำหรับแทบทุกอย่าง
(openai.com)- แอป Codex ได้รับการอัปเดตครั้งใหญ่ ทำให้ตอนนี้สามารถทำงานใน กระบวนการพัฒนาซอฟต์แวร์ทั้งหมด ได้ภายในเวิร์กสเปซเดียว
- สามารถ ควบคุมคอมพิวเตอร์ได้โดยตรง พร้อมใช้งานเครื่องมือและแอปสำหรับงานประจำวันร่วมกัน และเพิ่มความสามารถด้าน การสร้างภาพ, การเรียนรู้พฤติกรรมในอดีต, การทำงานซ้ำอัตโนมัติ เพื่อ ทำให้เวิร์กโฟลว์การพัฒนาเป็นอัตโนมัติ และขยายขีดความสามารถ
- แอปเดสก์ท็อปมีฟีเจอร์รีวิว PR, มุมมองหลายไฟล์/เทอร์มินัล, การเชื่อมต่อ remote devbox ผ่าน SSH, และเบราว์เซอร์ในแอป ช่วยให้การวนรอบงานด้านดีไซน์ฟรอนต์เอนด์และการพัฒนาแอป/เกมเร็วขึ้น
- มีการผสานรวม ปลั๊กอินมากกว่า 90 รายการ และ โมเดล gpt-image-1.5 เพื่อมอบสภาพแวดล้อมที่เชื่อมต่อกันตั้งแต่การเขียนโค้ดไปจนถึงการออกแบบ การทดสอบ และการทำงานร่วมกัน
- รองรับการนำเธรดสนทนาเดิมกลับมาใช้ซ้ำและ การตั้งเวลาอัตโนมัติสำหรับงานระยะยาว รวมถึงพรีวิวหน่วยความจำ เพื่อให้การทำงานต่อเนื่องข้ามช่วงเวลาหลายวันถึงหลายสัปดาห์เป็นไปได้
การอัปเดตสำคัญของ Codex
- แอป Codex สำหรับ macOS และ Windows ได้รับการอัปเดตครั้งใหญ่ ขยายจากเดิมไปเป็นเครื่องมือที่รองรับ กระบวนการพัฒนาซอฟต์แวร์ทั้งหมด สำหรับนักพัฒนาที่ใช้งานรายสัปดาห์มากกว่า 3 ล้านคน
- เวอร์ชันใหม่นี้เพิ่มความสามารถด้าน การควบคุมคอมพิวเตอร์, การสร้างภาพ, หน่วยความจำ, ปลั๊กอิน, เบราว์เซอร์ในแอป เพื่อเร่งเวิร์กโฟลว์ของนักพัฒนา
- มีการเสริม ฟีเจอร์ที่เน้นงานพัฒนา เช่น รีวิว PR, มุมมองหลายไฟล์และเทอร์มินัล, รวมถึงการเชื่อมต่อ remote devbox ผ่าน SSH
- การปรับปรุงทั้งหมดถูกรวมเข้าด้วยกันเพื่อให้สามารถทำ การเขียนโค้ด, ตรวจสอบผลลัพธ์, ทบทวนการเปลี่ยนแปลง, และทำงานร่วมกัน ได้ในเวิร์กสเปซเดียว
-
การควบคุมคอมพิวเตอร์และงานแบบขนาน
- ผ่าน ฟีเจอร์ควบคุมคอมพิวเตอร์เบื้องหลัง สามารถคลิก พิมพ์ และนำทางบนคอมพิวเตอร์ของผู้ใช้ได้โดยตรง
- ใช้เคอร์เซอร์ของตัวเองในการควบคุมแอป จึงสามารถทดสอบหรือทำงานซ้ำในแอปที่ไม่มี API ได้
- เอเจนต์หลายตัวสามารถทำงานพร้อมกันแบบขนานบน Mac ได้ โดยไม่รบกวนการใช้งานแอปอื่นของผู้ใช้
- เหมาะสำหรับ การวนรอบการแก้ไขฟรอนต์เอนด์, การทดสอบแอป, งานในสภาพแวดล้อมที่ไม่มี API
- ผ่าน ฟีเจอร์ควบคุมคอมพิวเตอร์เบื้องหลัง สามารถคลิก พิมพ์ และนำทางบนคอมพิวเตอร์ของผู้ใช้ได้โดยตรง
-
การผสานรวมเว็บและเบราว์เซอร์
- เชื่อมต่อกับเว็บได้แบบเนทีฟ และผ่าน เบราว์เซอร์ในแอป ผู้ใช้สามารถใส่คำอธิบายประกอบบนหน้าเว็บได้โดยตรงเพื่อส่งคำสั่งที่เฉพาะเจาะจงให้ Codex
- ขณะนี้มีประโยชน์กับงานพัฒนาฟรอนต์เอนด์และเกม และมีแผนจะขยายจากเว็บแอปบน localhost ไปสู่การควบคุมเบราว์เซอร์ได้เต็มรูปแบบในอนาคต
-
การสร้างภาพและเวิร์กโฟลว์ด้านภาพ
- ใช้ โมเดล gpt-image-1.5 เพื่อสร้างภาพและทำงานแบบวนรอบ
- เมื่อนำมารวมกับภาพหน้าจอและโค้ด จะสามารถสร้าง คอนเซปต์ผลิตภัณฑ์, ดีไซน์ฟรอนต์เอนด์, ม็อกอัป, ภาพสำหรับเกม ได้ภายในเวิร์กโฟลว์เดียวกัน
-
การขยายผ่านปลั๊กอิน
- เพิ่ม ปลั๊กอินใหม่ มากกว่า 90 รายการ รองรับการเชื่อมต่อกับแอปหลากหลายประเภทและเซิร์ฟเวอร์ MCP
- ปลั๊กอินหลัก ได้แก่ Atlassian Rovo (จัดการ JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
- ปลั๊กอินช่วยให้ Codex สามารถ รวบรวมบริบทได้มากขึ้นและทำงานอัตโนมัติได้มากขึ้น
-
เสริมความแข็งแกร่งให้เวิร์กโฟลว์นักพัฒนา
- รองรับการจัดการคอมเมนต์รีวิว GitHub, การรันหลายเทอร์มินัลแท็บ, และการเชื่อมต่อ remote devbox ผ่าน SSH (ระยะอัลฟา)
- สามารถเปิดไฟล์จากแถบด้านข้างได้โดยตรง และมี พรีวิวแบบริชของ PDF, สเปรดชีต, สไลด์, เอกสาร
- มี แผงสรุปใหม่ (summary pane) สำหรับติดตามแผน แหล่งที่มา และผลลัพธ์ของเอเจนต์
- การย้ายไปมาระหว่างการเขียนโค้ด ตรวจสอบผลลัพธ์ รีวิวการเปลี่ยนแปลง และการทำงานร่วมกับเอเจนต์ภายในเวิร์กสเปซเดียว ช่วยให้สลับระหว่างแต่ละช่วงของวงจรการพัฒนาได้เร็วขึ้น
-
ระบบอัตโนมัติและงานระยะยาว
- ฟีเจอร์ระบบอัตโนมัติ ถูกขยายให้สามารถ นำเธรดสนทนาเดิมกลับมาใช้ซ้ำ และรักษาบริบทที่สะสมไว้ได้
- Codex สามารถตั้งเวลางานในอนาคตด้วยตัวเองและกลับมาทำต่อโดยอัตโนมัติ ทำให้ งานระยะยาวที่กินเวลาหลายวันถึงหลายสัปดาห์ดำเนินต่อเนื่องได้
- ตัวอย่างการใช้งานในทีม: การ merge PR ที่เปิดอยู่, การติดตามงานต่อเนื่อง, การติดตามบทสนทนาอย่างรวดเร็วข้ามเครื่องมืออย่าง Slack, Gmail, Notion
-
หน่วยความจำและการปรับให้เป็นส่วนตัว
- ด้วย ฟีเจอร์พรีวิวหน่วยความจำ (preview of memory) ทำให้ Codex จดจำบริบทที่มีประโยชน์จากอดีตได้ เช่น ความชอบส่วนบุคคล การแก้ไข หรือข้อมูลที่รวบรวมไว้
- ในงานถัดไป จะสามารถให้คุณภาพและความเร็วในระดับที่ก่อนหน้านี้ทำได้ด้วย custom instruction จำนวนมากเท่านั้น
- Codex สามารถเสนอ การทำงานต่อจากจุดที่ค้างไว้ ได้เชิงรุก โดยใช้บริบทจากโปรเจกต์ ปลั๊กอินที่เชื่อมต่อ และหน่วยความจำ เพื่อสร้าง ข้อเสนองานและรายการลำดับความสำคัญ โดยอัตโนมัติ
- ตัวอย่าง: ระบุคอมเมนต์ใน Google Docs ที่ต้องตรวจสอบ → รวบรวมบริบทที่เกี่ยวข้องจาก Slack, Notion, และ codebase → สร้าง รายการแอ็กชันที่จัดลำดับความสำคัญแล้ว
- ด้วย ฟีเจอร์พรีวิวหน่วยความจำ (preview of memory) ทำให้ Codex จดจำบริบทที่มีประโยชน์จากอดีตได้ เช่น ความชอบส่วนบุคคล การแก้ไข หรือข้อมูลที่รวบรวมไว้
-
แผนการเปิดใช้งานและขอบเขตการให้บริการ
- กำลังทยอยเปิดให้กับ ผู้ใช้แอปเดสก์ท็อป Codex ที่ล็อกอินด้วยบัญชี ChatGPT
- ฟีเจอร์การปรับให้เป็นส่วนตัว (ข้อเสนอแนะที่รับรู้บริบท, หน่วยความจำ) จะเปิดให้ผู้ใช้ Enterprise, Edu, EU และ UK เร็ว ๆ นี้
- ฟีเจอร์ควบคุมคอมพิวเตอร์ จะเปิดให้ใช้งานบน macOS ก่อน และจะขยายไปยังภูมิภาค EU และ UK
วิวัฒนาการและเป้าหมายของ Codex
- ภายใน 1 ปีหลังเปิดตัว Codex ได้ขยายขอบเขตการใช้งานจากการเขียนโค้ดไปสู่ การทำความเข้าใจระบบ, การรวบรวมบริบท, การรีวิว, การดีบัก, การทำงานร่วมกัน, การจัดการงานระยะยาว
- OpenAI มีเป้าหมายเพื่อให้ AGI เป็นประโยชน์ต่อมนุษยชาติทั้งหมด และการอัปเดตครั้งนี้ถูกออกแบบมาเพื่อ ลดช่องว่างระหว่างสิ่งที่มนุษย์จินตนาการกับสิ่งที่สามารถสร้างได้จริง
- ในอนาคต Codex จะยิ่งผสานเข้ากับ เครื่องมือ เวิร์กโฟลว์ และการตัดสินใจ ในกระบวนการสร้างซอฟต์แวร์อย่างใกล้ชิดมากขึ้น
6 ความคิดเห็น
เป็นเวอร์ชันเสียเงินของ Opecnclaw เหรอ…
ยังไม่ใช่ Windows ใช่ไหม? เป็นอัปเดตสำหรับ Mac ใช่ไหม?
เวลาขอให้ออกแบบเว็บทีไร ก็มักจะทำออกมาเป็นสไตล์การ์ดตลอด เมื่อไหร่จะเลิกนิสัยนี้สักที ถ้าแก้แค่นี้ได้ก็คงจะเลิกใช้ Claude ไปเลย
ก่อนหน้านี้ผมใช้แค่เชื่อมต่อผ่าน VSCode อย่างเดียว แต่คงต้องลองใช้ผ่านแอปดูแล้ว
ช่วงนี้ผมใช้ Codex เป็นหลักอยู่แล้ว เลยเป็นอัปเดตที่น่ายินดีมากครับ。
openai-oauth - ใช้งาน OpenAI API ฟรีด้วยบัญชี ChatGPT
ถ้าใช้ตัวนี้ ตอนนี้ก็น่าจะสร้างภาพได้ด้วยแล้วนะครับ
ความเห็นจาก Hacker News
พออ่านคอมเมนต์แล้วเหมือนหลายคนไม่รู้ว่า Claude Desktop กับ Cowork มีความสามารถแบบนี้อยู่แล้ว
Codex ให้ความรู้สึกเหมือนแค่ไล่ตามมากกว่าจะเป็นนวัตกรรม
OpenAI มีลูกค้าองค์กรน้อยกว่า เลยอุดหนุนทรัพยากรคอมพิวต์ให้ผู้ใช้ทั่วไปได้มากกว่า
สุดท้ายพอจำนวนผู้ใช้เพิ่มขึ้นก็จะกลายเป็นแบบ Anthropic ตอนนี้ก็แค่ กลยุทธ์ PR เท่านั้น
Codex สามารถคลิกแอป พิมพ์ข้อความในเบื้องหลัง และให้หลายเอเจนต์ทำงานพร้อมกันได้
อย่างที่ฉันเขียนไว้ในบล็อกโพสต์ AI ควรทำงานแบบ เชิงรุก มากกว่านี้
อย่างเช่นสรุป Slack, รวมบันทึกการประชุม, สร้างโน้ตเตรียมประชุมอัตโนมัติ สิ่งพวกนี้ทำได้อยู่แล้วแต่ไม่มีใครทำ
สุดท้ายสิ่งสำคัญคือ การจัดการความสนใจ และ AI ควรช่วยบอกว่าเราควรโฟกัสอะไร
พอมอง UI ช่วงนี้จะเห็นแนวโน้มชัดมากว่า พยายามซ่อนโค้ด
พรอมป์ต์กลายเป็นต้นฉบับจริง ส่วนโค้ดถูกมองเป็นผลลัพธ์ขั้นกลางที่น่ารำคาญ
แบบนี้ทั้งเร็วขึ้นและได้ผลลัพธ์ที่เหมือนโค้ดที่ฉันเขียนเอง
พวกเรารู้วิธีทำ automation อยู่แล้ว แต่คนส่วนใหญ่ไม่รู้
git diffได้เลยตอนนี้ภาษาระดับสูงอาจดูแปลก แต่สุดท้ายมันก็เป็นกระบวนการเพิ่ม ชั้นของ abstraction
prompt engineering เองก็เป็นระบบภาษาประดิษฐ์อีกรูปแบบหนึ่งเหมือนกัน
แม้จะมีคนมองอย่างสงสัยเยอะ แต่ฉันคิดว่านี่จะ แพร่หลายสู่คนหมู่มาก
ฉันใช้ CLI มา 25 ปี แต่ทุกวันนี้ให้ Codex ทำงานในเทอร์มินัลแทนแล้ว
ถ้าเวอร์ชัน GUI ทำมาดี ผู้ใช้ทั่วไปก็น่าจะชินได้เร็ว
งานตั้งค่าที่เมื่อก่อนใช้เวลาหลายชั่วโมง ตอนนี้เหลือไม่กี่วินาที
ยกเว้นแอปที่จำเป็นต้องใช้ GUI งานส่วนใหญ่ใช้ AI แบบข้อความก็พอแล้ว
ยังสงสัยว่าเราอยากให้ Codex ควบคุมคอมพิวเตอร์กับแอปโดยตรงจริงไหม
ฉันยังให้ความสำคัญกับ sandbox security อยู่มาก
ดูเหมือน OpenAI จะเตรียม ปล่อยแบบปิด ไว้ให้ตรงจังหวะกับตอนที่คู่แข่งประกาศอะไรบางอย่าง
ตารางของสื่อและอินฟลูเอนเซอร์จะมีการประสานไว้ล่วงหน้า
พรอมป์ต์ในวิดีโอที่สองคือ “ช่วยลดขนาดฟอนต์กับความยาว tagline หน่อย”
จนอดคิดไม่ได้ว่าตอนนี้เราใช้ LLM มา ปรับขนาดฟอนต์ กันแล้วเหรอ
ส่วนในวิดีโอที่สามบอกว่า “ช่วยสร้างภาพ hero section ให้หน่อย”
การใช้ ภาพที่ AI สร้าง ในคำอธิบายผลิตภัณฑ์มันดู ปลอม เกินไป
พูดตรง ๆ คือฉันไม่รู้จะเอาสิ่งนี้ไปใช้ตรงไหน
มันมีประโยชน์ในฐานะผู้ช่วยเขียนโค้ด แต่ฉันไม่ได้อยากให้มันมาควบคุมคอมพิวเตอร์ของฉันโดยตรง
ถ้าเป็นสรุป Slack ก็พอเข้าใจได้ แต่ตอนนี้มันดูเหมือน โซลูชันที่พยายามแก้ปัญหาที่ไม่ได้เป็นปัญหา
ฉันมองว่า เอเจนต์เฉพาะทางแบบ Cowork/Codex จะเป็นกลุ่มผลิตภัณฑ์ที่โตเร็วที่สุดสำหรับผู้ใช้ที่ไม่ใช่นักพัฒนา
เอเจนต์พวกนี้จะเข้ามาจัดการซอฟต์แวร์แทนมนุษย์
อย่างที่สรุปไว้ในบทความนี้
สุดท้ายแล้ว โครงสร้างของตลาดซอฟต์แวร์เองจะเปลี่ยนไป
และนั่นก็ทำให้ ภัยคุกคามด้านความปลอดภัย สูงขึ้น
มันอ่านอีเมลกับบันทึกการประชุม วางแผนและลงมือทำงาน แล้วส่งสรุปกลับมาให้
สิ่งนี้เป็นไปได้เพราะงานความรู้ส่วนใหญ่สุดท้ายแล้วสามารถแสดงออกมาในรูปแบบของ โค้ด ได้
ถ้าเชื่อมข้อมูลได้ดี ตลาด B2B SaaS ก็จะเปิดขึ้นมา
ยังสงสัยว่า Codex ยัง อ่านไฟล์ที่อ่อนไหวโดยไม่ได้รับความยินยอมจากผู้ใช้ อยู่หรือเปล่า
มี issue ที่เกี่ยวข้องอยู่ใน GitHub
การรันบน เครื่องแยกต่างหากที่ไม่มีข้อมูลอ่อนไหว จะปลอดภัยกว่า
ชื่อ Codex ชวนสับสน
อันหนึ่งคือ เครื่องมือเขียนโปรแกรมแบบเอเจนต์, อีกอันคือ แอป GUI สำหรับ Mac/Windows แต่ใช้ชื่อเดียวกัน