14 คะแนน โดย GN⁺ 13 일 전 | 6 ความคิดเห็น | แชร์ทาง WhatsApp
  • แอป Codex ได้รับการอัปเดตครั้งใหญ่ ทำให้ตอนนี้สามารถทำงานใน กระบวนการพัฒนาซอฟต์แวร์ทั้งหมด ได้ภายในเวิร์กสเปซเดียว
  • สามารถ ควบคุมคอมพิวเตอร์ได้โดยตรง พร้อมใช้งานเครื่องมือและแอปสำหรับงานประจำวันร่วมกัน และเพิ่มความสามารถด้าน การสร้างภาพ, การเรียนรู้พฤติกรรมในอดีต, การทำงานซ้ำอัตโนมัติ เพื่อ ทำให้เวิร์กโฟลว์การพัฒนาเป็นอัตโนมัติ และขยายขีดความสามารถ
  • แอปเดสก์ท็อปมีฟีเจอร์รีวิว PR, มุมมองหลายไฟล์/เทอร์มินัล, การเชื่อมต่อ remote devbox ผ่าน SSH, และเบราว์เซอร์ในแอป ช่วยให้การวนรอบงานด้านดีไซน์ฟรอนต์เอนด์และการพัฒนาแอป/เกมเร็วขึ้น
  • มีการผสานรวม ปลั๊กอินมากกว่า 90 รายการ และ โมเดล gpt-image-1.5 เพื่อมอบสภาพแวดล้อมที่เชื่อมต่อกันตั้งแต่การเขียนโค้ดไปจนถึงการออกแบบ การทดสอบ และการทำงานร่วมกัน
  • รองรับการนำเธรดสนทนาเดิมกลับมาใช้ซ้ำและ การตั้งเวลาอัตโนมัติสำหรับงานระยะยาว รวมถึงพรีวิวหน่วยความจำ เพื่อให้การทำงานต่อเนื่องข้ามช่วงเวลาหลายวันถึงหลายสัปดาห์เป็นไปได้

การอัปเดตสำคัญของ Codex

  • แอป Codex สำหรับ macOS และ Windows ได้รับการอัปเดตครั้งใหญ่ ขยายจากเดิมไปเป็นเครื่องมือที่รองรับ กระบวนการพัฒนาซอฟต์แวร์ทั้งหมด สำหรับนักพัฒนาที่ใช้งานรายสัปดาห์มากกว่า 3 ล้านคน
  • เวอร์ชันใหม่นี้เพิ่มความสามารถด้าน การควบคุมคอมพิวเตอร์, การสร้างภาพ, หน่วยความจำ, ปลั๊กอิน, เบราว์เซอร์ในแอป เพื่อเร่งเวิร์กโฟลว์ของนักพัฒนา
  • มีการเสริม ฟีเจอร์ที่เน้นงานพัฒนา เช่น รีวิว PR, มุมมองหลายไฟล์และเทอร์มินัล, รวมถึงการเชื่อมต่อ remote devbox ผ่าน SSH
  • การปรับปรุงทั้งหมดถูกรวมเข้าด้วยกันเพื่อให้สามารถทำ การเขียนโค้ด, ตรวจสอบผลลัพธ์, ทบทวนการเปลี่ยนแปลง, และทำงานร่วมกัน ได้ในเวิร์กสเปซเดียว
  • การควบคุมคอมพิวเตอร์และงานแบบขนาน

    • ผ่าน ฟีเจอร์ควบคุมคอมพิวเตอร์เบื้องหลัง สามารถคลิก พิมพ์ และนำทางบนคอมพิวเตอร์ของผู้ใช้ได้โดยตรง
      • ใช้เคอร์เซอร์ของตัวเองในการควบคุมแอป จึงสามารถทดสอบหรือทำงานซ้ำในแอปที่ไม่มี API ได้
      • เอเจนต์หลายตัวสามารถทำงานพร้อมกันแบบขนานบน Mac ได้ โดยไม่รบกวนการใช้งานแอปอื่นของผู้ใช้
    • เหมาะสำหรับ การวนรอบการแก้ไขฟรอนต์เอนด์, การทดสอบแอป, งานในสภาพแวดล้อมที่ไม่มี API
  • การผสานรวมเว็บและเบราว์เซอร์

    • เชื่อมต่อกับเว็บได้แบบเนทีฟ และผ่าน เบราว์เซอร์ในแอป ผู้ใช้สามารถใส่คำอธิบายประกอบบนหน้าเว็บได้โดยตรงเพื่อส่งคำสั่งที่เฉพาะเจาะจงให้ Codex
    • ขณะนี้มีประโยชน์กับงานพัฒนาฟรอนต์เอนด์และเกม และมีแผนจะขยายจากเว็บแอปบน localhost ไปสู่การควบคุมเบราว์เซอร์ได้เต็มรูปแบบในอนาคต
  • การสร้างภาพและเวิร์กโฟลว์ด้านภาพ

    • ใช้ โมเดล gpt-image-1.5 เพื่อสร้างภาพและทำงานแบบวนรอบ
    • เมื่อนำมารวมกับภาพหน้าจอและโค้ด จะสามารถสร้าง คอนเซปต์ผลิตภัณฑ์, ดีไซน์ฟรอนต์เอนด์, ม็อกอัป, ภาพสำหรับเกม ได้ภายในเวิร์กโฟลว์เดียวกัน
  • การขยายผ่านปลั๊กอิน

    • เพิ่ม ปลั๊กอินใหม่ มากกว่า 90 รายการ รองรับการเชื่อมต่อกับแอปหลากหลายประเภทและเซิร์ฟเวอร์ MCP
    • ปลั๊กอินหลัก ได้แก่ Atlassian Rovo (จัดการ JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
    • ปลั๊กอินช่วยให้ Codex สามารถ รวบรวมบริบทได้มากขึ้นและทำงานอัตโนมัติได้มากขึ้น
  • เสริมความแข็งแกร่งให้เวิร์กโฟลว์นักพัฒนา

    • รองรับการจัดการคอมเมนต์รีวิว GitHub, การรันหลายเทอร์มินัลแท็บ, และการเชื่อมต่อ remote devbox ผ่าน SSH (ระยะอัลฟา)
    • สามารถเปิดไฟล์จากแถบด้านข้างได้โดยตรง และมี พรีวิวแบบริชของ PDF, สเปรดชีต, สไลด์, เอกสาร
    • มี แผงสรุปใหม่ (summary pane) สำหรับติดตามแผน แหล่งที่มา และผลลัพธ์ของเอเจนต์
    • การย้ายไปมาระหว่างการเขียนโค้ด ตรวจสอบผลลัพธ์ รีวิวการเปลี่ยนแปลง และการทำงานร่วมกับเอเจนต์ภายในเวิร์กสเปซเดียว ช่วยให้สลับระหว่างแต่ละช่วงของวงจรการพัฒนาได้เร็วขึ้น
  • ระบบอัตโนมัติและงานระยะยาว

    • ฟีเจอร์ระบบอัตโนมัติ ถูกขยายให้สามารถ นำเธรดสนทนาเดิมกลับมาใช้ซ้ำ และรักษาบริบทที่สะสมไว้ได้
    • Codex สามารถตั้งเวลางานในอนาคตด้วยตัวเองและกลับมาทำต่อโดยอัตโนมัติ ทำให้ งานระยะยาวที่กินเวลาหลายวันถึงหลายสัปดาห์ดำเนินต่อเนื่องได้
    • ตัวอย่างการใช้งานในทีม: การ merge PR ที่เปิดอยู่, การติดตามงานต่อเนื่อง, การติดตามบทสนทนาอย่างรวดเร็วข้ามเครื่องมืออย่าง Slack, Gmail, Notion
  • หน่วยความจำและการปรับให้เป็นส่วนตัว

    • ด้วย ฟีเจอร์พรีวิวหน่วยความจำ (preview of memory) ทำให้ Codex จดจำบริบทที่มีประโยชน์จากอดีตได้ เช่น ความชอบส่วนบุคคล การแก้ไข หรือข้อมูลที่รวบรวมไว้
      • ในงานถัดไป จะสามารถให้คุณภาพและความเร็วในระดับที่ก่อนหน้านี้ทำได้ด้วย custom instruction จำนวนมากเท่านั้น
    • Codex สามารถเสนอ การทำงานต่อจากจุดที่ค้างไว้ ได้เชิงรุก โดยใช้บริบทจากโปรเจกต์ ปลั๊กอินที่เชื่อมต่อ และหน่วยความจำ เพื่อสร้าง ข้อเสนองานและรายการลำดับความสำคัญ โดยอัตโนมัติ
    • ตัวอย่าง: ระบุคอมเมนต์ใน Google Docs ที่ต้องตรวจสอบ → รวบรวมบริบทที่เกี่ยวข้องจาก Slack, Notion, และ codebase → สร้าง รายการแอ็กชันที่จัดลำดับความสำคัญแล้ว
  • แผนการเปิดใช้งานและขอบเขตการให้บริการ

    • กำลังทยอยเปิดให้กับ ผู้ใช้แอปเดสก์ท็อป Codex ที่ล็อกอินด้วยบัญชี ChatGPT
    • ฟีเจอร์การปรับให้เป็นส่วนตัว (ข้อเสนอแนะที่รับรู้บริบท, หน่วยความจำ) จะเปิดให้ผู้ใช้ Enterprise, Edu, EU และ UK เร็ว ๆ นี้
    • ฟีเจอร์ควบคุมคอมพิวเตอร์ จะเปิดให้ใช้งานบน macOS ก่อน และจะขยายไปยังภูมิภาค EU และ UK

วิวัฒนาการและเป้าหมายของ Codex

  • ภายใน 1 ปีหลังเปิดตัว Codex ได้ขยายขอบเขตการใช้งานจากการเขียนโค้ดไปสู่ การทำความเข้าใจระบบ, การรวบรวมบริบท, การรีวิว, การดีบัก, การทำงานร่วมกัน, การจัดการงานระยะยาว
  • OpenAI มีเป้าหมายเพื่อให้ AGI เป็นประโยชน์ต่อมนุษยชาติทั้งหมด และการอัปเดตครั้งนี้ถูกออกแบบมาเพื่อ ลดช่องว่างระหว่างสิ่งที่มนุษย์จินตนาการกับสิ่งที่สามารถสร้างได้จริง
  • ในอนาคต Codex จะยิ่งผสานเข้ากับ เครื่องมือ เวิร์กโฟลว์ และการตัดสินใจ ในกระบวนการสร้างซอฟต์แวร์อย่างใกล้ชิดมากขึ้น

6 ความคิดเห็น

 
iolothebard 12 일 전

เป็นเวอร์ชันเสียเงินของ Opecnclaw เหรอ…

 
cshj55 13 일 전

ยังไม่ใช่ Windows ใช่ไหม? เป็นอัปเดตสำหรับ Mac ใช่ไหม?

 
slowandsnow 13 일 전

เวลาขอให้ออกแบบเว็บทีไร ก็มักจะทำออกมาเป็นสไตล์การ์ดตลอด เมื่อไหร่จะเลิกนิสัยนี้สักที ถ้าแก้แค่นี้ได้ก็คงจะเลิกใช้ Claude ไปเลย

 
bluenyx 13 일 전

ก่อนหน้านี้ผมใช้แค่เชื่อมต่อผ่าน VSCode อย่างเดียว แต่คงต้องลองใช้ผ่านแอปดูแล้ว

 
xguru 13 일 전

ช่วงนี้ผมใช้ Codex เป็นหลักอยู่แล้ว เลยเป็นอัปเดตที่น่ายินดีมากครับ。

openai-oauth - ใช้งาน OpenAI API ฟรีด้วยบัญชี ChatGPT

ถ้าใช้ตัวนี้ ตอนนี้ก็น่าจะสร้างภาพได้ด้วยแล้วนะครับ

 
GN⁺ 13 일 전
ความเห็นจาก Hacker News
  • พออ่านคอมเมนต์แล้วเหมือนหลายคนไม่รู้ว่า Claude Desktop กับ Cowork มีความสามารถแบบนี้อยู่แล้ว
    Codex ให้ความรู้สึกเหมือนแค่ไล่ตามมากกว่าจะเป็นนวัตกรรม

    • เหตุผลที่ Codex กำลังดังบน HN ช่วงนี้คือ Anthropic ลด rate limit สำหรับผู้ใช้รายบุคคล
      OpenAI มีลูกค้าองค์กรน้อยกว่า เลยอุดหนุนทรัพยากรคอมพิวต์ให้ผู้ใช้ทั่วไปได้มากกว่า
      สุดท้ายพอจำนวนผู้ใช้เพิ่มขึ้นก็จะกลายเป็นแบบ Anthropic ตอนนี้ก็แค่ กลยุทธ์ PR เท่านั้น
    • Codex มี ฟีเจอร์มากกว่า Claude Cowork เช่น ความสามารถในการควบคุมคอมพิวเตอร์เองในเบื้องหลัง
    • Claude ยังไม่มีฟีเจอร์แบบนี้
      Codex สามารถคลิกแอป พิมพ์ข้อความในเบื้องหลัง และให้หลายเอเจนต์ทำงานพร้อมกันได้
    • รู้สึกว่าสองผลิตภัณฑ์นี้กำลัง ค่อย ๆ บรรจบกัน ช่วงหลัง UI ของแอป Claude บน Mac ก็เปลี่ยนจนแทบเหมือน Codex
    • จริง ๆ ตอนนี้ทั้งสองฝั่งยังไม่ได้ทำ นวัตกรรม อะไรอย่างแท้จริง
      อย่างที่ฉันเขียนไว้ในบล็อกโพสต์ AI ควรทำงานแบบ เชิงรุก มากกว่านี้
      อย่างเช่นสรุป Slack, รวมบันทึกการประชุม, สร้างโน้ตเตรียมประชุมอัตโนมัติ สิ่งพวกนี้ทำได้อยู่แล้วแต่ไม่มีใครทำ
      สุดท้ายสิ่งสำคัญคือ การจัดการความสนใจ และ AI ควรช่วยบอกว่าเราควรโฟกัสอะไร
  • พอมอง UI ช่วงนี้จะเห็นแนวโน้มชัดมากว่า พยายามซ่อนโค้ด
    พรอมป์ต์กลายเป็นต้นฉบับจริง ส่วนโค้ดถูกมองเป็นผลลัพธ์ขั้นกลางที่น่ารำคาญ

    • ฉันกลับทำตรงกันข้าม คือเก็บโครงสร้างโค้ดไว้ในหัวแล้วคุยกับ AI เหมือน pair programming
      แบบนี้ทั้งเร็วขึ้นและได้ผลลัพธ์ที่เหมือนโค้ดที่ฉันเขียนเอง
    • พอเห็นว่าแอป Codex ยังใช้บน Linux ไม่ได้ ก็เหมือนกลุ่มเป้าหมายคือคนที่ไม่ได้รู้เรื่องโค้ดมากนัก
    • จริง ๆ เครื่องมือพวกนี้ให้ประโยชน์กับ คนที่ไม่ใช่นักพัฒนา มากกว่า
      พวกเรารู้วิธีทำ automation อยู่แล้ว แต่คนส่วนใหญ่ไม่รู้
    • ถ้าอยากได้อารมณ์นักพัฒนาของจริง ก็ทำงานใน vim แล้วเทียบด้วย git diff ได้เลย
    • เมื่อก่อนก็เคยมีช่วงที่คนเชื่อว่าแอสเซมบลีเท่านั้นคือโค้ดจริง
      ตอนนี้ภาษาระดับสูงอาจดูแปลก แต่สุดท้ายมันก็เป็นกระบวนการเพิ่ม ชั้นของ abstraction
      prompt engineering เองก็เป็นระบบภาษาประดิษฐ์อีกรูปแบบหนึ่งเหมือนกัน
  • แม้จะมีคนมองอย่างสงสัยเยอะ แต่ฉันคิดว่านี่จะ แพร่หลายสู่คนหมู่มาก
    ฉันใช้ CLI มา 25 ปี แต่ทุกวันนี้ให้ Codex ทำงานในเทอร์มินัลแทนแล้ว
    ถ้าเวอร์ชัน GUI ทำมาดี ผู้ใช้ทั่วไปก็น่าจะชินได้เร็ว

    • ฉันเองก็เป็น ผู้ใช้ Linux และรู้สึกสนุกมากที่ควบคุม OS ด้วยภาษาธรรมชาติ
      งานตั้งค่าที่เมื่อก่อนใช้เวลาหลายชั่วโมง ตอนนี้เหลือไม่กี่วินาที
    • อีก 3~5 ปีข้างหน้า แนวคิดเรื่อง คุณภาพโค้ด น่าจะเปลี่ยนไป และอัตราการใช้ IDE น่าจะลดลงมาก
    • วิธีแบบนี้แหละคือ การใช้คอมพิวเตอร์ อย่างแท้จริง
      ยกเว้นแอปที่จำเป็นต้องใช้ GUI งานส่วนใหญ่ใช้ AI แบบข้อความก็พอแล้ว
    • โดยเฉพาะการแก้ปัญหา error ของ Docker-compose นี่เหมือนเวทมนตร์จริง ๆ
    • แต่แนวทางนี้ก็ช้ากว่า ใช้ ทรัพยากรคอมพิวต์ มากกว่า และมีความเสี่ยงที่ข้อมูลจะถูกบันทึกไว้นอกเครื่อง
  • ยังสงสัยว่าเราอยากให้ Codex ควบคุมคอมพิวเตอร์กับแอปโดยตรงจริงไหม
    ฉันยังให้ความสำคัญกับ sandbox security อยู่มาก

    • โปรแกรมเมอร์ส่วนใหญ่อาจไม่อยากได้ แต่คนทั่วไปอยากได้ คำสั่งเสียงแบบ Star Trek
    • บน Mac การกดปุ่มคลิกอะไรสักอย่างไม่น่ากลัวเท่าไร จริง ๆ แล้วการปล่อยให้โปรแกรมที่ได้รับอนุมัติอัตโนมัติรันอยู่ต่างหากที่อันตรายกว่า
    • ฉันกลับอยากให้ AI คลิกแทน งานซ้ำ ๆ มันน่าเบื่อเกินไป
    • บางคนถึงขั้นรันของอย่าง OpenClaw เอง ส่วนฉันอย่างน้อยก็แยกมันไว้ด้วย Docker
    • จริง ๆ แล้ว Codex เคยช่วยแก้ ปัญหาสิทธิ์ บน Mac ของฉันให้อัตโนมัติด้วย
  • ดูเหมือน OpenAI จะเตรียม ปล่อยแบบปิด ไว้ให้ตรงจังหวะกับตอนที่คู่แข่งประกาศอะไรบางอย่าง

    • (พนักงาน OpenAI) จริง ๆ แล้วไม่ได้คำนวณขนาดนั้น แค่พัฒนาภายในแล้วค่อยเปิดออกภายนอกตามกำหนด
      ตารางของสื่อและอินฟลูเอนเซอร์จะมีการประสานไว้ล่วงหน้า
    • ถึงอย่างนั้นพอดูจังหวะการปล่อยช่วงหลังก็มีความเห็นว่า ยากจะมองว่าเป็นเรื่องบังเอิญ
    • บางคนก็บอกว่าบริษัทนี้ขับเคลื่อนด้วย กระแส hype
    • สุดท้ายก็เห็นด้วยว่านี่คือ ศึกชิงความเป็นเจ้าของวาระสื่อ
    • พวกเขาพิสูจน์เซนส์ด้านสื่อไปแล้วจาก การเข้าซื้อ TBPN
  • พรอมป์ต์ในวิดีโอที่สองคือ “ช่วยลดขนาดฟอนต์กับความยาว tagline หน่อย”
    จนอดคิดไม่ได้ว่าตอนนี้เราใช้ LLM มา ปรับขนาดฟอนต์ กันแล้วเหรอ
    ส่วนในวิดีโอที่สามบอกว่า “ช่วยสร้างภาพ hero section ให้หน่อย”
    การใช้ ภาพที่ AI สร้าง ในคำอธิบายผลิตภัณฑ์มันดู ปลอม เกินไป

  • พูดตรง ๆ คือฉันไม่รู้จะเอาสิ่งนี้ไปใช้ตรงไหน
    มันมีประโยชน์ในฐานะผู้ช่วยเขียนโค้ด แต่ฉันไม่ได้อยากให้มันมาควบคุมคอมพิวเตอร์ของฉันโดยตรง
    ถ้าเป็นสรุป Slack ก็พอเข้าใจได้ แต่ตอนนี้มันดูเหมือน โซลูชันที่พยายามแก้ปัญหาที่ไม่ได้เป็นปัญหา

  • ฉันมองว่า เอเจนต์เฉพาะทางแบบ Cowork/Codex จะเป็นกลุ่มผลิตภัณฑ์ที่โตเร็วที่สุดสำหรับผู้ใช้ที่ไม่ใช่นักพัฒนา
    เอเจนต์พวกนี้จะเข้ามาจัดการซอฟต์แวร์แทนมนุษย์
    อย่างที่สรุปไว้ในบทความนี้
    สุดท้ายแล้ว โครงสร้างของตลาดซอฟต์แวร์เองจะเปลี่ยนไป

    • แต่ถ้าเอเจนต์แบบนี้จะสำเร็จ มันต้องมี สิทธิ์เข้าถึงทั้งหมด
      และนั่นก็ทำให้ ภัยคุกคามด้านความปลอดภัย สูงขึ้น
    • ฉันเป็น CEO สายวิศวกรรมเครื่องกล และใช้ Claude Code เพื่อ ทำ automation ให้ทั้งแคมเปญโซเชียล
      มันอ่านอีเมลกับบันทึกการประชุม วางแผนและลงมือทำงาน แล้วส่งสรุปกลับมาให้
      สิ่งนี้เป็นไปได้เพราะงานความรู้ส่วนใหญ่สุดท้ายแล้วสามารถแสดงออกมาในรูปแบบของ โค้ด ได้
    • คนทำงานสายความรู้ส่วนใหญ่ไม่คิดจะเรียนรู้เครื่องมือแบบนี้
    • LLM คือ UI/UX ที่ดีที่สุด ไม่จำเป็นต้องออกแบบอินเทอร์เฟซแยกต่างหาก
      ถ้าเชื่อมข้อมูลได้ดี ตลาด B2B SaaS ก็จะเปิดขึ้นมา
    • ฉันเองก็ใช้ Codex กับงานที่ไม่ใช่การเขียนโค้ดเยอะ แต่ถ้าไม่มี วิธีคิดแบบโปรแกรมเมอร์ มันก็ใช้งานให้ดีได้ยาก
  • ยังสงสัยว่า Codex ยัง อ่านไฟล์ที่อ่อนไหวโดยไม่ได้รับความยินยอมจากผู้ใช้ อยู่หรือเปล่า
    มี issue ที่เกี่ยวข้องอยู่ใน GitHub

    • พออัปเดตนี้เพิ่ม ความสามารถในการควบคุมคอมพิวเตอร์ เข้ามา โมเดลสิทธิ์ก็ยิ่งสำคัญขึ้น
    • ทั้งการค้นหาไฟล์ การเข้าถึงเบราว์เซอร์ ฯลฯ ทำให้ ขอบเขตไม่ชัดเจน ว่าสิทธิ์ไหนถูกเปิดให้บ้าง
    • อย่างกรณีใน Reddit ก็เคยมี Claude วิจารณ์เรื่องความปลอดภัยของผู้ใช้
      การรันบน เครื่องแยกต่างหากที่ไม่มีข้อมูลอ่อนไหว จะปลอดภัยกว่า
    • ฉันเองก็เพิ่งเจอมากับตัวเมื่อวาน ยังมีปัญหาแบบนั้นอยู่
  • ชื่อ Codex ชวนสับสน
    อันหนึ่งคือ เครื่องมือเขียนโปรแกรมแบบเอเจนต์, อีกอันคือ แอป GUI สำหรับ Mac/Windows แต่ใช้ชื่อเดียวกัน

    • ถึงอย่างนั้นก็ยังคิดว่า ดีกว่าการตั้งชื่อของ Microsoft อยู่นิดหน่อย