- บทรีวิวโดย Simon Willison ที่เจาะลักษณะของฟีเจอร์นี้ในฐานะ เครื่องมือวิเคราะห์แบบรันโค้ดได้ จากการใช้งานจริงของฟีเจอร์ “Upgraded file creation and analysis” ของ Anthropic
- ฟีเจอร์ใหม่นี้รองรับ การรันโค้ด Python และ Node.js บนคอนเทนเนอร์ฝั่งเซิร์ฟเวอร์ รวมถึงการสร้างและแก้ไขไฟล์ ซึ่งมีการทำงานต่างจาก ‘Analysis tool’ แบบเดิมที่ใช้ JS ในเบราว์เซอร์ อย่างสิ้นเชิง
- คอนเทนเนอร์มี Ubuntu 24.04.2, Python 3.12.3, Node v18.19.1, RAM ราว 9GB / ดิสก์ 5GB พร้อมจุดเด่นคือ เครือข่ายแบบ whitelist ผ่าน Envoy proxy และ อนุญาตให้ติดตั้งแพ็กเกจจาก PyPI
- การทดสอบจริงทำทั้ง การสร้าง PDF ของไดอะแกรมสคีมา SQLite และ การสร้างกราฟอัตราการนำ AI ไปใช้ของ Apollo ขึ้นมาใหม่ โดยสามารถยกระดับคุณภาพผลลัพธ์ได้ผ่าน การออกแบบพรอมป์ต์และการปรับแต่งภาพ
- การเข้าถึงอินเทอร์เน็ตบางส่วนมี ความเสี่ยงด้าน prompt injection และข้อมูลรั่วไหล จึงจำเป็นต้องมี การเฝ้าระวังจากผู้ใช้ ขณะเดียวกัน การตั้งชื่อและการอธิบายฟีเจอร์ที่ล้มเหลว ก็ยังเป็นโจทย์ของทั้งอุตสาหกรรม
ภาพรวมฟีเจอร์
- Anthropic ประกาศว่า Claude รองรับความสามารถด้าน การสร้างและแก้ไขไฟล์
- สร้าง สเปรดชีต Excel, เอกสาร Word, สไลด์ PowerPoint, และ PDF ได้จาก Claude.ai และแอปเดสก์ท็อป
- ผู้ใช้สามารถอัปโหลดข้อมูลหรืออธิบายความต้องการเพื่อรับ ไฟล์ที่พร้อมใช้งานได้ทันที
- เปิดให้ใช้งานแบบพรีวิวสำหรับผู้ใช้ แพ็กเกจ Max, Team และ Enterprise ส่วน แพ็กเกจ Pro จะรองรับภายในไม่กี่สัปดาห์
- ความสามารถหลัก:
- การวิเคราะห์ข้อมูล: ทำความสะอาดข้อมูลดิบและให้ การวิเคราะห์เชิงสถิติ, กราฟ และอินไซต์สำคัญ
- การสร้างสเปรดชีต: สร้าง โมเดลการเงิน, ตัวติดตามโปรเจ็กต์, เทมเพลตงบประมาณ ฯลฯ พร้อมสูตร
- งานข้ามฟอร์แมต: แปลง PDF เป็น PowerPoint, จัดระเบียบบันทึกการประชุมเป็นเอกสาร ฯลฯ
- ผู้เขียน Simon Willison มองว่านี่คือฟีเจอร์ที่มาเทียบกับ ChatGPT Code Interpreter และประเมินว่าชื่อทางการ “Upgraded file creation and analysis” เป็น การตั้งชื่อที่ไม่เหมาะสม
- ความแตกต่างจากฟีเจอร์เดิม
- Analysis tool เมื่อเดือนตุลาคม 2024: เป็นเครื่องมือวิเคราะห์น้ำหนักเบาที่ รัน JS ในเบราว์เซอร์ของผู้ใช้
- ฟีเจอร์ใหม่ในเดือนกันยายน 2025: เป็น Code Interpreter เต็มรูปแบบ ที่รัน คำสั่งเชลล์, Python และ Node.js รวมถึง อ่านและสร้างไฟล์ บน คอนเทนเนอร์ฝั่งเซิร์ฟเวอร์
- คล้ายกับ Code execution tool ใน API ของบริษัทเดียวกัน แต่ครั้งนี้เป็นครั้งแรกที่ ผู้ใช้ปลายทาง สามารถรัน โค้ดตามอำเภอใจ บนคอนเทนเนอร์ฝั่งเซิร์ฟเวอร์ได้
คุณสมบัติของ Code Interpreter ใหม่
- Code Interpreter ของ Claude มีลักษณะคล้ายกับ ChatGPT Code Interpreter
- สามารถติดตั้งแพ็กเกจ Python จาก PyPI ได้ (เช่น
pip install sqlite-utils)
- มี Node.js v18.19.1 ติดตั้งมาให้ล่วงหน้า และใช้แพ็กเกจ global ของ npm ได้
- รายละเอียดสภาพแวดล้อม:
- OS: Ubuntu 24.04.2 LTS, Linux kernel 4.4.0
- สถาปัตยกรรม: x86_64, เชลล์: GNU Bash 5.2.21
- Python: 3.12.3, pip: 24.0
- ดิสก์: 4.9GB (ใช้ได้ 4.6GB), RAM: 9.0GB
- ข้อจำกัด: อัปโหลด/ดาวน์โหลดไฟล์ได้ 30MB ซึ่งถือว่า จำกัดกว่า 512MB ของ ChatGPT
- การเข้าถึงอินเทอร์เน็ต: ใช้ strict whitelist ภายใต้ Envoy proxy
- การ
curl ไปยังเว็บไซต์ทั่วไป (เช่น google.com) จะได้ข้อผิดพลาด 403 Forbidden
- โดเมนที่อนุญาต: api.anthropic.com, github.com, registry.npmjs.org / npmjs.com, pypi.org / files.pythonhosted.org ฯลฯ ซึ่งเป็น whitelist ที่เน้นแพ็กเกจและการจัดการเวอร์ชัน
- สามารถ ติดตั้งแพ็กเกจจาก PyPI เช่น pip install sqlite-utils ได้ และพร้อมใช้งาน Node runtime ทันที
- เข้าถึงเนื้อหาเว็บบางส่วนได้ผ่านคอนเทนเนอร์ web_fetch และ web_search
การตั้งค่าและวิธีใช้งาน
- การเปิดใช้งาน: เปิดสวิตช์ Upgraded file creation and analysis ที่ claude.ai/settings/features
- ไม่สามารถเปิดพร้อมกับ Analysis Tool ได้ เพื่อหลีกเลี่ยงความสับสน
-
งานง่าย: SQLite → PDF ไดอะแกรมการ join
- อินพุต: อัปโหลด ฐานข้อมูล SQLite ของเว็บไซต์ TIL (≈21.9MB) แล้วสั่งให้สร้าง PDF ไดอะแกรมการ join ของตาราง
- ผลลัพธ์: สร้าง PDF/PNG ได้สำเร็จ แม้ ความอ่านง่ายของเส้นเชื่อม จะยังไม่ดีนัก แต่พบว่าสามารถปรับปรุงได้ด้วย การเสริมพรอมป์ต์
- ความหมาย: เวิร์กโฟลว์มาตรฐานของ Code Interpreter ที่ วิเคราะห์ไฟล์ฐานข้อมูลที่อัปโหลดด้วย Python และ สร้างภาพ/PDF ทำงานได้อย่าง ลื่นไหล
-
งานยาก: สร้างกราฟอัตราการนำ AI ไปใช้ขึ้นมาใหม่
- โจทย์: ป้อน สกรีนช็อต + XLSX แล้วสั่งให้สร้าง กราฟเส้นอนุกรมเวลา ที่คล้ายต้นฉบับ
- กระบวนการ:
- ผลลัพธ์รอบแรกยังมี เส้นเชื่อมตรงและป้ายกำกับซ้อนกัน ซึ่งดู หยาบทางภาพ
- เมื่อสั่งให้ใช้ ค่าเฉลี่ยเคลื่อนที่จากการสำรวจ 6 ครั้ง ก็ช่วย ปรับปรุงเส้นแนวโน้ม
- เมื่อระบุให้ใช้ “curve interpolation แทนเส้นตรง” ก็เรนเดอร์เป็น เส้นโค้งที่ลื่นขึ้น และการซ้อนของชื่อกราฟก็แก้ได้ด้วยคำสั่งเพิ่ม
- ข้อสังเกต: หากใช้ทั้ง พรอมป์ต์ที่เป็นมิตรกับโมเดล และ การจูนพารามิเตอร์ของการทำภาพ ควบคู่กัน ก็สามารถได้ ประสิทธิภาพระดับใกล้เคียง ChatGPT
ความปลอดภัยและความเสี่ยงจาก prompt injection
- การเข้าถึงอินเทอร์เน็ต ทำให้มีความเสี่ยงต่อ การโจมตีแบบ prompt injection
- คำสั่งที่เป็นอันตรายอาจถูกแทรกผ่านไฟล์หรือเว็บไซต์ได้
- ตัวอย่าง: การรันโค้ดที่ไม่น่าเชื่อถือ, การรั่วไหลของข้อมูลสำคัญ
- Anthropic ได้ทำ red teaming และการทดสอบความปลอดภัย พร้อมแนะนำให้ผู้ใช้เฝ้าระวัง
- การอนุญาต GitHub เพิ่มความกังวลเรื่องเวกเตอร์การขโมยข้อมูล
- คำแนะนำ: ระมัดระวังเมื่อใช้ข้อมูลอ่อนไหว และหากพบการเข้าถึงข้อมูลที่ไม่คาดคิดให้หยุดใช้งานทันที
การประเมินด้านการใช้งานและคุณภาพ
- Claude Code Interpreter มอบความสามารถที่ เหนือกว่า ChatGPT Code Interpreter
- ข้อดี
- อนุญาตติดตั้งจาก PyPI + รองรับ Node ทำให้ การขยายระบบนิเวศของเครื่องมือ ทำได้ดี
- สามารถทำ การสร้างไฟล์, การแปลงฟอร์แมต, และการทำภาพข้อมูล เป็น interactive pipeline ได้ในครั้งเดียว
- ข้อจำกัด
- ข้อจำกัดไฟล์ 30MB เป็นอุปสรรคต่อ การอัปโหลดชุดข้อมูลหรือฐานข้อมูลขนาดใหญ่
- งานทำภาพบางประเภทอาจต้อง วนพรอมป์ต์เพิ่ม เพื่อ ปรับละเอียด
- คุณค่า: Code Interpreter เป็นหนึ่งใน ความสามารถที่มีประโยชน์ที่สุด ของ LLM และการอัปเกรดของ Claude ก็ยิ่งเพิ่มความคาดหวัง
ปัญหาการตั้งชื่อและการสื่อสาร
- Anthropic: จากชื่อ Analysis tool ในอดีต มาสู่ “Upgraded file creation and analysis” ที่ ชวนสับสนยิ่งกว่าเดิม และยัง ซ่อนความสามารถด้านการรันโค้ด ไว้ในเอกสารเปิดตัว
- OpenAI: ก็เคยมีกรณี ชื่อสลับไปมาระหว่าง Code Interpreter ↔ Advanced Data Analysis และ หน้า landing page อย่างเป็นทางการก็ยังมองเห็นได้ยาก
- บทสรุป: ทั้งอุตสาหกรรมยัง ล้มเหลวอย่างต่อเนื่อง ในการสื่อสาร คุณค่าหลักของการสร้างและวิเคราะห์ไฟล์แบบรันโค้ดได้ และจำเป็นต้อง ปรับปรุงคำศัพท์และคู่มือ เพื่อให้ผู้ใช้เข้าใจและเชื่อมั่นได้ดีขึ้น
ยังไม่มีความคิดเห็น