• บทรีวิวโดย Simon Willison ที่เจาะลักษณะของฟีเจอร์นี้ในฐานะ เครื่องมือวิเคราะห์แบบรันโค้ดได้ จากการใช้งานจริงของฟีเจอร์ “Upgraded file creation and analysis” ของ Anthropic
  • ฟีเจอร์ใหม่นี้รองรับ การรันโค้ด Python และ Node.js บนคอนเทนเนอร์ฝั่งเซิร์ฟเวอร์ รวมถึงการสร้างและแก้ไขไฟล์ ซึ่งมีการทำงานต่างจาก ‘Analysis tool’ แบบเดิมที่ใช้ JS ในเบราว์เซอร์ อย่างสิ้นเชิง
  • คอนเทนเนอร์มี Ubuntu 24.04.2, Python 3.12.3, Node v18.19.1, RAM ราว 9GB / ดิสก์ 5GB พร้อมจุดเด่นคือ เครือข่ายแบบ whitelist ผ่าน Envoy proxy และ อนุญาตให้ติดตั้งแพ็กเกจจาก PyPI
  • การทดสอบจริงทำทั้ง การสร้าง PDF ของไดอะแกรมสคีมา SQLite และ การสร้างกราฟอัตราการนำ AI ไปใช้ของ Apollo ขึ้นมาใหม่ โดยสามารถยกระดับคุณภาพผลลัพธ์ได้ผ่าน การออกแบบพรอมป์ต์และการปรับแต่งภาพ
  • การเข้าถึงอินเทอร์เน็ตบางส่วนมี ความเสี่ยงด้าน prompt injection และข้อมูลรั่วไหล จึงจำเป็นต้องมี การเฝ้าระวังจากผู้ใช้ ขณะเดียวกัน การตั้งชื่อและการอธิบายฟีเจอร์ที่ล้มเหลว ก็ยังเป็นโจทย์ของทั้งอุตสาหกรรม

ภาพรวมฟีเจอร์

  • Anthropic ประกาศว่า Claude รองรับความสามารถด้าน การสร้างและแก้ไขไฟล์
    • สร้าง สเปรดชีต Excel, เอกสาร Word, สไลด์ PowerPoint, และ PDF ได้จาก Claude.ai และแอปเดสก์ท็อป
    • ผู้ใช้สามารถอัปโหลดข้อมูลหรืออธิบายความต้องการเพื่อรับ ไฟล์ที่พร้อมใช้งานได้ทันที
  • เปิดให้ใช้งานแบบพรีวิวสำหรับผู้ใช้ แพ็กเกจ Max, Team และ Enterprise ส่วน แพ็กเกจ Pro จะรองรับภายในไม่กี่สัปดาห์
  • ความสามารถหลัก:
    • การวิเคราะห์ข้อมูล: ทำความสะอาดข้อมูลดิบและให้ การวิเคราะห์เชิงสถิติ, กราฟ และอินไซต์สำคัญ
    • การสร้างสเปรดชีต: สร้าง โมเดลการเงิน, ตัวติดตามโปรเจ็กต์, เทมเพลตงบประมาณ ฯลฯ พร้อมสูตร
    • งานข้ามฟอร์แมต: แปลง PDF เป็น PowerPoint, จัดระเบียบบันทึกการประชุมเป็นเอกสาร ฯลฯ
  • ผู้เขียน Simon Willison มองว่านี่คือฟีเจอร์ที่มาเทียบกับ ChatGPT Code Interpreter และประเมินว่าชื่อทางการ “Upgraded file creation and analysis” เป็น การตั้งชื่อที่ไม่เหมาะสม
  • ความแตกต่างจากฟีเจอร์เดิม
    • Analysis tool เมื่อเดือนตุลาคม 2024: เป็นเครื่องมือวิเคราะห์น้ำหนักเบาที่ รัน JS ในเบราว์เซอร์ของผู้ใช้
    • ฟีเจอร์ใหม่ในเดือนกันยายน 2025: เป็น Code Interpreter เต็มรูปแบบ ที่รัน คำสั่งเชลล์, Python และ Node.js รวมถึง อ่านและสร้างไฟล์ บน คอนเทนเนอร์ฝั่งเซิร์ฟเวอร์
    • คล้ายกับ Code execution tool ใน API ของบริษัทเดียวกัน แต่ครั้งนี้เป็นครั้งแรกที่ ผู้ใช้ปลายทาง สามารถรัน โค้ดตามอำเภอใจ บนคอนเทนเนอร์ฝั่งเซิร์ฟเวอร์ได้

คุณสมบัติของ Code Interpreter ใหม่

  • Code Interpreter ของ Claude มีลักษณะคล้ายกับ ChatGPT Code Interpreter
  • สามารถติดตั้งแพ็กเกจ Python จาก PyPI ได้ (เช่น pip install sqlite-utils)
    • มี Node.js v18.19.1 ติดตั้งมาให้ล่วงหน้า และใช้แพ็กเกจ global ของ npm ได้
  • รายละเอียดสภาพแวดล้อม:
    • OS: Ubuntu 24.04.2 LTS, Linux kernel 4.4.0
    • สถาปัตยกรรม: x86_64, เชลล์: GNU Bash 5.2.21
    • Python: 3.12.3, pip: 24.0
    • ดิสก์: 4.9GB (ใช้ได้ 4.6GB), RAM: 9.0GB
  • ข้อจำกัด: อัปโหลด/ดาวน์โหลดไฟล์ได้ 30MB ซึ่งถือว่า จำกัดกว่า 512MB ของ ChatGPT
    • การเข้าถึงอินเทอร์เน็ต: ใช้ strict whitelist ภายใต้ Envoy proxy
    • การ curl ไปยังเว็บไซต์ทั่วไป (เช่น google.com) จะได้ข้อผิดพลาด 403 Forbidden
    • โดเมนที่อนุญาต: api.anthropic.com, github.com, registry.npmjs.org / npmjs.com, pypi.org / files.pythonhosted.org ฯลฯ ซึ่งเป็น whitelist ที่เน้นแพ็กเกจและการจัดการเวอร์ชัน
    • สามารถ ติดตั้งแพ็กเกจจาก PyPI เช่น pip install sqlite-utils ได้ และพร้อมใช้งาน Node runtime ทันที
    • เข้าถึงเนื้อหาเว็บบางส่วนได้ผ่านคอนเทนเนอร์ web_fetch และ web_search

การตั้งค่าและวิธีใช้งาน

  • การเปิดใช้งาน: เปิดสวิตช์ Upgraded file creation and analysis ที่ claude.ai/settings/features
    • ไม่สามารถเปิดพร้อมกับ Analysis Tool ได้ เพื่อหลีกเลี่ยงความสับสน
  • งานง่าย: SQLite → PDF ไดอะแกรมการ join

    • อินพุต: อัปโหลด ฐานข้อมูล SQLite ของเว็บไซต์ TIL (≈21.9MB) แล้วสั่งให้สร้าง PDF ไดอะแกรมการ join ของตาราง
    • ผลลัพธ์: สร้าง PDF/PNG ได้สำเร็จ แม้ ความอ่านง่ายของเส้นเชื่อม จะยังไม่ดีนัก แต่พบว่าสามารถปรับปรุงได้ด้วย การเสริมพรอมป์ต์
    • ความหมาย: เวิร์กโฟลว์มาตรฐานของ Code Interpreter ที่ วิเคราะห์ไฟล์ฐานข้อมูลที่อัปโหลดด้วย Python และ สร้างภาพ/PDF ทำงานได้อย่าง ลื่นไหล
  • งานยาก: สร้างกราฟอัตราการนำ AI ไปใช้ขึ้นมาใหม่

    • โจทย์: ป้อน สกรีนช็อต + XLSX แล้วสั่งให้สร้าง กราฟเส้นอนุกรมเวลา ที่คล้ายต้นฉบับ
    • กระบวนการ:
      • ผลลัพธ์รอบแรกยังมี เส้นเชื่อมตรงและป้ายกำกับซ้อนกัน ซึ่งดู หยาบทางภาพ
      • เมื่อสั่งให้ใช้ ค่าเฉลี่ยเคลื่อนที่จากการสำรวจ 6 ครั้ง ก็ช่วย ปรับปรุงเส้นแนวโน้ม
      • เมื่อระบุให้ใช้ “curve interpolation แทนเส้นตรง” ก็เรนเดอร์เป็น เส้นโค้งที่ลื่นขึ้น และการซ้อนของชื่อกราฟก็แก้ได้ด้วยคำสั่งเพิ่ม
    • ข้อสังเกต: หากใช้ทั้ง พรอมป์ต์ที่เป็นมิตรกับโมเดล และ การจูนพารามิเตอร์ของการทำภาพ ควบคู่กัน ก็สามารถได้ ประสิทธิภาพระดับใกล้เคียง ChatGPT

ความปลอดภัยและความเสี่ยงจาก prompt injection

  • การเข้าถึงอินเทอร์เน็ต ทำให้มีความเสี่ยงต่อ การโจมตีแบบ prompt injection
    • คำสั่งที่เป็นอันตรายอาจถูกแทรกผ่านไฟล์หรือเว็บไซต์ได้
    • ตัวอย่าง: การรันโค้ดที่ไม่น่าเชื่อถือ, การรั่วไหลของข้อมูลสำคัญ
  • Anthropic ได้ทำ red teaming และการทดสอบความปลอดภัย พร้อมแนะนำให้ผู้ใช้เฝ้าระวัง
    • การอนุญาต GitHub เพิ่มความกังวลเรื่องเวกเตอร์การขโมยข้อมูล
  • คำแนะนำ: ระมัดระวังเมื่อใช้ข้อมูลอ่อนไหว และหากพบการเข้าถึงข้อมูลที่ไม่คาดคิดให้หยุดใช้งานทันที

การประเมินด้านการใช้งานและคุณภาพ

  • Claude Code Interpreter มอบความสามารถที่ เหนือกว่า ChatGPT Code Interpreter
  • ข้อดี
    • อนุญาตติดตั้งจาก PyPI + รองรับ Node ทำให้ การขยายระบบนิเวศของเครื่องมือ ทำได้ดี
    • สามารถทำ การสร้างไฟล์, การแปลงฟอร์แมต, และการทำภาพข้อมูล เป็น interactive pipeline ได้ในครั้งเดียว
  • ข้อจำกัด
    • ข้อจำกัดไฟล์ 30MB เป็นอุปสรรคต่อ การอัปโหลดชุดข้อมูลหรือฐานข้อมูลขนาดใหญ่
    • งานทำภาพบางประเภทอาจต้อง วนพรอมป์ต์เพิ่ม เพื่อ ปรับละเอียด
  • คุณค่า: Code Interpreter เป็นหนึ่งใน ความสามารถที่มีประโยชน์ที่สุด ของ LLM และการอัปเกรดของ Claude ก็ยิ่งเพิ่มความคาดหวัง

ปัญหาการตั้งชื่อและการสื่อสาร

  • Anthropic: จากชื่อ Analysis tool ในอดีต มาสู่ “Upgraded file creation and analysis” ที่ ชวนสับสนยิ่งกว่าเดิม และยัง ซ่อนความสามารถด้านการรันโค้ด ไว้ในเอกสารเปิดตัว
  • OpenAI: ก็เคยมีกรณี ชื่อสลับไปมาระหว่าง Code Interpreter ↔ Advanced Data Analysis และ หน้า landing page อย่างเป็นทางการก็ยังมองเห็นได้ยาก
  • บทสรุป: ทั้งอุตสาหกรรมยัง ล้มเหลวอย่างต่อเนื่อง ในการสื่อสาร คุณค่าหลักของการสร้างและวิเคราะห์ไฟล์แบบรันโค้ดได้ และจำเป็นต้อง ปรับปรุงคำศัพท์และคู่มือ เพื่อให้ผู้ใช้เข้าใจและเชื่อมั่นได้ดีขึ้น

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น