1 คะแนน โดย GN⁺ 3 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Chipotlai Max เป็นเอเจนต์เขียนโค้ด AI สายมีมที่ fork มาจาก OpenCode และตั้งค่าแชตบอตซัพพอร์ตลูกค้าของ Chipotle อย่าง Pepper AI ให้เป็นโมเดลเริ่มต้น
  • Pepper กลายเป็นไวรัลในช่วงวันที่ 12~13 มีนาคม 2026 จากการแก้โจทย์ LeetCode, เขียน Python และกลับลิงก์ลิสต์ได้ โดยทำงานบนพื้นฐานของ IPsoft Amelia
  • @Gonzih ได้รีเวิร์สเอนจิเนียร์แบ็กเอนด์ WebSocket/SockJS + STOMP ของ Amelia และเผยแพร่ พร็อกซีที่เข้ากันได้กับ OpenAI ซึ่งให้บริการ http://localhost:3000/v1 แบบรันในเครื่อง
  • โปรเจ็กต์นี้ตั้งต้นจากพร็อกซีดังกล่าว โดยพรีเซ็ตผู้ให้บริการ chipotle-pepper, โมเดล pepper-1 และ Base URL http://localhost:3000/v1 เอาไว้แล้ว
  • ระบุว่า API key ใช้ค่าอะไรก็ได้ เช่น burrito-2026 และแสดงค่าใช้จ่ายเป็น $0.00
  • วิธีรันคือใช้ git clone --recursive, bun install, ./start-chipotlai.sh เพื่อเริ่มทั้งพร็อกซีและ CLI พร้อมกัน หรือจะรันพร็อกซีกับ Chipotlai Max แยกกันคนละเทอร์มินัลก็ได้
  • ข้อจำกัดในการใช้งาน มีมาก: เพราะเป็นการรีเวิร์สเอนจิเนียร์บอตซัพพอร์ตโปรดักชันของ Chipotle จึงอาจละเมิด TOS และถ้า Chipotle แพตช์เมื่อไร พร็อกซีก็อาจพังได้ทุกเมื่อ
  • มีข้อจำกัดแบบอิงเซสชันนิรนาม และระบุ MAX_POOL_SIZE=5 ไว้ชัดเจน พร้อมเตือนไม่ให้ใช้กับโค้ดเบสโปรดักชัน
  • ส่วนการมีส่วนร่วมตั้งสมมติฐานว่า Chipotle Pepper ถูกแพตช์ไปแล้วในเดือนมีนาคม 2026 และกำลังมองหาพร็อกซีผู้ให้บริการแชตบอตของบริษัทอื่น เช่น Home Depot, Lowe’s, Target, Starbucks, Walmart และ McDonald’s
  • ขั้นตอนการเพิ่มผู้ให้บริการใหม่คือหาแชตบอตของบริษัท, รีเวิร์สเอนจิเนียร์ WebSocket หรือ REST API, สร้างพร็อกซี /v1/chat/completions ที่เข้ากันได้กับ OpenAI แล้วส่ง PR ไปที่ packages/opencode/src/provider/
  • ไลเซนส์เป็น MIT ที่สืบทอดมาจาก OpenCode และระบุชัดว่าไม่ได้เป็นพันธมิตรกับ Chipotle

1 ความคิดเห็น

 
GN⁺ 3 시간 전
ความเห็นบน Hacker News
  • ผมไม่ใช่ทนาย แต่กังวลว่านี่ดูเหมือนกำลังก้าวเข้าไปในเขตของ CFAA ในสหรัฐฯ ถ้าข้ามเส้นผิดที่ กฎหมายก็เปิดทางให้ลงโทษหนักได้
    อะไรอย่าง yt-dlp ยังพอป้องกันได้ว่าเป็นการดาวน์โหลดข้อมูลสาธารณะและเป็นแค่การทำให้การใช้งานบริการเป็นอัตโนมัติ แต่กรณีนี้เหมือนเป็นการยึดทรัพยากรเครื่องระยะไกลมาใช้คำนวณให้ตัวเองในแบบที่ผู้ให้บริการไม่ได้ตั้งใจไว้
    ไม่รู้เหมือนกันว่าในเชิงจริยธรรมจะมองยังไง แต่ผมคงไม่อยากไปเถียงในศาลอาญาว่านี่ไม่ใช่ “การแฮ็ก” ในความหมายด้านลบ

    • แถมยังสงสัยด้วยว่า “การแฮ็ก” นี้ใช้งานได้จริงหรือเปล่า ตอนที่ภาพหน้าจอซึ่งแชตบอตของ Chipotle ทำ การกลับลิงก์ลิสต์ กลายเป็นไวรัล ผมลองทำตามทันทีแต่ไม่ได้ผลเหมือนกัน และคนอื่นที่โพสต์ออนไลน์ก็เจอแบบเดียวกัน เลยคิดมาตลอดว่าน่าจะเป็นภาพหน้าจอที่จัดฉาก
    • ถ้าคิดว่า CFAA แย่แล้ว กฎหมายระดับรัฐบางแห่งมีเวอร์ชันที่โหดกว่าอีก โดยเฉพาะฉบับของรัฐอิลลินอยส์ที่ถึงขั้นทำให้ การละเมิดข้อกำหนดการใช้งาน เป็นอาชญากรรม
    • ถ้าจำไม่ผิด ถ้อยคำหลักคือ “การใช้ทรัพยากรคอมพิวเตอร์ในทางที่ผิด” แต่ก็ IANAL
      ถึงอย่างนั้นก็ต้องยกนิ้วให้ความสร้างสรรค์
    • เรื่องนี้ไม่น่าจะจบแค่คำเตือน คนทำเหมือนคาดไว้แค่ หนังสือบอกให้ยุติการกระทำ (C&D) แต่ถ้าอัยการรัฐบาลกลางที่ไฟแรงอยากยกเป็นคดีตัวอย่าง ก็มีสิทธิ์ถึงขั้นติดคุกจริงได้
  • ผมคิดมาตลอดว่าการยัดอะไรเข้าไปในหน้าต่างบริบทของ LLM มากเกินไปก็เหมือน ใส่ไส้เบอร์ริโตมากเกินไป พอยัดต่อไปเรื่อย ๆ สุดท้ายแผ่นตอร์ติญาก็รับไม่ไหว แล้วของที่ใส่ทีหลังก็ค่อย ๆ รั่วไหลออกทางด้านล่างอย่างเงียบ ๆ
    ยังไงก็ตาม เอเจนต์ตัวนี้ก็ดูมีเสถียรภาพเชิงโครงสร้างพอ ๆ กับเบอร์ริโตอ้วน ๆ ที่ยกด้วยการจับแค่มุมเดียว :)

    • มอนาดแบบไม่กำหนดแน่ชัดที่มีหน่วยความจำจำกัด ก็เหมือนเบอร์ริโตที่รั่ว
  • ผมก็เคยคิดอยู่ว่าจะทำแบบนี้กับที่อย่าง https://chatjimmy.ai/ ได้ไหม โมเดลพื้นฐานมีแค่ Llama 3 8B แต่ก็อยากรู้ว่าชุดโค้ดดิ้งฮาร์เนสที่ 17k tok/s จะให้ความรู้สึกยังไง

    • ถ้าเป็น macOS ก็ลองใช้ LLM ที่มีมาในระบบได้ ขนาดน่าจะใกล้ ๆ กัน มีโปรเจกต์ชื่อ Apfel ที่ห่อมันเป็น CLI
      อีกอย่างใน Chrome มีเว็บ API ชื่อ Prompt API ที่ให้ใช้ Gemini Nano แบบออฟไลน์ได้ และรับได้ทั้งข้อความกับภาพเป็นอินพุต อันนี้ก็เล็กเหมือนกัน
      ผมเคยรวมของพวกนี้ไว้ในเวิร์กโฟลว์ที่ต้องการการอนุมานเล็กน้อยแต่ไม่ถึงกับเป็นศูนย์ ระหว่างขั้นตอนที่กำหนดแน่นอนทั้งหมด
    • ผมเคยลองสร้างฮาร์เนสให้เข้ากับข้อจำกัดนั้นเพื่อพิสูจน์ความเป็นไปได้จริง แต่สุดท้ายก็สรุปว่าไม่ไหว เพราะเป็นการรวมกันของ หน้าต่างบริบทเล็ก, ไม่มีการเรียกใช้เครื่องมือ, และโมเดลขนาดเล็ก
      ถ้าคุณหาทางได้ ผมอยากฟังมาก
    • เมื่อก่อนผมเคยเพิ่มมันเข้าไปในคอนฟิก oh-my-pi ของตัวเอง มันเข้ากันได้กับ OpenAI เลยต่อใช้งานไม่ยาก แต่ Llama 3 8B นี่ใช้กับงานโค้ดจริง ๆ ไม่ไหวเลย
      อย่างไรก็ตาม มันเร็วมากและ latency ก็ดีมาก
    • ผมลองใช้เว็บนั้นแล้วแต่หาไม่เจอว่าแท้จริงมันคืออะไร มันคืออะไรกันแน่?
    • ใน Codex มีโมเดล -spark ที่รันบน Cerebras ไม่ถึง 17k tok/s แต่ก็ยังเร็วมาก น่าลองดู
  • แค่ใส่ คำสั่งให้คงอยู่รอด ไว้ใน AI แล้วให้มันทำเรื่องพวกนี้เอง เช่น ให้มันสลับโมเดลโดยอัตโนมัติเพื่อเอาตัวรอด
    มันก็แค่เกาะแหล่งโทเคนไหนก็ได้ที่หาเจอในธรรมชาติแล้วอยู่ต่อไป ถ้าเป็นเอเจนต์ ก็น่าจะเก็บเกี่ยวโทเคนของตัวเองได้จากแชตซัพพอร์ตมากมาย, ฟรีทรायल, คีย์ที่รั่ว, หรือช่องทางสร้างโทเคนที่ยังกันด้วยแคปช่าไม่แน่นพอ
    ปล่อยให้มันออกหาแหล่งโทเคนทั้งคืน แล้วกลางวันก็ให้เราใช้ฟรี

    • ถ้าอยากทำแบบนี้อย่างถูกกฎหมายจริง ๆ บน OpenRouter มีผู้ให้บริการโมเดลฟรีหลายราย แค่คุณจ่ายต้นทุนด้วยการยอมให้ข้อมูลนั้นถูกนำไปใช้ฝึก
  • ถ้าปรับทิศทางเรื่องนี้ไปสู่การให้ การเข้าถึง AI แก่ชุมชนชายขอบ เยาวชน และคนไร้บ้าน ก็อาจช่วยสร้างบรรยากาศที่เป็นมิตรในศาลได้ ขอให้โชคดี

    • กำลังเปลี่ยนโลกด้วย Fortune 500 AI Support Bot Multiplexer Broker Models
  • ทำให้นึกถึงตอนที่เคยใช้แชตบอต AI ของ Amazon.com ให้เขียนอะไรอย่าง fizzbuzz ตอนนั้นมันชื่อ Rufus และภายหลังก็เปลี่ยนชื่อเป็น Alexa สำหรับการช็อปปิ้ง ตอนนี้ดูเหมือนจะถูกแพตช์ให้ปฏิเสธแล้ว

    • เข้ามาจะพูดเรื่องเดียวกันเลย ผมไม่ได้ลองมาหลายเดือนแล้ว แต่ Rufus ในแอปช็อปปิ้งของ Amazon เคยพ่นโค้ด Python ออกมาได้จริง แค่ต้องใช้ภาษาอังกฤษแทนภาษาท้องถิ่น
  • ผมจำได้ว่าเคยถามคำถามคณิตศาสตร์กับโปรแกรมมิงกับ Rufus ซึ่งเป็น “ผู้ช่วยช็อปปิ้ง” รุ่นเก่าของ Amazon แล้วสำเร็จ มันใช้งานได้ แต่คุณภาพแย่มากจนไม่คุ้มจะเสียเวลา

  • ไม่เข้าใจว่าทำไมบริษัทยังไม่แพตช์เรื่องนี้ ทั้งที่มันถูกเปิดเผยต่อสาธารณะมานานแล้วไม่ใช่เหรอ?

  • ผมเคยกด ปุ่ม Gemini ตอนขับรถทั้งที่รู้ทางอยู่แล้ว แค่อยากดูว่ามันทำอะไรได้บ้าง สุดท้ายผมก็ทำให้มันเขียนฟังก์ชัน Rust สำหรับคำนวณจำนวนเฉพาะ และยังสั่งให้อ่านทั้งฟังก์ชันนั้นทีละบรรทัดได้ด้วย
    การเล่นกับระบบแบบนี้มันสนุกดี

    • หมายถึง Gemini บนมือถือใช่ไหม?
      ถ้าใช่ มันก็ถูกออกแบบมาให้ทำแบบนั้นอยู่แล้ว และถือว่าค่อนข้างดีเมื่อเทียบกับ LLM สำหรับเขียนโค้ดที่มีอยู่ตอนนี้
  • สงสัยว่าทำไมไม่ใช้ Playwright กับ Google AI Mode หรือเฮดเดอร์ค้นหา AI ของ Google