สำรวจ GPTs: ChatGPT ในเสื้อเทรนช์โค้ต?

(simonwillison.net)

1 คะแนน โดย GN⁺ 2023-11-16 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

วิธีประกอบ GPT

GPT คือชุดการตั้งค่าที่มีชื่อของ ChatGPT ซึ่งประกอบด้วยชื่อ โลโก้ และคำอธิบายสั้น ๆ
มีคำสั่งแบบกำหนดเองที่ใช้กำกับพฤติกรรมของ GPT ซึ่งเทียบเท่ากับ "system prompt"
สามารถใส่ตัวอย่างพรอมป์ต์ได้สูงสุด 4 รายการแบบไม่บังคับ เพื่อใช้เริ่มต้นการสนทนา
สามารถอัปโหลดไฟล์หลายไฟล์เพื่อให้บริบทเพิ่มเติมและช่วยในการสร้างคำตอบ
สามารถเปิดหรือปิด Code Interpreter, โหมด Browse และ DALL-E 3 ได้
สามารถตั้งค่า "Actions" แบบไม่บังคับ ซึ่งเป็น API endpoints ที่ GPT เรียกใช้งานได้

วิธีการทำงานของ GPT Builder

GPT Builder เป็นแชตบอตที่สร้าง GPT ให้โดยอัตโนมัติผ่านการสนทนากับผู้ใช้
แท็บ "Create" ช่วยให้ผู้ใช้สร้าง GPT ผ่านการสนทนา แต่ในทางปฏิบัติแล้วมันคือการกรอกฟอร์ม "Configure" ให้อัตโนมัติ
หลายคนแนะนำให้หลีกเลี่ยงแท็บ "Create" หลังจากสร้าง GPT ตัวแรกแล้ว

ตัวอย่าง GPT ที่น่าสนใจ

Dejargonizer: GPT ที่ช่วยตีความศัพท์เฉพาะ โดยวิเคราะห์ข้อความและอธิบายความหมายของคำศัพท์เทคนิค
JavaScript Code Interpreter: GPT ที่สามารถรันโค้ด JavaScript ได้ โดยใช้งานผ่าน Deno runtime ที่แนบเข้าไป
Dependency Chat: วิเคราะห์เอกสาร dependency ของโปรเจ็กต์บน GitHub และตอบคำถามที่เกี่ยวข้อง
Add a walrus: GPT ที่เพิ่มวอลรัสลงในภาพ โดยใช้ GPT-Vision และ DALL-E
Animal Chefs: GPT ที่เชฟสัตว์จะเล่าเรื่องส่วนตัวควบคู่กับการให้สูตรอาหาร
Talk to the datasette.io database: GPT ที่ตอบคำถามด้วยการรัน SQL queries
Just GPT-4: GPT ที่ปิดฟีเจอร์เสริมทั้งหมดและมอบประสบการณ์ GPT-4 แบบล้วน ๆ

ความสามารถด้านความรู้ของ GPT

เมื่อแนบไฟล์ให้ GPT มันจะพยายามใช้ไฟล์นั้นเพื่อตอบคำถาม
ดูเหมือนจะเป็นการใช้งาน Retrieval Augmented Generation (RAG)
OpenAI ไม่ได้เปิดเผยข้อมูลเชิงลึกเกี่ยวกับฟีเจอร์นี้มากนัก ทำให้ผู้ใช้ใช้งานได้อย่างมีประสิทธิภาพค่อนข้างยาก

โมเดลการชำระเงินของ GPT

GPT ใช้ได้เฉพาะกับผู้สมัครสมาชิก ChatGPT Plus ราคา $20/เดือน เท่านั้น จึงมีข้อจำกัดด้านการเผยแพร่
ผู้ใช้สามารถเผยแพร่โปรเจ็กต์ที่สร้างบนแพลตฟอร์ม OpenAI ได้โดยไม่ต้องให้ผู้ใช้ปลายทางใส่ API key ของตนเอง

ความสำคัญของความปลอดภัยของพรอมป์ต์และการเปิดเผย

หากผู้ใช้พยายามมากพอ เอกสารและพรอมป์ต์ที่เพิ่มไว้ใน GPT อาจรั่วไหลได้
ควรตั้งสมมติฐานไว้ก่อนว่าพรอมป์ต์จะรั่ว และอาจเลือกเปิดเผยไปเลยจะดีกว่า

ความคาดหวังต่อ GPT ในอนาคต

คาดหวังการปรับปรุง เช่น เอกสารที่ดีกว่าสำหรับฟีเจอร์ความรู้ การเข้าถึงผ่าน API วิธีให้บริการ GPT แก่ผู้ที่ไม่ได้สมัครสมาชิก และการตั้งขีดจำกัดงบประมาณ

ความเห็นของ GN⁺

ประเด็นสำคัญที่สุดของบทความนี้คือการสำรวจฟีเจอร์ใหม่และความเป็นไปได้ของ GPTs ซึ่งเป็นหัวข้อที่น่าสนใจสำหรับผู้ที่ทำงานด้านวิศวกรรมซอฟต์แวร์และปัญญาประดิษฐ์ ความสามารถในการสร้าง GPT ของตนเองและให้ผู้ใช้อื่นมามีปฏิสัมพันธ์ได้ เปิดทางสู่แนวทางใหม่ในการสร้างอินเทอร์เฟซการสนทนาแบบปรับแต่งได้ นอกจากนี้ยังแสดงให้เห็นศักยภาพในการยกระดับประสบการณ์ผู้ใช้ผ่านการผสานความสามารถหลากหลาย เช่น การรันโค้ด การค้นหาเอกสาร และการสร้างภาพ

1 ความคิดเห็น

GN⁺ 2023-11-16

ความคิดเห็นจาก Hacker News

ในฐานะผู้ใช้ GPT ฉันตระหนักว่าถ้ามองไม่เห็นพรอมป์ต์ ฉันก็ไม่อยากใช้ GPT ไม่ต้องการใช้ ChatGPT ที่คนแปลกหน้าสามารถฝังพฤติกรรมแปลก ๆ เข้าไปได้โดยที่ฉันไม่รู้
- อยากให้ OpenAI เพิ่มตัวเลือก "ดูซอร์ส" ให้กับ GPT คิดว่าควรเปิดเป็นค่าเริ่มต้น แต่ก็พอจะนึกออกว่านี่อาจเป็นการตัดสินใจที่ไม่เป็นที่นิยม
มีแนวโน้มจะหลีกเลี่ยงแชตบอตที่อิงกับ GPT ไม่อยากถูกชักจูงอย่างแนบเนียนตามคำสั่งเฉพาะที่ฉันไม่รู้
- การเพิ่มตัวเลือก "ดูซอร์ส" จะเปลี่ยนฟีเจอร์นี้จาก "ไม่ค่อยน่าสนใจ" เป็น "คุ้มค่าพอที่จะจ่ายเงิน"
- ตอนนี้ใช้เวลาเกือบทั้งหมดกับ Kagi เลยกำลังคิดจะยกเลิก GPT Plus แต่การเปลี่ยนแปลงแบบนี้จะทำให้ฉันยอมคงการสมัครต่อ
วิธีที่ฉันได้รู้จักฟีเจอร์ใหม่ของ OpenAI:
1. กวาดตาดูพาดหัวบน Twitter ที่ประกาศของใหม่กันแบบเอิกเกริก
2. ได้รับทวีตจำนวนท่วมท้นจากอินฟลูเอนเซอร์บน Twitter เกี่ยวกับเรื่องนั้น
3. เมินมันไปและรอจนกว่า simonw จะอธิบาย
4. อ่านบล็อกโพสต์ที่ simonw ได้ลองทดสอบฟีเจอร์นั้นไปแล้วหลายแบบ พร้อมเขียนคำอธิบายและบทวิจารณ์ที่ชัดเจน ทุกอย่างเข้าใจได้ทันที
การบอกว่า "มันก็แค่ ChatGPT ที่มี pre-prompt" นั้นเป็นเรื่องจริง
- การบอกว่า "มันก็แค่ Custom Instructions ที่มี UI ดี ๆ" ก็จริงเหมือนกัน
- แต่อย่าประเมินผลกระทบที่เปลี่ยนโลกของ "UI ที่ดี" ต่ำเกินไป GPT-3 ใช้งานได้มาหลายปีแล้ว แต่แทบไม่มีใครรู้จักหรือสนใจ จนกระทั่งมีการทำ UI ที่ดีขึ้น
- มันดูเหมือนเป็นแค่ "การปรับจูนเล็กน้อย" ในด้าน usability แต่ให้ผลกระทบระดับ "ก้าวกระโดดเชิงควอนตัม" แบบเดียวกัน
มีคนถามความคิดเห็นเกี่ยวกับ GPT/AI กับฉันบ่อย ๆ ฉันก็ถามกลับว่าเคยใช้ไหม "ไม่" "รู้ไหมว่ามันใช้ฟรี" "รู้" ท่าทีแบบนี้เข้าใจยาก กลัวสิ่งที่ไม่รู้จักหรือ? ขี้เกียจหรือ? หรือต้องการ social proof ก่อนจะลองอะไรสักอย่าง?
ถึงจะมองไม่เห็นพรอมป์ต์ของ OpenAI และอาจรวมถึงผู้สร้างเองก็มองไม่เห็น แต่ฉันก็ยังอยากใช้ GPT ของ OpenAI
- มันต้องอาศัยการกระโดดข้ามเรื่องความเชื่อใจพอสมควร สงสัยว่า OpenAI มีโรดแมปที่เป็นรูปธรรมเกี่ยวกับความน่าเชื่อถือหรือความสม่ำเสมอหรือไม่
มีพรอมป์ต์ทั้งหมดของ Custom GPT Builder อยู่: [มีลิงก์ GitHub ให้]
อยากขอบคุณ simonw ที่คอยบันทึกและอธิบายทุกอย่างแบบเรียลไทม์ และทำเครื่องมือที่เข้าใจง่ายและเข้าถึงง่ายอย่าง llm บน command line เป็นต้น
- ก่อนหน้านี้คิดว่า Search API ทำพลาดเพราะไม่ให้ citation ที่เหมาะสม แต่ก็ดีที่รู้ว่าไม่ได้เป็นอยู่คนเดียว
อยากรู้เพิ่มว่า openAI ทำฟีเจอร์ RAG แบบ "ฐานความรู้" อย่างไร แต่รายละเอียดมีน้อยเกินไป
- ฉันอัปโหลดข้อความทั้งหมดจาก grugbrain.dev และคุยกับ grug brain ที่สมเหตุสมผลมากได้: [มีลิงก์แชต OpenAI ให้]
ช่วงนี้กำลังทำ "synbiogpt" อยู่ และทำให้ตระหนักถึงข้อจำกัดของ custom GPT
- ข้อมูลลำดับชีวภาพมักยาวมาก ข้อมูลในไฟล์ยังพอไหว แต่ถ้าต้องโต้ตอบกับ API เพื่อใช้ฟังก์ชันขั้นสูง เช่น codon optimization ก็ต้องส่งข้อมูลนี้ผ่านเครือข่าย สุดท้าย context window ของการเรียก API ก็เต็มไปด้วยข้อมูลลำดับจนล้มเหลว
- ไม่สามารถ inject dependency ได้ บางครั้ง GPT พยายามเขียน implementation เอง แต่ก็มักผิด
- ถ้า GPT-4 คิดว่ามันรู้ว่ากำลังพูดถึงอะไร Search API ก็มักจะเปิดไฟล์ไม่ถูก ตอนคุยเรื่องส่วนของยีน ฉันอยากเจาะจงมาก ๆ ว่าหมายถึงส่วนเฉพาะในไลบรารีของฉัน ไม่ใช่ส่วนที่ GPT-4 คิดเอาเอง
- ฉันแก้ปัญหาไปได้เกือบทั้งหมดด้วยการสร้างสภาพแวดล้อมสำหรับสคริปต์ lua เอง (ฟังก์ชันด้านชีววิทยาอยู่ใน golang และใช้ gopher-lua เพื่อรันสภาพแวดล้อม lua) แล้ว inject ตัวอย่าง lua สำหรับวิธีใช้ความสามารถด้านสคริปต์ พร้อมกับไลบรารีชิ้นส่วนยีนขนาดเล็กที่มีอยู่ตอนนี้ จากนั้นขอให้มันสร้าง lua เพื่อทำงานเฉพาะอย่างกับไฟล์ที่ให้มา GPT-4 ไม่ได้ดูไฟล์เลย และแอป golang ภายในของฉันเป็นคนรัน lua ที่ถูกสคริปต์ไว้ วิธีนี้เวิร์กมากและเร็วกว่า custom GPT มาก
- ตอนนี้ปัญหาใหญ่ที่สุดคือฝั่งฟรอนต์เอนด์ อยากได้ ChatGPT clone แบบโอเพนซอร์สที่ดึงไฟล์แนบออกมาได้และแก้ไขข้อความนำเข้าตอนแรกของผู้ใช้ได้ แต่จนถึงตอนนี้ยังไม่เจอตัวเลือกที่ดี
เกี่ยวกับวิธีใช้ RAG เพื่อให้ได้ผลลัพธ์ที่ดีขึ้น
- ฉันประสบความสำเร็จกับเรื่องนี้อยู่บ้าง
- ฉันใช้ Assistant API ซึ่งเชื่อว่าไม่เหมือน GPT และได้ลองใช้ผ่านเว็บอินเทอร์เฟซ
- ฉันมีไฟล์ PDF มากกว่า 100 ไฟล์ที่ผ่าน OCR ด้วย Tesseract จากนั้นให้ ChatGPT เขียนสคริปต์เพื่อรวมทุกไฟล์เป็นไฟล์ txt เดียวโดยคงเลย์เอาต์ไว้
- จากนั้นอัปโหลดไฟล์และเริ่มถามคำถาม ไฟล์เหล่านี้มีข้อมูลเชิงเทคนิคมากเกี่ยวกับข้อบังคับด้านสถาปัตยกรรมที่ไม่ใช่ภาษาอังกฤษ ดังนั้นโมเดลอาจไม่คุ้นกับภาษาประเภทนั้น
- ถึงอย่างนั้นผลลัพธ์ก็ดีน่าทึ่ง มันตอบคำถามได้และคำตอบก็ดี ควรมีการใส่ annotation ว่าคำตอบมาจากไหน แต่สิ่งนี้ทำงานไม่ค่อยถูกต้อง
- ลองอัปโหลดทั้ง PDF, ไฟล์ JSON, CSV ฯลฯ มาแล้ว จนถึงตอนนี้ข้อความดิบยังทำงานได้ดีที่สุด
บันทึกเกี่ยวกับฟีเจอร์ RAG แบบ "ความรู้" น่าสนใจ
- จากบทสนทนาและประสบการณ์ ผู้คนพบว่าการดึงข้อมูลแบบ RAG มีความเฉพาะเจาะจงต่อธุรกิจและโมเดลข้อมูลมาก ไม่มีวิธีแก้แบบใช้ได้กับทุกกรณี ขั้นตอนถัดไปของลูกค้าใน CMS ไม่เหมือนกับการสร้าง SQL จากสคีมา และก็ไม่เหมือนกับการเลือกซื้อจากแค็ตตาล็อกอีคอมเมิร์ซ
- โดยพื้นฐานแล้วมันเป็นปัญหาด้าน search และในความเป็นจริงยากยิ่งกว่านั้น ปัญหาประเภทนี้ขึ้นชื่อว่ายากมาก