1 คะแนน โดย GN⁺ 2023-11-16 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

วิธีประกอบ GPT

  • GPT คือชุดการตั้งค่าที่มีชื่อของ ChatGPT ซึ่งประกอบด้วยชื่อ โลโก้ และคำอธิบายสั้น ๆ
  • มีคำสั่งแบบกำหนดเองที่ใช้กำกับพฤติกรรมของ GPT ซึ่งเทียบเท่ากับ "system prompt"
  • สามารถใส่ตัวอย่างพรอมป์ต์ได้สูงสุด 4 รายการแบบไม่บังคับ เพื่อใช้เริ่มต้นการสนทนา
  • สามารถอัปโหลดไฟล์หลายไฟล์เพื่อให้บริบทเพิ่มเติมและช่วยในการสร้างคำตอบ
  • สามารถเปิดหรือปิด Code Interpreter, โหมด Browse และ DALL-E 3 ได้
  • สามารถตั้งค่า "Actions" แบบไม่บังคับ ซึ่งเป็น API endpoints ที่ GPT เรียกใช้งานได้

วิธีการทำงานของ GPT Builder

  • GPT Builder เป็นแชตบอตที่สร้าง GPT ให้โดยอัตโนมัติผ่านการสนทนากับผู้ใช้
  • แท็บ "Create" ช่วยให้ผู้ใช้สร้าง GPT ผ่านการสนทนา แต่ในทางปฏิบัติแล้วมันคือการกรอกฟอร์ม "Configure" ให้อัตโนมัติ
  • หลายคนแนะนำให้หลีกเลี่ยงแท็บ "Create" หลังจากสร้าง GPT ตัวแรกแล้ว

ตัวอย่าง GPT ที่น่าสนใจ

  • Dejargonizer: GPT ที่ช่วยตีความศัพท์เฉพาะ โดยวิเคราะห์ข้อความและอธิบายความหมายของคำศัพท์เทคนิค
  • JavaScript Code Interpreter: GPT ที่สามารถรันโค้ด JavaScript ได้ โดยใช้งานผ่าน Deno runtime ที่แนบเข้าไป
  • Dependency Chat: วิเคราะห์เอกสาร dependency ของโปรเจ็กต์บน GitHub และตอบคำถามที่เกี่ยวข้อง
  • Add a walrus: GPT ที่เพิ่มวอลรัสลงในภาพ โดยใช้ GPT-Vision และ DALL-E
  • Animal Chefs: GPT ที่เชฟสัตว์จะเล่าเรื่องส่วนตัวควบคู่กับการให้สูตรอาหาร
  • Talk to the datasette.io database: GPT ที่ตอบคำถามด้วยการรัน SQL queries
  • Just GPT-4: GPT ที่ปิดฟีเจอร์เสริมทั้งหมดและมอบประสบการณ์ GPT-4 แบบล้วน ๆ

ความสามารถด้านความรู้ของ GPT

  • เมื่อแนบไฟล์ให้ GPT มันจะพยายามใช้ไฟล์นั้นเพื่อตอบคำถาม
  • ดูเหมือนจะเป็นการใช้งาน Retrieval Augmented Generation (RAG)
  • OpenAI ไม่ได้เปิดเผยข้อมูลเชิงลึกเกี่ยวกับฟีเจอร์นี้มากนัก ทำให้ผู้ใช้ใช้งานได้อย่างมีประสิทธิภาพค่อนข้างยาก

โมเดลการชำระเงินของ GPT

  • GPT ใช้ได้เฉพาะกับผู้สมัครสมาชิก ChatGPT Plus ราคา $20/เดือน เท่านั้น จึงมีข้อจำกัดด้านการเผยแพร่
  • ผู้ใช้สามารถเผยแพร่โปรเจ็กต์ที่สร้างบนแพลตฟอร์ม OpenAI ได้โดยไม่ต้องให้ผู้ใช้ปลายทางใส่ API key ของตนเอง

ความสำคัญของความปลอดภัยของพรอมป์ต์และการเปิดเผย

  • หากผู้ใช้พยายามมากพอ เอกสารและพรอมป์ต์ที่เพิ่มไว้ใน GPT อาจรั่วไหลได้
  • ควรตั้งสมมติฐานไว้ก่อนว่าพรอมป์ต์จะรั่ว และอาจเลือกเปิดเผยไปเลยจะดีกว่า

ความคาดหวังต่อ GPT ในอนาคต

  • คาดหวังการปรับปรุง เช่น เอกสารที่ดีกว่าสำหรับฟีเจอร์ความรู้ การเข้าถึงผ่าน API วิธีให้บริการ GPT แก่ผู้ที่ไม่ได้สมัครสมาชิก และการตั้งขีดจำกัดงบประมาณ

ความเห็นของ GN⁺

ประเด็นสำคัญที่สุดของบทความนี้คือการสำรวจฟีเจอร์ใหม่และความเป็นไปได้ของ GPTs ซึ่งเป็นหัวข้อที่น่าสนใจสำหรับผู้ที่ทำงานด้านวิศวกรรมซอฟต์แวร์และปัญญาประดิษฐ์ ความสามารถในการสร้าง GPT ของตนเองและให้ผู้ใช้อื่นมามีปฏิสัมพันธ์ได้ เปิดทางสู่แนวทางใหม่ในการสร้างอินเทอร์เฟซการสนทนาแบบปรับแต่งได้ นอกจากนี้ยังแสดงให้เห็นศักยภาพในการยกระดับประสบการณ์ผู้ใช้ผ่านการผสานความสามารถหลากหลาย เช่น การรันโค้ด การค้นหาเอกสาร และการสร้างภาพ

1 ความคิดเห็น

 
GN⁺ 2023-11-16
ความคิดเห็นจาก Hacker News
  • ในฐานะผู้ใช้ GPT ฉันตระหนักว่าถ้ามองไม่เห็นพรอมป์ต์ ฉันก็ไม่อยากใช้ GPT ไม่ต้องการใช้ ChatGPT ที่คนแปลกหน้าสามารถฝังพฤติกรรมแปลก ๆ เข้าไปได้โดยที่ฉันไม่รู้
    • อยากให้ OpenAI เพิ่มตัวเลือก "ดูซอร์ส" ให้กับ GPT คิดว่าควรเปิดเป็นค่าเริ่มต้น แต่ก็พอจะนึกออกว่านี่อาจเป็นการตัดสินใจที่ไม่เป็นที่นิยม
  • มีแนวโน้มจะหลีกเลี่ยงแชตบอตที่อิงกับ GPT ไม่อยากถูกชักจูงอย่างแนบเนียนตามคำสั่งเฉพาะที่ฉันไม่รู้
    • การเพิ่มตัวเลือก "ดูซอร์ส" จะเปลี่ยนฟีเจอร์นี้จาก "ไม่ค่อยน่าสนใจ" เป็น "คุ้มค่าพอที่จะจ่ายเงิน"
    • ตอนนี้ใช้เวลาเกือบทั้งหมดกับ Kagi เลยกำลังคิดจะยกเลิก GPT Plus แต่การเปลี่ยนแปลงแบบนี้จะทำให้ฉันยอมคงการสมัครต่อ
  • วิธีที่ฉันได้รู้จักฟีเจอร์ใหม่ของ OpenAI:
    1. กวาดตาดูพาดหัวบน Twitter ที่ประกาศของใหม่กันแบบเอิกเกริก
    2. ได้รับทวีตจำนวนท่วมท้นจากอินฟลูเอนเซอร์บน Twitter เกี่ยวกับเรื่องนั้น
    3. เมินมันไปและรอจนกว่า simonw จะอธิบาย
    4. อ่านบล็อกโพสต์ที่ simonw ได้ลองทดสอบฟีเจอร์นั้นไปแล้วหลายแบบ พร้อมเขียนคำอธิบายและบทวิจารณ์ที่ชัดเจน ทุกอย่างเข้าใจได้ทันที
  • การบอกว่า "มันก็แค่ ChatGPT ที่มี pre-prompt" นั้นเป็นเรื่องจริง
    • การบอกว่า "มันก็แค่ Custom Instructions ที่มี UI ดี ๆ" ก็จริงเหมือนกัน
    • แต่อย่าประเมินผลกระทบที่เปลี่ยนโลกของ "UI ที่ดี" ต่ำเกินไป GPT-3 ใช้งานได้มาหลายปีแล้ว แต่แทบไม่มีใครรู้จักหรือสนใจ จนกระทั่งมีการทำ UI ที่ดีขึ้น
    • มันดูเหมือนเป็นแค่ "การปรับจูนเล็กน้อย" ในด้าน usability แต่ให้ผลกระทบระดับ "ก้าวกระโดดเชิงควอนตัม" แบบเดียวกัน
  • มีคนถามความคิดเห็นเกี่ยวกับ GPT/AI กับฉันบ่อย ๆ ฉันก็ถามกลับว่าเคยใช้ไหม "ไม่" "รู้ไหมว่ามันใช้ฟรี" "รู้" ท่าทีแบบนี้เข้าใจยาก กลัวสิ่งที่ไม่รู้จักหรือ? ขี้เกียจหรือ? หรือต้องการ social proof ก่อนจะลองอะไรสักอย่าง?
  • ถึงจะมองไม่เห็นพรอมป์ต์ของ OpenAI และอาจรวมถึงผู้สร้างเองก็มองไม่เห็น แต่ฉันก็ยังอยากใช้ GPT ของ OpenAI
    • มันต้องอาศัยการกระโดดข้ามเรื่องความเชื่อใจพอสมควร สงสัยว่า OpenAI มีโรดแมปที่เป็นรูปธรรมเกี่ยวกับความน่าเชื่อถือหรือความสม่ำเสมอหรือไม่
  • มีพรอมป์ต์ทั้งหมดของ Custom GPT Builder อยู่: [มีลิงก์ GitHub ให้]
  • อยากขอบคุณ simonw ที่คอยบันทึกและอธิบายทุกอย่างแบบเรียลไทม์ และทำเครื่องมือที่เข้าใจง่ายและเข้าถึงง่ายอย่าง llm บน command line เป็นต้น
    • ก่อนหน้านี้คิดว่า Search API ทำพลาดเพราะไม่ให้ citation ที่เหมาะสม แต่ก็ดีที่รู้ว่าไม่ได้เป็นอยู่คนเดียว
  • อยากรู้เพิ่มว่า openAI ทำฟีเจอร์ RAG แบบ "ฐานความรู้" อย่างไร แต่รายละเอียดมีน้อยเกินไป
    • ฉันอัปโหลดข้อความทั้งหมดจาก grugbrain.dev และคุยกับ grug brain ที่สมเหตุสมผลมากได้: [มีลิงก์แชต OpenAI ให้]
  • ช่วงนี้กำลังทำ "synbiogpt" อยู่ และทำให้ตระหนักถึงข้อจำกัดของ custom GPT
    • ข้อมูลลำดับชีวภาพมักยาวมาก ข้อมูลในไฟล์ยังพอไหว แต่ถ้าต้องโต้ตอบกับ API เพื่อใช้ฟังก์ชันขั้นสูง เช่น codon optimization ก็ต้องส่งข้อมูลนี้ผ่านเครือข่าย สุดท้าย context window ของการเรียก API ก็เต็มไปด้วยข้อมูลลำดับจนล้มเหลว
    • ไม่สามารถ inject dependency ได้ บางครั้ง GPT พยายามเขียน implementation เอง แต่ก็มักผิด
    • ถ้า GPT-4 คิดว่ามันรู้ว่ากำลังพูดถึงอะไร Search API ก็มักจะเปิดไฟล์ไม่ถูก ตอนคุยเรื่องส่วนของยีน ฉันอยากเจาะจงมาก ๆ ว่าหมายถึงส่วนเฉพาะในไลบรารีของฉัน ไม่ใช่ส่วนที่ GPT-4 คิดเอาเอง
    • ฉันแก้ปัญหาไปได้เกือบทั้งหมดด้วยการสร้างสภาพแวดล้อมสำหรับสคริปต์ lua เอง (ฟังก์ชันด้านชีววิทยาอยู่ใน golang และใช้ gopher-lua เพื่อรันสภาพแวดล้อม lua) แล้ว inject ตัวอย่าง lua สำหรับวิธีใช้ความสามารถด้านสคริปต์ พร้อมกับไลบรารีชิ้นส่วนยีนขนาดเล็กที่มีอยู่ตอนนี้ จากนั้นขอให้มันสร้าง lua เพื่อทำงานเฉพาะอย่างกับไฟล์ที่ให้มา GPT-4 ไม่ได้ดูไฟล์เลย และแอป golang ภายในของฉันเป็นคนรัน lua ที่ถูกสคริปต์ไว้ วิธีนี้เวิร์กมากและเร็วกว่า custom GPT มาก
    • ตอนนี้ปัญหาใหญ่ที่สุดคือฝั่งฟรอนต์เอนด์ อยากได้ ChatGPT clone แบบโอเพนซอร์สที่ดึงไฟล์แนบออกมาได้และแก้ไขข้อความนำเข้าตอนแรกของผู้ใช้ได้ แต่จนถึงตอนนี้ยังไม่เจอตัวเลือกที่ดี
  • เกี่ยวกับวิธีใช้ RAG เพื่อให้ได้ผลลัพธ์ที่ดีขึ้น
    • ฉันประสบความสำเร็จกับเรื่องนี้อยู่บ้าง
    • ฉันใช้ Assistant API ซึ่งเชื่อว่าไม่เหมือน GPT และได้ลองใช้ผ่านเว็บอินเทอร์เฟซ
    • ฉันมีไฟล์ PDF มากกว่า 100 ไฟล์ที่ผ่าน OCR ด้วย Tesseract จากนั้นให้ ChatGPT เขียนสคริปต์เพื่อรวมทุกไฟล์เป็นไฟล์ txt เดียวโดยคงเลย์เอาต์ไว้
    • จากนั้นอัปโหลดไฟล์และเริ่มถามคำถาม ไฟล์เหล่านี้มีข้อมูลเชิงเทคนิคมากเกี่ยวกับข้อบังคับด้านสถาปัตยกรรมที่ไม่ใช่ภาษาอังกฤษ ดังนั้นโมเดลอาจไม่คุ้นกับภาษาประเภทนั้น
    • ถึงอย่างนั้นผลลัพธ์ก็ดีน่าทึ่ง มันตอบคำถามได้และคำตอบก็ดี ควรมีการใส่ annotation ว่าคำตอบมาจากไหน แต่สิ่งนี้ทำงานไม่ค่อยถูกต้อง
    • ลองอัปโหลดทั้ง PDF, ไฟล์ JSON, CSV ฯลฯ มาแล้ว จนถึงตอนนี้ข้อความดิบยังทำงานได้ดีที่สุด
  • บันทึกเกี่ยวกับฟีเจอร์ RAG แบบ "ความรู้" น่าสนใจ
    • จากบทสนทนาและประสบการณ์ ผู้คนพบว่าการดึงข้อมูลแบบ RAG มีความเฉพาะเจาะจงต่อธุรกิจและโมเดลข้อมูลมาก ไม่มีวิธีแก้แบบใช้ได้กับทุกกรณี ขั้นตอนถัดไปของลูกค้าใน CMS ไม่เหมือนกับการสร้าง SQL จากสคีมา และก็ไม่เหมือนกับการเลือกซื้อจากแค็ตตาล็อกอีคอมเมิร์ซ
    • โดยพื้นฐานแล้วมันเป็นปัญหาด้าน search และในความเป็นจริงยากยิ่งกว่านั้น ปัญหาประเภทนี้ขึ้นชื่อว่ายากมาก