2 คะแนน โดย GN⁺ 2023-11-22 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Claude 2.1 ใช้งานได้ผ่าน API และมอบประสบการณ์แชตผ่าน claude.ai
  • จุดเด่นคือหน้าต่างบริบท 200K โทเค็น, การลดอาการหลอนของโมเดล (Hallucination), system prompt และฟีเจอร์เบต้าใหม่อย่างการใช้เครื่องมือ
  • มีแผนอัปเดตนโยบายราคาเพื่อเพิ่มความคุ้มค่าด้านต้นทุนให้ลูกค้า

หน้าต่างบริบท 200K

  • ผู้ใช้ Claude ต้องการหน้าต่างบริบทที่ใหญ่ขึ้นและผลลัพธ์ที่แม่นยำยิ่งขึ้นเมื่อต้องทำงานกับเอกสารยาว
  • ด้วย 200,000 โทเค็น สามารถส่งข้อมูลประมาณ 150,000 คำ หรือเอกสารมากกว่า 500 หน้าให้ Claude ได้
  • Claude สามารถสนทนากับคอนเทนต์หรือข้อมูลขนาดใหญ่ และทำงานได้หลากหลาย เช่น สรุป ถาม-ตอบ คาดการณ์แนวโน้ม และเปรียบเทียบหลายเอกสาร

ลดอัตรา Hallucination ลง 2 เท่า

  • Claude 2.1 ลดอัตราการเกิดข้อความที่ไม่เป็นจริงลง 2 เท่า เพื่อเพิ่มความซื่อสัตย์ของโมเดล
  • องค์กรสามารถสร้างแอปพลิเคชัน AI และนำไปใช้งานจริงได้ด้วยความเชื่อมั่นและความน่าเชื่อถือที่สูงขึ้น
  • Claude 2.1 แสดงให้เห็นถึงการพัฒนาด้านความเข้าใจและความสามารถในการสรุป โดยเฉพาะในเอกสารยาวและซับซ้อนที่ต้องการความแม่นยำ

API Tool Use

  • เพิ่มฟีเจอร์เบต้าใหม่ "Tool Use" ที่สามารถผสานเข้ากับกระบวนการทำงาน ผลิตภัณฑ์ และ API เดิมของผู้ใช้ได้
  • Claude สามารถประสานงานฟังก์ชันหรือ API ที่นักพัฒนากำหนดไว้ ค้นหาแหล่งข้อมูลบนเว็บ และดึงข้อมูลจากฐานความรู้ส่วนตัวได้
  • Tool Use ยังอยู่ในช่วงพัฒนาเริ่มต้น และกำลังมีการสร้างความสามารถสำหรับนักพัฒนาและแนวทางด้านพรอมป์ต์

ประสบการณ์สำหรับนักพัฒนา

  • ปรับประสบการณ์คอนโซลสำหรับนักพัฒนาของผู้ใช้ Claude API ให้เรียบง่ายขึ้น และช่วยให้การทดสอบพรอมป์ต์ใหม่ทำได้ง่ายขึ้น
  • ผ่านผลิตภัณฑ์ Workbench ใหม่ นักพัฒนาสามารถปรับแต่งพรอมป์ต์แบบวนซ้ำ และเข้าถึงการตั้งค่าโมเดลเพื่อเพิ่มประสิทธิภาพพฤติกรรมของ Claude ได้
  • เปิดตัว system prompt เพื่อให้ผู้ใช้สามารถส่งคำสั่งแบบกำหนดเองให้ Claude ได้

ความเห็นของ GN⁺

  • จุดเด่นสำคัญที่สุดของ Claude 2.1 คือหน้าต่างบริบท 200K โทเค็นและการลดอัตรา Hallucination ซึ่งช่วยให้ผู้ใช้ประมวลผลเอกสารและข้อมูลขนาดใหญ่ขึ้น และได้ผลลัพธ์ที่เชื่อถือได้มากขึ้น
  • ความสามารถเหล่านี้แสดงให้เห็นถึงความก้าวหน้าของเทคโนโลยี AI และมีศักยภาพในการพลิกโฉมการทำงานขององค์กรและนักพัฒนา ด้วยการมอบเครื่องมือที่มีประสิทธิภาพและแม่นยำยิ่งขึ้น
  • บทความนี้นำเสนอข้อมูลที่น่าสนใจเกี่ยวกับแนวโน้มล่าสุดของเทคโนโลยี AI และเครื่องมือใหม่ที่นักพัฒนาสามารถนำไปใช้ได้ จึงเป็นเนื้อหาที่น่าดึงดูดสำหรับผู้ที่สนใจเทคโนโลยี

1 ความคิดเห็น

 
GN⁺ 2023-11-22
ความคิดเห็นจาก Hacker News
  • ทั้งหวานทั้งขมของคอนเท็กซ์ 200k: น่าเสียดายที่อัตราความผิดพลาดพุ่งสูงมากตั้งแต่ 70k ไปถึง 195k แต่ก็น่าชื่นชมที่ข้อผิดพลาดในช่วงกลางลดลง
  • ความไม่พอใจต่อการใช้งานโมเดลที่ถูกจำกัด: Claude ไม่ได้ปฏิเสธน้อยลงอย่างที่พาดหัวอ้างไว้ Anthropic เซ็นเซอร์โมเดลมากเกินไปจนใช้งานยาก ผู้ใช้ควรเป็นคนตัดสินใจเลือกเครื่องมือ ไม่ใช่ให้เครื่องมือมาตัดสินผู้ใช้
  • ชี้ให้เห็นความไม่สอดคล้องระหว่างพาดหัวกับเนื้อหา: การประกาศที่ระบุว่า 'การปฏิเสธลดลง' ไม่ตรงกับเนื้อหาจริง และยังชวนให้เข้าใจว่า Claude 2.1 มีแนวโน้มจะปฏิเสธมากกว่าจะให้ข้อมูลที่ผิด
  • ความไม่มีประสิทธิภาพด้านการเขียนโค้ด: แย่กว่า GPT-4 ถึง 10 เท่า เมื่อขอฟังก์ชันซิงก์ฐานข้อมูลแบบง่าย ๆ กลับให้ pseudocode จำนวนมากแทนโค้ดจริง
  • ความประทับใจเชิงลบต่อโมเดล: โมเดลของ Anthropic ถูกฝึกให้ปฏิเสธคำขอส่วนใหญ่มากเกินไป จนการคุยกับ Claude ไม่สนุก
  • กรณีปฏิเสธจากมุมมองเชิงอุดมการณ์: การปฏิเสธคำขอรายชื่อคำศัพท์เพื่อพูดให้เหมือนนักเห็นแก่ประโยชน์ส่วนรวมอย่างมีประสิทธิภาพ กลายเป็นสถานการณ์ชวนขำ
  • ความผิดหวังกับ Claude 2: ตอนแรกคาดหวังไว้ แต่ตัดสินว่าประสิทธิภาพด้อยกว่า GPT-4 มาก ต่อให้มีหน้าต่างคอนเท็กซ์ใหญ่ หากคุณภาพคำตอบแย่ก็ไม่มีความหมาย
  • ปัญหาการเข้าถึงสำหรับการใช้ API: สนใจจะใช้ API แต่ผิดหวังที่ไม่ได้รับการตอบกลับ สะท้อนว่าไม่ค่อยใส่ใจในฐานะแพลตฟอร์มสำหรับนักพัฒนา
  • ความยากในการเข้าถึง API: ไม่ได้รับการตอบกลับต่อคำขอผ่านเว็บไซต์ของ Anthropic หรือผ่าน Bedrock ทำให้ดูเหมือนแทบเป็นไปไม่ได้ที่จะเข้าถึง API ในฐานะธุรกิจ
  • ความสนใจต่อการเพิ่ม system prompt: จับตาการเพิ่ม system prompt ที่ช่วยให้ผู้ใช้ส่งคำสั่งแบบปรับแต่งเองให้ Claude เพื่อปรับปรุงประสิทธิภาพ พร้อมคาดหวังถึงความง่ายทั้งในการใช้งานและการนำไปใช้ในทางที่ผิด
  • การใช้ Claude ในการทดสอบและการเลือก OpenAI: แม้ยังไม่ใช้ในระบบจริง แต่ก็นำมารวมในการทดสอบเป็นประจำเมื่อสร้างฟีเจอร์ใหม่ร่วมกับ LLM OpenAI ได้การรับรองเร็วกว่าและออกสู่ตลาดก่อน อีกทั้ง API ยังดีกว่า เชื่อถือได้กว่า และถูกกว่า แต่เมื่อ Claude ถูกรวมไว้ใน AWS Bedrock ก็ทำให้สิ่งที่เคยทำไม่ได้กลายเป็นทำได้