การเปิดตัวเว็บเบราว์เซอร์ Atlas ของ ChatGPT รุ่งสางวันที่ 22 ตุลาคม OpenAI เปิดตัวเว็บเบราว์เซอร์ใหม่ของตนคือ ChatGPT Atlas
Atlas เป็นเว็บเบราว์เซอร์ที่ขับเคลื่อนด้วย AI และสร้างบน ChatGPT โดย OpenAI ระบุว่าได้เตรียมโปรเจกต์นี้มานานมาก OpenAI มองว่า AI คือโอกาสที่อาจเกิดได้ไม่กี่ครั้งในช่วงสิบปี และมองว่าการทบทวนว่าเบราว์เซอร์สามารถทำอะไรได้อย่างไร ควรใช้เบราว์เซอร์อย่างไร และใช้เว็บให้เป็นประโยชน์และเพลิดเพลินที่สุดได้อย่างไร ถือเป็นโอกาสสำคัญ แม้ว่าระบบแท็บจะเป็นรูปแบบที่ยอดเยี่ยม แต่ก็ยังแทบไม่มีการปฏิวัติด้านเบราว์เซอร์มากนักหลังจากนั้น OpenAI จึงเริ่มมองศักยภาพของเบราว์เซอร์ใหม่อีกครั้ง
แต่เดิม URL bar และช่องค้นหาคือแกนหลักของการใช้อินเทอร์เน็ต แต่ OpenAI ระบุว่าความสำคัญจะไปอยู่ที่ประสบการณ์แชตมากขึ้น ทำให้พวกเขาออกแบบประสบการณ์ผู้ใช้ด้วยแนวคิดนี้ตั้งแต่ต้น การทำงานจำนวนมากและกิจวัตรประจำวันต่างๆ กำลังเกิดขึ้นในเบราว์เซอร์ และหาก ChatGPT เป็นผู้ช่วยหลัก ผู้ใช้จะสามารถทำสิ่งต่างๆ มากขึ้นได้ เช่น แชตกับหน้าเว็บ ใช้ ChatGPT เพื่อค้นหาข้อมูล และใช้โหมดเอเจนต์ของ ChatGPT ในเบราว์เซอร์ OpenAI บอกว่าจะค่อยๆ เปิดตัวฟีเจอร์ใหม่ๆ และให้ผู้ใช้ได้ลองใช้งานจริงต่อไป
คุณสมบัติหลักของ Atlas การเริ่มต้น Atlas มาจากคำถามที่ว่า "ถ้าสามารถแชตกับเบราว์เซอร์ได้ล่ะ?" จากแนวคิดนี้ ทีมงานได้ปรับประสบการณ์แชตที่ซับซ้อนในหลายปีให้เป็นรูปแบบที่ใช้งานง่ายขึ้น Atlas ไม่ได้เป็นเพียงเว็บเบราว์เซอร์ที่เพิ่มปุ่มแชตเท่านั้น แต่ถูกออกแบบให้ ChatGPT เป็นศูนย์กลาง และ ChatGPT จะอยู่ข้างๆ ผู้ใช้ช่วยให้คำแนะนำระหว่างที่สำรวจเว็บอยู่ตลอดเวลา OpenAI คาดว่าเมื่อใช้งาน Atlas ผู้ใช้จะถามคำถามได้มากขึ้นและได้เรียนรู้อะไรเพิ่มมากขึ้น
Atlas ถูกออกแบบมาให้เร็วและยืดหยุ่นเพื่อรองรับประสบการณ์ใหม่ที่แปลกใหม่
ฟีเจอร์หลักของ Atlas ได้แก่ การแชตได้ทุกที่ในเว็บ ฟีเจอร์หน่วยความจำของเบราว์เซอร์ และฟีเจอร์เอเจนต์ที่ช่วยให้ ChatGPT ทำงานแทนผู้ใช้ เบราว์เซอร์นี้คือรูปแบบใหม่สำหรับยุคเว็บใหม่ และ OpenAI คาดหวังว่ามันจะโชว์ศักยภาพนี้ได้อย่างชัดเจน
- ฟีเจอร์แชต
- ฟีเจอร์หน่วยความจำของเบราว์เซอร์
- ฟีเจอร์เอเจนต์
คุณสมบัติหลักของ Atlas เมื่อดาวน์โหลด Atlas ครั้งแรกแล้วเปิดโปรแกรมหรือสร้างแท็บใหม่ หน้าหลักจะปรากฏขึ้น หน้าจอนี้ถูกออกแบบให้คุ้นเคยแบบเบราว์เซอร์ทั่วไป แต่รวมฟังก์ชันทั้งหมดของ ChatGPT เข้าด้วยกัน ตรงกลางมีตัวคอมโพส (composer) ให้พิมพ์คำถามแชต และมีแถบด้านข้างที่เข้าถึงเครื่องมือ โมเดล และประวัติแชต เพราะเป็นเบราว์เซอร์ จึงทำอะไรได้มากขึ้น เช่น การป้อน URL เพื่อไปยังเว็บไซต์เฉพาะหรือเปิดหน้าที่อ้างอิงจากบุ๊คมาร์ก นอกจากนี้ยังสามารถใช้ browser memory เพื่อค้นหาเว็บเพจที่เคยดูมาก่อนแต่จำตำแหน่งได้ไม่ชัดเจนได้อีกด้วย
หน้าแรกของ Atlas มีระบบแนะนำด้วย ระบบนี้สร้างจากกิจกรรมของผู้ใช้เอง และสามารถเสนอข่าวหรือภารกิจของเอเจนต์ที่ผู้ใช้มีแนวโน้มสนใจได้ เมื่อใช้ Atlas มากขึ้น คำแนะนำจะแม่นยำขึ้นเรื่อยๆ ในตัวอย่างของ GitHub เมื่อทำงานกับโค้ด คุณสามารถเชิญ ChatGPT เข้าสู่แถบด้านข้างเพื่อช่วยเข้าใจและแก้ไขเนื้อหาหน้าเว็บได้ นั่นทำให้เครื่องมือเปลี่ยนจากเพียงแสดงข้อมูล ไปเป็นเครื่องมือที่เข้าใจและแก้ไขข้อมูลได้
เปิดแท็บ หน้าแสดงแท็บใหม่คือจุดเริ่มต้นของ Atlas ไม่ว่าคุณจะแชตคำถามหรือป้อน URL ผลลัพธ์ที่รวดเร็วและมีประโยชน์กว่าจะเห็นได้ที่เดียว นอกจากแชตแล้ว หากต้องการสำรวจผลลัพธ์แบบเจาะจงมากขึ้น ก็สามารถเลือกลิงก์ค้นหา ภาพ วิดีโอ และข่าว (ถ้ามี) จากแท็บได้
ถาม ChatGPT
คลิก ขอ ChatGPT เพื่อเปิดแถบด้านข้าง ChatGPT ทำงานเพื่อสรุป อธิบาย หรือทำงานอื่นได้ทันทีในหน้าต่างเดียว
เพราะ ChatGPT มองเห็นรายละเอียดของหน้าที่ผู้ใช้กำลังอยู่ จึงทำให้การตอบสนองมีประโยชน์มากขึ้นและให้บริบทที่ถูกต้องมากกว่าเดิม
ใช้ Cursor ChatGPT ช่วยให้คุณสามารถเขียนข้อความบนหน้าจอข้อความประเภทเท็กซ์แบบเปิดได้ด้วยการแก้ไขและเสนอแนะแบบอินไลน์
ข้อเสนอแนะแบบส่วนตัว ChatGPT จะจำสิ่งที่ผู้ใช้ได้สำรวจไปแล้ว และเสนอได้ว่าครั้งหน้าอาจย้อนกลับไปหน้าก่อนหน้า ลงลึกในหัวข้อ เสนอแนวคิดที่เกี่ยวข้อง หรืออัตโนมัติกิจกรรมประจำวันให้
สอบถาม หากต้องการสิ่งใด ก็ตั้งคำถามได้ตลอดเวลา เช่น "เปิดรองเท้าที่ดูเมื่อวานอีกครั้ง" หรือ "จัดเรียงแท็บ" ให้ ChatGPT จัดการต่อให้
อื่นๆ เมื่อเปิด browser memory ให้ ChatGPT จดจำประเด็นสำคัญของเนื้อหาที่ผู้ใช้ค้นหา เพื่อพัฒนาคำตอบแชตให้ดีขึ้น รวมถึงช่วยทำรายการงานที่ต้องทำจากกิจกรรมล่าสุด หรือสืบต่อการค้นหาของขวัญปีสิ้นปีจากสินค้าที่เคยตรวจสอบแล้ว หน่วยความจำของเบราว์เซอร์ถูกเก็บเป็นส่วนตัว และอยู่ภายใต้การควบคุมของบัญชี ChatGPT และผู้ใช้
ในหน้าการตั้งค่า ผู้ใช้สามารถดูหน่วยความจำทั้งหมด และเก็บไว้เฉพาะที่เกี่ยวข้อง จากนั้นจึงล้างประวัติการค้นหาได้ แม้ browser memory จะเปิดอยู่ ก็ยังสามารถใช้สวิตช์ที่แถบที่อยู่เพื่อกำหนดให้ ChatGPT มองเห็นไซต์ได้หรือไม่ได้ หากซ่อนความมองเห็น ChatGPT จะไม่สามารถมองเห็นเนื้อหาหน้าเว็บ และจะไม่สร้างความจำจากไซต์นั้น
โดยค่าเริ่มต้น ไม่ได้นำเนื้อหาการนำทางมาใช้ฝึกสอนโมเดล
คุณสามารถเปิดตัวเลือก include web browsing ในการตั้งค่าควบคุมข้อมูล
หากบัญชี ChatGPT เปิดการฝึกสอนแชตไว้ Atlas ก็จะสามารถเปิดการฝึกสอนแชตได้ด้วย
สิ่งนี้รวมถึงเนื้อหาเว็บไซต์ที่แนบมาจากแถบ ChatGPT ในการถามคำถาม และ browser memory ที่ให้ข้อมูลแก่แชต
การควบคุมความปลอดภัยสำหรับเด็กก็ใช้ได้ใน Atlas หากผู้ปกครองตั้งการควบคุมความปลอดภัยของ ChatGPT แล้ว การตั้งค่าเหล่านั้นจะส่งผ่านไปยังการสนทนากับ ChatGPT ใน Atlas OpenAI กำลังเพิ่มระบบควบคุมความปลอดภัยแบบใหม่สำหรับ Atlas ด้วยเช่นกัน โดยรวมตัวเลือกสำหรับผู้ปกครองให้ปิด browser memory และโหมดเอเจนต์ได้
ในการสร้างฟีเจอร์เอเจนต์ของ ChatGPT เราให้น้ำหนักกับความปลอดภัยเป็นหลัก และเพิ่มมาตรการป้องกันที่ช่วยจัดการความเสี่ยงใหม่ๆ ที่อาจเกิดจากการเข้าถึงไซต์ที่ล็อกอินและการค้นหาประวัติ
ไม่สามารถรันโค้ดในเบราว์เซอร์ ดาวน์โหลดไฟล์ หรือสั่งติดตั้งส่วนขยายได้ ไม่สามารถเข้าถึงแอปอื่นๆ ของคอมพิวเตอร์หรือระบบไฟล์ได้ อาจถูกพักการทำงานชั่วคราวเพื่อสังเกตการปฏิบัติงานกับไซต์ที่อ่อนไหวบางประเภท เช่น สถาบันการเงิน โหมดออกจากระบบช่วยให้จำกัดการเข้าถึงข้อมูลอ่อนไหวเมื่อใช้เอเจนต์ และลดความเสี่ยงที่เอเจนต์จะปฏิบัติเหมือนทำงานบนเว็บไซต์โดยไม่เหมาะสม
ฟีเจอร์เอเจนต์ของ ChatGPT ยังคงมีความเสี่ยงอยู่ นอกจากความเสี่ยงจากความผิดพลาดที่เกิดขึ้นเมื่อเอเจนต์ทำงานแทนผู้ใช้แล้ว ยังมีความเสี่ยงจากคำสั่งมาลิชเชิงซ้อนที่ซ่อนอยู่ได้ คำสั่งเหล่านี้อาจฝังตัวในเว็บเพจหรืออีเมล โดยมีจุดประสงค์เพื่อให้เพิกเฉยต่อพฤติกรรมที่เอเจนต์ควรทำ ผลลัพธ์อาจทำให้ข้อมูลถูกขโมยจากไซต์ที่ล็อกอินอยู่ หรือมีการกระทำที่ไม่คาดคิดเกิดขึ้น
ตาม System Card ของระบบเอเจนต์ ChatGPT เราได้ทำ red teaming อย่างเข้มข้นหลายพันชั่วโมง และออกแบบมาตรการป้องกัน โดยเฉพาะเพื่อให้ ChatGPT ปรับตัวรับมือกับการโจมตีแบบใหม่ได้อย่างรวดเร็ว แต่เมื่อ AI เอเจนต์ได้รับความนิยมมากขึ้น เราไม่อาจป้องกันการโจมตีทั้งหมดได้ ผู้ใช้ควรชั่งน้ำหนักการให้ข้อมูลกับเอเจนต์ และลดความเสี่ยงด้วยการใช้โหมดออกจากระบบใน Atlas หรือการเฝ้าติดตามกิจกรรมของเอเจนต์ เราจะติดตามช่องโหว่ที่พบอย่างต่อเนื่องและออกแพตช์แก้ไข
การปล่อยตัวครั้งนี้คือก้าวสำคัญสู่อนาคตที่การใช้งานเว็บส่วนใหญ่จะเกิดผ่านระบบเอเจนต์ ซึ่งช่วยให้ผู้ใช้สามารถมอบหมายงานซ้ำๆ ให้ระบบทำแทน และมุ่งทำสิ่งที่สำคัญที่สุดได้
ค้นหาและการแชตด้วย Cursor โหมดเอเจนต์ของ Atlas คือฟีเจอร์ขั้นสูงที่ช่วยให้ Atlas นำทางเว็บและทำงานแทนผู้ใช้ได้
ฟีเจอร์นี้ช่วยให้เอเจนต์ทำงานที่ผู้ใช้รู้สึกว่าลำบากมากเกินไปเอง หรือช่วยสอนการใช้งานซอฟต์แวร์ใหม่ OpenAI รู้สึกทึ่งกับประสิทธิภาพของเอเจนต์เมื่อมันมีสิทธิ์เข้าถึงเบราว์เซอร์และอินเทอร์เน็ตส่วนตัวของผู้ใช้แบบเต็มรูปแบบ โหมดเอเจนต์ออกแบบโดยให้ความสำคัญกับความปลอดภัย และมีมาตรการป้องกันฝังอยู่ทั้งในส่วนโมเดลและประสบการณ์ผลิตภัณฑ์
ผ่านโหมดเอเจนต์ ChatGPT สามารถควบคุมเบราว์เซอร์ของผู้ใช้และทำงานต่างๆ ได้
ตัวอย่างเช่น สามารถตรวจสอบรายการสิ่งที่ต้องทำใน Google Docs เพื่อแจ้งเตือนผู้ที่ยังไม่ป้อนงาน หรือย้ายงานที่เสร็จสิ้นทั้งหมดไปยัง Linear ซึ่งเป็นซอฟต์แวร์จัดการงาน ผู้ใช้สามารถดูงานของเอเจนต์แบบเรียลไทม์ได้ โหมดเอเจนต์สามารถเข้าถึงระบบยืนยันตัวตนในเครื่องและประวัติของผู้ใช้ และถูกออกแบบให้รู้สึกเหมือนเป็นส่วนขยายที่เป็นธรรมชาติของผู้ใช้
ตัวอย่างการใช้โหมดเอเจนต์และมาตรการความปลอดภัย โหมดเอเจนต์สามารถใช้งานเพื่อเรื่องส่วนตัวได้
เช่น จากหน้าสูตรอาหาร อาจขอให้หาปริมาณวัตถุดิบที่ต้องการ คำนวณปริมาณที่จำเป็น และสร้างรายการช้อปปิ้งได้ ChatGPT จะจำร้านที่ผู้ใช้ชอบได้ และไปยังเว็บนั้นเพื่อเพิ่มสินค้าที่จำเป็นลงในตะกร้า โหมดเอเจนต์ช่วยให้ผู้ใช้ตรวจสอบรายการช้อปปิ้งและเพิ่มหรือลบสินค้าได้ตามความเหมาะสม
การที่เอเจนต์ ChatGPT แชร์เบราว์เซอร์กับผู้ใช้ทำให้เกิดความเสี่ยงใหม่ได้ ดังนั้น OpenAI จึงจัดการให้เอเจนต์ ChatGPT ทำงานได้เฉพาะในแท็บของผู้ใช้ และไม่สามารถรันโค้ดบนคอมพิวเตอร์หรือเข้าถึงไฟล์อื่นได้ นอกจากนี้ผู้ใช้ยังสามารถกำหนดได้ว่าเอเจนต์จะเข้าถึงไซต์ที่ล็อกอินและข้อมูลใดบ้าง และเลือกใช้โหมดลับได้ตามต้องการ Atlas จึงมีตัวเลือกหลายอย่างเพื่อให้ผู้ใช้ใช้งานโหมดเอเจนต์ได้อย่างปลอดภัยและปกป้องข้อมูลส่วนตัว
แผนในอนาคต OpenAI คาดหวังว่า ChatGPT Atlas จะได้รับการต้อนรับจากผู้ใช้ในวงกว้าง
ขณะนี้เริ่มให้บริการแก่ผู้ใช้ทั่วโลกในเวอร์ชัน macOS ก่อน และโหมดเอเจนต์ให้เฉพาะผู้ใช้ Plus และ Pro เวอร์ชัน Windows และ iOS กับ Android จะเปิดตัวตามลำดับในไม่ช้า พวกเขาตั้งแผนพัฒนาความคิดเรื่องคำแนะนำแบบกำหนดเองที่ติดตามผู้ใช้บนเว็บ ทำให้เอเจนต์รู้จักผู้ใช้มากขึ้น ทำงานแทนผู้ใช้ และนำเสนอสิ่งที่ผู้ใช้ต้องการล่วงหน้า และจะรับฟังข้อเสนอแนะจากผู้ใช้เพื่อปรับปรุง ChatGPT Atlas อย่างต่อเนื่อง
3 ความคิดเห็น
ผมเองก็โหลดมาตั้งแต่วันเปิดตัวแล้วลองใช้งานดู และพบว่าเจอปรากฏการณ์เดียวกันกับผู้ที่พูดมาก่อนหน้านี้ครับ
เป็นข้อผิดพลาดจึงคิดว่าไม่นานนักคงมีการอัปเดตแก้ไขแน่นอน
มีคนจำนวนมากที่เมื่อพิมพ์ฮันกึลแล้วเกิดการแยกตัวอักษรย่อยในระดับหนึ่ง
เพิ่งติดตั้งแล้วลองใช้เมื่อกี้ แต่การแยกอักขระย่อยยังไม่ทำงานครับ ตอนนี้กำลังใช้เวอร์ชัน Tahoe(26.0.1) อยู่