Microsoft แนะนำ Copilot Mode ใน Edge
(blogs.windows.com)- Edge ได้รับการเพิ่มฟีเจอร์ AI เชิงทดลอง “โหมด Copilot” ที่ช่วยเสริมประสบการณ์เว็บของผู้ใช้แบบเชิงรุกและยกระดับการทำงานได้มากกว่าการท่องเว็บแบบใช้แท็บแบบเดิม
- ในโหมด Copilot, ช่องป้อนข้อมูลเพียงหนึ่งช่องรวมการแชต การค้นหา และการนำทาง และรับรู้บริบททั้งหมดของหลายแท็บเพื่อช่วยเปรียบเทียบ ตัดสินใจ และจัดระเบียบข้อมูล
- การนำทางด้วยคำสั่งเสียง, งานแบบเรียลไทม์ (Action), และแผงช่วยเหลือแบบไดนามิก ช่วยให้สำรวจได้อย่างมีประสิทธิภาพโดยไม่ต้องคลิกหรือป้อนข้อมูลเอง
- การเสริมความเป็นส่วนตัวและความปลอดภัย, และการที่ผู้ใช้สามารถเปิด/ปิดฟีเจอร์ได้ตลอดเวลา เป็นพื้นฐานการออกแบบ โดยมีการจัดการการประมวลผลข้อมูลเบราว์เซอร์และขอบเขตการเข้าถึงอย่างชัดเจน
- ให้ใช้ฟรีและเป็นแบบเลือกเข้าร่วม (Opt-in) อย่างเต็มรูปแบบ, ปัจจุบันให้บริการเฉพาะระยะเวลาจำกัดบน Edge สำหรับ Windows/Mac และวางแผนพัฒนาต่อจากฟีดแบ็กของผู้ใช้
Copilot Mode คืออะไร?
- เป็นโหมดเบราว์เซอร์ใหม่ที่ต่างจากการนำทางแบบเชิงเส้นผ่านแท็บเดิม โดย AI เข้าใจเจตนาและบริบทของผู้ใช้เพื่อเสนอแนะและช่วยเหลือแบบเชิงรุก
- เมื่อเปิดแท็บใหม่ จะมี ช่องป้อนข้อมูลเดียวที่รวมการแชต การค้นหา และการนำทาง และ UI ที่กระชับ
- Copilot เข้าใจบริบททั้งหมดของแท็บหลายๆ แท็บที่ผู้ใช้เปิดอยู่ เพื่อช่วยเปรียบเทียบ การตัดสินใจ และการจัดระเบียบข้อมูลในกระบวนการท่องเว็บที่ซับซ้อน
คุณสมบัติหลัก
-
รองรับการท่องเว็บตามบริบทของหลายแท็บ
- รับรู้บริบทของแท็บที่เปิดทั้งหมด เช่น ขณะเปรียบเทียบจุดหมายปลายทาง AI จะช่วยหาที่พักที่ใกล้ชายหาดที่สุดได้อย่างรวดเร็ว ลดการสลับแท็บและงานที่ต้องทำด้วยตนเองให้เหลือน้อยที่สุด
-
คำสั่งภาษาธรรมชาติและ Action
- รองรับคำสั่งเสียง: “ช่วยหาข้อมูลในหน้านี้ให้หน่อย”, “เปิดแท็บเพื่อเปรียบเทียบตัวเลือกสินค้าให้หน่อย” ขอได้ด้วยภาษาธรรมชาติ
- ในอนาคตจะเชื่อมต่อ ประวัติและข้อมูลการยืนยันตัวตนแบบเลือกได้ เพื่อให้ Copilot อัตโนมัติการทำงานแบบซับซ้อน เช่น การจอง การซื้อ และการรวบรวมข้อมูล
-
แผงช่วยเหลือแบบไดนามิก & ข้อมูลสรุป
- เรียกใช้งาน Copilot ในรูปแบบแผงได้ตามต้องการทุกช่วงเวลา โดยไม่ต้องเปลี่ยนหน้า เพื่อแปลงสูตรอาหาร การแปล การปิดป๊อปอัป และการสรุปข้อความยาว พร้อมตัดปัจจัยที่ทำให้สมาธิลดลงและให้ข้อมูลสำคัญได้ทันที
-
เชื่อมต่อการทำงานและเส้นทางการสำรวจต่อเนื่อง
- ในอนาคต จะจัดระเบียบประวัติการท่องเว็บจากอดีตสู่ปัจจุบันเป็น journey ตามหัวข้อ/โครงการ เพื่อรองรับการดำเนินการถัดไป การเรียนรู้ และข้อเสนอแนะที่ปรับให้เหมาะกับผู้ใช้
- ผู้ใช้สามารถรับรู้และควบคุมได้ชัดเจนว่า Copilot เข้าถึงข้อมูลในเวลาใดและขอบเขตใด
ความเป็นส่วนตัวและการควบคุมของผู้ใช้
- อิงตามมาตรฐานความเป็นส่วนตัวและความปลอดภัยที่เชื่อถือได้ของ Microsoft ให้ผู้ใช้ตั้งค่าและควบคุมการเก็บรวบรวมการใช้งานข้อมูลด้วยตนเองได้
- โหมด Copilot สามารถเปิด/ปิดได้จากการตั้งค่า Edge ได้ทุกเมื่อ และหากไม่ต้องการใช้ก็ยังคงใช้งาน Edge แบบเดิมได้ตามปกติ
- เมื่อ Copilot เข้าถึงและวิเคราะห์ข้อมูลเบราว์เซอร์ ระบบจะแสดงการแจ้งเตือนเชิงภาพที่ชัดเจนตลอดเวลา
การนำเสนอตามการทดลองและการรับฟีดแบ็ก
- โหมด Copilot ถูกนำเสนอ ก่อนแบบฟรี, ระยะจำกัด และแบบ Opt-in และจะพัฒนาต่อเนื่องตามฟีดแบ็กของผู้ใช้
- สามารถร่วมเสนอแนวคิดและเข้าร่วมการถกเถียงได้ในชุมชนต่างๆ รวมถึง Discord
วิธีเริ่มต้นใช้งาน
- ใช้งานได้ทันทีที่ aka.ms/copilot-mode เพื่อทดลองประสบการณ์การท่องเว็บด้วย AI ใหม่และแสดงความคิดเห็น
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ช่วงหลังเข้าใจกลยุทธ์ Copilot ของ Microsoft ได้ยากมาก ทั้งที่มีฟีเจอร์คล้ายกันอยู่เป็นสิบ ๆ แบบ ราคาแต่ละตัวก็ไม่เหมือนกัน แต่สุดท้ายกลับไม่มีอะไรทำงานได้ดีจริง จุดที่น่าจะทำเงินได้คือ "ใน Excel ขอให้สรุปหรือวิเคราะห์ข้อมูลซับซ้อนด้วยภาษาธรรมชาติ แล้วสร้างชีตใหม่กับกราฟให้อัตโนมัติ" ซึ่งเป็นงานประจำวันจริง ๆ แต่ Copilot ตอนนี้ทำได้แค่อธิบายลำดับขั้นตอนเท่านั้น ทั้งที่ Excel และ Office ก็มี API อยู่แล้ว แค่ทำ AI ที่เชื่อมคำสั่งภาษาธรรมชาติเข้ากับงานจริงใน Excel ให้ได้ ก็น่าจะมีทุกบริษัทใช้กันหมด ฉันเองต้องการเครื่องมือแบบนี้มากจนลอง AI มาหลายตัว แต่ก็ยังไม่มีตัวไหนทำได้อย่างที่ต้องการจริง ๆ ดูเหมือนจะเป็นปัญหาที่ยากกว่าที่คิด แต่ถึงอย่างนั้น Microsoft ก็ยัง แก้ไม่ค่อยได้ทั้งที่ทุ่มเงินไปหลายพันล้านดอลลาร์ แกนสำคัญคือ business logic ขององค์กร แต่ก็น่าเสียดายที่ยังขยายสิ่งนี้ต่อเป็นไอเดียใหม่ ๆ ได้ไม่ดีพอ
พอทุ่มเงินมหาศาลเข้า AI แล้ว Microsoft และบริษัทอื่น ๆ ก็ พยายามดันผลิตภัณฑ์ AI ที่ยังไม่เสร็จดีออกสู่ตลาด ยังไงก็ต้องปล่อยอะไรออกมาก่อน เลยใช้บริการที่ยังไม่สุกงอมมาดึงข้อมูลผู้ใช้ แล้วหวังว่าวันหนึ่งจะเอาข้อมูลนั้นไปสร้าง AI ที่ดีขึ้นได้ พร้อมกันนั้นก็พยายาม สร้างนิสัยให้ผู้ใช้หันไปหา AI ก่อนโดยอัตโนมัติ
เคยสมัคร ChatGPT Pro แล้วลองให้มันสรุปข้อมูลใน Excel มันทำงานอย่างกระตือรือร้นมาก แต่ไฟล์ที่ได้กลับ รูปแบบเละเทะ แถมข้อมูลบางส่วนก็ถูกตัดหายไป น่าผิดหวังมาก
ไม่นานมานี้เห็นการอบรมในบริษัทสาธิตวิธีใช้ Copilot แล้ว แค่จะนำเข้าไฟล์ header ของ CSV ยังล้มเหลวและเสียเวลาอยู่ 15 นาที เลยรู้สึกว่า AI-Excel integration ที่น่าเชื่อถือพอจะขายได้จริงยังอีกไกล
ฉันก็คิดคล้ายกันว่า สิ่งที่ Microsoft ควรทำจริง ๆ คือฟีเจอร์ "บันทึกสคริปต์ด้วย AI" แบบง่ายมาก ๆ เช่น ดาวน์โหลด CSV → แปลงข้อมูล → เพิ่มชีตใหม่ → ตรวจสอบ → อัปโหลดเข้าระบบ ถ้าบันทึก workflow งานซ้ำ ๆ แบบนี้ด้วย AI แค่ครั้งเดียวแล้วเอากลับมาอัตโนมัติภายหลังได้ คนที่ไม่เก่งโค้ด Excel หรือ VBA ก็จะเพิ่มประสิทธิภาพการทำงานได้มหาศาล เพราะ แทบทุกแผนกในบริษัทมีงานข้อมูลซ้ำ ๆ อยู่เยอะมาก
“AI ควรถูกผสานเข้าไปใน workflow ของ OS อย่างเป็นธรรมชาติ และช่วยยกระดับ ประสบการณ์ใช้งานจริง อย่างการค้นหาที่ดีขึ้น, OCR, การรู้จำลายมือ ฯลฯ ไม่ใช่แค่ยัดหน้าต่างแชตเข้ามาแบบฝืน ๆ จุดสำคัญคือความเป็นธรรมชาติ เหตุผลที่จะใช้ Edge ก็น้อยลงเรื่อย ๆ ปัญหาคือบรรยากาศตอนนี้เหมือนจะพยายามใส่ AI เข้าไปในเครื่องมือสำหรับนักพัฒนาทุกตัว ทั้ง VS, VSCode, PowerShell, Windows Terminal, Aspire, Azure เหมือนแต่ละทีมกำลังดิ้นรนกับเป้าหมายผลงานด้าน AI”
ช่วงหลังทิศทางของ Microsoft ให้ความรู้สึกว่ามุ่งไปทางสร้างความลำบากให้ผู้ใช้มากกว่าจะคำนึงถึงพวกเขา มีหลายกรณีที่ เพิ่มความเหนื่อยล้าให้ผู้ใช้ เช่น การบังคับใช้ Edge, dark pattern, การรีเซ็ต telemetry, ประเด็น Recall ฯลฯ ฉันเดาว่าเรื่องนี้มาจากการอิจฉารายได้ฝั่งเบราว์เซอร์ของ Google และทัศนคติแบบ "เราเป็นเจ้าของ OS เพราะงั้นก็ควรรีดรายได้ให้ได้มากกว่านี้" ของผู้บริหาร การไล่ล่ากำไรระยะสั้นแบบนี้กำลังเผาผลาญความไว้วางใจที่สะสมมาหลายสิบปี ถ้าจะให้ดีควรทำให้ Windows เป็น ต้นแบบด้านความเป็นส่วนตัว หรือสร้าง ecosystem ของ native app ที่แท้จริงแบบ macOS มากกว่า เพราะนั่นจะช่วยสร้างความภักดีระยะยาวได้
Microsoft มีท่าทีประมาณว่าต่อให้ต้องแลกด้วยการเสียสละผู้ใช้ ก็ยังทำเงินได้มหาศาลอยู่ดี และผู้ใช้ Windows เองก็ไม่ได้มีทางเลือกมากนักจึงไม่ค่อยน่ากังวล คนที่จะย้ายไป Apple ก็ย้ายไปกันแล้ว ส่วน Linux แม้จะโตขึ้นทีละน้อยก็ดูเหมือนไม่ได้ทำให้พวกเขากลัวนัก เมื่อเป็นบริษัทผูกขาด ก็แทบไม่จำเป็นต้องใส่ใจเรื่องความภักดีหรือการสร้างคุณค่าเท่าไร
เคยเห็นผลิตภัณฑ์บางตัวของ Microsoft มีศักยภาพยอดเยี่ยมมาก แต่บรรยากาศจากฝั่งผู้บริหารกลับเหมือนต้องการ รีดคุณค่าจากผู้ใช้ทุกทางที่ทำได้ ถ้าแค่ทำ UI ให้สอดคล้องกันทั้งระบบ และสร้าง ผลิตภัณฑ์ที่ยึดพื้นฐานให้ดี เช่น ไม่ยัดโฆษณาหรือผลค้นหาที่ไม่พึงประสงค์เข้ามา ก็น่าจะดีกว่านี้ สมัยก่อนฉันเป็นแฟน Edge แต่พอฟีเจอร์ไร้สาระอย่างคูปองถูกเพิ่มเข้ามาก็ผิดหวัง VS Code ยังยอดเยี่ยมอยู่ แต่ .Net support, ARM, RDP, Copilot กลับทำให้ผิดหวังมากขึ้นเรื่อย ๆ แม้เทียบกับโอเพนซอร์สหรือบริการทางเลือก หลายครั้งก็ยังไม่มี “ฟีเจอร์ที่จำเป็นที่สุด” ตอนนี้โปรเจกต์ใหม่ ๆ ก็อยากใช้ PostgreSQL แทน MS-SQL และกำลังพยายามหลีกเลี่ยงการพัฒนาโซลูชันบน Windows Server แม้แต่กับ VS Code เองก็เริ่มลังเลมากขึ้น
รายได้ของ Google ส่วนใหญ่มาจากโฆษณา และบริการอย่าง Chrome กับ YouTube ก็เปิดให้ใช้ฟรี ซึ่งเป็นจุดที่แตกต่าง ขณะที่ Microsoft แต่เดิมเน้นโมเดลแบบเสียเงินเป็นหลัก เช่น Windows, Office
มีทั้งบทวิเคราะห์ของ Bloomberg เกี่ยวกับ Microsoft Copilot (มีลิงก์ในต้นทาง) และการถกเถียงใน HN ที่เกี่ยวข้อง โดยสรุปคือ "ท้ายที่สุดแล้วไม่มีใครอยากใช้ Copilot เพราะคุณภาพมันต่ำ"
ตอน Edge ออกมาใหม่ ๆ ฉันชอบมากจนเคยใช้เป็นเบราว์เซอร์หลักอยู่พักหนึ่ง แต่หลังจากนั้นก็มี ฟีเจอร์ไร้สาระอย่างข้อเสนอคูปอง เพิ่มเข้ามาเรื่อย ๆ จนต้องมานั่งปิดการตั้งค่าทีละอย่างเอง สุดท้ายก็กลับไปใช้ Brave ฟีเจอร์ซิงก์ข้ามเบราว์เซอร์นั้นดี แต่ฉันเกลียด โฆษณาเชิงการตลาดและการโปรโมตเชิงพาณิชย์ มาก พอเห็นโฆษณาในผลค้นหาก็ย้ายไป Linux ทันที ตามสถิติของรัฐบาลสหรัฐ Linux บนเดสก์ท็อปมีส่วนแบ่งขึ้นมาถึง 6% แล้วช่วงหลัง และ Valve/Steam ก็ปรับปรุงความเข้ากันได้ของเกมได้ดีมาก Microsoft มีโอกาสดีมากมายทั้งในเครื่องมือและบริการสำหรับนักพัฒนา (.Net, VS Code) แต่ก็น่าเสียดายที่ พยายามไล่หารายได้จากผู้ใช้ทั่วไปอย่างหนักเกินไป ทุกวันนี้ซอฟต์แวร์เชิงพาณิชย์ควรคิดเรื่องการแพ็กเกจสำหรับ Linux ด้วยเสมอ โดยเฉพาะ AppImage/Flatpak และตลาด ตัวแทน Adobe ก็ยังมีโอกาสอีกมาก
มีการพูดถึงว่า Copilot เข้าใจบริบทของแท็บที่เปิดอยู่ทั้งหมด ซึ่งทำให้กังวลว่า ถ้าในแท็บที่เปิดอยู่มี บล็อกสแปม SEO คุณภาพต่ำ เยอะ บริบทที่ AI ใช้ก็จะปนเปื้อนไปด้วย ต่อไปถ้าผู้ผลิตคอนเทนต์เริ่มปล่อยข้อมูลเท็จที่ซับซ้อนลงเว็บมากขึ้น ก็มีความเสี่ยงที่ AI จะหยิบมาอ้างโดยไม่แยกแยะ เวลาฉันประเมินข้อมูลด้วยตัวเอง ฉันให้ความสำคัญกับ ความน่าเชื่อถือของแหล่งที่มา มาก แต่ AI ยังมีข้อจำกัดในการจัดการเรื่องนี้ น่าจะเป็นเพราะ AI ที่ถูกสงสัยว่าดูดข้อมูลมหาศาลมาใช้นั้น มีข้อจำกัดเชิงโครงสร้างในการระบุแหล่งที่มาให้ถูกต้อง
มีการยกตัวอย่างว่า Copilot อาจเดาว่าผู้ใช้คนหนึ่ง (เช่น Dylan) ชอบฟุตบอล แล้วพอเปิดเบราว์เซอร์ก็แนะนำตั๋วให้ทันที ซึ่งให้ความรู้สึกว่าเป็นการ ยัดฟีเจอร์ AI เข้ามาแบบฝืน ๆ มากกว่าจะช่วยสนับสนุนพฤติกรรมของผู้ใช้โดยแท้จริง และยังชี้ให้เห็นว่ามันโผล่มาตลอดแม้ไม่ได้ prompt อะไรเลย
รู้สึกเหมือนว่าใน ยุค AI การจัดการผลิตภัณฑ์พื้นฐาน (Product Management) หายไปแล้ว ฟีเจอร์อย่างระบบอัตโนมัติในเบราว์เซอร์แบบนี้ มีใครร้องขอจริงหรือเปล่า และ product-market fit ของมันอยู่ตรงไหนกันแน่
แม้จะมี ความเห็นเชิงลบจำนวนมาก แต่ฉันกลับมองในแง่บวกมากกว่า ใน Safari และ Firefox ก็มีปลั๊กอินบางตัวอยู่แล้ว แต่ฉันเป็นคนที่รู้สึกเสียดายมาตลอดกับการขาด deep integration ที่รับรู้บริบทร่วมกันข้ามแท็บ เวลาเปิดแท็บเกิน 15 แท็บเพื่อทำรีเสิร์ช การถาม LLM โดยอิงบริบททั้งหมดพร้อมกันนั้นน่าสนใจมาก เหตุผลเดียวที่ฉันยังไม่ได้ติดตั้งคือมีข่าวลือว่า OpenAI ก็เตรียมฟีเจอร์คล้ายกันอยู่ เลยหวังว่าจะได้เห็นอะไรแบบนี้ออกมาในเร็ว ๆ นี้
งาน ดึงและจัดการข้อมูลอัตโนมัติจากเว็บไซต์ที่ไม่มี API เป็นโจทย์ที่ยากมาก และในงานวิเคราะห์ข้อมูลส่วนใหญ่ ก็มักจะมีโปรเจกต์ภายในแบบนี้ตามมาเสมอ ถ้าเว็บไซต์ต่าง ๆ ไม่ได้เปิดบริการอย่างเป็นทางการ หรือฝั่งนั้นไม่มีศักยภาพทางเทคนิคพอจะทำ API ได้ ก็จะจบลงที่ต้องให้คนมาคลิกหรือดาวน์โหลดซ้ำ ๆ ด้วยมือ จนถึงตอนนี้สิ่งที่ยังพอเป็นทางออกได้ก็คือโซลูชัน RPA (Robotic Process Automation) และหากไม่มีเจตนาไม่ดี มันก็ให้ประโยชน์ด้าน ปลดปล่อยคนจากแรงงานซ้ำซากแบบง่าย ๆ ได้มากกว่า
ฉันคิดว่านวัตกรรมจะมาจากการ แทนที่ระบบปฏิบัติการด้วยอินเทอร์เฟซแบบ AI ตอนนี้ทุกอย่างยังวนอยู่กับงานซ้ำระดับเบราว์เซอร์ แต่เป้าหมายที่แท้จริงคือการ เปลี่ยนวิธีที่ผู้ใช้โต้ตอบกับเทคโนโลยีอย่างถึงราก พูดอีกแบบคือ ความพยายามที่จะ “ถ้าทุกอย่างที่ต้องใช้มีอยู่ใน ChatGPT ก็สร้าง OS ทั้งระบบให้เป็นอินเทอร์เฟซแบบแชตไปเลย” นั่นแหละที่สำคัญ