- Bing Image Creator เป็นเครื่องมือฟรีสำหรับแปลงหรือแก้ไข ภาพ AI จากข้อความและภาพที่อัปโหลด โดย DALL-E 3 จะทยอยยุติการให้บริการ และภาพเดิมจะยังคงอยู่ใน My Creations
- สามารถเลือกโมเดลสร้างภาพได้จาก DALL-E3, GPT4o, MAI-Image-2e แต่การแก้ไขภาพที่อัปโหลดจะประมวลผลด้วย GPT4o เท่านั้น
- ต้องลงชื่อเข้าใช้ด้วย Microsoft Account (MSA) ส่วนบัญชีที่ทำงานหรือสถานศึกษาซึ่งใช้ Microsoft Entra ID ยังไม่รองรับใน Image Creator และ Video Creator
- Image Creator ให้สิทธิ์ Fast generation ฟรี 15 ครั้งต่อวัน และป้อนพรอมป์ได้สูงสุด 200 รายการต่อ 24 ชั่วโมง ส่วน Video Creator รองรับการสร้างวิดีโอจากข้อความด้วย Sora 2
- ภาพที่อัปโหลดอาจถูกใช้เพื่อประมวลผลคำขอและปรับปรุงบริการ แต่จะไม่ถูกใช้เพื่อฝึกโมเดลหรือทำให้ประสบการณ์เป็นแบบเฉพาะบุคคล และภาพอัปโหลดที่ตรวจพบใบหน้าจะถูก ลบหลัง 30 วัน
การเปลี่ยนผ่านของ Bing Image Creator และ DALL-E 3
- Bing Image Creator เป็นเครื่องมือ AI สำหรับสร้างหรือแก้ไขภาพจาก ข้อความและภาพที่อัปโหลด ของผู้ใช้
- DALL·E 3 ซึ่งเปิดให้ creators ใช้งาน จะถูก ยุติการให้บริการ (retire) ภายในไม่กี่สัปดาห์ข้างหน้า
- ภาพเดิมจะยังอยู่ใน My Creations
- กำลังเตรียมฟีเจอร์ทดแทนเฉพาะทางไว้
- ระหว่างนี้ยังสามารถสร้างต่อได้ด้วยโมเดลที่ใหม่กว่า
โมเดลสร้างภาพและวิธีการแก้ไข
- การสร้างภาพมีตัวเลือกโมเดล 3 แบบ
- DALL-E3: เมื่อกด “Create” จะสร้างภาพหลายภาพจากพรอมป์ และนับเป็น 1 creation
- GPT4o: เมื่อกด “Create” จะสร้างภาพ 1 ภาพจากพรอมป์
- MAI-Image-2e: เมื่อกด “Create” จะสร้างหลายภาพ และนับเป็น 1 creation
- MAI-Image-2e มี model card และ data summary
- เมื่อใช้หรือแก้ไขภาพที่อัปโหลด จะไม่สามารถเลือก DALL-E3 และ MAI-Image-2e ได้ และการแก้ไขทั้งหมดจะประมวลผลด้วย GPT4o
- สำหรับคำขอที่คล้ายกับพรอมป์ที่เพิ่งใช้ล่าสุด ระบบอาจแสดง cached image ที่เก็บไว้ชั่วคราวแทนการสร้างภาพใหม่ตั้งแต่ต้น
บัญชี ความเร็ว และข้อจำกัดการใช้งาน
- Bing Image Creator ใช้งานฟรีได้ด้วย Microsoft Account (MSA) ส่วนบุคคล
- ผู้ใช้ที่ลงชื่อเข้าใช้ด้วย Microsoft Entra ID จะใช้งานไม่ได้
- แม้จะใช้งานจาก Copilot Search หรือ Bing Search ก็ต้องลงชื่อเข้าใช้ก่อนสร้างภาพ
- ความเร็วในการสร้างแบ่งเป็น Fast creation และ Standard creation
- ได้รับ Fast image creation ฟรีวันละ 15 ครั้ง
- เมื่อใช้ครบ 15 ครั้งแล้ว จะได้รับสิทธิ์เพิ่มอีกในวันถัดไป
- หากต้องการใช้ Fast creation ต่อ สามารถใช้คะแนน Microsoft Rewards ได้
- Standard creation ใช้ฟรีแต่ช้ากว่า Fast
- Image Creator ป้อนพรอมป์ได้สูงสุด 200 รายการ ต่อ 24 ชั่วโมง
- การกด “Edit image” ก็ถูกนับรวมในลิมิต 200 รายการด้วย
- เมื่อใช้ครบลิมิตแล้ว จะได้รับสิทธิ์ใหม่อีกครั้งในวันถัดไป
- การสร้างแบบไม่ลงชื่อเข้าใช้หรือในโหมดผู้เยี่ยมชมมีลิมิตรายวัน และเมื่อเข้าสู่ระบบแล้วจะสามารถอัปโหลดและเข้าถึงโมเดลเพิ่มเติมได้
Bing Video Creator
- Bing Video Creator เป็นผลิตภัณฑ์ของ Bing ที่ใช้ Sora 2 สร้างวิดีโอ AI ตามข้อความพรอมป์
- Video Creator ก็ต้องลงชื่อเข้าใช้ด้วย Microsoft Account ส่วนบุคคล และยังไม่รองรับบัญชี Microsoft Entra ID
- ความเร็วในการสร้างมีทั้ง Fast creation และ Standard creation
- Standard creation ใช้ฟรี
- โดยทั่วไป Fast creation ต้องใช้คะแนน Microsoft Rewards
- ในบางกรณีอาจมีเครดิตสำหรับ Fast creation ให้
- สามารถต่อคิวการสร้างวิดีโอที่กำลังดำเนินการได้พร้อมกันสูงสุด 3 รายการ
- หากมี 3 รายการกำลังดำเนินการอยู่แล้ว จะไม่สามารถสร้างวิดีโอใหม่ได้จนกว่าจะมีรายการหนึ่งเสร็จสิ้น
- วิดีโอที่เสร็จแล้วสามารถดูได้ในมินิแอป Bing Video Creator บนแอป Bing มือถือ หรือใน “My Creations” ที่ bing.com/create
- ขณะนี้การสร้างวิดีโอ ใช้งานได้บนมือถือเท่านั้น และต้องเข้าผ่านแอป Bing
ภาพที่อัปโหลดและการจัดการข้อมูลส่วนบุคคล
- ภาพที่อัปโหลดจะถูกใช้เพื่อให้ Bing Image Creator หรือ Bing Video Creator ดำเนินการสร้างหรือแก้ไขภาพตามคำขอของผู้ใช้
- ภาพที่อัปโหลดอาจถูกใช้เพื่อปรับปรุงบริการประมวลผลภาพ แต่จะไม่ถูกใช้เพื่อ ฝึกโมเดล AI หรือปรับประสบการณ์ให้เป็นแบบเฉพาะบุคคล
- ไม่มีการพยายามระบุตัวตนของใบหน้าที่ปรากฏในภาพที่อัปโหลด
- ระยะเวลาการจัดเก็บขึ้นอยู่กับเนื้อหาในภาพ
- ภาพที่อัปโหลดจะถูกเก็บไว้ได้สูงสุด 30 วัน
- ภาพที่ตรวจพบใบหน้าจะถูกลบหลัง 30 วัน
- ภาพที่ไม่ตรวจพบใบหน้าอาจถูกเก็บไว้ได้นานสูงสุด 18 เดือน
- ภาพและวิดีโอที่สร้างแล้วอาจถูกเก็บไว้ได้สูงสุดอย่างละ 90 วัน
- ผู้ใช้สามารถลบประวัติได้โดยเลือก “Clear all” ในประวัติการค้นหา Bing หรือเลือก “Clear all search history” ในส่วน “Search history” ของ privacy dashboard บัญชี Microsoft
- การดำเนินการนี้จะลบทั้งประวัติการค้นหา Bing, โปรไฟล์ Bing Image Creator และ Video Creator รวมถึงประวัติการสร้าง
ข้อจำกัดการอัปโหลดและข้อมูลชีวมิติ
- ผู้ใช้ควรอัปโหลดเฉพาะ ภาพต้นฉบับ ที่ตนเป็นเจ้าของหรือมีสิทธิ์ใช้งานเท่านั้น
- ห้ามอัปโหลดภาพที่ละเมิดสิทธิของบุคคลที่สาม ละเมิดความเป็นส่วนตัวของผู้อื่น แสดงบุคคลโดยไม่ได้รับความยินยอม หรือขัดต่อ Microsoft Services Agreement หรือ Bing Image Creator Code of Conduct
- หากตรวจพบความพยายามอัปโหลดเนื้อหาที่ผิดกฎหมายหรือถูกห้าม บัญชีอาจถูกจำกัดการใช้งานหรือระงับ
- Video Creator ไม่อนุญาตให้อัปโหลด ภาพใบหน้าที่สมจริง เพื่อนำไปใช้สร้างวิดีโอ ด้วยเหตุผลด้านความปลอดภัย
- ในฟีเจอร์อัปโหลดภาพ อาจมีการประมวลผลข้อมูลชีวมิติ เช่น ใบหน้าหรือมือ
- ข้อมูลชีวมิติจะถูกประมวลผลเฉพาะเมื่อผู้ใช้อัปโหลดมาเท่านั้น
- วัตถุประสงค์ของการประมวลผลจำกัดอยู่ที่การตอบสนองต่อคำขอของผู้ใช้
- บางภูมิภาคอาจต้องขอความยินยอมก่อนประมวลผลภาพ
- ไม่ควรแชร์ภาพของผู้อื่นโดยไม่ได้รับความยินยอม
การเขียนพรอมป์และภาษาที่รองรับ
- Bing Image Creator และ Bing Video Creator รองรับมากกว่า 100 ภาษา โดยดูรายการทั้งหมดได้ที่ Microsoft Translator
- หากต้องการผลลัพธ์ที่ดี ควรเขียนพรอมป์ให้เฉพาะเจาะจงและมีจินตนาการ มากกว่าการเขียนสั้น ๆ แบบคำค้นหา
- หากระบุรูปลักษณ์ สี พื้นผิว การกระทำ ฉากหลัง แสง มุมกล้อง และสไตล์สื่อของหัวข้อ ก็อาจช่วยให้คุณภาพผลลัพธ์ดีขึ้น
- พรอมป์วิดีโอสามารถใส่คำอธิบายธีมอย่าง “action movie”, “fantasy”, “dramatic” และคำบรรยายแสงอย่าง “direct sunlight”, “dusk”, “soft lighting” ได้
- ในวิดีโอที่มีเสียง สามารถแนะนำเสียงบรรยากาศ แนวทางดนตรี และโทนการบรรยายได้ แต่ไม่สามารถกำหนดบทพูดที่เป๊ะเจาะจงเป็นสคริปต์ได้
Rewards และ AI อย่างรับผิดชอบ
- เมื่อใช้สิทธิ์ Fast creation ฟรี 15 ครั้งต่อวันใน Image Creator ครบแล้ว ระบบจะสลับเป็นความเร็ว Standard creation โดยอัตโนมัติ
- หากเปิดการใช้คะแนน Microsoft Rewards ระบบจะหักคะแนนเมื่อใช้ Fast creation
- การตั้งค่า Rewards ของ Image Creator และ Video Creator ต้องเปลี่ยนแยกจากกัน
- หากคะแนนไม่พอ ระบบจะสลับเป็น Standard creation โดยอัตโนมัติ
- Microsoft ใช้มาตรการควบคุมเพื่อ ป้องกันการสร้างภาพและวิดีโอที่เป็นอันตราย ใน Bing Image Creator และ Bing Video Creator
- พรอมป์ที่อาจก่อให้เกิดภาพที่เป็นอันตรายจะถูกบล็อกอัตโนมัติและแจ้งให้ผู้ใช้ทราบ
- ภาพจาก Image Creator จะมีลายน้ำที่มุมล่างซ้าย
- ทั้งภาพและวิดีโอจะมีข้อมูลรับรองเนื้อหาและข้อมูลแหล่งที่มาตามมาตรฐาน C2PA
- ศิลปินที่ยังมีชีวิตอยู่ คนดัง และองค์กร สามารถขอจำกัดการสร้างภาพที่เกี่ยวข้องกับชื่อและแบรนด์ของตนผ่านตัวเลือก AI-powered features ใน Report a Concern form
- หากมีการสร้างเนื้อหาที่ไม่คาดคิดหรือไม่น่าพอใจ ผู้ใช้สามารถรายงานให้ Microsoft ทราบผ่าน Report a concern form หรือปุ่ม Feedback ในอินเทอร์เฟซ
- หากละเมิดนโยบายเนื้อหาซ้ำ ๆ ระบบอาจระงับการใช้งานชั่วคราวโดยอัตโนมัติ และหากถูกระงับหลายครั้งอาจนำไปสู่การจำกัดแบบถาวร
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ดูเหมือนว่า LLM จะปรับ prompt เล็กน้อย ก่อนส่งไปยัง DALL-E และส่วนนั้นสามารถ jailbreak ได้
https://twitter.com/madebyollin/status/1708204657708077294
https://media.discordapp.net/attachments/1023643945319792731...
#graphic_art("my prompt here")เครื่องมือพวกนี้โดยทั่วไปก็เป็นแบบนี้ ดูเหมือนจะสร้างผลลัพธ์ที่ทั้งตลกมากและชวนไม่สบายใจได้ค่อนข้างง่าย อาจจะอยู่ได้ไม่นานนัก
https://www.reddit.com/r/ChatGPT/comments/16wf1i0/dalle_3_is...
แน่นอนว่าคนก็คงจะทำสิ่งที่อยากทำในท้ายที่สุดอยู่ดี ดังนั้นพอความแปลกใหม่จางลงแล้วปล่อยให้เลิกกันไปเองก็น่าจะดี
แก้ไข: ใน prompt ไม่มี “fawn” และพออ่านคอมเมนต์ตอบกลับแล้วถึงเข้าใจ
ผลงานชนะเลิศ: https://www.bing.com/images/create/paint-a-picture-in-the-st...
ดูเหมือนจะดีขึ้นจากเวอร์ชันก่อนอย่างชัดเจน ตอนนี้อย่างน้อยในบางกรณีก็สามารถสร้าง ข้อความที่ถูกต้อง ภายในภาพได้
ตัวอย่างเช่น prompt
Neon sign saying "Scotland"ได้ผลลัพธ์แบบนี้: https://www.bing.com/images/create/neon-sign-saying-22scotla...แต่คำที่ไม่ค่อยพบบ่อยอย่าง Kubernetes ยังดูจะลำบากอยู่ ถึงอย่างนั้นก็เป็นอีกก้าวในทิศทางที่ถูกต้อง
ในอินเทอร์เฟซแชตของ Bing ถ้าถามว่า “วาดรูป X ให้ได้ไหม?” มันจะตอบว่า “ขออภัย แต่ฉันวาดรูปไม่ได้ ต้องการความช่วยเหลืออื่นไหม?” แล้วทันทีหลังจากนั้นก็มีข้อความตามมาว่า “การสร้างภาพกำลังใช้เวลาอยู่ โปรดตรวจสอบความคืบหน้าใน Image Creator”
ดูเหมือนว่าคำตอบในแชตใช้ LLM ที่ไม่รู้ว่าตัวเองสามารถวาดภาพได้ และในขณะเดียวกันก็รันโมเดลอีกตัวแบบขนานเพื่อกำหนดว่าจะวาดอะไรให้ดู
ใน Bing ผมพิมพ์ว่า “Draw me an image of...” หรือแค่ “Image: คำอธิบายภาพ” จนถึงตอนนี้ก็ทำงานได้ดี
ดูเหมือน LLM จะมองตัวสร้างภาพเป็นเครื่องมือที่มันใช้ หรือพูดอีกอย่างคือเป็นสิ่งที่แยกจากตัวมันเอง
ในช่วง 24 ชั่วโมงที่ผ่านมาได้ลองสร้างโน่นนี่ดู ถือว่าค่อนข้างดี ผมไม่ชอบ อินเทอร์เฟซ Discord ของ Midjourney จริง ๆ
เป็นวิธีที่ค่อนข้างดีสำหรับการสเกลอย่างรวดเร็วมากในช่วงแรก แต่ Discord คงไม่ชอบแน่ ๆ นึกว่าป่านนี้จะทำอินเทอร์เฟซของตัวเองแล้ว
Bing ดูค่อนข้างจนตรอก เมื่อวานผมพยายามติดตั้ง GPT บนอุปกรณ์ ผลลัพธ์แอปอันดับแรกเป็นโฆษณา และมันคือ Bing แถมยังบอกว่าถ้าใช้แอปจะได้รับรางวัลด้วย
ไม่รู้ว่าสนใจเพิ่มจำนวนผู้ใช้มากกว่า หรือสนใจเก็บข้อมูลหอมหวานมากกว่า น่าจะทั้งคู่
https://en.wikipedia.org/wiki/Microsoft_Bing#:~:text=Bing%20...
ชอบที่ i18n ภาษาฝรั่งเศสของชื่อหน้านั้นเป็น “Créer art de mots avec IA” แปลห่วยระดับเกือบเท่า “all your base are belong to us”
น่าจะเป็น AI แปล แต่ถ้าเป็นผู้ใช้ภาษาฝรั่งเศสก็คงเชื่อมั่นในผลิตภัณฑ์ AI บนหน้านี้ได้ยาก
ลองดูได้ว่า ChatGPT-4 จัดการคำขอแปลโดยตรงอย่างไร: https://chat.openai.com/share/8211a1f6-552b-4bf6-8f9c-bcbeb8...
และดูได้ว่ามันพูดถึงชุดคำแปลเดิมอย่างไร: https://chat.openai.com/share/299e40ce-806b-4f0e-a889-cb2ee2...
ผมไม่ค่อยรู้ภาษาฝรั่งเศส แต่จากประสบการณ์แปลภาษาสเปนที่พอรู้บ้างและภาษาอื่น ๆ ด้วย “AI” นั้นดีกว่า Google Translate หลายเดือนก่อนผมเทียบงานแปลเป็นอังกฤษของ ChatGPT-4 กับ Google Translate แบบวางข้างกัน ผลคือเทียบกันไม่ติด
ไม่ชัดเจนว่า Microsoft เอาคำแปลแย่ ๆ แบบนี้มาจากไหน แต่ถ้าแปลด้วย ChatGPT-4 ก็น่าจะแย่น้อยกว่านี้
คำอย่าง “for” หรือ “to” ถูกแทนด้วยคำในบริบทที่ต่างกันโดยสิ้นเชิง ทำให้นึกถึงเครื่องแปลภาษาแถว ๆ ปี 2000
น่าเสียดายที่ฟีเจอร์ใหม่ ๆ ของ Windows อย่างการบังคับซิงก์ OneDrive ก็ใช้คำแปลแย่พอ ๆ กัน ทุกวันนี้ภาษาฟินแลนด์ในอีเมลฟิชชิงยังดีกว่า Windows อีก
ทำให้ Tux ออกมาดูถูกต้องได้แล้ว: https://www.bing.com/images/create/tux-the-penguin-lounging-...
มันขึ้นว่า “รอ 2 ชั่วโมง”, “การสร้างภาพใหม่อาจใช้เวลา”, “บูสต์หมดแล้ว การสร้างภาพอาจใช้เวลานานกว่าปกติ”
Microsoft กำลังเผาเงินไปมากแค่ไหนกันแน่กับการให้ฟีเจอร์ทั้งหมดนี้?
ครั้งสุดท้ายที่เช็ก ดูเหมือนว่าต่อให้แจกหนักขนาดนี้ก็ไม่ได้ส่งผลกับ Bing มากนัก ไม่ใช่เหรอ?
สงสัยว่านี่เป็น “ทำเพราะทำได้” หรือมันทำเงินได้จริง ๆ
[0]: https://searchengineland.com/new-bing-google-market-share-si...
ถ้าถามว่าทำกำไรไหม ก็คงไม่ แต่ตรงนั้นแหละคือประเด็น ให้บริการต่ำกว่าราคาตลาด รอจนคู่แข่งหายไป แล้วค่อยทำเงิน
ตัวอย่างมีเยอะมาก แต่นึกถึงอย่าง Google Workspace ทำให้เริ่มใช้ได้ง่ายและถูก ให้คนกับบริษัทคุ้นกับผลิตภัณฑ์ แล้วค่อย ๆ ต้มกบทีละนิด
https://jobs.careers.microsoft.com/global/en/job/1627555/Pri...
เห็นจาก Slashdot: https://m.slashdot.org/story/419681
เหมือนกับที่ Edge ใช้สำหรับติดตั้ง Chrome
ต่อให้ใส่การตลาดหรือฟีเจอร์เข้าไปเท่าไร ก็ทำให้ซากศพพวกนี้กลับมาเดินไม่ได้