19 คะแนน โดย GN⁺ 2025-10-02 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • ณ เดือนกันยายน 2025 โมเดล AI ทรงพลังอย่าง Claude Opus 4.1, GPT-5, Nano Banana ได้ถือกำเนิดขึ้น ทำให้ยุคทองของการพัฒนาซอฟต์แวร์มาถึง
  • บนฉากหลังของสภาพแวดล้อม AI ในปัจจุบัน ผู้เขียนเสนอ 28 เครื่องมือ AI เชิงนวัตกรรม ที่ยังไม่มีอยู่จริงแต่อยากให้มี
  • ไอเดียที่เสนอครอบคลุมหลากหลายด้าน เช่น ประสิทธิภาพส่วนบุคคล, การพัฒนาโค้ด, เฮลธ์แคร์, การสร้างคอนเทนต์
  • คุณลักษณะที่ถูกเน้นร่วมกันคือความสามารถในการพัฒนาให้ดีขึ้นผ่าน การรับรู้บริบท, การปรับให้เหมาะกับผู้ใช้, และ การเรียนรู้แบบอัตโนมัติพร้อมวงจรป้อนกลับ
  • แทนที่จะเป็นเอเจนต์ทั่วไปแบบในปัจจุบัน ผู้เขียนเสนอแนวคิดของ AI เอเจนต์เฉพาะทางที่มีจุดประสงค์เดียว และ มาร์เก็ตเพลส สำหรับแลกเปลี่ยนเอเจนต์เหล่านี้

28 เครื่องมือ AI ที่เสนอ

1. แอปกล้องที่ใช้ Nano Banana

  • แอปที่เปลี่ยนภาพถ่าย iPhone ธรรมดาให้ดู เหมือนถ่ายด้วย Leica

2. เอเจนต์สำหรับเพิ่มโหมดสว่าง/มืดอัตโนมัติ

  • เพิ่มการรองรับโหมดสว่าง โหมดมืด และธีมแบบกำหนดเองให้ทุกโปรเจ็กต์ฟรอนต์เอนด์โดยอัตโนมัติ
  • ใช้วิสัยทัศน์คอมพิวเตอร์เพื่อตรวจสอบการเปลี่ยนแปลง UI และ แก้ไขซ้ำแบบวนรอบ โดยอิงจาก UI ที่เรนเดอร์แล้ว

3. เอเจนต์ถอดคอมไพล์และดีบักโค้ดที่ถูกทำให้อ่านยาก

  • ถอดคอมไพล์โค้ดที่ถูก minify ให้กลับมาเป็นโค้ดเบสที่อ่านเข้าใจได้และดีบักได้
  • ต้องมี วงจรโค้ด-ดีบัก ที่ทรงพลัง

4. ไฮบริดระหว่างแอป Strong กับ ChatGPT

  • โมเดลเข้าถึงข้อมูลการออกกำลังกายและเสนอคำแนะนำเพื่อพัฒนา พร้อมทำหน้าที่โค้ช
  • สามารถคุยกับโมเดลที่รู้ บริบทอย่างละเอียด แม้แต่เวลาระหว่างแต่ละเซ็ต

5. เอนจินแนะนำ

  • วิเคราะห์ประวัติการท่องเว็บเพื่อดูว่าโพสต์บล็อกหรือบทความใดที่ผู้ใช้ใช้เวลาอ่านนานที่สุด
  • ค้นเว็บทุกคืนเพื่อหาเนื้อหาที่ควรอ่าน และส่ง ลิงก์ไดเจสต์ในตอนเช้า
  • ปรับปรุงไดเจสต์ของวันถัดไปจากฟีดแบ็กต่อคำแนะนำที่ดี/ไม่ดี

6. แอปแชตติดตามแคลอรี

  • แอปแชตที่อิงกับฐานข้อมูลโภชนาการ
  • ลด ภาระทางความคิด ที่ต้องใช้ในการบันทึกมื้ออาหารให้น้อยที่สุด

7. แอปมินิมอลสำหรับเขียนคอนเทนต์ยาว

  • โมเดลจะไฮไลต์ข้อความบางช่วงและทิ้งคอมเมนต์ไว้ที่ขอบหน้า
  • ตั้งค่า "เพอร์โซนา" ได้หลายแบบ เพื่อใช้ตรวจทานสิ่งที่เขียน

8. เอเจนต์สร้างเอเจนต์ AI ผู้เชี่ยวชาญ

  • หากได้รับคำอธิบายงานอย่าง "ช่วยสร้างเอเจนต์ถอดคอมไพล์โค้ดให้หน่อย" ก็จะ สร้างเอเจนต์ที่เฉพาะทางมาก ๆ โดยอัตโนมัติ

9. เครื่องอ่านอีบุ๊กแบบมินิมอล

  • ระหว่างอ่านอีบุ๊ก หากไฮไลต์ข้อความบางช่วง โมเดลจะอธิบายเชิงลึกเพิ่มเติมอยู่ด้านข้าง
  • สวมบทเป็นเพอร์โซนาของผู้เขียน
  • ควรให้ความรู้สึกเหมือนเป็น ส่วนขยายของหนังสือ มากกว่าจะเป็นแชตอินสแตนซ์แยกต่างหาก

10. เอเจนต์ Deep Research ที่ใช้เวลาให้เหตุผลหลายวัน

  • รองรับการป้อนคำถามที่ซับซ้อนมาก
  • สร้างเอเจนต์ย่อยหลายร้อยตัวและ ใช้เวลาให้เหตุผล 3 วัน ก่อนส่งคำตอบกลับมา

11. แอปสร้างภาพยนตร์แบบ paint-by-number

  • ระดมไอเดียหนังสั้น แล้วโมเดลสร้าง สตอรีบอร์ดอย่างละเอียด
  • ผู้ใช้เพียงแค่ถ่ายแต่ละฉากตามสตอรีบอร์ดด้วยสมาร์ตโฟน
  • ทำหน้าที่เป็น ล้อช่วยพยุงสำหรับการสร้างหนัง

12. แอปบันทึกหน้าจอและสรุปเชิงความหมาย

  • ใช้โมเดลบนเครื่องเพื่อสร้าง สรุปเชิงความหมายอย่างละเอียด ของสิ่งที่ทำบนคอมพิวเตอร์ในแต่ละวัน
  • ส่งให้แอปแชตเป็นบริบท เช่น: "เมื่อวานฉันลืมตอบใครไปนะ?"
  • แม้จะใช้ Rewind มา 1 ปี แต่ก็ ไม่ได้มีประโยชน์เท่าที่คาดหวัง

13. ตัวกรองเชิงความหมายสำหรับ Twitter/X/YouTube

  • เขียน ตัวกรองแบบปลายเปิด ได้ เช่น "ซ่อนทวีตที่มีแนวโน้มจะทำให้ฉันหงุดหงิด"
  • เอาคอนเทนต์ที่กระตุ้นความโกรธออกจากฟีด
  • เรา หล่อหลอมตัวเองผ่านการหล่อหลอมฟีดของเรา

14. เอเจนต์สร้างหลักสูตรเฉพาะทางสำหรับหัวข้อเฉพาะกลุ่ม

  • รองรับคำขออย่าง "ฉันอยากเรียนรู้ทุกอย่างที่เรารู้เกี่ยวกับวิทยาศาสตร์แห่งความก้าวหน้า"
  • ค้นหาบุคคล บล็อก วิดีโอ YouTube เรียงความ และตำราเรียนจากบนเว็บ
  • อ่านคอนเทนต์ทั้งหมดและจัดทำ หลักสูตรที่พาจากระดับเริ่มต้นไปสู่ผู้เชี่ยวชาญ

15. เอนจินแนะนำหนังสือที่ดีจริง ๆ

  • เริ่มจากทำ แบบทดสอบ เกี่ยวกับสิ่งที่เคยอ่าน เป้าหมาย และประเภทการอ่านที่ชอบ
  • เมื่อรู้ข้อมูลมากพอ เอเจนต์อื่นจะจำลองว่าผู้ใช้น่าจะคิดอย่างไรกับข้อเสนอของเอเจนต์หลัก
  • คัดมาเฉพาะ หนังสือที่มีโอกาสสูงมากว่าจะชอบจริง ๆ

16. เอนจินค้นหาเชิงความหมายสำหรับ TikTok และ Instagram Reels

  • ช่วย เข้าถึงข้อมูลที่มีประโยชน์ ซึ่งถูกขังอยู่ในวิดีโอสั้น
  • ต้องมีความสามารถในการค้นหาแบบสืบค้นได้

17. แอปฟิตเนสด้านการนอน

  • รวมข้อมูล จาก Apple Watch (อัตราการเต้นหัวใจ, VO₂), Eight Sleep, Oura Ring และแอปออกกำลังกาย
  • ให้คำแนะนำที่นำไปใช้ได้จริงเพื่อปรับปรุงการนอนและการฟื้นตัว
  • ส่งข้อความเชิงรุก เช่น: "สัปดาห์นี้ HRV ของคุณลดลง คุณอาจกำลังฝึกหนักเกินไปหรือเปล่า?"

18. ไลบรารีคอมโพเนนต์ขนาดใหญ่

  • ออกแบบมาให้ เรนเดอร์ภายในอินเทอร์เฟซแชต
  • ไลบรารีที่มีอยู่ในปัจจุบันมี primitive ที่อยู่ระดับล่างเกินไป
  • ให้ความสำคัญกับ วิดเจ็ตระดับสูงมากกว่าการคัสตอม

19. ผู้ช่วยเสียงแบบมินิมอลสำหรับ Apple Watch

  • สำหรับคำถามที่ซับซ้อนเกินไปสำหรับ Siri แต่เหมาะกับ ChatGPT
  • ให้คำตอบสั้น ๆ เพียง ไม่กี่คำ

20. แอปเขียนที่ให้รายการอ่านแนะนำ

  • ค้นเว็บตามหัวข้อที่กำลังเขียน และจัดทำ รายการแหล่งข้อมูลที่น่าจะเป็นประโยชน์
  • แอปเขียน ต้องไม่เขียนแทนผู้ใช้

21. แอปรันนิ่ง

  • สร้างแผนเฉพาะบุคคล ติดตามเพซการวิ่งและอัตราการเต้นหัวใจ
  • ปรับโปรแกรมฝึกซ้อมแบบวนซ้ำจากข้อมูลจริง

22. ซูเปอร์แอปแต่งภาพ Nano Banana

  • มี เทมเพลตกว่าหลายร้อยแบบ โดยไม่ต้องเขียนพรอมป์ต์
  • เช่น ลองทรงผมหลายแบบ ทำนายหน้าตาลูกกับคู่รัก หรือทำให้ดูเหมือน The Rock

23. การค้นหาวิดีโอ YouTube สไตล์ Same.energy

  • ใส่ URL แล้วค้นหา วิดีโอที่มีบรรยากาศคล้ายกัน
  • อัลกอริทึม YouTube ในปัจจุบันมุ่งแค่เพิ่มการมีส่วนร่วมของผู้ใช้เฉลี่ยให้สูงสุด

24. อุปกรณ์สไตล์ Sony Walkman สำหรับเด็ก

  • อุปกรณ์แบบ เน้นเสียงเป็นหลัก ที่สามารถถาม LLM ได้
  • เป็นอุปกรณ์ที่เน้นการอธิบายและ ไม่มีหน้าจอเลย
  • ถ้าเป็นแบบออฟไลน์เป็นหลักได้ก็ยิ่งดี

25. เอนจินค้นหาชีวประวัติ

  • ใช้ คำค้นแบบแบบสอบถาม เกี่ยวกับปัญหาที่กำลังเผชิญ ช่วงชีวิต สาขา ฯลฯ
  • ส่งคืนเป็นผลลัพธ์จาก บทในชีวประวัติ/อัตชีวประวัติของบุคคลสำคัญในประวัติศาสตร์ ที่พูดถึงสถานการณ์คล้ายกัน

26. เอเจนต์ตรวจสอบการเสพคอนเทนต์ด้วยการบันทึกหน้าจอ

  • เฝ้าดูการใช้งานคอมพิวเตอร์และสมาร์ตโฟน
  • ตรวจสอบคอนเทนต์ที่บริโภคในแต่ละวัน
  • Screen Time ยังไม่ละเอียดพอ
  • ต้องรู้ คุณค่าทางโภชนาการที่แท้จริงของโทเค็น ที่เรากำลังเสพ

27. มาร์เก็ตเพลสเอเจนต์ AI สำหรับงานเฉพาะกลุ่ม

  • เอเจนต์ที่ ออกแบบมาให้เหมาะกับกรณีใช้งานเฉพาะ น่าจะดีกว่าเอเจนต์อเนกประสงค์
  • แคตตาล็อกเอเจนต์เฉพาะทางมาก ๆ สำหรับงานเฉพาะกลุ่ม เช่น การหาอพาร์ตเมนต์เช่าในซานฟรานซิสโก
  • ต้องมี เอเจนต์นับหมื่นตัว ที่ใช้งานได้ผ่านเว็บหรือ API

28. ฟีเจอร์ขอคำวิจารณ์จากนักเขียนชื่อดัง

  • "ถ้าเป็น Hemingway เขาจะพูดอะไรกับบล็อกโพสต์นี้?"
  • ช่วยดูว่าเขา สับสนตรงไหนและชอบตรงไหน

2 ความคิดเห็น

 
shakespeares 2025-10-07

ข้อ 2 กับ 3 ถ้าทำได้อัตโนมัติจริง ๆ ก็คงดีมากเลยนะครับ
ดูเหมือนจะเป็นหนึ่งในงานซ้ำ ๆ ที่น่ารำคาญ เพราะต้องคอยเพิ่มทีละอันอยู่เรื่อย ๆ

 
GN⁺ 2025-10-02
ความคิดเห็นจาก Hacker News
  • คิดว่าควรระมัดระวังมากจริง ๆ กับข้อ "24. ให้เด็กมีอุปกรณ์สไตล์ Sony Walkman สำหรับถาม LLM ได้"

    • ตราบใดที่ยังไม่ใช่ AGI คำตอบที่เด็กจะได้ฟังส่วนใหญ่คงแม่นยำมาก แต่คำตอบผิดเพียงเล็กน้อยหรือความเข้าใจคลาดเคลื่อนแบบละเอียดอ่อนจำนวนน้อยมาก ก็อาจส่งผลร้ายแรงต่อเส้นทางการเรียนรู้ของเด็กได้
    • ต่อให้เป็น LLM ที่สมบูรณ์แบบและไม่เคยพลาดเลย ผลลัพธ์ก็คือความจำเป็นในการสื่อสารกับผู้อื่นจะลดลง ทำให้โอกาสพัฒนาทักษะการทำงานร่วมกันลดลงด้วย
    • ในมุมของพ่อแม่อาจแค่อยากพักสักครู่ แต่ถ้าเด็กรู้จักอุปกรณ์ที่ตอบได้ทันทีตลอดเวลา เวลาผูกพันอันมีค่าที่ใช้ร่วมกันเพื่อหาคำตอบก็จะหายไป เด็กอาจค่อย ๆ ห่างจากพ่อแม่มากขึ้น ต้องคิดให้ดีว่าจะส่งต่อค่านิยมแบบไหนให้เด็ก
    • พ่อแม่ที่เอาระบบแบบนี้ไปติดให้ลูก ต่างตั้งอยู่บนสมมติฐานว่าโลกทัศน์และค่านิยมของตนถูกสะท้อนในระบบนั้นอย่างดีแล้ว พ่อแม่ใน HN อาจมีมุมมองแบบวิทยาศาสตร์เป็นศูนย์กลาง แต่ในประเทศ/ภูมิภาคอื่น อุปกรณ์นั้นอาจกลายเป็นเครื่องมือโฆษณาชวนเชื่อทางการเมือง ศาสนา หรือวัฒนธรรมได้ ความเสี่ยงที่เครื่องมือแบบนี้จะถูกใช้เป็นอาวุธล้างสมองมีสูงมาก
    • คิดว่าน่าจะได้ผลลัพธ์ที่ดีกว่าการไปถามครูที่โรงเรียนมาก

    • สองวันก่อนฉันลองขอให้ ChatGPT อธิบายเรื่องระบบค่าประจำหลัก (place-value system) ให้เด็กหกขวบเข้าใจ แต่กลับอธิบายผิดเพราะสับสนระหว่างค่าประจำหลักกับค่าของตัวเลข ฉันสังเกตเห็นข้อผิดพลาดนั้นและ ChatGPT ก็ขอโทษ แต่ถ้าลูกเป็นคนถามเองคงไม่รู้ว่ามันผิด
      เลยกังวลว่าลูกของฉันจะเชื่อข้อมูลผิด ๆ จากอุปกรณ์แบบนี้ว่าเป็นเรื่องจริงมากแค่ไหน

  • เรื่องข้อ 19 ฉันลองทำเองเมื่อไม่กี่สัปดาห์ก่อนด้วย iOS Shortcut

    เป็นผู้ช่วยเสียงแบบมินิมอลสำหรับ Apple Watch Siri รับมือคำถามซับซ้อนได้ยาก แต่ ChatGPT จัดการได้สบาย รับคำตอบเป็นประโยคสั้น ๆ กระชับไม่เกิน 150 ตัวอักษร
    ใช้แอ็กชัน Dictate Text รับเสียงแล้วส่งไปยัง OpenAI API พร้อมใช้ system prompt แบบนี้
    “CRITICAL: คำตอบจะแสดงได้แค่ใน push notification ของ iOS หรือบนหน้าจอนาฬิกาเท่านั้น ดังนั้นให้ตอบสั้น กระชับ ไม่เกิน 150 ตัวอักษร ห้ามใช้ Markdown ใช้ plain text เท่านั้น ใช้คำศัพท์และเครื่องหมายวรรคตอนที่ประณีตเท่าที่จำเป็น
    ผู้ใช้ไม่สามารถถามต่อจากคำตอบได้ ตอบทีละประโยคเดียว และถ้าจำเป็นต้องตั้งสมมติฐานเกี่ยวกับคำถามก็ให้ทำเลย ถ้าสมมติฐานผิดผู้ใช้ต้องถามใหม่”
    มันทำงานได้ค่อนข้างดี ข้อเสียใหญ่สุดคือใช้เวลา 5–20 วินาทีกว่าจะได้คำตอบ แต่การส่งคำถามแทบจะทันทีเลย (ไม่ต้องเปิดแอปแยก) เลยถือว่าน่าพอใจมาก

  • สิ่งที่ฉันรู้สึกจากไอเดีย/บทความจำนวนมากคือ พวกมันไม่ได้ "คิดแบบพอร์ทัล (thinking with portals)" เกี่ยวกับ LLM เรามีเทคโนโลยีระดับ "ปืนพอร์ทัล" อยู่ในมือแล้ว (อย่างน้อยก็มีการโฆษณาแบบนั้น) แต่กลับใช้มันแค่เป็นประตูที่ดีกว่าเดิมเท่านั้น

    • สิ่งที่ LLM ทำได้ท้ายที่สุดคือการขยายข้อความที่เชื่อมโยงกันอย่างมีตรรกะ การประยุกต์ใช้อาจกว้าง แต่ในทางปฏิบัติมันมักไปได้ไม่ไกลเกินกว่าตัวแก้ไขข้อความขั้นสูง ตัวอย่างเช่น ถ้าอยากใช้กับการตัดต่อวิดีโอ ก็ต้องสร้างภาษาสคริปต์ขึ้นมา และยังต้องซิงก์ความสามารถกับตัวตัดต่ออีก สำหรับบริษัทใหญ่อย่าง Adobe มูลค่าที่ได้เมื่อเทียบกับกำลังคนอาจไม่ชัดเจน ส่วนสตาร์ตอัปก็ต้องสู้กับ Adobe ในสงครามฟีเจอร์และการล็อกอินผู้ใช้ที่ยาวนาน ทั้งสองกรณีไม่มีข้อได้เปรียบมากนัก เว้นแต่ LLM จะปฏิวัติวงการได้จริง ๆ ยิ่งไปกว่านั้น LLM ยังมองผลลัพธ์วิดีโอโดยตรงไม่ได้ และ ณ ตอนนี้ก็ยังอยู่ระดับ "พอใช้ได้"

    • เห็นด้วยกับมุมมองนี้ ถ้ามีแหล่งอ้างอิงที่พอใช้ทำความเข้าใจเรื่อง "thinking with portals" ได้ อยากให้ช่วยแชร์หน่อย

    • ถ้ามีตัวอย่างของการคิดแบบพอร์ทัล จะดีมากถ้าช่วยแชร์แบบง่าย ๆ สั้น ๆ ได้

  • เรื่องข้อ 22 ฉันอยากได้เอนจินที่วิเคราะห์ประวัติการท่องเว็บของฉัน เพื่อดูว่าฉันใช้เวลาอ่านบล็อก/บทความแบบไหนนานที่สุด แล้วทุกคืนก็ค้นหาเนื้อหาแนะนำที่ฉันยังไม่เคยอ่านให้
    ChatGPT Pulse มีลักษณะคล้ายกันอยู่แล้ว แม้จะใช้ประวัติ ChatGPT แทน browser history แต่สำหรับคนที่ใช้ ChatGPT บ่อย คำแนะนำแบบนี้น่าจะเชื่อถือได้มากกว่า
    https://openai.com/index/introducing-chatgpt-pulse/

    • จะว่าไปแล้ว ฟีดอัลกอริทึมของโซเชียลมีเดียแทบทั้งหมดก็ทำหน้าที่นี้อยู่แล้ว
  • คิดว่าไอเดียส่วนใหญ่ที่เสนอในบทความนี้ จริง ๆ แล้วใกล้เคียงกับการอยากได้ UI/UX ที่ทำมาดีกว่านี้บน LLM พื้นฐานเสียมากกว่า

  • รู้สึกว่าวิธีคิดแบบนี้มีความสับสนเชิงหมวดหมู่ (category mistake) อยู่โดยพื้นฐาน
    ตัวอย่างเช่นฟีเจอร์ "ถ้าเป็น Hemingway เขาจะวิจารณ์งานเขียนของฉันว่าอย่างไร" แต่ความจริงแล้วนั่นคือคำตอบที่ AI สร้างขึ้น ไม่ใช่คำวิจารณ์ของ Hemingway ตัวจริง
    ถ้าถาม 100 โมเดลก็คงได้ 100 คำตอบ และวิธีคิดหรือนิสัยของ Hemingway จริง ๆ ก็ไม่อาจฟื้นคืนได้ครบถ้วนจากงานเขียนไม่กี่แสนคำของเขา
    สุดท้ายจึงเป็นปัญหาว่า "มันฟังดูน่าเชื่อพอเหมือนคนนั้นพูดจริงไหม"
    เหตุผลที่เราอยากฟังความเห็นจากคนดัง ก็เพราะมันเป็นมุมมองจากมนุษย์จริงที่ยังมีชีวิต การเลียนแบบของ AI ก็เหมือนพยายามกินรูปแซนด์วิชแทนแซนด์วิชจริง
    รู้สึกกังวลนิด ๆ ที่หลายคนยังไม่ขีดเส้นแบ่งให้ชัดกับภาพลวงตานี้

    • เห็นด้วย 100%
      แต่พออ่านคอมเมนต์นี้ก็ทำให้นึกถึง holodeck ใน Star Trek TNG ที่มีการจำลองบุคคลดังอย่างไอน์สไตน์ ฟรอยด์ ฯลฯ และในฐานะผู้ชม แม้ตอนอายุ 15 ก็ไม่ได้คิดว่า "นี่ก็แค่คำตอบสุ่มที่คอมพิวเตอร์ปั่นขึ้นมา"
      ในตอนหนึ่งจริง ๆ ก็มีฉากที่การจำลองบุคคลจริงจากข้อมูลบันทึกเกิดความผิดพลาด (https://www.imdb.com/title/tt0708682/) และต่อมาก็เผยให้เห็นว่ามันแตกต่างแค่ไหน (https://www.imdb.com/title/tt0708720/)
      สรุปคือ

      1. รู้สึกว่าตอนพวกนั้นล้ำยุคมากจริง ๆ
      2. ฉันไม่เคยรู้สึกไม่สบายใจกับการจำลองบุคคลประวัติศาสตร์ปลอม ๆ แบบนั้นเลย เลยสงสัยว่าทำไมในบริบทของ LLM ถึงรู้สึกอ่อนไหวขึ้นมา เป็นเพราะทุกคนรู้ตั้งแต่ต้นว่ามันปลอม 100% หรือมีเหตุผลอื่นกันแน่...
        โพสต์นี้ทำให้คิดหลายอย่างเลย
    • อธิบายได้ง่าย ๆ ว่าทำไมเราไม่จำเป็นต้องมี AI Hemingway เพราะจริง ๆ แล้วเมื่อราว 10 ปีก่อนก็มีคู่มือการเขียนที่ดีอย่าง hemingwayapp อยู่แล้ว https://hemingwayapp.com/
      มันใช้กฎง่าย ๆ ในการแก้ไวยากรณ์และชวนให้เปลี่ยนเป็นสำนวนที่ง่ายกว่า และการที่มันไม่ได้เขียนใหม่ให้อัตโนมัติ อาจยิ่งดีกว่าสำหรับการเรียนรู้ด้วยตัวเอง

    • พอมองไอเดียหลายอย่างอย่างเช่น "แอปแต่งภาพจิ๋วเหมือนกล้วย มีเทมเพลตกว่าหลายร้อยแบบโดยไม่ต้องใช้พรอมต์..." และอื่น ๆ ก็เห็นชัดว่าท้ายที่สุดมันคือความต้องการของมนุษย์ที่จะใช้ชีวิตให้ขี้เกียจยิ่งขึ้นไม่ทางใดก็ทางหนึ่ง เรื่องอย่าง "Hemingway จะคิดอะไร" ก็ให้ความรู้สึกคล้ายกัน

    • แก่นแท้คือคำถามว่า "มันเป็นคำตอบที่ดูน่าเชื่อในแบบของคนนั้นจนหลอกมนุษย์ได้ไหม" และจริง ๆ แล้วแค่นั้นก็มีประโยชน์ในตัวเอง
      ถ้ามนุษย์รู้ตัวว่ากำลังถูกหลอก เราเรียกสิ่งนั้นว่า make-believe หรือการระงับความไม่เชื่อ
      ทุกครั้งที่เราแสดงเป็นคนอื่น หรือพยายามคิดจากอีกมุมมองหนึ่ง เราก็ผ่านกระบวนการแบบนี้ เช่นเดียวกับเวลาที่เราพยายามเรียนรู้จากบันทึกของบุคคลจริงหรือตัวละครในนิยาย
      ฉันกลับคิดว่าการบอกว่า "เราอยากฟังความเห็นของ Steve Jobs/Hemingway เพราะเป็นมนุษย์จริง" นั้นตรงกันข้ามเสียอีก
      ในความเป็นจริง คู่สนทนาที่สำคัญไม่ใช่มนุษย์ตัวจริง แต่เป็นบุคลิกแบบสรุปย่อของคนดังหรือตัวละครที่เราจินตนาการขึ้นมา มีน้อยคนนักที่จะหมกมุ่นกับตัวตนจริงของบุคคลนั้น
      "Hemingway คนดัง" ในแบบที่ถูกสร้างเป็นตำนานต่างหากที่น่าดึงดูดกว่า และกลับมีประโยชน์กับน่าสนใจกว่าของจริงเสียอีก
      เพราะงั้นในกรณีอย่าง Star Trek TNG ฉันจึงมองว่าการจำลองบุคคลเสมือนแบบนั้นกลับทำงานได้ดีตามเจตนาเดิมอยู่แล้ว

    • Feynman เคยบอกว่า "หลักการข้อแรกของวิทยาศาสตร์คืออย่าหลอกตัวเอง" และฉันคิดว่าคำนี้ใช้ได้กับผลลัพธ์จาก LLM เช่นกัน

  • น่าสนใจมาก
    พวกเราทุกคนเคยเห็นเดโมจากลิสต์นี้หรือเทคโนโลยีคล้ายกันมามากแล้ว และมีสตาร์ตอัปจำนวนมากที่ทุ่มเงินหลายร้อยล้านดอลลาร์ตลอดหลายปีเพื่อสร้างผลิตภัณฑ์
    แต่ถึงอย่างนั้นกลับแทบไม่เห็นผลิตภัณฑ์ที่ใช้งานได้จริงเลย และสิ่งที่เจอในชีวิตประจำวันก็ไม่ได้ทำงานดีเหมือนเดโม
    เลยอดสงสัยไม่ได้ว่ากำลังเกิดอะไรขึ้นกันแน่
    กล่าวคือ ผลิตภัณฑ์มีอยู่จริงแต่แทบไม่มีใครใช้ หรือว่าการใช้โมเดลที่ดีพอจนใช้งานได้จริงมันแพงเกินไป หรือว่าการทำเดโมสวย ๆ ง่ายกว่าการสร้างผลิตภัณฑ์จริงมาก... อยากรู้ว่าความเป็นไปได้ไหนคือคำอธิบาย

    • ต้นทุนในการเข้าถึงผู้ใช้เป้าหมายที่เหมาะสมสูงเกินไป
      ตอนคุยกับเอเจนซีโฆษณาแอปฟินเทค เขาบอกว่าต้องเผางบโฆษณาราวเดือนละ 20,000 ดอลลาร์เป็นเวลา 3 เดือนก่อน ถึงจะเริ่มเข้าใจว่ามันทำงานอย่างไร หลังจากนั้นค่อยลด CAC ลงและได้ผู้ใช้เป้าหมายมา
      พอปิดโฆษณา การรับรู้ต่อผลิตภัณฑ์ก็หายไปอีก และผู้ใช้ใหม่ก็หยุดไหลเข้า ไม่เหลือวิธีให้คนรู้เลยว่ามันมีอยู่
  • ไอเดียเหล่านี้จำนวนมากต้องอาศัยการเข้าใจรสนิยม รูปแบบ พฤติกรรมการสื่อสาร ตารางเวลา และข้อมูลสุขภาพของผู้ใช้
    Apple อาจมีจุดแข็งอย่างมากในด้านนี้
    เพราะโทรศัพท์กับนาฬิการู้ข้อมูลส่วนตัวมากที่สุด Apple อาจผสานบริบทหลากหลายเข้ากับ LLM ได้อย่างชาญฉลาดภายใต้เงื่อนไขการคุ้มครองความเป็นส่วนตัว

  • ฉันกดลิงก์นั้นเข้าไปแล้วรู้สึกผิดหวัง เพราะมันไม่ใช่เครื่องมือจริง แต่เหมือนแค่รวมไอเดียแอปที่ไม่ค่อยเกี่ยวข้องกัน

  • "อุปกรณ์สไตล์ Sony Walkman ที่ให้เด็กถาม LLM ด้วยเสียงได้"
    แม้จะไม่ตรงกัน 100% แต่สินค้าชิ้นนี้ https://www.aliexpress.com/item/1005009196849357.html ก็คล้ายมากทีเดียว
    มันไม่ออฟไลน์ แต่มีขนาดใหญ่กว่าลูกปิงปองนิดหน่อย
    ฉันให้หลาน ๆ (อายุ 5 กับ 3 ขวบ) ลองใช้เป็นใน 2 นาที แล้วพวกเขาก็ยิงคำถามเป็นชุดอย่าง "เล่านิทานเกี่ยวกับยูนิคอร์น Bob ให้ฟังหน่อย", "หมากับลิงเป็นเพื่อนกันได้ไหม?" และอีกมากมาย ซึ่งทั้งหมดก็ได้คำตอบที่ฟังดูเข้าท่าในไม่กี่วินาที
    คิดว่าคริสต์มาสนี้ผลิตภัณฑ์แบบนี้จะถูกฝังมาในของเล่นแน่ ๆ และถ้าออกมาก็จะซื้อทันที