• รวมประสบการณ์จริงที่สรุปกระบวนการทั้งหมดในการหางานตำแหน่ง Research Scientist หลังจบปริญญาเอกด้าน Machine Learning
  • อ้างอิงจากกรณีที่ ได้รับออฟเฟอร์จากทุกบริษัทที่สัมภาษณ์จบครบถ้วน รวมถึง DeepMind, Isomorphic Labs, Cohere, Meta และสตาร์ตอัปแบบ stealth
  • สรุปเป็นลำดับขั้นตั้งแต่เกณฑ์การได้สัมภาษณ์, วิธีเตรียมด้านเทคนิค·อารมณ์·โลจิสติกส์, การเปรียบเทียบสตาร์ตอัป vs บิ๊กเทค ไปจนถึงการต่อรองเงินเดือน
  • รวมรายการเตรียมตัวแบบเฉพาะเจาะจง เช่น ความต่างด้านภาษี·โครงสร้างของ RSU กับ stock option และการ ลงมือเขียน transformer·attention เอง
  • เน้นย้ำว่าโดยแก่นแล้วการสัมภาษณ์มีความ สุ่ม (stochastic) และผลลัพธ์ไม่ได้เป็นตัวตัดสินคุณค่าของคุณในฐานะนักวิจัย

ผลลัพธ์การสัมภาษณ์ทั้งหมดและภูมิหลัง

  • ผู้เขียนผ่านประสบการณ์หางาน Research Scientist หลังจบปริญญาเอกด้าน ML ด้วยตัวเองและนำมาสรุป โดยตอนเริ่มแทบไม่มีแหล่งข้อมูลอ้างอิงเลย
  • ได้รับออฟเฟอร์จากทุกบริษัทที่สัมภาษณ์จนจบ — รวมถึง DeepMind (ตอบรับ), Isomorphic Labs, Cohere, Meta และสตาร์ตอัปแบบ stealth
    • Anthropic, Mistral, TeslaAI ติดต่อกลับช้าเกินไปจึงทำกระบวนการไม่ทันเสร็จ
    • ReflectionAI เป็นที่เดียวที่ถูกปฏิเสธในตำแหน่ง RS แต่ได้รับข้อเสนอให้เปลี่ยนไปสาย Engineering แทน
  • SpaceXAI, Waymo, Wayve ไม่ได้เชิญสัมภาษณ์
    • ผู้เขียนสมัคร Waymo ทุก 6 เดือนตลอดช่วงเรียนปริญญาเอก แต่ไม่เคยได้รับการตอบกลับเลย

วิธีให้ได้สัมภาษณ์

  • คันโยกสำคัญในการได้สัมภาษณ์คือ มี paper มากขึ้น, ทำหัวข้อที่กำลังมาแรง, และมี internship ที่ดีกว่าเดิม
    • ระหว่างเรียนปริญญาเอกมี paper ผู้เขียนลำดับแรก (หรือร่วมลำดับแรก) 4 ฉบับ ที่ตีพิมพ์ใน ICLR / NeurIPS / ICML (LLM, RL, Meta-Learning, Evolution Strategies)
    • เคยฝึกงานที่ Apple และมีประสบการณ์เป็นวิศวกรซอฟต์แวร์ที่ Meta
  • เกณฑ์คร่าว ๆ คือถ้ามี paper ผู้เขียนลำดับแรกอย่างน้อย 3 ฉบับ + internship หรือประสบการณ์ในอุตสาหกรรมอย่างน้อย 1 ครั้ง ก็มีโอกาสได้ callback จากแล็บชั้นนำอย่างต่อเนื่อง
  • ถ้าคุณเริ่มได้สัมภาษณ์อยู่แล้ว paper เพิ่มเติมจะไม่ค่อยช่วย → ควร โฟกัสกับการเตรียมสัมภาษณ์ ไม่ใช่งานวิจัย และเพราะคุณจะไม่เคยรู้สึกว่า “พร้อมแล้ว” จึงควรเริ่มตั้งแต่ตอนนี้

Cover letter, referral, cold email, LinkedIn/X

  • LinkedIn / X: หลายบริษัทลงประกาศรับสมัครที่นี่ และบาง internship ก็สมัครได้ผ่านช่องทางนี้เท่านั้น
    • ต้องกรอก Google form ที่แนบกับประกาศด้วยจึงจะนับว่าเป็นการสมัครจริง
  • Referrals (การแนะนำ): มีก็ดี แต่ไม่จำเป็น
    • ที่ DeepMind ผู้เขียนได้รับเชิญสัมภาษณ์ทั้งตำแหน่งที่มี referral และไม่มี referral
  • Cold emails: การส่งอีเมลหาฝ่ายสรรหาหรือคนในทีมโดยตรงมักเป็นสิ่งที่ยินดีรับ
    • ไม่ใช่แค่ส่ง CV ซ้ำ แต่ควรอธิบายว่าทำไมคุณถึงเหมาะกับทีมนั้นและสนใจตรงไหน
  • Cover letters: ไม่ค่อยถูกขอ แต่ถ้าถูกขอก็ควรเขียนให้ดี
    • อย่าให้ Claude / Gemini / ChatGPT เขียนให้ทั้งฉบับ, ควรเขียนเองก่อนแล้วใช้ช่วยเกลาเท่านั้น

สตาร์ตอัป vs บิ๊กเทค

  • หาสตาร์ตอัปยากกว่า เพราะไม่มีศูนย์กลางค้นหาที่ชัดเจน → การบอกต่อผ่านเพื่อนร่วมงาน เพื่อน หรืออดีตเพื่อนร่วมงานคือวิธีที่ดีที่สุด และการแข่งขันก็มักน้อยกว่า
  • กระบวนการสัมภาษณ์ของสตาร์ตอัปแปรปรวนมากกว่า ขณะที่บิ๊กเทคมีโครงสร้างที่คาดเดาได้มากกว่า
    • ถ้ากระบวนการดูง่ายเกินไป อาจเป็นสัญญาณถึงความซับซ้อนของงานจริง
  • ลักษณะงานมีทั้งสองด้าน — ถ้าเป็นสตาร์ตอัปที่เหมาะ คุณอาจได้ทำวิจัยที่น่าสนใจและมีอิมแพกต์มากกว่า แต่ก็อาจมาพร้อมแรงกดดัน งานโครงสร้างพื้นฐาน และการเปลี่ยนทิศทางวิจัยบ่อยครั้ง
    • ตอนสัมภาษณ์ควรถามว่าใครเป็นคนจัดลำดับความสำคัญของงานวิจัย, เส้นทางการสร้างรายได้คืออะไร, และคู่แข่งคือใคร
  • โอกาสเติบโต: สตาร์ตอัปเปิดโอกาสให้เติบโตเร็ว รับผิดชอบมากขึ้น และช่วยกำหนดทิศทางงาน ส่วนในบิ๊กเทคคุณอาจเป็นเพียงหนึ่งในหลายคน
  • การเป็นที่รู้จักใน CV: OpenAI หรือ Anthropic คนเห็นแล้วรู้จักทันที แต่ถ้าเป็นสตาร์ตอัป stealth ที่ไม่มีชื่อเสียง คุณต้องอธิบายเพิ่ม
  • ความมั่นคงในการจ้างงาน: บิ๊กเทคเองก็เคยปลดพนักงานครั้งใหญ่ซ้ำ ๆ ดังนั้นไม่มีฝั่งไหนปลอดภัย 100%

ค่าตอบแทน: RSU vs Stock Option (อิงสหราชอาณาจักร)

  • RSU (พบบ่อยในบิ๊กเทค): ได้รับหุ้นจริงตามตาราง vesting และตอน vest มักถูกขายออกทันทีราวครึ่งหนึ่งเพื่อกันไว้จ่ายภาษีเงินได้ — RSU ถูกเก็บภาษีเป็นรายได้
  • Stock option (พบบ่อยในสตาร์ตอัป): ไม่ใช่หุ้น แต่เป็นสิทธิ์ในการซื้อหุ้นที่ราคาคงที่ X
    • ถ้าราคาตลาด Y > X ก็ซื้อที่ X แล้วขายที่ Y เพื่อรับกำไรส่วนต่างได้ แต่ถ้า Y < X option ก็ไม่มีมูลค่า
  • โดยทั่วไป stock option จะ หมดอายุหลังลาออก 90 วัน และถ้าบริษัทยังไม่เข้าตลาด ต่อให้ซื้อแล้วก็ยังขายไม่ได้
    • ในสหราชอาณาจักร ตอนใช้สิทธิ์จะถูกเก็บภาษีเงินได้กับส่วนต่าง Y−X ทันที ทั้งที่ยังไม่ได้รับเงินสดแม้แต่นิดเดียว
    • ถ้าทำงานกับบริษัทเอกชน 2 ปีแล้วลาออกและใช้สิทธิ์ คุณต้องจ่ายทั้งค่าซื้อหุ้น (X × จำนวน option) และภาษีเงินได้ที่คำนวณจาก (Y−X) × จำนวน option × อัตราภาษี ก่อนจะมีรายได้จริง
  • ส่วนใหญ่มีตัวเลือก cashless exercise และหลายบริษัทก็มีการรับซื้อหุ้นคืนของพนักงาน (liquidity event)
    • แต่ทุกครั้งที่มี funding round สัดส่วนการถือหุ้นจะถูก dilute, กำไรเพิ่มเติมยังโดนภาษีกำไรจากการขายสินทรัพย์ราว 20%, และมูลค่าใน liquidity event ก็มักต่ำกว่ามูลค่าบริษัทอย่างเป็นทางการ
  • สรุป: ถ้า recruiter เสนอค่าตอบแทนรวมโดยนับมูลค่าหุ้นของสตาร์ตอัปเข้าไปด้วย ก็ยิ้มรับอย่างสุภาพได้ แต่ควรตีมูลค่าลดลงพอสมควรในใจ

โครงสร้างการสัมภาษณ์

  • บริษัทส่วนใหญ่ใช้โครงสร้างคล้ายกัน แต่ให้น้ำหนักแต่ละขั้นไม่เท่ากัน
  • Recruiter screen: โดยมากเป็นการคุยที่ไม่กดดันมาก เป็นโอกาสให้ดูว่าทักษะของคุณเหมาะกับตำแหน่งไหม และคุณอธิบาย paper ของตัวเองได้ดีแค่ไหน
  • Technical interviews: เป็นส่วนใหญ่ของกระบวนการ และเป็นส่วนที่ต้องเตรียมมากที่สุด โดยขึ้นกับบริษัทอาจมี 3–8 รอบ
    • Coding: สไตล์ LeetCode ปกติระดับ Medium หรือ Hard
    • ML coding/debugging: เช่น เขียน attention, เขียน backward pass, หาบั๊กใน training loop
    • ML knowledge: พื้นฐาน, ทฤษฎี, applied ML, system design
  • Behavioural interviews: แบ่งเป็นคำถามพฤติกรรมแบบคลาสสิกกับคำถามสไตล์นักวิจัย (หัวข้อที่สนใจ, มุมมองต่อทิศทางของสาขา) แม้จะคุยสบายกว่า technical interview แต่ไม่ควรมองข้าม

การเตรียมด้านเทคนิค

  • นี่คือส่วนสำคัญที่สุด อย่าข้าม — มีคนเป็นนักวิจัยเก่งมากแต่ตกเพราะเตรียมไม่พอ การทำ ML ทุกวันไม่เหมือนกับการต้องเขียน attention ตั้งแต่ศูนย์ และควรจัดเวลาเรียนอย่างสม่ำเสมออย่างน้อย หนึ่งเดือน
  • กลยุทธ์ระดับเมตาคือเตรียมกว้าง ๆ ให้น้อยที่สุด แล้ว เตรียมแบบเจาะจงตามบริษัทและรอบสัมภาษณ์ถัดไป เพื่อให้เนื้อหายังสดอยู่ในหัว
  • การสัมภาษณ์สาย RS / Engineer อาจถามได้แทบทุกอย่าง ตั้งแต่พื้นฐานอย่าง overfitting ไปจนถึง LeetCode, การเขียน transformer และสถาปัตยกรรมสมัยใหม่อย่าง Griffin, TransformerXL, S4

Flashcards

  • ใช้ได้ดีสำหรับพื้นฐาน ML, applied ML และการคุยงานวิจัย โดย flashcard แบบกระดาษได้ผลดีกว่า Anki สำหรับผู้เขียน
  • การเขียนการ์ดเองคือครึ่งหนึ่งของการเรียนรู้, อย่าดาวน์โหลด deck ของคนอื่น
  • ตอนทบทวนให้ถามตัวเองและพยายามเข้าใจให้ลึก หลายคำถามที่ผู้เขียนตั้งขึ้นระหว่างเรียนถูกถามจริงในการสัมภาษณ์

Mock interview ด้วย LLM (Claude / Gemini)

  • ก่อนแต่ละรอบสัมภาษณ์ ผู้เขียนจะนำคำอธิบายตำแหน่ง รูปแบบสัมภาษณ์ และข้อมูลบริษัทไปให้ LLM (ส่วนใหญ่คือ Claude) แล้วขอให้ช่วยสัมภาษณ์ จำลอง ซึ่งคำถามฝึกกับคำถามจริงซ้ำกันบ่อย
  • ถ้าระดับความยากไม่พอดี ให้เริ่มแชตใหม่แล้วระบุระดับและภูมิหลังของตัวเองให้ชัดขึ้น
  • สำหรับการเรียน Claude ทำได้ดีที่สุดและให้ feedback ที่ยุติธรรมกว่า ขณะที่ Gemini มีแนวโน้มชมมากเกินไปเล็กน้อย

LeetCode / NeetCode

  • อย่างน้อยควรทำ Blind 75 และถ้าต้องการก็เพิ่ม NeetCode 150 โดยเน้นโจทย์ Medium
    • ตั้งเป้าหาคำตอบที่เหมาะสมที่สุดของแต่ละข้อ (คำตอบ O(N²) สำหรับ TwoSum ไม่ถือว่าใช้ได้) และไม่ควรใช้เวลามากกับ Hard
  • ควรเขียนแพตเทิร์นพื้นฐานอย่าง DFS, BFS, Graphs, Backtracking, DP, Binary Search ได้อย่างรวดเร็ว โดยตั้งเป้าต่ำกว่า 20 นาทีต่อโจทย์ Medium
    • ถ้าติดเกิน 15 นาที ให้ดูเฉลย ทำเครื่องหมายไว้ แล้วไปต่อ
  • ความกว้างสำคัญกว่าความลึก, รวมแล้วควรทำโจทย์ Medium ราว 150 ข้อ

หนังสือ

  • Designing Machine Learning Systems (Chip Huyen): ครอบคลุมคำถามพื้นฐานและ applied ML จำนวนมาก
  • The JAX Scaling Book: ผู้เขียนเพิ่งมาเจอหลังสัมภาษณ์จบ แต่เป็นแหล่งข้อมูลที่ดีมาก และถ้ารู้ก่อนคงใช้เตรียมอย่างจริงจัง
  • Reinforcement Learning (Sutton & Barto): แนะนำเฉพาะคนที่เพิ่งเริ่ม RL ถ้าทำงานสายนี้อยู่แล้วอาจมากเกินไป

คอร์ส

  • พีชคณิตเชิงเส้น: คอร์ส YouTube ของ Gilbert Strang, เปิด 2x ก็เรียนจบได้ภายในวันเดียว
  • Diffusion / Flow Matching: คอร์สของ MIT และ Stanford ดีทั้งคู่ แต่มีคณิตศาสตร์เยอะ ถ้าไม่ได้ทำวิจัยสายนี้ก็ควรจำ intuition พื้นฐานและแก่นสำคัญ เช่น diffusion SDE, flow matching ODE

ML coding และ debugging

  • เป็นด้านที่หาแหล่งฝึกดี ๆ ได้ยากที่สุดและต้องอาศัยประสบการณ์จริงมากที่สุด การฝึก debugging interview ก็ยากเพราะ LLM ยังสร้างโค้ดที่มีบั๊กแบบสมจริงได้ไม่สม่ำเสมอ
    • ทางที่ดีที่สุดคือรีวิว codebase ของตัวเองหรือของเพื่อนร่วมงาน และ DeepML กับ Tensor Puzzles ก็ช่วยได้
  • baseline ที่ควรทำได้
    • เขียน transformer แบบ end-to-end
    • เขียน causal, cross, self attention
    • เขียน flash attention
    • เขียน attention backward pass
    • เขียน MLP forward / backward pass
    • เขียน SGD training loop ด้วย PyTorch หรือ JAX
  • ถ้าคุณเขียนสิ่งเหล่านี้ได้เองภายใต้แรงกดดันด้านเวลา ก็ถือว่าอยู่ในจุดที่ดี

การเตรียมด้านอารมณ์

  • ถ้าคุณสบายดีทางอารมณ์อยู่แล้ว ให้ข้ามหัวข้อนี้ไป เพื่อหลีกเลี่ยงการสร้างความกังวลโดยไม่จำเป็น
  • ปัญหาใหญ่ที่สุดคือการนอน — ก่อนสัมภาษณ์นอนไม่หลับ และถ้ามีสัมภาษณ์สัปดาห์ละ 10 รอบจะยิ่งหนักมาก กินข้าวก็ลำบากจนคลื่นไส้
    • แนะนำให้ออกกำลังกายสม่ำเสมอ, มีกิจวัตรช่วงเย็นที่คงที่, และหลีกเลี่ยงการแยกตัวจากสังคม
    • การวิ่งก่อนสัมภาษณ์ช่วยระบายพลังความกังวลและรีเซ็ตสมองได้
  • การรักษา รูทีนก่อนสัมภาษณ์ ช่วยสร้างความมั่นคงได้มาก — เช่น วางดอกไม้สดไว้ด้านหลัง, แต่งหน้าหรือทำสกินแคร์, เปิดวิดีโอปลอบใจแบบเดิม
  • มีช่วงหนึ่งที่ความกังวลกลายเป็นอุปสรรคยิ่งกว่าการเตรียมตัว และบางครั้งสมองก็ตื้อว่างเปล่าระหว่างสัมภาษณ์
    • จึงควรทบทวน ตัวกระตุ้นของตัวเอง, ความสัมพันธ์ของคุณกับความล้มเหลว, และแหล่งที่มาของ self-worth ก่อนเริ่มกระบวนการ
  • ข้อความสำคัญคือ คุณค่าของคุณในฐานะมนุษย์ไม่ได้ถูกตัดสินโดยการสัมภาษณ์เหล่านี้, กระบวนการนี้มีความสุ่มโดยธรรมชาติ ต่อให้รู้จริงก็พลาดได้ และนั่นก็ไม่เป็นไร
  • หนังสือที่ช่วยได้: The Now Habit, The Gifts of Imperfection, Mindset, The Tyranny of Merit

การเตรียมด้านโลจิสติกส์

  • วันละหนึ่งสัมภาษณ์เท่านั้น: การสัมภาษณ์ใช้พลังมาก พอถึงรอบที่สามในวันเดียวผลลัพธ์ย่อมตกลง และเวลาที่เหลือหลังสัมภาษณ์เช้าควรใช้เตรียมรอบถัดไป
  • เริ่มจากบริษัทที่สนใจน้อยกว่า: เช่น สตาร์ตอัปเล็กหรือบริษัทในพื้นที่ที่ไม่อยากย้ายไป เพื่อจูนความรู้สึกกับกระบวนการ สร้างความมั่นใจ และประเมินระดับเงินเดือนก่อน
  • คำนึงถึงจังหวะเวลา: แต่ละบริษัทเดินกระบวนการเร็วช้าต่างกัน ควรพยายามจัดให้ออฟเฟอร์มาถึงใกล้เคียงกันเพื่อสร้างอำนาจต่อรองจริง
  • บอกทุกบริษัทว่าคุณกำลังอยู่ในหลายกระบวนการ: จะช่วยให้ไทม์ไลน์ชัดขึ้น กระบวนการเร็วขึ้น และทำให้บริษัทมองว่าคุณเป็นผู้สมัครที่จริงจัง

การต่อรอง

  • ต่างจากคำแนะนำทั่วไปที่บอกว่าอย่าเปิดเผย competing offer หลายบริษัทกลับ ขอหลักฐานของออฟเฟอร์อื่นอย่างชัดเจน ก่อนจะปรับเพิ่ม และมีแห่งหนึ่งถึงขั้นถามความแท้จริงของภาพหน้าจอ
  • ถ้าบริษัทต้องการตัวคุณจริง ตัวเลขขยับได้มาก, ดังนั้นควรถามเสมอ เพราะส่วนใหญ่เปิดกว้างต่อการเจรจา
  • เส้นตาย มีตั้งแต่ 1–2 สัปดาห์ไปจนถึงคำกว้าง ๆ ว่า “ระยะเวลาที่สมเหตุสมผล” และโดยมากไม่ยืดหยุ่นต่อการขอขยาย
  • recruiter อ่านความชอบของผู้สมัครได้เก่งมาก สัญญาณเล็ก ๆ อย่างความถี่ในการพูดถึงบริษัทหรือโทนการพูดก็ถูกเก็บไว้
  • บริษัทมี ข้อมูลย้อนหลังเกี่ยวกับการเลือกของผู้สมัคร → ออฟเฟอร์จากคู่แข่งระดับเดียวกัน (เช่น OpenAI) เท่านั้นที่มีน้ำหนักจริง การเปรียบเทียบที่ไม่สมจริงใช้ไม่ได้ผล

กระบวนการตัดสินใจ

  • ตอนแรกผู้เขียนกังวลมากจนอยากรีบรับออฟเฟอร์แรกที่ได้ แต่สุดท้ายเลือกเชื่อสัญชาตญาณและค้นหาตัวเลือกที่ดีกว่า
  • เกณฑ์ในการเลือกออฟเฟอร์แตกต่างกันไปในแต่ละคน เช่น ทำเล, ค่าตอบแทน, ชื่อเสียง, ประเภทของงาน และเมื่อได้รู้จักทีม วัฒนธรรม และค่าตอบแทนมากขึ้น ลำดับความชอบก็อาจเปลี่ยน
  • ผู้เขียนคุยกับคนจากทั้งสองบริษัทแทบทุกคน แต่แต่ละคนก็บอกว่าจะเลือกบริษัทตัวเอง จึงช่วยได้ไม่มาก → สุดท้ายการคุยกับ คนที่รู้จักตัวคุณดี มีประโยชน์ที่สุด

ถ้าต้องทำใหม่ จะเปลี่ยนอะไรบ้าง

  • ทำสเปรดชีตไว้: การเก็บทุกอย่างไว้ในหัวมีขีดจำกัด ถ้าเรียบเรียงบริษัท, ขั้นตอน, เส้นตาย, และข้อมูลติดต่อไว้ตั้งแต่แรก ก็คงไม่พลาดสมัครบางที่ที่สนใจ
  • เตรียมอารมณ์ไม่แพ้เทคนิค: การสัมภาษณ์อาจรู้สึกเหมือนเป็นคำตัดสินสุดท้ายต่อความสามารถและคุณค่าของปริญญาเอก แต่เป็นกรอบคิดที่ไม่สมเหตุสมผล การทบทวนตัวเองหรือรับคำปรึกษาก่อนเริ่มน่าจะช่วยได้
  • รับมือกับบริษัทที่ไม่ตอบกลับให้เชิงรุกกว่านี้: อย่าพึ่งแต่ใบสมัคร ควรส่ง cold email แสดงความสนใจโดยตรงเพื่อให้ตัวเองเข้าไปอยู่ในเรดาร์

รายการหัวข้อเทคนิค

  • เป็นลิสต์หัวข้อที่ผู้เขียนทำไว้ก่อนเริ่มสัมภาษณ์ ด้วยภูมิหลังของตัวเองจึงถูกถามเรื่อง LLM และ RL มากเป็นพิเศษ และเกือบทุกหัวข้อที่เรียนถูกถามอย่างน้อยหนึ่งครั้ง
  • Reinforcement Learning: Q-Learning / TD Learning, Bellman Equations, PPO, GRPO, GAE, DPO, Policy Gradient Theorem, On/Off-Policy, MuZero, Dreamer, AlphaGo, Soft Actor-Critic, MDP ฯลฯ
  • LLMs: Flash Attention, LoRA, TransformerXL, Griffin, Perceiver, Scaling Laws, Mixture of Experts, RoPE, S4, Tokenisation, RLHF, Causal/Cross Attention ฯลฯ
  • Generative Modelling: GANs, VAE และ ELBO, Score Function, Diffusion Forward/Reverse Process (DDIM/DDPM), Diffusion SDE, Flow Matching ODE, Classifier Free Guidance
  • Applied ML: Tensor Parallelism, FSDP, DDP, Pipeline Parallelism, Mixed precision training, Gradient checkpointing/accumulation/clipping, JAX·PyTorch·TensorFlow ฯลฯ
  • General ML: Curse of dimensionality, CNN, RNN/LSTM, MLE vs MAP, Bias-Variance Tradeoff, Backprop, BatchNorm/LayerNorm/RMSNorm, Adam/AdamW, KL Divergence, Precision/Recall/F1/AUC-ROC ฯลฯ
  • Linear Algebra: Positive Semi-Definite, Jacobian, Eigenvectors/Eigenvalues, Hessian, Null/Image space, Rank/Span, Determinant ฯลฯ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น