1 คะแนน โดย GN⁺ 2025-02-25 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

บทนำ

  • พบสมมติฐานในซับเรดดิตของฝรั่งเศสว่า "ยิ่งใกล้สถานีรถไฟ เคบับยิ่งไม่อร่อย"
  • มีการถกเถียงเกี่ยวกับสมมติฐานนี้ และเพื่อทดสอบจึงได้ทำ "งานวิจัย" แบบไม่เป็นทางการขึ้น

วิธีการ

  • เลือกปารีสเป็นพื้นที่ศึกษา เนื่องจากสมมติฐานนี้เริ่มต้นจากซับเรดดิตฝรั่งเศส
  • ใช้ OSMnx เพื่อดาวน์โหลดและบันทึกข้อมูลเครือข่ายทางเดินเท้าของปารีส
  • ใช้ Google Places API เพื่อรวบรวมข้อมูลร้านอาหารที่เสิร์ฟเคบับ แต่มีอุปสรรคบางอย่างจากข้อจำกัดของ API

ข้อมูลเครือข่าย

  • รวบรวมข้อมูลสถานีรถไฟและสถานีรถไฟใต้ดินในปารีส
  • ใช้ OSMnx เพื่อกรองทางเข้ารถไฟและรถไฟใต้ดิน

ข้อมูลร้านอาหาร

  • ใช้ Google Places API เพื่อค้นหาร้านอาหารที่เสิร์ฟเคบับ
  • มีความยากลำบากในการเก็บข้อมูลบางส่วนเนื่องจากข้อจำกัดของ API

เส้นทางและระยะทาง

  • คำนวณระยะทางจากร้านอาหารแต่ละแห่งไปยังทางเข้าสถานีที่ใกล้ที่สุด
  • ใช้ NetworkX เพื่อทำการวิเคราะห์เครือข่าย

ผลลัพธ์

  • ค่าสหสัมพันธ์เพียร์สันอยู่ที่ 0.091 ซึ่งบ่งชี้ว่าสมมติฐานอาจเป็นจริงอยู่บ้าง แต่ค่าสหสัมพันธ์อ่อนมาก
  • หลังตัดค่าผิดปกติออกแล้ว ค่าสหสัมพันธ์อยู่ที่ 0.098 และไม่ได้ดีขึ้นอย่างมีนัยสำคัญ

อภิปราย

  • มีคำถามว่า Google รีวิวสามารถวัดความอร่อยของเคบับได้อย่างเป็นกลางหรือไม่
  • การท่องเที่ยวอาจมีผลต่อรีวิว
  • มีการถกเถียงเกี่ยวกับความแม่นยำของผลลัพธ์จาก Google
  • สมมติฐานตั้งต้นเฉพาะเจาะจงเกินไป จึงไม่ได้รวมร้านอาหารทั่วไป
  • จำนวนรีวิวอาจส่งผลต่อผลลัพธ์

สรุป

  • การศึกษานี้สนุกดี และแนะนำให้คนอื่นลองทำการทดลองลักษณะนี้ดู
  • เป็นไปได้ว่าเงื่อนไขเฉพาะของปารีสมีผลต่อสมมติฐานนี้
  • มีแผนจะทำการศึกษาเพิ่มเติม

1 ความคิดเห็น

 
GN⁺ 2025-02-25
ความเห็นจาก Hacker News
  • ฉันคือ "OP" เอง ผ่านมาเพิ่งเกินหนึ่งสัปดาห์นิดหน่อยนับจากที่เขียนโพสต์นี้ครั้งแรก แต่พอเห็นมันแพร่ไปทั่วอินเทอร์เน็ตก็รู้สึกขำดี เลยอยากชี้แจงบางอย่างให้ชัดเจน

    • โพสต์นี้เดิมทีเป็นมีมแบบหนึ่ง ฉันทำ "งานวิจัย" (หรือ "การวิเคราะห์") แบบเร็ว ๆ เพื่อโพสต์ต้นฉบับลง r/gis แต่ก็แปลกใจที่คนจำนวนมากจริงจังกับประเด็นนี้มาก ดูเหมือนว่าเคบับอร่อยเป็นเรื่องสำคัญทีเดียว
    • อย่างที่คนอื่นชี้ไว้ การใช้ความสัมพันธ์เชิงเส้นน่าจะเป็นวิธีที่ไม่เหมาะหากจะทดสอบ "สมมติฐาน" นี้ แม้ถ้อยคำในโพสต์ภาษาฝรั่งเศสต้นฉบับจะชวนให้ตีความแบบนั้น แต่พอมองย้อนกลับไป ดูเหมือนว่าร้านเคบับที่อยู่ในรัศมีหนึ่ง ๆ จะมีแนวโน้มแย่โดยเฉลี่ยมากกว่า
    • ปารีสไม่ใช่พื้นที่ศึกษาที่ดีนัก มีร้านเคบับดีมากหลายร้านอยู่ใกล้สถานีรถไฟ
    • ดูเหมือนฉันควรเริ่มภาค 2 แล้ว
  • ในเบอร์ลินมีร้านเคบับหลายพันร้าน ส่วนใหญ่อยู่ตามย่านต่าง ๆ และคนท้องถิ่นแวะไปกันเป็นประจำ คุณภาพมีตั้งแต่ดีมากไปจนแย่ หลายร้านดูเหมือนจะตั้งขึ้นมาเพื่อฟอกเงินมากกว่าจะขายอาหารจริง ๆ (รับแต่เงินสด) สุขอนามัยแย่ การบริการก็ไม่ใส่ใจ ร้านแบบนี้แทบไม่มีเหตุผลทางธุรกิจเลยถ้าไม่ใช่เพื่อฟอกเงิน มักจะเก่า ดูสกปรก และแทบไม่มีลูกค้า ถ้าช่วงกลางวันหรือมื้อเย็นยังไม่มีใครกิน ก็ควรเลี่ยง

    • และก็มีร้านที่ยอดเยี่ยมจริง ๆ ใช้เตาถ่านอย่างเหมาะสม พนักงานเป็นมิตรและใส่ใจกับการบริการลูกค้า ร้านแบบนี้ดีมากและโดยทั่วไปก็คุ้มราคา หมักเนื้อกันเองและมีเมนูหลากหลายนอกเหนือจากเคบับมาตรฐาน ถ้าอยู่เบอร์ลิน ควรขอคำแนะนำว่าควรไปย่านไหน มีร้านเคบับที่น่าทึ่งอยู่หลายแห่ง และส่วนใหญ่เปิดมานานมากแล้ว
    • หมวดที่สามคือร้านตามจุดท่องเที่ยวและแหล่งเที่ยวดึกที่จับกลุ่มนักเดินทางหรือคนเมา การแข่งขันเพื่อแย่งลูกค้ากลุ่มนี้รุนแรงมาก และก็มีตัวเลือกดี ๆ ที่คนยอมอ้อมทางไปกิน หลายร้านบริหารจัดการได้ดีและปรับให้เหมาะกับปริมาณลูกค้าและความสม่ำเสมอ (ไม่ได้แปลว่าคุณภาพสูงเสมอไป)
  • คิดว่าควรอัปเดตชื่อโพสต์นี้ เพราะตอนนี้ครึ่งหนึ่งของคอมเมนต์ยอดนิยมกำลังตั้งสมมติฐานว่างานวิจัยนี้ยืนยันสมมติฐานนั้นแล้ว

    • Pearson correlation coefficient อยู่ที่ 0.091 ดังนั้นข้อมูลแค่บอกได้ว่าเรื่องนี้อาจเป็นจริงก็ได้ ความสัมพันธ์อ่อนมากจนจะเรียกว่า "ไม่มีนัยสำคัญทางสถิติ" ยังแทบจะเป็นการพูดแบบใจกว้างเกินไป
  • สมมติฐานย่อยที่ควรเพิ่ม: คนที่เพิ่งลงจากรถไฟหิวมากกว่าคนทั่วไป และคนที่หิวก็มักจะให้รีวิวในทางบวกมากกว่าโดยทั่วไป

  • ฉันหาความสัมพันธ์ระหว่างสถานีรถไฟกับรีวิวเคบับไม่เจอ เป็นงานวิจัยที่เหมาะกับคาบเรียนสถิติ

  • ฉันชอบอ่านรีวิว Best Kebab บน Trip Advisor อยู่เสมอ เพราะมันอยู่ติดกับสถานีรถไฟ Queen Street พอดี จึงเข้ากับงานวิจัยนี้

    • ไม่เพียงแต่อาหารจะไม่สุกเท่านั้น ฉันยังเจอแผนสมคบคิดในมันฝรั่งทอดกับชีสด้วย พอแจ้งปัญหาไปก็ถูกไล่ตามด้วยมีด บน Dundas Street ช็อกจริง ๆ
  • คำพูดนี้ยังใช้ได้ในประเทศกำลังพัฒนา โดยเฉพาะกรณีที่ในเมืองหรือหมู่บ้านมีสถานีรถไฟหลักหรือสถานีขนส่งหลักเพียงแห่งเดียว สถานที่แบบนี้มุ่งจับลูกค้าขาจรที่ทั้งปีอาจไม่กลับมาอีกเลย การนับรวมรถไฟใต้ดินถือว่าผิดจากบริบทจริงที่คำพูดนี้มีที่มา การบังคับใช้มาตรฐานความปลอดภัยอาหารและคุณภาพอย่างเข้มงวดในปารีสน่าจะทำให้เรื่องนี้พิสูจน์ไม่ได้จริง

  • ขำมากที่เรื่องนี้ใช้ได้แม่นยำกับซูฟลากิในกรีซ ในทางกลับกัน ฉันกลับประหลาดใจกับคุณภาพอาหารตามสถานีในญี่ปุ่น ร้านที่ดู "น่าสงสัย" บางร้านกลับเสิร์ฟราเม็ง/อุด้งที่ดีที่สุดที่ฉันเคยกินในญี่ปุ่น

  • จริง ๆ แล้วสามารถตั้งเส้นทางไปยังทางเข้าทุกร้านอาหารได้ แต่คงใช้เวลาหลายสิบปี ดูเหมือนจะเป็นปัญหา routing แบบ many-to-many มาตรฐานบนโครงข่ายถนนที่ค่อนข้างเล็กของปารีส ทำไมถึงต้องใช้เวลาหลายสิบปี? แค่ implement Dijkstra แบบธรรมดาก็น่าจะไม่เกิน 1 นาที

  • ฉันเคยพัฒนาทฤษฎีว่าในเวนิสสามารถประมาณระยะทางถึง San Marco ได้จากราคาพิซซ่าหนึ่งชิ้น ยิ่งแพงก็ยิ่งใกล้ ยังไม่เคยลองทดสอบ แต่คงสนุกดีถ้าได้ดู heatmap ของมัน