کتاب: بازی اعداد، چیزهایی که اعداد نمی گویند
توسط کمانگیر در روز 21 مه 2009مه 21
آمارها نشان می دهد که در چهار بزرگراه پر رفت و آمد، تصادفات ِ منجر به آسیب ِ جدی به یک معضل تبدیل شده اند. پلیس تصمیم می گیرد در این بزرگراه ها دوربین کنترل سرعت نصب کند. مدتی پس از نصب دوربین ها سخنگوی پلیس گزارش می دهد که آمار ِ تصادفات ۳۵% کاهش پیدا کرده است. این موضوع بعنوان دلیلی بر کارایی بسیار بالای دوربین های کنترل سرعت تلقی شده و قرار بر نصب دوربین های بیشتر در بزرگراه های دیگر می شود. آیا این نتیجه گیری درست است؟
از فصل چهارم کتاب ِ “بازی ِ اعداد” The Numbers Game نقل می کنم. عنوان این فصل “بالا و پایین: مردی و سگش” است.
بیایید یک آزمایش ساده انجام بدهیم. ۱۰ نفر را جمع کنید و از هر کدام بخواهید یک تاس رو دوبار بیاندازند و جمع ِ اعداد را یادداشت کنند. به هر کس نام ِ یک بزرگراه را بدهید. به همه بگویید که عددی که در این مرحله بدست آورده اند نشان دهنده ی میزان تصادف در بزرگراهشان است. حالا به همه ی کسانی که بالاتر از ۱۰ هستند، یعنی بزرگراه های خطرناک، یک کاغذ بدهید که روی آن نوشته شده است “دوربین ِ کنترل ِ سرعت”. از همه بخواهید دوباره تاس بیاندازند. دقت کنید که میزان تصادف در “بزرگراه های خطرناک” چه تغییری کرد. به احتمال خوبی دوربینهای کاغذی، همانند ِ دوربین های واقعی در مثال ِ بالا، منجر به کاهش ِ میزان تصادفات شدند. آیا هنوز فکر می کنید نتیجه گیری ِ بالایی درست بوده است؟
این اتفاق واقعا در انگلیس افتاد. در سال ۲۰۰۳ وزارت ترابری اعلام کرد که در یک بررسی دوساله ۳۵% کاهش در میزان تصادف در بزرگراه های مجهز شده به دوربین های کنترل سرعت مشاهده شده است. “این بوضوح نشان می دهد که دوربین ها دارند کار می کنند”. لااقل این نتیجه گیری اولیه ی وزیر بود. در تصحیح ِ بعدی این عدد به ۷% کاهش پیدا کرد. اما چرا؟
مهم است که زمانی که به اعداد و نوسان های آنها نگاه می کنیم موج های لحظه ای را با جذر و مد اشتباه نگیریم. به عبارت ِ دیگر، با بزرگ شدن ِ یک عدد، مثلا میزان تصادف در یک بزرگراه، احتمال ِ بازگشت ِ آن به میزان متوسط افزایش پیدا می کند. به این موضوع “بازگشت به میانگین” Regression to Mean گفته می شود. در بررسی ها مشخص شد که از ۳۵% کاهش ِ مشاهده شده، ۲۱% بدلیل این موضوع بوده است. این همان اتفاقی است که در مثال دوربین های کاغذی افتاد: کسی که عدد ِ تاس ِ بالاتری دارد احتمال بالاتری برای گرفتن ِ عدد ِ کمتری در دور بعد دارد*. علاوه بر این ۷% دیگر از کاهش در تصادفات به کاهش ِ کلی تعداد تصادفات مرتبط شناخته شد. در این کاهش هم دوربین ها نقشی نداشتند.
در یک کلام، “بازی ِ اعداد” محشر است. عنوان فصل ها را ببینید:
- شمارش: مربای توت فرنگی.
- اندازه: این یک موضوع شخصی است.
- تصادف: ببری که نیست.
- بالا و پایین: مردی و سگش.
- میانگین ها: رنگین کمان ِ سفید.
- کارایی: تمام ِ فیل.
۶ فصل ِ بعدی هم بماند برای وقتی که خواندمشان.
* این جمله خیلی دقیق نیست.
با سلام
اگه لطف کنید لینک دانلود کتاب رو بزارید ممنون می شم
کمانگیر: عزیز من فایل کتاب رو ندارم.
After your last post about this book, I bought it from Biblio. Can’t wait to read it 😉
میشه منظور نویسنده رو فهمید ولی فکر کنم مثالش زیاد خوب نبوده
این حرف وقتی میتونه درست باشه که با گذشت زمان و وجود دوربین ، باز هم شاهد افزایش درصد تصادفها باشیم.
اصولا اتفاقی که در یک دور تاس اندازی می افته ربطی به دور قبل نداره ولی بهتره که اینطوری بگیم که از ۳۶ حالت تنها ۱/۶ احتمال داره که بالاتر از ۱۰ داشته باشیم و احتمال اینکه دو بار پشت سر هم عدد بالای ۱۰ داشته باشیم کم(۱/۳۶) است. یعنی از بین اون عده (که در سری اول بالای ۱۰ داشتند) تنها ۱/۶ انها دوباره بالای ۱۰ می آورند ولی سایر کسانی که تاس می اندازند هم همچنان ممکن است که بالای ۱۰ بیاورند. یعنی میزان بالای ۱۰ ها همچنان ۱/۶ کل خواهد بود. با این حساب در مثال بزرگراه باید بگوییم که درست است که در این دسته که ما تحت نظر داشتیم تصادق کاهش یافته ولی در مجموع تعداد تصادف ها ثابت بوده. البته اصولا این کار رو با آمار و تابع X2 انجام میدهند که بگویند اختلاف دو سیستم معنی دار است یا نه و قص علی هذا من فضل ربی و رحمه الله و برکاته
توضیحات عماد کاملا درسته. اون جمله نه تنها زیاد دقیق نیست که به نظرم اصلا درست نیست. میرم که کتاب رو بگیرم. کتاب مشابه قدیمی تری هم بود که اتفاقا به فارسی هم سالها قبل ترجمه شده بود: how to lie with statistics اسمش در فارسی اگه اشتباه نکنم بود جگونه با آمار دروغ می گویند.
کمانگیر: محمود جان، اینطور بگیم، احتمال xt+1 بزرگتر از xt برای xt بزرگتر از X برای X به اندازه ی کافی بزرگ از xt کوچک تر از X بیشتر است. اشتباه می کنم؟
چقدر جمله ات پیچیده شد! به نظرم تو داری به این قضیه از دید یک فرآیند تصادفی نگاه می کنی. در صورتی که تا اونجایی که سوات من قد می ده این یک فرآیند نیست. چون احتمال خال تاس در دور دوم هیچ ربطی به دور اولش نداره. هرجند اگر بار اول ۶ آمده باشه احتمال آمدن دوباره ۶ خیلی کم میشه چون دو تا ۶/۱ در هم ضرب می شن اما نه به خاطر اینکه این یک فرآیند تصادفیه. مثلاْ زنجیر مارکوف رو اگه در نظر بگیری احتمال وضعیت بعدی باید فقط به وضعیت فعلی بستگی داشته باشه. درسته؟
ضمنا احتمال ایتکه برداشت من اشتباه باشه به یک میل می کنه!
[…] ادامه را در اینجا بخوانید: کتاب: بازی اعداد، چیزهایی که اعداد نمی گویند. […]