به گزارش «نود اقتصادی» وزارت راه‌وشهرسازی اخیرا جدیدترین گزارش مربوط به تحولات مسکن تهران در بهمن را منتشر کرده است. این گزارش که از داده‌های خام سامانه ثبت معاملات املاک و مستغلات وزارت صمت استخراج شده، از آنجایی‌که بدون داده‌کاوی و حذف داده‌های پرت منتشر شده، از رشد بیش از ۲۴ درصدی معاملات و نزدیک به ۴ درصدی قیمت مسکن حکایت می‌کند.

 اما چرا داده‌های پرت، مهم هستند؟ طبق آنچه که در جدول پایینی آمده است، در بین داده‌های خام مسکن سامانه املاک و مستغلات، تعداد بسیار قابل توجه معاملاتی را مشاهده می‌کنیم که مساحت آنها فقط ۱ متر است. همچنین مساحت‌های ۲، ۳، ۴، ۵ و غیره نیز به تعداد قابل توجه در بین این داده‌های وجود دارد.

 این درحالی است که در واقعیت هیچ ملک ۱ متری مشاهده نمی‌کنیم که معامله شده باشد. این وضعیت به طور قابل توجهی در قیمت‌ها نیز مشاهده می‌شود که برای مثال قیمت یک مترمربع برخی معاملات تا یک میلیارد تومان هم می‌رسد. بر این اساس عقل سلیم و منطق علم آمار می‌گوید بدون حذف داده‌های پرت، استخراج گزارش‌های آماری فاقد ارزش علمی و فنی است. حال می‌توان گفت القای رونق معاملات مسکن در گزارشی که مبنای استخراج آن زیر سوال است، به عمد باشد یا سهوا، کاملا به نفع دلالانی است که برای داغ نگهداشتن بازار مسکن به اینگونه آمارها نیاز دارند.

 قابل ذکر است در مباحث آماری، داده پرت (Outliers Data) به داده‌ای گفته می‌شود که با دیگر داده‌های هم‌گروه فاصله چشمگیری داشته‌باشد، یا به‌اصطلاح با بقیه داده‌ها «نخواند».