ناگفته نماند که داده سنگ بنای هر تحلیل داده است. در مورد داده ها، میلیون ها چیز وجود دارد که ممکن است معیوب باشد. این می تواند ترتیب، فضاهای اضافی، مشکلات قالب داده، موارد تکراری باشد – این لیست ادامه دارد. قبل از اینکه متوجه شوید، تجزیه و تحلیل داده ها می تواند به کابوس شخصی شما تبدیل شود. فقط در مورد آن فکر کنید: متخصصان داده تا 80٪ از زمان خود را صرف سازماندهی و پاکسازی داده ها می کنند، در حالی که 20٪ دیگر به خود تجزیه و تحلیل داده ها اختصاص می یابد. این نسبت کاملاً غیر مؤثر است، اینطور نیست؟ (یک شوخی جایگزین وجود دارد: دانشمندان داده تا 80٪ از زمان خود را صرف سازماندهی و تمیز کردن داده ها می کنند و 20٪ از وقت خود را صرف ناله کردن در مورد آن می کنند. ما شما را احساس می کنیم. پاکسازی داده ها مانند ضربه زدن به باد است.) همانطور که می بینید، تجزیه و تحلیل مناسب داده ها به تکنیک های مختلف پاکسازی داده نیاز دارد تا داده های شما برای تجزیه و تحلیل آماده شوند.
خبرنامه ها
حساب رسمی برای همه خبرنامه های HackerNoon. www.hackernoon.com/u/newsletters
ناگفته نماند که داده سنگ بنای هر تحلیل داده است.
در مورد داده ها، میلیون ها چیز وجود دارد که ممکن است معیوب باشد. این می تواند ترتیب، فضاهای اضافی، مشکلات قالب داده، موارد تکراری باشد – این لیست ادامه دارد.
قبل از اینکه متوجه شوید، تجزیه و تحلیل داده ها می تواند به کابوس شخصی شما تبدیل شود. فقط به آن فکر کنید: داده ها …