آیا پشته داده های مدرن فقط شراب قدیمی در یک بطری جدید است؟ • TechCrunch

کابل را به خاطر بسپار، پیشنهادات ترکیبی تلفن و اینترنت که قبلاً در صندوق های پستی ما قرار می گرفت؟ این پیشنهادها برای تبدیل بسیار بهینه شده بودند و نوع پیشنهاد و قیمت ماهانه میتواند به طور قابل توجهی بین دو خانه همسایه یا حتی بین کاندوها در یک ساختمان متفاوت باشد.
من این را می دانم زیرا قبلاً یک مهندس داده بودم و خطوط لوله داده استخراج-تبدیل بار (ETL) را برای این نوع بهینه سازی پیشنهاد می ساختم. بخشی از کار من شامل بازکردن فیدهای داده رمزگذاری شده، حذف سطرها یا ستون هایی بود که داده های گمشده داشتند، و نگاشت فیلدها به مدل های داده داخلی ما. سپس تیم آمار ما از داده های تمیز و به روز شده برای مدل سازی بهترین پیشنهاد برای هر خانواده استفاده کرد.
این تقریبا یک دهه پیش بود. اگر امروز آن فرآیند را در نظر بگیرید و آن را روی استروئیدها برای مجموعه داده های 100 برابر بزرگتر اجرا کنید، به مقیاسی خواهید رسید که امروزه سازمان های متوسط و بزرگ با آن سروکار دارند.
هر مرحله از فرآیند تجزیه و تحلیل داده ها برای ایجاد اختلال آماده است.
به عنوان مثال، یک تماس ویدئو کنفرانس می تواند گزارش هایی ایجاد کند که به صدها جدول ذخیره سازی نیاز دارد. به دلیل فضای ذخیرهسازی نامحدود و منابع محاسباتی مقیاسپذیری که میتوانید با قیمت مقرونبهصرفه دریافت کنید، Cloud اساساً روش انجام تجارت را تغییر داده است.
به بیان ساده، تفاوت بین پشته های قدیمی و مدرن این است:

اعتبار تصویر: آشیش کاکران، Thomvest Ventures
چرا رهبران داده امروزه به پشته داده های مدرن اهمیت می دهند؟
تجزیه و تحلیل سلف سرویس
توسعه دهندگان شهروندی می خواهند به داشبوردهای تجاری مهم در زمان واقعی دسترسی داشته باشند. آنها می خواهند داشبوردهای ساخته شده بر روی داده های عملیاتی و مشتریان خود را به طور خودکار به روز کنند.
به عنوان مثال، تیم محصول میتواند از دادههای استفاده بلادرنگ محصول و تجدید مشتری برای تصمیمگیری استفاده کند. Cloud باعث میشود که دادهها واقعاً برای همه قابل دسترسی باشد، اما در مقایسه با گزارشهای قدیمی، استاتیک، درخواستی و داشبورد به تجزیه و تحلیل سلف سرویس نیاز است.