آقای Jay Parikh که نائبرئیس بخش مهندسی فیسبوک را بر عهده دارد، با اشاره به اهمیت این موضوع میگوید: «حجم داده بزرگ در واقع به مثابه یک فرصت است و باید تأثیر مثبتی روی کسب و کار شما داشته باشد. اگر نتوانید از این دادههای عظیم بهره ببرید، آنچه که در دست دارید تلّی از دادههایی است که هیچاند.» فیسبوک با پردازش دادهها در چند دقیقه قادر است راهحلهای جدیدتری یافته، عکسالعمل کاربرانش را فهمیده و در صورت نیاز، طرح و تدبیر را به سرعت تغییر دهد.
در این گزارش اشاره شده که هر دسته از دیسکهای ذخیرهی اطلاعات در فیسبوک –که به روش Hadoop پیکربندی شدهاند- قادر به ذخیرهسازی بیش از ۱۰۰ پتابایت داده است. آقای Parikh در ادامه از فیسبوک به عنوان مجموعهای یاد میکند که بزرگترین میزان ظرفیت ذخیرهسازی دادهها را با این روش به کار گرفته است؛ حتی بیشتر از آنچه «یاهو» میتواند.
اگرچه این حجم از داده برای سازمانهای کوچک، مقداری بسیار بزرگ به نظر میرسد اما Parikh میگوید که «پس ازگذشت چند ماه، دیگر برای کسی مهم نیست که شما ۱۰۰ پتابایت اطلاعات در انبار دادههای خود داشته باشید.» سرعت مصرف افزایش یافته و «دنیا بیش از پیش تشنه دادههاست.»
مسلما این مقدار داده تنها برای فیسبوک مفید نیست و سفارشدهندگان آگهیها نیز از آن بهرهمند میشوند. «ما پیگیر نحوه استقبال از این آگهیها توسط گروههای هدف هستیم و برایمان مهم است که آگهیها در میان کاربرانی با جنسیت، سن، علایق و مشخصات دیگر چه بازخوردی دارند. به عنوان مثال در صورتی که یک آگهی مشخص در کالیفرنیا بهتر جواب داده، پس باید در بین کاربران این ناحیه بیشتر نشان داده شود تا موفقتر باشد.»
در حال حاضر فیسبوک حتی دیگر نیازی به انتظار برای مشاهده اثرات یک تغییر ندارد. «با در نظر گرفتن تاریخچه دادهها، میتوانیم یک مدل را قبل از به کار بستن آن اعتبارسنجی کنیم. با شبیهسازی دادهها به راحتی قادر هستیم ببینیم نرخ کلیککردن روی آگهی تا چه مقدار میتواند افزایش یابد.» حتی سیستمی به نام Gatekeeper طراحی شده است که اجازه میدهد بصورت همزمان، اثرات تغییرات اعمال شدهی مختلف در آگهی، روی نسبت کوچکی از کاربران آزمایش شود!
بد نیست در اینجا اشارهای هم به “Project Prism” در فیسبوک داشته باشیم. در حال حاضر کل دادهی کاربران فیسبوک تنها در یک دیتاسنتر ذخیره و نگهداری میشود. زمانی که نیاز به افزایش ظرفیت باشد، تمامی دادهها بالاجبار باید به دیتاسنتر دیگری که ظرفیت بیشتری را داراست منتقل بشوند و این انتقال، منابع بسیاری را هدر میدهد.
آقای Parikh توضیح میدهد که «این طرح این امکان را به ما میدهد که این انبار داده یکپارچه را به صورت فیزیکی در چندین دیتاسنتر پخش کنیم و در عین حال بتوانیم همین دید یکپارچگی را برای دادهها حفظ کرده باشیم.ب به عبارت دیگر، دادهها میتوانند در دیتاسنترهای مختلف فیسبوک در کالیفرنیا، ویرجینیا، اُرِگون، کارولینای شمالی و کشور سوئد جداگانه ذخیره شوند. (فرض کنید ۵ عکس در یک آلبوم جدید در فیسبوک اضافه کردهاید. مکان فیزیکی نگهداری این ۵ عکس الزاما یکسان نیست. مثلا ۳تای آنها در دیتاسنتر کالیفرنیا و ۲تای دیگری در هزاران کیلومتر دورتر در دیتاسنتر سوئد نگهداری میشوند. با این وجود زمانی که آلبوم را باز میکنید متوجه چنین تفاوتی در مکان واقعی ذخیرهسازی عکسها نیستید و تمامی تصاویر بصورت یکسان لود میشوند).
اما آیا پخش شدن دادهها به نفع حریم شخصی کاربر تمام میشود یا به ضرر آن؟ هر چه که باشد شاید دانستن این که عدهای از مهندسین فیسبوک در مکانهای مختلف امکان دسترسی به اطلاعات کاربران را دارند شما را آشفته کند؛ اما بنا به گفتهی Parikh، تمامی فعالیتهای کارکنان فیسبوک ثبت میگردد و در صورتی که کارمندی خارج از حیطهی وظایف خود به اطلاعات کاربران سرکشی نماید، بلافاصله با حکم اخراج بدرقه خواهد شد و فیسبوک چنین مواردی را به هیچوجه تحمل نمیکند.
البته به گمانم مسئله بزرگتر از اینهاست. الان دیگر گوگل، فیسبوک و بسیاری از غولهای دات کام اینترنت عادات و علایق ما را بهتر از خودمان میدانند، به نظرتان هولناک نیست؟
آگهی:
فروش ویژه دامین های خاص دات کام و دات آی آر
تعداد محدودی دامین ارزشمند و کاربردی با قیمت های عالی و باورنکردنی
http://kharazmi.orgپذیرش آگهی متنی و تصویری در نشریه خوارزمی