فایل ورد کامل Blink و انجام آن: پرس و جوهای تعاملی بر روی داده های بسیار بزرگ
توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد
این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد
متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم
فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل Blink و انجام آن: پرس و جوهای تعاملی بر روی داده های بسیار بزرگ،به هیچ وجه بهم ریختگی وجود ندارد
تعداد صفحات این فایل: ۲۲ صفحه
چکیده :
در این مقاله BlinkDB را ارائه خواهیم داد، که یک چهارچوب پردازش پرس و جوی تقریبی موازی انبوه مبتنی بر نمونه برای اجرای پرس و جوهای تعاملی بر روی داده های بزرگ می باشد. ملاحظه اصلی در BlinkDB در این مورد است که شخص توسط آن می تواند در شرایطی که پاسخ های کاملی وجود ندارد، تصمیمات معقول و منطقی بگیرد. BlinkDB پشته Hive/HDFS را توسعه می دهد و در نتیجه پشتیبانی این سیستم ها می تواند به مجموعه ای یکسان از پرس و جوهای SPJA (انتخاب، طرح ریزی، ملحق کردن و بهم پیوستن) رسیدگی نماید. BlinkDB در کنار تضمین خطای آماری پاسخ های زمان واقعی ارائه می نماید و می تواند به شیوه تحمل خطا، پتابایت داده و هزاران دستگاه را مقیاس نماید. آزمایش های ما با استفاده از معیار TPC-H و با توزیع محتوای ویدئو حجم کار دنیای واقعی ناشناخته توسط شرکت Conviva نشان دادکه BlinkDB می تواند طیف گسترده ای از پرس و جوها را به میزان ۱۵۰× سریعتر از Hive در MapReduce و ۱۰ تا – ۱۵۰ × سریعتر ازShark (Hive در Spark) و بیش ده ها ترابایت از داده ذخیره شده در ۱۰۰ دستگاه را با یک خطای ۲ – ۱۰ درصدی اجرا نماید.
عنوان انگلیسی:
Blink and It’s Done: Interactive Queries on Very Large Data
~~en~~ writers :
Sameer Agarwal UC Berkeley, Aurojit Panda UC Berkeley , Barzan Mozafari MIT CSAIL
In this demonstration, we present BlinkDB, a massively parallel,
sampling-based approximate query processing framework for running interactive queries on large volumes of data. The key observation in BlinkDB is that one can make reasonable decisions in the
absence of perfect answers. BlinkDB extends the Hive/HDFS stack
and can handle the same set of SPJA (selection, projection, join
and aggregate) queries as supported by these systems. BlinkDB
provides real-time answers along with statistical error guarantees,
and can scale to petabytes of data and thousands of machines in
a fault-tolerant manner. Our experiments using the TPC-H benchmark and on an anonymized real-world video content distribution
workload from Conviva Inc. show that BlinkDB can execute a wide
range of queries up to 150× faster than Hive on MapReduce and
۱۰ ۱۵۰× faster than Shark (Hive on Spark) over tens of terabytes
of data stored across 100 machines, all with an error of 2 10%.
$$en!!
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
مهسا فایل |
سایت دانلود فایل 