چگونه دیتاساینتیست شویم؟
یکی از شغلهایی که بهواسطه گسترش اینترنت ایجاد شده، دانشمند دادهها یا دیتا ساینتیست (Data Scientist) است. امروزه شرکتها در دنیا دادههای بسیار زیادی از کاربران خود دارند که دوست دارند از آنها استفاده کنند تا خدمات بهتری به مشتری بدهند و سود بیشتری هم بکنند.
در این میان دیتا ساینتیستها افرادی هستند که میتوانند از لابهلای این حجم از دادههای متنوع، تصاویر دقیق و عمیق درباره فاکتورها مختلف از رفتارهای مشتری بگیر تا شرایط آینده را استخراج کنند. به همین دلیل هم دیتا ساینتیست در حال تبدیل به شغلی بسیار مهم است. شغلی که البته درآمد خوبی هم دارد.
اما چگونه میتوانیم یک دیتا ساینتیست شویم و چه مهارتهایی برای آن لازم است. با ما همراه باشید.
دیتا ساینتیست، قهرمان عصر داده
عصر ما عصر دادهها و اقتصاد دادهها است. در حال حاضر روزانه 2.5 میلیون ترابایت داده در اینترنت تولید میشود. همه اینها یا دادههای کاربرانی هستند که صرفا محتوا مصرف میکنند یا اینکه دادههای هستند که تولیدکنندگان در سایتهای گوناگون اینترنتی بارگذاری میکنند.
2.5 میلیون ترابایت داده عدد بسیار بزرگی است؛ یعنی شما برای ذخیرهسازی دادههایی که هر روز در اینترنت تولید میشود 2.5 میلیون هارد یک ترابایت لازم دارید.
بخشی از این دادهها، دادههایی هستند که شرکتها از کاربران جمع میکنند و کاربران خواسته یا ناخواسته در اختیار شرکتها قرار میدهد، دادههایی مثل جنسیت، سابقه خرید اینترنتی، سابقه جستجو، موقعیت مکانی و سابقه وبسایتهای بازدید شده. این دادهها ساختار (structured) دارند و خواندنشان راحت است.
بقیه دادهها مثل پستهای وبلاگ، فیلم، عکس و کامنت دادههای بدونساختار (Unstructured) نام دارند.
این دادهها هم حجمشان زیاد است (Volume)، هم تنوع زیادی دارند (Variety) و هم با سرعت بسیار زیادی تولید میشوند (Velocity). سه فاکتور حجم، سرعت و تنوع چیزهایی هستند که حوزه بیگ دیتا (Big Data) را تعریف میکنند.
نکته اینجاست که مدیریت و ذخیرهسازی این حجم از دادهها چالش بسیار بزرگی است. چالشی که بیگ دیتا و فناوریهای آن سعی در حل آن دارند.
استخدام دیتا ساینتیست
فناوریهای بیگ دیتا به دو حوزه قابلتقسیم هستند. حوزه ذخیرهسازی و مدیریت دادهها و حوزه پردازش و تحلیل آنها. مشخص است که برای مدیریت این حجم از دادهها با ابزارهای بیگ دیتا یا باید کسی را استخدام کنیم یا مسئولیت نگهداری آن را به شرکتهای دیگر بدهیم.
وقتی شما حجم عظیمی از دادههای ساختاردار دارید که بیشتر آنها شبیه فایلهای اکسل با هزاران یا میلیونها داده هستند، ما برای اینکه بتوانیم واقعا از این دادهها استفاده کنیم و مثلا بفهمیم که بر اساس آنها چگونه استراتژیهای بازاریابی را تغییر دهیم، نیازمند این هستیم که این دادهها را تحلیل کنیم و از آنها سر دربیاوریم.
تحلیلکردن این حجم از دادهها و فهمیدن اینکه چگونه از آن نتیجهای بگیریم، کار هر کسی نیست. استفاده از این دادههای نیازمند دانش دادههاست و کسی که این دانش را دارد و میتواند این دادهها را تحلیل کند، دانشمند دادهها یا دیتا ساینتیست است.
دیتا ساینتیست کسی است که مهارتهای متنوعی در حوزه نرمافزارها، برنامهنویسی در زبانهای گوناگون، هوش مصنوعی، مدیریت دادهها و دانش زیادی از بازارها، رفتارهای کاربران و روانشناسی آنها دارد و میتواند با تحلیل دادهها، تصاویر دقیقی از آنچه لازم است، ارائه دهد.
او میتواند دادهها را مصورسازی کند و از آنها نمودارها و اینفوگرافیک تهیه کند و یا الگوهایی در دادهها بیابد که احتمالا پیش از آن قابلتصور نبوده است.
تفاوت دیتا ساینتیست و متخصص آمار
در ضمن دیتا ساینتیستها متفاوت از متخصصین آمار هستند. با اینکه دیتا ساینتیست و متخصص آمار اهداف و مهارتهای مشترکی دارند و هر دو از دادههای حجیم استفاده میکنند، اما کار این دو متفاوت است. دانش دادهها یا دیتا ساینس (Data Science) حوزه جدیدی است که عمیقا بر استفاده از کامپیوتر و فناوری متکی است.
دانش دادهها یا دیتا ساینس (Data Science) حوزه جدیدی است که عمیقا بر استفاده از کامپیوتر و فناوری متکی است.
اما متخصصین آمار در تلاش هستند از نظریههای تاییدشده برای تحلیل دادهها استفاده کنند و کارشان بیشتر بررسی فرضیهها است. رشته آمار رشتهای است که در صد سال گذشته چندان تغییر نکرده است و به همین دلیل همهچیز آن مشخص و معین است اما دانش دادهها پس از کامپیوترها و بهطور خاص در چند سال گذشته توسعه یافته است.
دیتا ساینتیست کارمندی پردرآمد
از آنجایی که اهمیت دادهها هر روز در دنیای ما بیشتر میشود، چندین سال است که شرکتها دیتا ساینتیست استخدام میکنند. این شغل در حال حاضر یکی از پردرآمدترین شغلهای دنیاست.
تعداد کمی از شرکتهای ایرانی نیز در سالهای اخیر شروع به استخدام دیتا ساینتیست کردهاند اما با توجه به درصد بالای بیکاری در ایران، صرفا فارغالتحصیلان دکترا میتوانند در این شغلها استخدام شوند.
زیرا مثل دیگر شغلهای بازار کار آیتی در ایران، شرکتها در این حوزه هم دوست دارند یک نوبل فیزیک را با حقوق ۳ میلیون تومان استخدام کنند. یکی از دلایلی هم که بسیاری از شرکتهای ایرانی هنوز اقدام به استخدام دیتا ساینتیست نمیکنند، این است که دادههای آنها کم است.
این شرکتها یا دادههای چندانی از کاربران ندارند زیرا در بهترین حالت سیستمهای روابط عمومی ضعیف یا وبسایتهایی صرفا با ظاهر خوب دارند (البته اگر خوشبین باشیم!) و ابزارهایی برای جمعآوری دادهها ندارند و در بدترین حالت کلا اقدامی برای جمعآوری چنین دادههایی نکردهاند.
همچنین بهدلیل نبود و یا محدودیت شدید ارتباط مالی با دنیا، این امکان که شرکتهای ایرانی بتوانند از گوگل داده دریافت کنند، سخت است. به همین دلیل هم ممکن است داده چندانی نداشته باشند که بخواهند دیتا ساینتیست استخدام کنند.
اما همه اینها در حال تغییر است. ما در دهه و شاید قرن اطلاعات زندگی میکنیم که بیگ دیتا یکی از مهمترین ترندها و مگاترندهای آن است. به همین دلیل دیر یا زود، شرکتهای ایرانی هم دیتا ساینتیست نیاز خواهند داشت.
مطمئن هم باشید که اگر شما دیتا ساینتیست باشید، شغل خوبی با درآمد بالا خواهید داشت. به همین دلیل شاید بد نباشد بدانید چگونه میتوان دیتا ساینتیست شد.
چگونه میتوان دیتا ساینتیست شد؟
برای اینکه شما دیتا ساینتیست شوید یا اینکه دیتا ساینتیست خوبی شوید، باید علاوه بر مهارتهای متنوع، خصوصیات منحصربهفردی هم داشته باشید.
پیش از همه باید ذاتی کنجکاو داشته باشید که شما را دائما به سمت یادگیری چیزهای جدید سوق دهد. در حوزه دانش دادهها، موضوعات فراوان و دادههای بسیاری وجود دارند که یک دیتا ساینتیست باید کنجکاوی ذاتی برای مطالعه، تفکر و جمعآوری اطلاعات درباره آنها را داشته باشد تا در نهایت بتواند با یافتن ارتباط بین اجزای مختلف در دادههای موجود، پاسخهای درست به سوالهای مطرحشده بیابد.
حوزههایی مثل دانش دادهها که دائما در حال تغییر هستند، چالشهای همیشگی اجتنابناپذیر هستند، لازم است مستمر یاد بگیرید و خلاقیت دائمی داشته باشید. چنین چیزی میتواند خستهکننده هم باشد، در نتیجه کمی سرسختی در این شغل بسیار مفید خواهد بود.
قضیه اینجاست که یک دیتا ساینتیست در طول کارهایی که بهطور معمول انجام میدهد، به شرایطی برمیخورد که انگار همهچیز به هم گره خورده است و ممکن است به کلاف سردرگمی از دادهها و مسائل پیچیده برسد که به نظر حلناپذیر میآید.
اما یک دیتا ساینتیست خوب در این شرایط هم دست از دستهبندی، تحلیل دوباره و کارکردن روی دادهها برنمیدارد و آنقدر ادامه میدهد که بتواند مسئله را از نگاهی جدید دریابد و حل کند.
خصوصیات دیگری مثل خلاقیت، توانایی تمرکز بالا و توجه بسیار زیاد به جزئیات میتواند به شما کمک کند که یک دیتا ساینتیست خوب باشید. داشتن مهارتهای ارتباطی و توانایی کار تیمی هم مهم است.
در ضمن از آنجا که در این شغل اولا شما باید مهارتهای زیاد و در حوزههای گستردهای داشته باشید و همچنین بتوانید دائم و سریع یاد بگیرید، اگر یک فرد چندپتانسیلی (Multipotentialite) هستید، مطمئن باشید که شما میتوانید بهترین دیتا ساینتیستی باشید که میتوان پیدا کرد.
دیدگاهتان را بنویسید