واژه‌نامه‌ای برای علم داده: کلماتی که باید بدانید

علم آمار و همچنین روزنامه‌نگاری داده (دیتا ژورنالیسم) به روزنامه نگاری کمک می کند تا از هر زمان دقیق‌تر عمل کند. پیشتر روزنامه‌نگاران درباره هر چه دوست داشتند می‌نوشتند و از هر چه احساس می‌کردند مهم است حرف می‌زدند. اما امروز دانشمندان، طراحان، برنامه‌نویسان و روزنامه‌نگاران مثل یک تیم کنار هم کار می‌کنند تا از این داده‌ها بهترین نتیجه را استخراج کنند، که مسلما منبع ارزشمند و نیروی حیاتی‌ برای تغییر است.

به همین دلیل تصمیم گرفتیم تا شما را با یک واژه‌نامه دیگر آشنا کنیم تا بتوانید کلمات ابتدایی علم داده را بیشتر بشناسید.

 

۱. استخراج داده: وقتی از استخراج داده حرف می‌زنیم، در واقع صحبت از گرفتن داده‌ها از فاصل‌هایی‌ست که در اصل برای تعامل انسان‌ها و ترجمه آنها به فرمتی قابل خوانده شدن توسط ماشین طراحی شده‌اند.

 

۲. تمیزکاری داده: عبارتند از تلاش برای بهبود کیفیت کلی داده‌ها با حذف یا اصلاح داده‌های نادرست، ناقص یا غیر مرتبط از یک سیستم داده.

 

۳. مصورسازی داده: این یک اصطلاحی عمومی است که هر تلاشی برای کمک به مردم در درک اهمیت داده‌ها با قرار دادن آن در یک زمینه بصری را توصیف می‌کند. همچنین الگوها، روند‌ها و همبستگی‌هایی که ممکن است در داده‌های مبتنی بر متن ناشناخته بماند، می‌تواند با مصورسازی داده‌ها ساده‌تر شود.

 

۴. تجزیه و تحلیل داده‌ها: فرآیند بررسی مجموعه داده‌ها به منظور به دست آوردن نتیجه‌گیری در مورد اطلاعات آنها را، به طور فزاینده با کمک سیستم‌های تخصصی و نرم افزار.

 

۵. ابرداده: ابرداده داده‌های مربوط به داده‌هاست. ابرداده نشان دهنده اطلاعات پشت صحنه‌ست که در همه جا، توسط هر صنعت، به روش های مختلف استفاده می‌شود. ابرداده را می توان در سیستم‌های اطلاعاتی، رسانه‌های اجتماعی، وب‌سایت‌ها، نرم‌افزار، تصاویر، خدمات موسیقی، خرده فروشی آنلاین و غیره پیدا کرد.

 

۶. دانشمند علم داده: کارشناسی‌ست در استخراج بینش و ارزش داده‌ها. این نقش شامل استفاده از مهارت‌ها در تجزیه و تحلیل، دانش کامپیوتر، ریاضیات، آمار، خلاقیت، تجسم داده‌ها و ارتباطات و همچنین کسب و کار و استراتژی است.

 

۷. همبستگی: یک اندازه گیری آماری است که نشان می‌دهد میزان دو یا چند متغیر در کنار یکدیگر متفاوت است. گاهی اوقات سردرگمی در ارتباط با علیت وجود دارد. به یاد داشته باشید، فقط به این دلیل که دو چیز همبستگی دارند به این معنا نیست که یکی علت دیگریست.

 

۸. داده‌‌ی بزرگ: از این داده به عنوان یک اصطلاح برای توصیف مجموعه‌ای از مجموعه داده‌های بسیار بزرگ و پیچیده استفاده می‌شود که پردازش آن با استفاده از ابزارهای مدیریت پایگاه داده یا برنامه‌های پردازش داده‌های سنتی صورت می‌گیرد. 

 

۹. داده کاوی: عمل خودکار جستجو در انبار بزرگ داده‌ها برای کشف الگوها و روندی که فراتر از تجزیه و تحلیل ساده است را داده کاوی می‌نامند. در این روش از الگوریتم‌های ریاضی پیشرفته برای تجزیه و تحلیل داده‌ها و احتمال وقوع رویدادهای آینده استفاده می‌شود.

 

۱۰. عادی سازی: عادی‌سازی داده‌ها شامل حذف واحد اندازه‌گیری آن‌هاست و این کار به شما اجازه می دهد تا راحت‌تر داده‌ها را از مکان‌های مختلف با هم مقایسه کنید.

 

شما چطور؟ آیا درباره این کلمات چیزی شنیده‌اید؟ آیا مفاهیم دیگری هستند که بخواهید ما به لغت‌نامه خود اضافه کنیم؟ به ما به آدرس @Advocassembly توییت کنید.

 

آیا به مبحث علم داده علاقه‌مندید؟ می‌توانید در دوره‌های کوتاه مدرسه داده هم‌اکنون ثبت‌نام کنید!

 

دوره‌های مربوط

  • ۹۰ دقیقه

    داده

    تمیزکاری و تحلیل داده‌ها

    School of Data

    ۹۰ دقیقه

    داده

    تمیزکاری و تحلیل داده‌ها

    School of Data
  • ۵۰ دقیقه

    رسانه

    آموزش برقراری ارتباطات به خبرنگاران آزاد ایرانی

    Rory Peck Trust

    ۵۰ دقیقه

وبلاگ‌ها

رد کردن و رفتن به بخش راهبری وبسایت
0
0
  • حریم خصوصی
  • قوانین