بيانات

60 دقيقة

مقدمة لطيفة لاستخلاص البيانات

School of Data
الملخص:
أنتم ترون المعلومات التي تريدونها في تقارير PDF، وفي الشبكات الاجتماعية (مثل تويتر وإنستغرام)، أو حتى في صفحات الوب، ولكن ليس بوسعكم في الواقع أن تفعلوا أي شيء بها. نحن سنُبيّن لكم كيف تستخرجون المعلومات بسرعة وسهولة من هذه المصادر غير المنظمة وتضعونها في مجموعة بيانات مفيدة. سوف تحصلون على بيانات كنتم تعتقدون سابقاً أنه من غير الممكن الوصول إليها، وسنقدم لمشروعكم مستوىً جديداً من الصقل والملاءمة. وسنفعل ذلك من خلال توفير مقدمة لطيفة لما يعتبره البعض المهارة الأكثر تأثيراً للنشطاء والصحفيين المعتمِدين على البيانات: ألا وهي الاستخلاص.
عن الدورة:
هذه الدورة مصمّمة لنشطاء حقوق الإنسان والصحفيين الذين يودّون استعمال البيانات لدعم عملهم في مجال كسب التأييد أو لسرد القصص. ستتعلمون المفاهيم الأساسية للاستخلاص، وكيفية استعمال الأدوات المجانية والسهلة لاستخلاص البيانات من صفحات الوب (باستعمالGoogle Sheets وامتداد لمتصفح وب يدعى مُستخلِص الوب Web Scraper)، والشبكات الاجتماعية مثل تويتر وإنستغرام (باستعمال خدمة وب تدعى IFTTT) وملفات PDF (باستعمال كل من خدمة الوب التي تدعى Abby Fine Reader وتطبيق Tabula، وهو تطبيق مجاني مُنجز من قِبل صحفيين يمكنكم تحميله على حواسيبكم).
ماذا سأتعلم:
ستمتلكون في نهاية هذه الدورة فهماً أساسياً لما يعنيه الاستخلاص، وستتمكنون من تنفيذ أعمال الاستخلاص الروتينية الأساسية في صفحات الوب والشبكات الاجتماعية وملفات الـ PDF. ستكونون قادرين على الحصول على البيانات من أماكن غير متوفرة تقليدياً للأشخاص الذين لا يمتلكون مهارات برمجية، وهذا سيوسع نطاق جهود جمع البيانات الخاصة بكم، ما يتيح المزيد من الأهمية لمشاريع كسب التأييد والتنمية الاجتماعية والصحفية الخاصة بكم.
ما الذي أحتاج إلى معرفته:
هذه الدورة مناسبة لأي شخص أنهى دورَتَي School of Data وهما: تحليل البيانات وجمع البيانات. ويتطلب ذلك أن تُلِمَّوا بعض الشيء بمفاهيم البيانات الأساسية، مثل أنماط البيانات وكيفية تنظيم مجموعات البيانات. ستحتاجون إلى اتصال بشبكة الإنترنت، وحاسوب، وسوف يُطلب منكم إنشاء حسابات في بعض خدمات الوب، مثل Google Spreadsheets، وتويتر، وإنستغرام، وخدمة IFTTT. لن تحتاجوا إلى أي مهارات في الترميز، أو مهارات تقنية خاصة، أو معرفة متقدمة في كيفية العمل على جداول البيانات.

المدرّبون

ماركو توليو بيريس

ماركو توليو بيريس هو مدير مختبرغوغل للأخبار في البرازيل وأمريكا اللاتينية.عمل سابقاً كمدير البرامج في School of Data، ويعمل بين أقسام علوم الحاسوب والصحافة والتعليم. وقد ساعد غُرف الأخبار والطلبة في بلدان عديدة حول العالم ليصبحوا أكثر براعة فيما يتعلق بقراءة وكتابة البيانات.

1.1 مقدمة للدورة
1.2 ما هو الاستخلاص؟
1.3 مُستخلِصي الأول: أنا
1.4 اختبار
2.1 مقدمة
2.2 استعمال Abby Fine Reader على الشبكة العنكبوتية لاستخراج البيانات من ملفات الـ PDF.
2.3 استعمال Tabula لاستخراج البيانات من جداول ملفات الـ PDF
2.4 مُستخلصي الثاني: تحرير ملفات PDF
2.5 اختبار
3.1 مقدمة
3.2 استخلاص بيانات تويتر باستعمال IFTTT
3.3 مُستخلِصي الثالث: تويتر وإنستغرام
4.1 مقدمة
4.2 مقدمة موجزة للغة HTML
4.3 استعمال مفتش الوب
4.4 اختبار
5.1 مقدمة
5.2 استعمال صيغ Google Sheets لاستخلاص البيانات
5.3 استخلاص البيانات من صفحات الوب باستعمال Google Sheets
5.4 استخلاص موسوعة ويكيبيديا
6.1 مقدمة
6.2 استخلاص البيانات من صفحات الوب باستعمال مُستخلص الوب
6.3 استخلاص الوب
7.1 الختام

دورات ذات صلة

  • 90 دقيقة

    بيانات

    تنظيف وتحليل البيانات

    School of Data

    90 دقيقة

    بيانات

    تنظيف وتحليل البيانات

    School of Data
  • 60 دقيقة

    بيانات

    جمع البيانات للمبتدئين

    School of Data

    60 دقيقة

    بيانات

    جمع البيانات للمبتدئين

    School of Data

قائمة القراءات المقترحة

الانتقال إلى التصفح
0
0
  • الخصوصية
  • الأحكام والشروط