məlumatları necə təsvir etmək olar


cavab 1:

Bu kimi müşahidələri daxil etmək lazım deyil. Məlumat dəstini təsvir etmək üçün atributlardan hər birinin adını, dəyişkən növünü və atribut haqqında qısa təsviri qoyun. Kategorik bir atribut üçün mümkün olan kateqoriyaları sadalaya bilərsiniz.

Nümunə - İnsanların bir verilənlər bazasını nəzərdən keçirin

id - uzun, unikal identifikator

Yaş - Tam, Fərdin yaşı

Təhsil - Kategorik, Ən yüksək təhsil səviyyəsi. Mümkün dəyərlər: [buraxma, Associates, bakalavr, doktorantura, HS-Graduate, magistr, doktorluq]

Ailə vəziyyəti - Fərdi kateqoriyalı, Ailə vəziyyəti. Mümkün dəyərlər: [Heç Evli, Evli, Evli deyil, Dul]

Əmək haqqı - Fərdi şəxsin ikiqat əmək haqqı.

Cins - Kategorik, Fərdi Cinsiyyət. Mümkün dəyərlər: [Kişi, Qadın, Digər]


cavab 2:

Aşağıdakıların bir verilənlər bazası üçün maraqlı olduğunu düşünürəm:

  1. Nəyi proqnozlaşdırmağa çalışırsan?
  2. Çıxış aralığı nədir: {0, 1}, [0, 1] -də davamlı skalar, ixtiyari real no. Və s.
  3. Dərs sayı, yox. atributlardan, yox. müşahidələrin, yox. balanssız olduqda sinif başına müşahidələrin.
  4. Atributlar / dəyişənlər hansılardır?
  5. Dəyişən növləri hansılardır: həqiqi dəyərlər, ikili, kateqoriyalı və s.

Yuxarıda göstərilənlər xaricində daha çox əhəmiyyətsiz məlumatlar verməyincə, həqiqi müşahidələrin aparılması tələb oluna bilməz.


cavab 3:

Bir məlumat lüğəti hazırlamalısınız. Bütün dəyişənlərinizi və qısa bir tərifinizi göstərin. Layihə analizini qısaca izah etməlisiniz. Buraya dəyişənləri düzgün kontekstdə yerləşdirmək üçün hər hansı bir yazı daxildir. Hesabatınızda ümumi statistik praktikanı qeyd etməlisiniz. Layihənin məqsədi, məlumat toplanması və lüğət, təhlil və nəticələr daxil edin. Hesabatınız demək olar ki, həmişə daha böyük bir hədəfə söykənir. Bu konteksti düzgün müəyyənləşdirirsinizsə, hesabatınız yaxşı hizalanır. Bütün məqsədlər üçün bir hissə olaraq kömək edir.


cavab 4:

Veri dəsti haradan gəldi? Necə toplandı? Niyə toplandı? Niyə bu dəyişənlər verilənlər bazasına daxil edildi? Bu dəyişənlər hansı vahidlərdir? Məlumat nə qədər toplandı və nə üçün? Niyə bu verilənlər bazasını seçdin, bir dənəsini də tatlamadın?