Senin, 14 April 2014

tugas statistika distribusi normal, distribusi t dan distribusi f

. Distribusi Normal

Salah satu distribusi frekuensi yang paling penting dalam statistika adalah distribusi normal. Distribusi normal berupa kurva berbentuk lonceng setangkup yang melebar tak berhingga pada kedua arah positif dan negatifnya. Penggunaanya sama dengan penggunaan kurva distribusi lainnya. Frekuensi relatif suatu variabel yang mengambil nilai antara dua titik pada sumbu datar. Tidak semua distribusi berbentuk lonceng setangkup merupakan distribusi normal.
Pada tahun 1733 DeMoivre menemukan persamaan matematika kurva normal yang menjadi dasar banyak teori statistika induktif. Distribusi normal sering pula disebut Distribusi Gauss untuk menghormati Gauss (1777 – 1855), yang juga menemukan persamaannya waktu meneliti galat dalam pengukuran yang berulang-ulang mengenai bahan yang sama.
Sifat dari variabel kontinu berbeda dengan variabel diskrit. Variabel kontinu mencakup semua bilangan, baik utuh maupun pecahan. Oleh karenanya tidak bisadipisahkan satu nilai dengan nilai yang lain. Itulah sebabnya fungsi variabel random kontinu sering disebut fungsi kepadatan, karena tidak ada ruang kosong diantara dua nilai tertentu. Dengan kata lain sesungguhnya keberadaan satu buah angka dalam variabel kontinu jika ditinjau dari seluruh nilai adalah sangat kecil, bahkan mendekati nol. Karena itu tidak bisa dicari probabilitas satu buah nilai dalam variabel kontinu, tetapi yang dapat dilakukan adalah mencari probabilitas diantara dua buah nilai. Distribusi kontinu mempunyai fungsi matematis tertentu. Jika fungsi matematis tersebut digambar, maka akan terbentuk kurva kepadatan dengan sifat sebagai berikut:
1. Probabilitas nilai x dalam variabel tersebut terletak dalam rentang antara 0 dan 1
2. Probabilitas total dari semua nilai x adalah sama dengan satu (sama dengan luas daerah
di bawah kurva)
Fungsi kepadatan merupakan dasar untuk mencari nilai probabilitas di antara dua nilai variabel. Probabilitas di antara dua nilai adalah luas daerah di bawah kurva di antara dua nilai dibandingkan dengan luas daerah total di bawah kurva. Dapat dicari luas daerah tersebut dengan menggunakan integral tertentu (definit integral).
Persamaan matematika distribusi peluang peubah normal kontinu bergantung pada dua parameter μ dan σ yaitu rataan dan simpangan baku. Jadi fungsi padat x akan dinyatakan dengan n (x; μ, σ).
Begitu μ dan σ diketahui maka seluruh kurva normal diketahui. Sebagai contoh, bila μ = 50 dan σ = 5, maka ordinat n(x ; 50, 5) dapat dengan mudah dihitung untuk berbagai harga x dan kurvanya dapat digambarkan. Kedua kurva bentuknya persis sama tapi titik tengahnya terletak di tempat yang berbeda di sepanjang sumbu datar.
Dengan memeriksa turunan pertama dan kedua dari n(x ; μ, σ) dapat diperoleh lima sifat kurva normal berikut :
1. Modus, titik pada sumbu datar yang memberikan maksimum kurva, terdapat pada x=μ
2. Kurva setangkup terhadap garis tegak yang melalui rataan μ
3. Kurva mempunyai titik belok pada x = μ σ, cekung dari bawah bila μ – σ < x < μ + σ,
dan cekung dari atas untuk harga x lainnya
4. Kedua ujung kurva normal mendekati asimtot sumbu datar bila harga x bergerak
menjauhi μ baik ke kiri maupun ke kanan
5. Seluruh luas di bawah kurva diatas sumbu datar sama dengan 1

Bila x menyatakan peubah acak distribusi maka P(x1 < x < x2) diberikan oleh daerah yang diarsir dengan garis yang turun dari kiri ke kanan. Jelas bahwa kedua daerah yang diarsir berlainan luasnya. Jadi, peluang yang berpadanan dengan masing-masing distribusi akan berlainan pula.
Contoh soal :
Contoh Soal : Mawar adalah seorang peragawati yang akan diseleksi dengan tinggi badan 173 cm. Standar tinggi badan rata-rata peragawati adalah 171,8 dan standar deviasinya adalah 12. Berapakah standar normalnya (Z) ?
Penyelesaian :
Dik : x = 173, µ = 171,8, σ = 12
Dit : Z ?
Jawab : Z = x - µ
σ = 173 – 171.8 = 0.1
12
2. ANALYSIS OF VARIANCE (ANOVA)
 ANOVA dapat digunakan untuk menguji kesaman 3 (tiga) atau lebih rata-rata populasi menggunakan data yang diperoleh dari pengamatan maupun percobaan.
n Menggunakan hasil sampel untuk menguji hipotesis berikut:
H0: m1 = m2 = … = mk
Ha: minimal ada mi ¹ mj
n Jika H0 ditolak berarti minimal ada 2 rata-rata populasi yang memiliki nilai berbeda.
ASUMSI-ASUMSI PADA ANOVA
n Untuk setiap populasi, variabel respons-nya terdistribusi normal.
n Varian dari variabel respons, dinotasikan s 2, adalah sama untuk semua populasi.
n Unit observasi harus saling bebas (independent).
ANOVA: PENGUJIAN RATA-RATA POPULASI
ESTIMASI VARIAN POPULASI ANTAR SAMPEL
n Estimasi s2 antar-sampel (between-samples) disebut mean square between (MSB).
n Pembilang dari MSB merupakan sum of squares between (SSB).
n Penyebut dari MSB menyatakan derajat bebas (degrees of freedom)yang terkait dengan SSB.
n ANOVA: PENGUJIAN RATA-RATA POPULASI
ESTIMASI VARIAN POPULASI DALAM SAMPEL
n Estimasi s2 yang didasarkan pada variasi observasi dalam masing-masing sampel disebut mean square within (MSW).


n Pembilang dari MSW disebut sum of squares within (SSW).
n Penyebut dari MSW menunjukkan derajat bebas (degrees of freedom) yang bersesuaian dengan SSW.
n ANOVA: PENGUJIAN RATA-RATA POPULASI
PERBANDINGAN ESTIMASI VARIAN: UJI F
n Jika H0 benar dan asumsi pada ANOVA terpenuhi, maka distribusi

n Jika rata-rata k populasi tidak sama, nilai MSB/MSW akan meningkat karena MSB overestimate.
n Oleh karena itu, kita akan menolak H0.
n PROSEDUR PENGUJIAN RATA-RATA POPULASIHipotesis
H0: m1 = m2 = … = mk
Ha: minimal ada mi ¹ mj
n Uji Statistik
F = MSB/MSW

n Aturan Penolakan
Tolak H0 jika F > Fa
dimana nilai Fa didasarkan pada distribusi F dg derajat bebas k - 1 dan nT - 1.
CONTOH SOAL:
DISTRIBUSI T

Adalah pengujian hipotesis yang menggunakan distribusi T sebagai uji statsistik, table pengujiannya disebut table T student. Distribusi T pertama kali diterbitkan tahu 1908 dalam suatu makalah oleh W.S. Gosset. Hasil uji statistiknya kemudian dibandingkan dengan nilai yang ada pada tabel kemudian menerima atau menolak hipotesis nol (Ho) yang dikemukakan. Cirinya : sample yang di uji berukuran kurang dari 30
Tabel Nilai t
df

α



0.05
0.025
0.01
0.005
1
6.314
12.706
31.821
63.657
2
2.920
4.303
6.965
9.925
3
2.353
3.182
4.541
5.841
4
2.132
2.776
3.747
4.604
5
2.015
2.571
3.365
4.032
6
1.943
2.447
3.143
3.707
7
1.895
2.365
2.998
3.499
8
1.860
2.306
2.896
3.355
9
1.833
2.262
2.821
3.250
10
1.812
2.228
2.764
3.169
11
1.796
2.201
2.718
3.106
12
1.782
2.179
2.681
3.055
13
1.771
2.160
2.650
3.012
14
1.761
2.145
2.624
2.977
15
1.753
2.131
2.602
2.947
16
1.746
2.120
2.583
2.921
17
1.740
2.110
2.567
2.898
18
1.734
2.101
2.552
2.878
19
1.729
2.093
2.539
2.861
20
1.725
2.086
2.528
2.845
21
1.721
2.080
2.518
2.831
22
1.717
2.074
2.508
2.819
23
1.714
2.069
2.500
2.807
24
1.711
2.064
2.492
2.797
25
1.708
2.060
2.485
2.787
26
1.706
2.056
2.479
2.779
27
1.703
2.052
2.473
2.771
28
1.701
2.048
2.467
2.763
29
1.699
2.045
2.462
2.756
30
1.697
2.042
2.457
2.750
40
1.684
2.021
2.423
2.704
50
1.676
2.009
2.403
2.678
100
1.660
1.984
2.364
2.626
10000
1.645
1.960
2.327
2.576
Uji t dikembangkan oleh William Sealy Gosset. Dalam artikel publikasinya, ia menggunakan nama samaran Student, sehingga kemudian metode pengujiannya dikenal dengan uji t-student. William Sealy Gosset menganggap bahwa untuk sampel kecil, nilai Z dari distribusi normal tidak begitu cocok. Oleh karenanya, ia kemudian mengembangkan distribusi lain yang mirip dengan distribusi normal, yang dikenal dengan distribusi t-student. Distribusi student ini berlaku baik untuk sampel kecil maupun sampel besar. Pada n ≥ 30, distribusi t ini mendekati distribusi normal dan pada n yang sangat besar, misalnya n=10000, nilai distribusi t sama persis dengan nilai distribusi normal (lihat tabel t pada df 10000 dan bandingkan dengan nilai Z).
Pemakaian uji t ini bervariasi. Uji ini bisa digunakan untuk objek studi yang berpasangan dan juga bisa untuk objek studi yang tidak berpasangan. Berikut contoh penggunaan uji t.
Uji t tidak berpasangan
Contoh kasus :
Kita ingin menguji dua jenis pupuk nitrogen terhadap hasil padi
1. Hipotesis
Ho : clip_image002[22]1 =clip_image002[22]2
HA : clip_image002[22]1 ≠ clip_image002[22]2
2. Hasil penelitian tertera pada Tabel 1.
Tabel 1. Data hasil penelitian dua jenis pupuk nitrogen terhadap hasil padi (t/h)

Plot
Pupuk A
Y1
Pupuk B
Y2
1
7
8
2
6
6
3
5
7
4
6
8
5
5
6
6
4
6
7
4
7
8
6
7
9
6
8
10
7
7
11
6
6
12
5
7
3. Data analisis adalah sebagai berikut
Hitunglah
clip_image002[22]1 = 5.58
Y 2 = 6.92
S1 = 0.996
S2 = 0.793
thit =( clip_image002[22]1clip_image002[22]2)/√(S12/n1) +(S22/n2)
=( 5.58 – 6.92)/√(0.9962/12)+(0.7932/12)
= -1.34/0.367522 = -3.67
Setelah itu, kita lihat nilai t table, sebagai nilai pembanding. Cara melihatnya adalah sebagai berikut. Pertama kita lihat kolom α = 0.025 pada Tabel 2. Nilai α ini berasal dari α 0.05 dibagi 2, karena hipotesis HA kita adalah hipotesis 2 arah (lihat hipotesis). Kemudian, kita lihat baris ke 22. Nilai 22 ini adalah nilai df, yaitu n1+n2-2. Nilai n adalah jumlah ulangan, yaitu masing 12 ulangan. Akhirnya, kita peroleh nilai ttable = 2.074.
t table = t α/2 (df) = t0.05/2 (n1+n2-2)=t0.025(12+12-2) = t0.025(22) = 2.074.
 
 
 
 
 
 

 

.




 
 



tugas statistika momen ,kemiringan dan kurtoris(STIESS)


Ukuran Kemiringan (skewness)

Merupakan derajat atau ukuran dari ketidaksimetrisan (Asimetri) suatu distribusi data. Kemiringan distribusi data terdapat 3 jenis, yaitu :

Simetris : menunjukkan letak nilai rata-rata hitung,
median, dan modus berhimpit (berkisar disatu
titik)
Miring ke kanan : mempunyai nilai modus paling
kecil dan rata-rata hitung
paling besar
Miring ke kiri : mempunyai nilai modus paling
besar dan rata-rata hitung paling kecil



Kemiringan simetri (normal) kemiringan Negatif positif


Untuk mengukur derajat kecondongan suatu distribusi dinyatakan dengan koefisien kecondongan (koefisien skewness).Ada tiga metode yang bisa digunakan untuk menghitung koefisien skewness yaitu :

Rumus pearson

 = 1/S (X ̅ - Mod) Atau  = 3/S (X ̅ – Med)



Rumus Momen

Data tidak berkelompok

3 = 1/〖nS〗^2 ∑ ( X1 X ̅ )3


Data Berkelompok

3 = 1/〖nS〗^3 ∑f i( mi - X ̅ )3

Keterangan
3 = derajat kemiringan
x1 = nilai data ke – i
X ̅ = nilai rata-rata hitung
Fi = frrekuensi nilai ke i
M1 = nilai titik tengah kelas ke-i
S = Simpangan Baku
N = Banyaknya data
Jika 3 = 0 distribusi data simetris
3 < 0 distribusi data miring ke kiri
3 > 0 distribusi data miring ke kanan









Rumus bowley

Rumus ini menggunakan nilai kuartil :

3 = (Q_3+ Q_1- 2Q_2)/(Q_3- Q_1 )
Keterangan :
Q1 = kuartil pertama
Q2 = Kuartil Kedua
Q3 = Kuaril Ketiga




Cara menentukan kemiringannya :
Jika Q3 – Q2 = Q2 – Q1 sehingga Q3 + Q1 -2Q2 = 0 yang mengakiibatkan 3 = 0, sebaliknya jika distribusi miring maka ada dua kemungkinan yaitu Q1 = Q2 atau Q2 = Q3, dalam hal Q1 = Q2 maka 3 = 1 , dan untuk Q2 = Q3 maka 3 = -1


Ukuran kemiringan data merupakan ukuran yang menunjukan apakah penyebaran data terhadap nilai rata-ratanya bersifat simetris atau tidak. Ukuran kemiringan pada dasarnya merupakan ukuran yang menjelaskan besarnya penyimpangan data dari bentuk simetris. Suat distribusi frekuensi yang miring (tidak simetris) akan memiliki nilai mean, median dan modus yang tidak sama besar (X ̅ ≠ Md ≠ Mo) sehinggan distribusi akan memusat pada salah satu sisi yaitu sisi kanan atau sisi kiri. Hal ini yang menyebabkan bentuk kurva akan miring ke kanan atau ke kiri. Jika kurva miring ke arah kanan (ekornya memanjang ke arah kiri) disebut kemiringan positif, dan jika kurva miring ke arah kiri (ekornya memnjang ke arah kanan) disebut kemiringan negatif.



Analisis kasus :
Tabel 2.1
Cara perhitungan koefisien kecondongan dengan metode
Pearson dari data penghasilan keluarga
penghasila keluarga X f U fU Fu2
10-22 16 5 -3 -15 225
23-35 29 6 -2 -12 144
36-48 42 13 -1 -13 169
49-61 55 19 0 0 0
62-74 68 11 1 11 121
75-87 81 11 2 22 484
88-100 94 5 3 15 225
Jumlah 70 ∑ fU = 8 ∑ fU2 = 1368









Sebelum menggunakan rumus terlebih dahulu dicari nilai , mean, median, dan standar deviasinya berikut ini:
Mean :
X ̅ = A + ((∑▒〖f.U〗)/n) . i
X ̅ = 55 + (8/70) . 3
X ̅ = 56,485

Median :
Med = Tkbmd + ((1/2 n-fkb)/fmd) . i

Med = 48.5 + ((35-24)/19) . 13
Med = 48.5 + 7,526
Med = 56,026






Standar Deviasi :

S = i √((n∑f.U^2-(∑f.U^2))/(n(n-1)))
S = 13 √(((70)-(1368)-(〖8)〗^2)/(70(70-1)))
S = 13 √19,81
S = 57,86

Setelah kita dapatkan nilai-nilai diatas, kemudian dimasukan ke dalam rumus koefisein skewness :
α = 3/S (X ̅ - Med)

α = 3/57,86 ( 56,485 – 56,026)

α = 0,0238

dari hasil perhitungan menunjukan bahwa koefisien skewness menghasilkan nilai positif, itu berarti distribusi frekuensi mempunyai bentuk kemiringan yang positif yaitu miring ke arah kanan












2.1.3 Ukuran Keruncingan (kurtosis)
Merupakan derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya data. Jika bentuk kurva runcingberarti nilai data terkonsentrasi terhadap nilai rata-tata atau nilai penyebarannya kecil, sebaliknya jika bentuk kurva nya tumpul berarti nilai data tersebar terhadap nilai rata-rata atau nilai penyebaran besar. Keruncingan distribusi data ini disebut juga kurtosis.
Derajat keruncingan suatu distribusi frekuensi dapat dibedakan menjadi tiga, yaitu:
Leptokurtis
Distribusi data yang puncaknya relatif tinggi atau bentuk distribusi yang ujungnya sangat runcing
Mesokurtis
Distribusi data yang puncaknya tidak terlalu runcing atau tidak terlalu tumpul
Platikurtis
Distribusi data yang puncaknya terlalu rendah atau terlalu mendatar


Mesokurtis leptokurtis platikurtis








Derajat keruncingan distribusi data α4 dapat dihitung berdasarkan rumus berikut
Data tidak berkelompok
α4 = 1/(nS^4 ) ∑ ( Xi - X ̅)4

Data berkelompok
α4 = 1/(nS^4 ) ∑ fi ( mi - X ̅ )4

Keterangan :
α4 = Derajat keruncingan
Xi = nilai data ke – i
= nilai rata-rata hitung
fi = frekuensi kelas ke – i
mi = nilai titik tengah ke –i
S = simpangan baku
n = banyaknya data

dari penggunaan rumus diatas akan menghasilkan kemungkinan tiga nilai yaitu :
α4 = 3 distribusi keruncingan data disebut mesokurtis
α4 > 3 distribusi keruncingan data disebut leptokurtis
α4 < 3 distribusi keruncingan data disebut platikurtis

Analisis kasus :
Tabel 2.2
Cara perhitungan koofisien keruncingan
Dari data penghasilan keluarga
Penghasilan keluarga Frekuensi U f.U f.U2 f.U3 f.U4
10-22 5 -3 -15 45 -135 405
23-35 6 -2 -12 24 -48 96
36-48 13 -1 -13 13 -13 13
49-61 19 0 0 0 0 0
62-74 11 1 11 11 11 11
75-87 11 2 22 44 88 176
88-100 5 3 15 45 135 405
jumlah 70 8 182 38 1106

s = i √((n∑fU^2-(∑f.〖U)〗^2)/(n(n-1)))
s = 13 √(((70)(1368)-(〖8)〗^2)/(70(70-1)))

s = 13 √19,81

s = 57,86









Setelah kita dapatkan nilai diatas, kemudian dimasukan ke dalam rumus koefisein kurtosis :

α4 = [(∑f.U^4)/n-4{(∑f.U^3)/n}{(∑f.U^ )/n}+6{(∑f〖.U〗^2)/n} {(∑f.U)/n}^2-3{(∑f.U)/n}^4 ] i^4/s^4

α4 = [1106/70-4{38/70}{8/70}+6{182/70} {8/70}^2-3{8/70}^4 ] 〖13〗^4/〖57.86〗^4

α4 = (15.7557) (0,00255)

α4 = 0.040