Jumat, 04 Mei 2018

Pengertian dan Penggunaan SAS IML (Interactive Matrix Language)

Interactive Matrix Language (IML) adalah bahasa matriks yang mirip dengan MATLAB dan Gauss. SAS IML memungkinkan kita untuk melakukan penghitungan matriks secara lebih efektif dengan menggunakan fungsi matrik. Namun, SAS IML hanya mampu menangani matriks 2 dimensi. (Srivastava, 2014). Sebagian besar prosedur statistik SAS/STAT yang berkaitan dengan model linier dapat dilakukan dengan prosedur IML. (Perrett, 2010)


Tampilan SAS
Adapun penggunaan utama coding IML yaitu:
  1. Membantu memprogram prosedur statistik yang sulit dikodekan pada SAS. Misalnya prosedur bersifat berulang dan dan membutuhkan banyak waktu ketika dikodekan.
  2. Melakukan operasi Matriks, misalnya: menghitung inverse, melakukan perkalian matriks, determinan, dll.
  3. Melakukan operasi pada baris dan kolom pada set data.
  4. Menciptakan grafis yang menarik.
Sumber:
Perret, Jamis J. 2010. A SAS/IML Companion for Linear Model.Springer New York Dordrecht Heidelberg:London.

Srivastava,Tavish. 2014. Introduction to PROC IML: Making matrix handling on SAS as easy as R. https://www.analyticsvidhya.com/blog/2014/10/proc-iml-matrix-handling-sas/ 

Selasa, 01 Mei 2018

Uji T Sampel Berpasangan (Paired Sample T-test) pada SAS

Uji t sampel berpasangan mengasumsikan dua sampel yang saling berhubungan. Misalnya dalam suatu eksperimen respon diukur dua kali saat sebelum diberikan obat (kontrol) dan setelah diberi obat (perlakuan). 
Asumsi uji t sampel berpasangan yaitu 
1. Dua kelompok data dependen.
2. Perbedaan antara kontrol dan perlakuan mengikuti distribusi normal.

Data berikut saya simpan di data E dalam folder Data yang berisi file respon.csv, kemudian data tersebut saya panggil menggunakan infileData respon.csv saya peroleh dari http://www.stat.purdue.edu 

data respon;
      infile "E:\Data\respon.csv" dlm=',' firstobs=2;
      input kontrol perlakuan;
    run;
proc print data=respon;
run;
proc ttest data=respon sides=2 alpha=0.05 h0=0;
      title "Paired sample t-test";
      paired kontrol * perlakuan;
   run;

Berikut Outputnya:

Hipotesis:
Hipotesis Nol: H0: μd = 0
Hipotesis Alternatif: H1: μd ≠ 0

Kesimpulan:
Kita menolak H0 karena p-value<0,05 (0,0074<0,05). Artinya Pada tingkat kepercayaan 95% telah terbukti bahwa Ada perbedaan antara sebelum penggunaan obat dan setelah penggunaan obat.

Menghitung Ringkasan Statistik (Rataan dan Simpangan Baku) di R

Teman-teman bisa menggunakan R version 3.4.3. atau R Studio. Untuk output di bawah, saya menggunakan R Studio yah teman-teman.
Kita akan membuat output seperti gambar berikut.


> # Data dalam bentuk dua numerik vektor

> # Berat badan mahasiswa sebelum diberi perlakuan 
> sebelum <-c(60.5, 65, 57.7, 56, 67.4, 70.9, 63.2, 65.5, 54.2, 57.7)
> # Berat badan mahasiswa setelah diberi perlakuan
> sesudah <-c(55.9, 62.2, 56.1, 52, 61, 68.9, 63, 63.9, 54.3, 50.2
> # Membuat data frame
>  Data_p <- data.frame(
+     group = rep(c("sebelum", "sesudah"), each = 10), 
+     berat = c(sebelum, sesudah))
> # print semua data
> print(Data_p)
     group berat
1  sebelum  60.5
2  sebelum  65.0
3  sebelum  57.7
4  sebelum  56.0
5  sebelum  67.4
6  sebelum  70.9
7  sebelum  63.2
8  sebelum  65.5
9  sebelum  54.2
10 sebelum  57.7
11 sesudah  55.9
12 sesudah  62.2
13 sesudah  56.1
14 sesudah  52.0
15 sesudah  61.0
16 sesudah  68.9
17 sesudah  63.0
18 sesudah  63.9
19 sesudah  54.3
20 sesudah  50.2

Ringkasan statistik  (Rataan dan Simpangan Baku) dihitung dengan menggunakan package: dplyr .
Jadi sebelum menghitung ringkasan statistik data di atas instal dulu packege: dplyr

install.packages("dplyr")

> library("dplyr")
Attaching package: ‘dplyr’
Warning message:
package ‘dplyr’ was built under R version 3.4.3 
> group_by(Data_p, group) %>%
+     summarise(
+         count = n(),
+         mean = mean(berat, na.rm = TRUE),
+         sd = sd(berat, na.rm = TRUE)
+     )

# A tibble: 2 x 4
    group count  mean       sd
   <fctr> <int> <dbl>    <dbl>
1 sebelum    10 61.81 5.444355
2 sesudah    10 58.75 5.945914

Tunggu tulisan selanjutnya, kita akan membahas cara membuat boxplotnya. ^_^
#Membuat data frame di R
#Ringkasan Statistik di R pada data kelompok

Sumber: http://www.sthda.com/

Mengapa Melakukan Percobaan?

Kita ketahui bersama bahwa Kajian Statistik ada dua: 
↳ Observasional
↳ Eksperimental

Kajian Observasional
↪1. Faktor yang dipelajari tidak dapat dikendalikan. 

Contoh: Kita tertarik mengetahui apakah rokok dapat membuat mahasiswa bodoh. Untuk mengetahuinya dengan cara dicobakan kepada siswa. tentu hal ini tidak mungkin dilakukan. karena tidak semua siswa merokok dan tidak mungkin kita menyuruh mereka untuk merokok selama beberapa minggu. Jadi tidak ada peneliti mengeksperimen rokok tetapi hanya dapat mengamati perilaku mahasiswa merokok. Jadi faktor rokok tidak dapat dikendalikan.

↪2. Lebih sulit dipelajari hubungan sebab akibat.

Kajian Eksperimental (Oehlert, Gary W, 2010)
↪ 1. Kita dapat mengendalikan eksperimen. Satu atau lebih faktor dapat dikendalikan sehingga dapat digunakan untuk membuat kesimpulan yang lebih kuat tentang sifat perbedaan yang kita lihat dalam percobaan. Khususnya, kita dapat membuat kesimpulan tentang sebab-akibat.
↪ 2. Memungkinkan kita untuk menetapkan perbandingan langsung antara perlakuan yang dicobakan.
↪ 3. Kita dapat merancang eksperimen untuk meminimalkan bias dalam perbandingan.
↪ 4. Kita dapat merancang eksperimen sehingga kesalahan dalam perbandingan kecil.

Eksperimental⇒ mencobakan beberapa perlakuan lalu dievaluasi perlakuannya. Eksperimen dicirikan oleh perlakuan dan unit percobaan yang digunakan serta ada respon yang diukur.

Sumber: Oehlert, Gary W. 2010. A First Course in Design and Analysis of Experiments. University of Minnesota. http://creativecommons.org/licenses/by-nc-nd/3.0/