Asal mula statistik dapat ditelusuri di masa Cina dan Yunani kuno. Konsep pengelompokan dan rataan dapat dilihat ke belakang pada 6 abad sebelum masehi di Cina Kuno, setelah ditemukannya sempoa (alat bantu hitung). Data statistik (statistics) saat itu dikumpulkan oleh negara (state) dalam membantu pemimpinnya untuk mengatur keuangan dan militer (sangat wajar jika ada pertanyaan bahwa apakah kata statistics dan state bersumber dari akar yang sama). Di abad abad 16 dan 17, golongan orang kaya sangat menggemari permainan peluang sehingga mereka sering memberikan pertanyaan-pertanyaan tentang peluang terutama ditujukan kepada matematikawan terkenal seperti Fermat, Leibnitz, dll. Pada tahun-tahun berikutnya banyak penelitian di bidang matematika dan statistika.
Didalam statistika, kata populasi, sampel dan data akan sering dijumpai. Populasi dapat didefinisi sebagai koleksi dari unit. Setiap elemen dapat diklasifikasikan dengan jelas apakah elemen tersebut menjadi bagian dari populasi tertentu atau tidak. Contoh: mahasiswa jurusan Agribisnis Untirta semester 2. Mahasiswa yang teregistrasi sebagai mahasiswa bukan jurusan Agribisnis di Untirta dan bukan semester 2 tidak akan masuk dalam anggota populasi mahasiswa jurusan Agribisnis Untirta semester 2.
Sampel adalah setiap Bagian/ elemen yang diambil dari populasi. Contoh: setiap mahasiswa jurusan Agribisnis Untirta semester 2 adalah sampel dari populasi mahasiswa jurusan Agribisnis Untirta semester 2. Jika Ina dan Asep adalah mahasiswa jurusan Agribisnis Untirta semester 2 maka Ina dan Asep adalah sampel dari populasi mahasiswa jurusan Agribisnis Untirta semester 2.
Data adalah koleksi dari nilai yang diamati yang merepresentasikan satu atau lebih karakteristik dari beberapa obyek atau unit. Contoh: data nilai mata kuliah matematika mahasiswa jurusan Agribisnis Untirta semester 2. Jika jumlah mahasiswanya adalah 40, misalnya, maka data dapat terdiri atas 40 baris (untuk obyek) dan 2 kolom (untuk nama mahasiswa dan nilai matematikanya). Perhatikan jika nama Asep dan nilai matematikanya diambil (terdiri atas 1 baris 2 kolom) maka yang diambil ini disebut dengan datum (bentuk tunggal dari data).
Data tidak dapat terlepas dari kehidupan setiap hari. Ilmu yang berhubungan dengan pengumpulan, analisis, interpretasi, dan presentasi dari data adalah ilmu statistika. Kata parameter dan statistik juga sering dijumpai saat belajar statistika. Ukuran untuk populasi disebut parameter (biasa dilambangkan dengan huruf yunani) sedangkan ukuran untuk sampel disebut statistik (biasa dilambangkan dengan huruf latin). contoh: rataan nilai matematika mahasiswa jurusan Agribisnis Untirta semester 2 adalah 67.575, rataan nilai matematika dari 2 orang mahasiswa (Ina dan Asep) jurusan Agribisnis Untirta semester 2 adalah 70. Nilai rataan 67.575 disebut parameter karena rataan dari populasi (\(\mu\)/ mu), sedangkan nilai rataan 70 disebut dengan statistik karena rataan dari 2 orang sampel (\(\bar{x}\)/ x bar).
Contoh kode di R
sebagai berikut:
set.seed(2016)
nama <- c("Ina", "Asep",letters[1:26],LETTERS[1:12])
nilai <- floor(rnorm(40, 70, 10))
(matematika <- data.frame(nama = nama, nilai = nilai))
## nama nilai
## 1 Ina 60
## 2 Asep 80
## 3 a 69
## 4 b 72
## 5 c 42
## 6 d 67
## 7 e 62
## 8 f 63
## 9 g 73
## 10 h 71
## 11 i 65
## 12 j 67
## 13 k 83
## 14 l 60
## 15 m 85
## 16 n 73
## 17 o 61
## 18 p 80
## 19 q 62
## 20 r 63
## 21 s 65
## 22 t 63
## 23 u 66
## 24 v 75
## 25 w 71
## 26 x 59
## 27 y 63
## 28 z 83
## 29 A 81
## 30 B 59
## 31 C 60
## 32 D 69
## 33 E 82
## 34 F 54
## 35 G 70
## 36 H 83
## 37 I 61
## 38 J 61
## 39 K 65
## 40 L 55
#Rataan nilai matematika satu kelas adalah:
mean(matematika[,"nilai"])
## [1] 67.575
#Sedangkan rataan nilai matematika Ina dan Asep adalah:
mean(matematika[1:2,"nilai"])
## [1] 70