Ngram, juga biasa disebut N-gram, adalah analisis statistik dari konten teks atau ucapan untuk ditemukan n (nomor) dari beberapa jenis barang dalam teks.
Item pencarian bisa segala macam hal, seperti fonem, prefiks, frasa, atau huruf. Meskipun N-gram agak tidak jelas di luar komunitas penelitian, itu digunakan dalam berbagai bidang dan memiliki banyak implikasi bagi pengembang coding program komputer yang memahami dan menanggapi bahasa lisan alami.
Dalam kasus Google Books Ngram Viewer, teks yang akan dianalisis berasal dari sejumlah besar buku yang telah dipindai Google dari perpustakaan umum untuk mengisi mesin pencarian Google Buku mereka. Untuk Google Books Ngram Viewer, mereka merujuk pada teks yang akan Anda cari sebagai korpus . Penampil Ngram agregat berdasarkan bahasa, meskipun Anda dapat menganalisis secara terpisah Inggris dan Bahasa Inggris Amerika atau menggabungkannya.
Bagaimana Ngram Bekerja
-
Buka Penampil Ngram Google Buku di books.google.com/ngrams.
-
Ketik frasa atau frasa apa pun yang ingin Anda analisis. Pisahkan setiap frasa dengan koma. Google menyarankan, "Albert Einstein, Sherlock Holmes, Frankenstein" untuk memulai. Item peka huruf besar kecil, tidak seperti penelusuran web Google.
-
Ketikkan rentang tanggal. Standarnya adalah 1800 hingga 2000.
-
Pilih korpus. Anda dapat mencari teks bahasa asing atau bahasa Inggris, dan selain pilihan standar, Anda mungkin memperhatikan hal-hal seperti "Bahasa Inggris (2009) atau Bahasa Inggris Amerika (2009)" di bagian bawah. Ini adalah korpora lama yang sejak itu diperbarui oleh Google, tetapi Anda mungkin memiliki beberapa alasan untuk membuat perbandingan Anda terhadap kumpulan data lama. Sebagian besar pengguna dapat mengabaikannya dan fokus pada korpora terbaru.
-
Atur tingkat perataan Anda. Smoothing mengacu pada seberapa halus grafik di bagian akhir. Representasi yang paling akurat adalah tingkat perataan 0, tetapi pengaturan itu mungkin sulit dibaca. Standarnya diatur ke 3. Biasanya, Anda tidak perlu menyesuaikannya.
-
tekan Cari banyak buku tombol.
Google memungkinkan Anda untuk menelusuri sedikit dengan Ngram Viewer. Jika Anda ingin mencari ikan kata kerja, bukan ikan kata benda, Anda dapat melakukannya dengan menggunakan tag. Dalam hal ini, Anda akan menelusuri "fish_VERB"
Google menyediakan daftar lengkap perintah yang dapat Anda gunakan dan dokumentasi lanjutan lainnya di situs web mereka.
Apa itu Menampilkan Ngram?
Google Books Ngram Viewer akan menampilkan grafik yang merepresentasikan penggunaan frasa tertentu dalam buku sepanjang waktu. Jika Anda memasukkan lebih dari satu kata atau frasa, Anda akan melihat garis-garis berkode warna untuk membedakan istilah pencarian yang berbeda. Ini sangat mirip dengan Google Trends, hanya pencarian mencakup jangka waktu yang lebih lama.
Studi kasus
Pertimbangkan studi kasus pai cuka. Mereka disebutkan di Laura Ingalls Wilder's Little House on the Prairie seri. Menjelajahi dengan pencarian Web Google untuk mempelajari lebih lanjut tentang pai cuka mengungkapkan bahwa mereka dianggap bagian dari masakan Selatan Amerika dan benar-benar terbuat dari cuka. Mereka mendengarkan kembali saat-saat ketika tidak semua orang memiliki akses ke produk segar setiap saat sepanjang tahun. Tapi apakah itu keseluruhan cerita?
Cari Google Ngram Viewer untuk pai cuka dan Anda akan menemukan beberapa menyebutkan kue di kedua awal dan akhir 1800-an, banyak menyebutkan pada 1940-an, dan peningkatan jumlah menyebutkan dalam beberapa kali. Namun, dengan tingkat penghalusan 3 Anda akan melihat dataran tinggi di atas menyebutkan pada 1800-an. Karena tidak banyak buku yang diterbitkan selama waktu itu, dan karena data kami disetel menjadi halus, itu mendistorsi gambar. Mungkin ada satu buku yang menyebutkan kue cuka, dan itu hanya dirata-ratakan untuk menghindari lonjakan. Dengan mengatur smoothing ke 0, kita dapat melihat bahwa ini persis seperti itu. Pusat lonjakan pada 1869, dan ada lonjakan lain pada 1897 dan 1900.
Tidak mungkin bahwa tidak ada yang berbicara tentang cuka pai sisa waktu: Ada kemungkinan resep mengambang di semua tempat, tetapi orang-orang hanya tidak menulis tentang mereka dalam buku, dan itu adalah batasan penting dari pencarian Ngram ini.




