Natural Language Processing

By GIE - Januari 28, 2020



Natural Language Processing (NLP) adalah salah satu bidang ilmu komputer, kecerdasan buatan, dan bahasa (linguistik) yang berkaitan dengan interaksi antara komputer dan bahasa alami manusia, seperti bahasa Indonesia atau bahasa Inggris. Tujuan utama dari studi NLP adalah membuat mesin yang mampu mengerti dan memahami makna bahasa manusia lalu memberikan respon yang sesuai.

Perembangan dalam bidang NLP sangat pesat sehingga memungkinkan bahasa alami menjadi sebuah knowledge base. Untuk memahami Pemrosesan Bahasa Alami ada 3 aspek, yaitu :

1. Syntax
Menjelaskan bentuk dari sebuah bahasa. Syntax bisa dispesifikasikan oleh grammar. bahasa alami jauh lebih daripada bahasa formal yang digunakan untuk logika kecerdasan buatan dan program komputer. Ia bisa membedakan kaliamat “ayah pergi ke kantor dengan mobil” dengan “ayah kantor ke mobil dengan pergi”.

2. Semantics
Menjelaskan arti yang terkandung dari kalimat dalam satu bahasa. Meskipun teori semantics secara umum sudah ada, ketika membangun sistem natural language understanding untuk aplikasi tertentu, akan digunakan representasi yang paling sederhana. Tugas-tugas yang termasuk pada tugas semantics adalah Word Sense Disambiguation (WSD), Semantc Role Labelling (SRL), semantic parsing, dan textual entailment.

3, Pragmatics
Menjelaskan bagaimana pernyataan yang ada berhubungan dengan dunia. Untuk memahami bahasa, agen harus mempertimbangkannya lebih dari sekedar kalimat. Agen harus memperhatikan konteks sosial dan komunikasi secara keseluruhan dan bagaimana pengaruhnya terhadap penafsiranm salah satu contohnya adalah peribahasa.
4. Fonetik
Segala hal berhubungan dengan suara yang menghasilkan akta yang dapat dikenali. Fonetik digunakan dalam pengembangan NLP khususnya di bidang speech based system.

5. Grammar
untuk membuat sebuah sistem yang dapat memproses bahasa alami terlebih dahulu melalui Text Preprocessing. Tahap tersebut memiliki beberapa tahapan, yaitu :
  • Analisis Leksikal Teks
Proses untuk mengubah sebuah teks atau kalimat menjadi pecahan kata, yang bertujuan untuk mengidentifikasi kata-kata dalam sebuah teks.
  • Penghapusan Stopwords
Stopwords merupakan kata umum yang sering digunakan dalam sebuah teks dan biasanya tidak berguna jika bertujuan melakukan pencarian, salah satu contohnya adalah kata penguhubung seperti dan, atau, tetapi. Proses ini bertujuan untuk mengurangi ukuran indeks yang digunakan dalam memproses teks
  • Stemming
Stemming merupakan proses pemisahan kata yang mengandung awalan atau akhiran sehingga menghasilkan kata dasar. Hal ini berguna untuk meningkatkan kinerja pengambilan kata karena akan mengurangin varian kata yang sama dalam konsep umum. Proses ini juga berguna untuk mengurangi ukuran struktur pengindeksan karena jumlah istilah indeks yang berbeda menjadi berkurang.

  • Share:

You Might Also Like

0 komentar