hendra: pngenalan pola

PENGENALAN POLA
(PATTERN RECOGNITION)

Pengenalan Pola (1)

• Proses mengenali suatu objek secara independent ataupun berdasarkan kemiripan dengan data-data yang telah ada sebelumnya.

• Prinsip kerjanya: meniru kemampuan manusia mengenali objek-objek berdasarkan ciri-ciri dan pengetahuan yang pernah diamatinya dari objek-objek tersebut.

Pengenalan Pola (2)

• Cara kerjanya: mengklasifikasikan objek kedalam kategori/kelas tertentu berdasarkan beberapa parameter yg telah disimpan dan ditentukan sebelumnya.

• Contoh aplikasi: Speech recognition, Data mining, Biometrics, dll.

Istilah Dalam Pengenalan Pola

• Fitur adalah objek dari sebuah pola yang kuantitasnya dapat diukur, pengklasifikasiannya berdasar dari masing masing nilai dari fitur-fitur tersebut

• Vektor fitur adalah sejumlah atau sekumpulan dari fitur, misalakan sebuah fitur adalah x maka kumpulan fitur dapat direpresentasikan sebagai x1, ....,xi.

Tahap Pengklasifikasian

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhtwV3KClCkJf9pkRkt1DrOSDnQlxHIljOR6-vTXT7QrH8ZOJIWE5tLLc3qMv6Pr2RpgpJUWzb0pzsoAIxUU0c9q_tl4bLuBE3A6i8FA8SsJVTtS72XDAKqGn3fTpW5XU7nkoz1inn_88M/s320/tgs.jpg

Metode Pengenalan Pola

• Ada3 metode pengenalan pola

1. Sintaks

2. Statistik

3. Jaringan Saraf Tiruan (JST)

a. Sintaks

•

Metode pengenalan pola berdasarkan ciri-ciri fisik yang jelas dengan toleransi yg telah ditentukan sebelumnya.

b. Statistik

• Metode pengenalan pola berdasarkan data-data yg bersifat statistik

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjeZIlA_xlLydOECnWmw69CQ2KH68HOu_Xr1I5fF6Tlt1gOuKfdd9yJFuo1JPq7dt-BlT8QsyXABO52ipESWmYwbfVn3OQ-cARGd7clavBv9Z8kczjLb493YrfNAuIHifMv3cIOj1q7kZE/s320/statis.jpg

Contoh: deskripsi baju yang dimiliki seseorang.

c. Jaringan Saraf Tiruan (JST) ...(1)

• Metode pengenalan pola yang menggabungkan metode sintaks dan statistik, yaitu mengenali objek berdasarkan ciri-ciri fisik yg jelas kemudian mengambil keputusan berdasarkan data statistik.

• Sistem kerja JST seolah-olah meniru otak manusia.

Jaringan Saraf Tiruan (JST) ...(2)

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhAqL7v_3MwUN6MHVA-kNQSoBRHeEG3EhKrPNGaVwmNczYidnUFw5BFhFeH31vNbc3mPKcNuXA0PzIApYMJmhi6I4De5OgOG34fJluGvYsIS78kJr9Uik3sBrmT_-8ZWmmxIZuu0R90gmA/s320/saraf+tiruan.jpg

Contoh: mengenali seseorang dari kejauhan.

Selain itu ada juga Pengenalan pola yang lain yaitu sebagai beriukut:

Pengenalan pola merupakan bidang dalam pembelajaran mesin dan dapat diartikan sebagai "tindakan mengambil data mentah dan bertindak berdasarkan klasifikasi data". Dengan demikian, ia merupakan himpunan kaidah bagi pembelajaran diselia (supervised learning).
Ada beberapa definisi lain tentang pengenalan pola, di antaranya:

Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa kategori.
Ilmu pengetahuan yang menitikberatkan pada deskripsi dan klasifikasi (pengenalan) dari suatu pengukuran.
Suatu pengenalan secara otomatis suatu bentuk, sifat, keadaan, kondisi, susunan tanpa keikutsertaan manusia secara aktif dalam proses pemutusan.

Berdasar beberapa definisi di atas, pengenalan pola bisa didefinisikan sebagai cabang kecerdasan yang menitik-beratkan pada metode pengklasifikasian objek ke dalam klas - klas tertentu untuk menyelesaikan masalah tertentu.

Salah satu aplikasinya adalah pengenalan suara, klasifikasi teks dokumen dalam kategori (contoh. surat-E spam/bukan-spam), pengenalan tulisan tangan, pengenalan kode pos secara otomatis pada sampul surat, atau sistem pengenalan wajah manusia. Aplikasi ini kebanyakan menggunakan analisis citra bagi pengenalan pola yang berkenaan dengan citra digital sebagai input ke dalam sistem pengenalan pola.

Support Vector Machine (SVM)

Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari hyperplane2 terbaik yang berfungsi sebagai pemisah dua buah class pada input space. Gambar 1a memperlihatkan

beberapa pattern yang merupakan anggota dari dua buah class : +1 dan –1. Pattern yang

tergabung pada class –1 disimbolkan dengan warna merah (kotak), sedangkan pattern pada class +1, disimbolkan dengan warna kuning(lingkaran). Problem klasifikasi dapat

diterjemahkan dengan usaha menemukan garis (hyperplane) yang memisahkan antara kedua

2 hyperplane dalam ruang vector berdimensi d adalah affine subspace berdimensi d-1 yang membagi ruang vector tersebut ke dalam dua bagian, yang masing-masing berkorespondensi pada class yang berbeda.

A. KARAKTERISTIK SVM

Karakteristik SVM sebagaimana telah dijelaskan pada bagian sebelumnya, dirangkumkan sebagai berikut:

1. Secara prinsip SVM adalah linear classifier

2. Pattern recognition dilakukan dengan mentransformasikan data pada input space ke ruang yang berdimensi lebih tinggi, dan optimisasi dilakukan pada ruang vector yang baru tersebut. Hal ini membedakan SVM dari solusi pattern recognition pada umumnya, yang melakukan optimisasi parameter pada ruang hasil transformasi yang berdimensi lebih rendah daripada

dimensi input space.

3. Menerapkan strategi Structural Risk Minimization (SRM)

4. Prinsip kerja SVM pada dasarnya hanya mampu menangani klasifikasi dua class.

B. KELEBIHAN DAN KEKURANGAN SVM

Dalam memilih solusi untuk menyelesaikan suatu masalah, kelebihan dan kelemahan

masing-masing metode harus diperhatikan. Selanjutnya metode yang tepat dipilih dengan

memperhatikan karakteristik data yang diolah. Dalam hal SVM, walaupun berbagai studi telah menunjukkan kelebihan metode SVM dibandingkan metode konvensional lain, SVM juga memiliki berbagai kelemahan. Kelebihan SVM antara lain sbb.

1. Generalisasi

Generalisasi didefinisikan sebagai kemampuan suatu metode (SVM, neural network, dsb.) untuk mengklasifikasikan suatu pattern, yang tidak termasuk data yang

dipakai dalam fase pembelajaran metode itu. Vapnik menjelaskan bahwa generalization

error dipengaruhi oleh dua faktor: error terhadap training set, dan satu faktor lagi yang dipengaruhi oleh dimensi VC (Vapnik-Chervokinensis). Strategi pembelajaran pada neural network dan umumnya metode learning machine difokuskan pada usaha untuk

meminimimalkan error pada training-set. Strategi ini disebut Empirical Risk Minimization (ERM). Adapun SVM selain meminimalkan error pada training-set, juga meminimalkan faktor kedua. Strategi ini disebut Structural Risk Minimization (SRM), dan dalam SVM diwujudkan dengan memilih hyperplane dengan margin terbesar. Berbagai studi empiris menunjukkan bahwa

pendekatan SRM pada SVM memberikan error generalisasi yang lebih kecil daripada yang diperoleh dari strategi ERM pada neural network maupun metode yang lain.

2. Curse of dimensionality

Curse of dimensionality didefinisikan sebagai masalah yang dihadapi suatu metode pattern recognition dalam mengestimasikan parameter (misalnya jumlah hidden neuron pada neural network, stopping criteria dalam proses pembelajaran dsb.) dikarenakan jumlah sampel data yang relatif sedikit dibandingkan dimensional ruang vektor data tersebut. Semakin tinggi dimensi dari ruang vektor informasi yang diolah, membawa konsekuensi dibutuhkannya jumlah data dalam proses pembelajaran. Pada kenyataannya seringkali terjadi, data yang diolah berjumlah terbatas, dan untuk mengumpulkan data yang lebih banyak tidak mungkin dilakukan karena

kendala biaya dan kesulitan teknis. Dalam kondisi tersebut, jika metode itu “terpaksa” harus bekerja pada data yang berjumlah relatif sedikit dibandingkan dimensinya, akan membuat proses estimasi parameter metode menjadi sangat sulit. Curse of dimensionality sering dialami dalam aplikasi di bidang biomedical engineering, karena biasanya data biologi yang tersedia sangat terbatas, dan penyediaannya memerlukan biaya tinggi. Vapnik membuktikan bahwa tingkat

generalisasi yang diperoleh oleh SVM tidak dipengaruhi oleh dimensi dari input vector [3]. Hal ini merupakan alasan mengapa SVM merupakan salah satu metode yang tepat dipakai untuk memecahkan masalah berdimensi tinggi, dalam keterbatasan sampel data yang ada.

3. Landasan teori

Sebagai metode yang berbasis statistik, SVM memiliki landasan teori yang dapat dianalisa dengan jelas, dan tidak bersifat black box.

4. Feasibility

SVM dapat diimplementasikan relatif mudah, karena proses penentuan support vector dapat dirumuskan dalam QP problem. Dengan demikian jika kita memiliki library untuk menyelesaikan QP problem, dengan sendirinya SVM dapat diimplementasikan dengan mudah. Selain itu dapat diselesaikan dengan metode sekuensial sebagaimana penjelasan sebelumnya.

Disamping kelebihannya, SVM memiliki kelemahan atau keterbatasan, antara lain:

1. Sulit dipakai dalam problem berskala besar. Skala besar dalam hal ini dimaksudkan

dengan jumlah sample yang diolah.

2. SVM secara teoritik dikembangkan untuk problem klasifikasi dengan dua class. Dewasa ini SVM telah dimodifikasi agar dapat menyelesaikan masalah dengan class lebih dari dua, antara lain strategi One versus rest dan strategi Tree Structure. Namun demikian, masing-masing strategi ini memiliki kelemahan, sehingga dapat dikatakan penelitian dan pengembangan SVM pada multiclass-problem masih merupakan tema penelitian yang masih terbuka.

hendra

Jumat, 18 November 2011

pngenalan pola

Tidak ada komentar:

Posting Komentar