Breaking News
recent

Resume Paper dari Journal Text Mining


Aplikasi Text Mining dalam Wilayah Biomedis
Ahmad Akbar Mariuddin
Program Studi S1 Informatika, ST3 Telkom Purwokerto, Purwokerto, Indonesia
14102004@st3telkom.ac.id
_________________________________________________________________________________
A B S T R A K                                                                                                                                                                                 
Text mining merupakan teknologi yang fleksibel dan dapat diperbaharui dengan banyaknya perbedaan tugas dalam biologis, pengobatan. Beberapa tahun belakangan ini jumlah data eksperimen yang dihasilkan oleh penelitian biomedis dan jumlah paper yang dipublikasi di bidang ini memiliki perkembangan yang sangat pesat. Agar selalu up to date dengan pengembangan di bidang minat mereka dan untuk menafsirkan hasil eksperimen semua  dari literatur yang tersedia, penelitian secara terus-menerus menggunakan literatur mining. Sebagai akibatnya, alat text mining telah berkembang jauh dengan jumlah dan kualitasnya dan beberapa hari ini dapat digunakan untuk mengatasi berbagai pertanyaan dalam penelitian mulai dari de novo yang menjadi sasaran interpretasi biologis yang ditingkatkan dari hasil percobaan. Dalam paper ini memperkenalkan teknik penting, yang akan digunakan untuk text mining, yang memberikan gambaran tentang alat dari text mining yang saat ini sedang digunakan dan untuk diterapkan dalam masalah.

Keyword: Text Mining, Ontologi, Proses Bahasa Natural, Penemuan Obat, Penelitian Biomedis
_________________________________________________________________________________




1.      Pendahuluan
Dalam sebuah tulisan ilmiah menyediakan kekayaan informasi untuk sebuah penelitian. Mungkin berfungsi sebagai titik awal untuk menilai sebuah seni di bidang tertentu, atau sebagai sumber informasi yang dapat digunakan untuk membuat hipotesa penelitian yang selanjutnya penelitiannya bisa divalidasi. Tambahan pengetahuan dasar dapat menyediakan sumber untuk interpretasi hasil dari eksperimen.[1]
Kebanyakan dari sebuah instansi  yang bergerak di bidang penyaluran informasi yaitu berita. Yang pada awalnya disampaikan melalui Televisi, Surat Kabar, Majalah atau Radio telah menggunakan sebuah sistem yang berbasis web agar dapat menyampaikan berita-beritanya yang up to date[2].

2.      Text Mining
Text Mining kebanyakan berfokus dari sebuah penelitian Data Mining sebelumnya yang terletak pada data-data yang sifatnya terstruktur, seperti relasional, transaksi dan data-data dari warehouse. Namun, pada kenyataannya, sebagian besar informasi yang tersedia, tersedia dalam bentuk sebuah  teks database (database dokumen) yang terdiri dari koleksi-koleksi besar dokumen dari berbagai sumber yaitu seperti artikel berita, makalah penelitian, buku, perpustakaan digital, e-mail, dan halaman web.
Sama halnya seperti sebuah Data Mining yang digunakan untuk mencari pola dari suatu data, Text Mining juga digunakan untuk mencari pola data yang berupa teks, walaupun keduanya terlihat sama, namun keduanya memiliki perbedaan nyata. Data Mining lebih identik dengan proses ekstraksi dari data yang tersirat, informasi yang sebelumnya tidak diketahui, sedangkan pada Text Mining, informasi yang akan diekstrak adalah jelas dan eksplisit dinyatakan dalam teks tersebut. Dalam Text Mining terdapat beberapa tahapan-tahapan penting seperti misalnya, Arsing , Filtering , dan Stemming.[3]

2.1        Pencarian Informasi (Information Retrieval)
Langkah paling pertama untuk mendapatkan kembali sumber tekstual yang relevan untuk memberikan subjek yang menarik. Proses ini disebut dengan Pencarian Informasi atau Information Retrieval (IR) dan merupakan pertanyaan dasar dari daftar pustaka database dengan kata kunci.

2.2        Named Entity Recognition (NER)
Sesudah melakukan teknik IR, selanjutnya dokumen yang telah dihasilkan dapat dianalisis dengan algoritma pencarian dengan kata kunci tertentu yang menarik dan statement kata kunci tersebut. Langkah penting ini dinamakan dengan Named Entity Recognition.

2.3        Information Extraction : mendeteksi hubungan
Sesudah teknik IR dan NER, spesialis algoritma dapat mendeteksi hubungan antara konsep dengan teks.

2.3.1  Metode Berbasis Kejadian
Metode ini membuat asumsi bahwa dua konsep sering terjadi bersama dalam sesama teks yang fungsionalnya terkait.

2.3.2  Metode Berbasis NLP
NLP merupakan definisi sebagai pemrosesan bahasa natural, i.e. bahasa manusia, oleh komputer. Metode NLP berbasis pengetahuan yang menetahui bagaimana bahasa terstruktur dan bagaimana mengetahui yang ada di informasi biologi yang telah terhubung di dalam literatur.

2.4        Penemuan Pengetahuan
Jika mengikuti dari Text Mining oleh Hearts yang merupakan sistem Text Mining yang dapat dikualifikasi sebagai sistem Information Exctration (IE).

2.4.1  Prinsip ABC
Swanson dimulai dengan berbasis literatur penemuan pengetahuan dengan memperkenalkan prinsip ABC.

2.5        Visualisasi
Langkah terpenting dalam Text Mining ialah representasi dan visualisasi pengetahuan digali untuk memungkin dengan cepat dan mengoreksi interpretasi dari hasil dan untuk petunjuk penelitian dalam merumuskan hipotesa baru dan menindaklanjuti percobaan.

2.5.1     Literatur jaringan
Aplikasi Text Mining paling banyak bertujuan untuk mengungkapkan hubungan antara konsep yang ditemukan dalam teks.

2.5.2     Word Clouds
Word Clouds merupakan visualisasi yang menampilkan kata yang sering muncul di dalam teks.

3.      Penerapan Text Mining untuk Masalah Biomedis
Bagian diatas menjelaskan langkah-langkah dalam alur kerja khusus Text Mining. Dibawah ini akan menjelaskan beberapa contoh dalam langkah-langkah alur kerja Text Mining yang digunakan untuk mengatasi pertanyaan biomedis.

3.1  Genom and Gene Expression Annotation
Genomik, trascriptomik, dan proteomik telah berkembang menjadi teknik yang secara rutin digunakan dalam penelitian biomedis.

3.2  Pencarian Obat
Text mining sudah digunakan secara luas dalam mencari obat baru dan calon obat.

3.3  Mereposisi Obat
Mereposisi obat atau penggunaan kembali obat yang sudah ada adalah proses mengidentifikasi dan mengembangkan untuk mengetahui kegunaan baru dari obat yang sudah ada yang berbeda dengan penggunaan obat seperti biasanya. Dengan adanya ini bisa mengurangi risiko dan biaya pembangunan.

3.4  Efek Samping
Meskipun untuk menemukan obat dan pencarian obat yang baru harus diketahui dulu apa khasiat dan yang penting ialah efek samping dari obat tersebut. Hahn et al. dalam upaya Text Mining berusaha mengetahui informasi dari litertur farmakogenik agar lebih mengetahui bagaimana respon yang sangat begitu variasi dari sebuah obat.

3.5  Pencatat kesehatan secara elektronik
Electronic Health Records (EHRs), Electronix Patient Records (EPRs) atau Electronic Medical Records (EMRs) yang menjadi penyedia utama agar dapat melakukan penyimpanan informasi kesehatan dari pasien ataupun penduduk yang dapat digunakan kapanpun dan memudahkan pengaksesan dan pertukaran data dari tenaga kesehatan [112]

3.6     Domain database khusus
Selain aplikasi dalam penemuan obat dan penjelasan dari genom, Text Mining digunakan untuk membuat database tertentu dari sebuah domain. Database dari domain tertentu ini begitu kompleks dan memiliki link yang saling berkaitan, informasi database dari domain tertentu dan dapat melayani sebagai portal untuk para peneliti di domain ini. Beberapa database yang menggunakan Text Mining untuk mengambil dan menggabungkan data seperti contohnya MEDLINE.

4.         Pandangan
Text Mining telah berevolusi ke tahap dimana dapat digunakan lebih efisien untuk mengambil dan menganalisis dari meningkatnya jumlah paper di bidang biomedis untuk memberikan keterangan hasil. Dari hal diatas ada beberapa yang harus diketahui yaitu teknologi ini sudah mendukung pengembangan hipotesis baru.

4.1     Pembangunan Ontologi
Beberapa ontologi yang ada di wilayah biomedis telah terbukti berguna dalam Text Mining dan ide baru dapat dibuat dengan metode kolaborasi dari para ahli.

4.2     Jawaban dari Hipotesis
Alur kerja Text Mining sangat berguna untuk membantu penelitian dalam hipotesis. Karena di alam sangat berpotensi menghasilkan banyak data dan hipotesis.

4.3  Sumber tambahan
Karena sesungguhnya data yang ada sangat banyak, Text Mining harus memiliki tambahan informasi.

Dalam berinteraksi dengan database luar, perawatan harus dilakukan karena adanya process, input dan output sehingga dengan alat Text Mining dapat dengan mudah dimasukkan dalam alur kerja bioinformatika standar. Jika dengan alat Text Mining dapat memenuhi tantangan yang ada, informasi tersebut akan selalu menjadi aset yang sangat diperlukan bagi para peniliti di wilayah biomedis.[1]

Referensi
[1]
W. A. Wilco W.M. Fleuren, "Methods," Application of text mining in the biomedical domain, pp. 97-106, 2015.
[2]
S. E. O. S. S. Bambang Kurniawan, "Text Mining," Klasifikasi Konten Berita Dengan Metode, vol. 1, no. 1, pp. 14-19, 2012.
[3]
K. I. P. Sari, PENGEMBANGAN APLIKASI TEXT MINING DENGAN METODE ASSOCIATION RULE ANALYSIS UNTUK PENCARIAN DOKUMEN, vol. 1, no. 4, pp. 444-456, 2012.



Ahmad

Ahmad

No comments:

Post a Comment

Powered by Blogger.