Ahmad Akbar Mariuddin
Program
Studi S1 Informatika, ST3 Telkom Purwokerto, Purwokerto, Indonesia
14102004@st3telkom.ac.id
_________________________________________________________________________________
A B S T R A K
Text mining
merupakan teknologi yang fleksibel dan dapat diperbaharui dengan banyaknya
perbedaan tugas dalam biologis, pengobatan. Beberapa tahun belakangan ini
jumlah data eksperimen yang dihasilkan oleh penelitian biomedis dan jumlah paper yang dipublikasi di bidang ini
memiliki perkembangan yang sangat pesat. Agar selalu up to date dengan pengembangan di bidang minat mereka dan untuk
menafsirkan hasil eksperimen semua dari literatur
yang tersedia, penelitian secara terus-menerus menggunakan literatur mining. Sebagai akibatnya, alat text mining telah berkembang jauh dengan
jumlah dan kualitasnya dan beberapa hari ini dapat digunakan untuk mengatasi
berbagai pertanyaan dalam penelitian mulai dari de novo yang menjadi sasaran interpretasi biologis yang
ditingkatkan dari hasil percobaan. Dalam paper ini memperkenalkan teknik
penting, yang akan digunakan untuk text
mining, yang memberikan gambaran tentang alat dari text mining yang saat ini sedang digunakan dan untuk diterapkan
dalam masalah.
Keyword: Text Mining, Ontologi, Proses Bahasa Natural, Penemuan Obat, Penelitian
Biomedis
_________________________________________________________________________________
1.
Pendahuluan
Dalam sebuah tulisan ilmiah menyediakan kekayaan informasi
untuk sebuah penelitian. Mungkin berfungsi sebagai titik awal untuk menilai sebuah
seni di bidang tertentu, atau sebagai sumber informasi yang dapat digunakan
untuk membuat hipotesa penelitian yang selanjutnya penelitiannya bisa
divalidasi. Tambahan pengetahuan dasar dapat menyediakan sumber untuk
interpretasi hasil dari eksperimen.[1]
Kebanyakan dari sebuah instansi
yang bergerak di bidang penyaluran informasi yaitu berita. Yang pada
awalnya disampaikan melalui Televisi, Surat Kabar, Majalah atau Radio telah
menggunakan sebuah sistem yang berbasis web
agar dapat menyampaikan berita-beritanya yang up to date[2].
2.
Text Mining
Text Mining kebanyakan berfokus dari sebuah
penelitian Data Mining sebelumnya yang
terletak pada data-data yang sifatnya terstruktur, seperti relasional,
transaksi dan data-data dari warehouse.
Namun, pada kenyataannya, sebagian besar informasi yang tersedia, tersedia
dalam bentuk sebuah teks database (database dokumen) yang terdiri dari koleksi-koleksi besar dokumen dari
berbagai sumber yaitu seperti artikel berita, makalah penelitian, buku,
perpustakaan digital, e-mail, dan halaman web.
Sama halnya seperti sebuah Data Mining yang digunakan untuk mencari pola dari suatu data, Text Mining juga digunakan untuk mencari
pola data yang berupa teks, walaupun keduanya terlihat sama, namun keduanya
memiliki perbedaan nyata. Data Mining
lebih identik dengan proses ekstraksi dari data yang tersirat, informasi yang sebelumnya
tidak diketahui, sedangkan pada Text
Mining, informasi yang akan diekstrak adalah jelas dan eksplisit dinyatakan
dalam teks tersebut. Dalam Text Mining
terdapat beberapa tahapan-tahapan penting seperti misalnya, Arsing , Filtering , dan Stemming.[3]
2.1
Pencarian
Informasi (Information Retrieval)
Langkah paling pertama untuk mendapatkan kembali sumber
tekstual yang relevan untuk memberikan subjek yang menarik. Proses ini disebut
dengan Pencarian Informasi atau Information
Retrieval (IR) dan merupakan pertanyaan
dasar dari daftar pustaka database dengan kata kunci.
2.2
Named Entity Recognition (NER)
Sesudah melakukan teknik IR,
selanjutnya dokumen yang telah dihasilkan dapat dianalisis dengan algoritma
pencarian dengan kata kunci tertentu yang menarik dan statement kata kunci tersebut. Langkah penting ini dinamakan dengan
Named Entity Recognition.
2.3
Information Extraction : mendeteksi hubungan
Sesudah teknik IR
dan NER, spesialis algoritma dapat
mendeteksi hubungan antara konsep dengan teks.
2.3.1 Metode Berbasis Kejadian
Metode ini membuat asumsi bahwa dua
konsep sering terjadi bersama dalam sesama teks yang fungsionalnya terkait.
2.3.2 Metode Berbasis NLP
NLP merupakan
definisi sebagai pemrosesan bahasa natural,
i.e. bahasa manusia, oleh komputer. Metode NLP berbasis pengetahuan yang menetahui bagaimana bahasa
terstruktur dan bagaimana mengetahui yang ada di informasi biologi yang telah terhubung
di dalam literatur.
2.4
Penemuan
Pengetahuan
Jika mengikuti dari Text Mining oleh Hearts yang merupakan sistem Text
Mining yang dapat dikualifikasi sebagai sistem Information Exctration (IE).
2.4.1 Prinsip ABC
Swanson dimulai dengan berbasis
literatur penemuan pengetahuan dengan memperkenalkan prinsip ABC.
2.5
Visualisasi
Langkah terpenting dalam Text Mining ialah representasi dan
visualisasi pengetahuan digali untuk memungkin dengan cepat dan mengoreksi
interpretasi dari hasil dan untuk petunjuk penelitian dalam merumuskan hipotesa
baru dan menindaklanjuti percobaan.
2.5.1 Literatur jaringan
Aplikasi Text Mining paling banyak bertujuan untuk mengungkapkan hubungan antara
konsep yang ditemukan dalam teks.
2.5.2
Word Clouds
Word Clouds merupakan visualisasi yang
menampilkan kata yang sering muncul di dalam teks.
3. Penerapan Text Mining untuk
Masalah Biomedis
Bagian diatas menjelaskan langkah-langkah dalam alur kerja
khusus Text Mining. Dibawah ini akan
menjelaskan beberapa contoh dalam langkah-langkah alur kerja Text Mining yang digunakan untuk
mengatasi pertanyaan biomedis.
3.1 Genom and Gene Expression Annotation
Genomik, trascriptomik, dan proteomik telah berkembang
menjadi teknik yang secara rutin digunakan dalam penelitian biomedis.
3.2 Pencarian Obat
Text mining sudah digunakan secara luas dalam
mencari obat baru dan calon obat.
3.3 Mereposisi Obat
Mereposisi obat atau penggunaan kembali obat yang sudah ada
adalah proses mengidentifikasi dan mengembangkan untuk mengetahui kegunaan baru
dari obat yang sudah ada yang berbeda dengan penggunaan obat seperti biasanya.
Dengan adanya ini bisa mengurangi risiko dan biaya pembangunan.
3.4 Efek Samping
Meskipun untuk menemukan obat dan pencarian obat yang baru
harus diketahui dulu apa khasiat dan yang penting ialah efek samping dari obat
tersebut. Hahn et al. dalam upaya Text Mining
berusaha mengetahui informasi dari litertur farmakogenik agar lebih mengetahui
bagaimana respon yang sangat begitu variasi dari sebuah obat.
3.5 Pencatat kesehatan secara elektronik
Electronic Health Records (EHRs),
Electronix Patient Records (EPRs) atau Electronic Medical Records (EMRs)
yang menjadi penyedia utama agar dapat melakukan penyimpanan informasi
kesehatan dari pasien ataupun penduduk yang dapat digunakan kapanpun dan
memudahkan pengaksesan dan pertukaran data dari tenaga kesehatan [112]
3.6
Domain database khusus
Selain aplikasi dalam penemuan obat dan penjelasan dari
genom, Text Mining digunakan untuk
membuat database tertentu dari sebuah
domain. Database dari domain
tertentu ini begitu kompleks dan memiliki link
yang saling berkaitan, informasi database
dari domain tertentu dan dapat
melayani sebagai portal untuk para peneliti di domain ini. Beberapa database
yang menggunakan Text Mining untuk
mengambil dan menggabungkan data seperti contohnya MEDLINE.
4.
Pandangan
Text Mining telah berevolusi ke tahap dimana
dapat digunakan lebih efisien untuk mengambil dan menganalisis dari
meningkatnya jumlah paper di bidang biomedis untuk memberikan keterangan hasil.
Dari hal diatas ada beberapa yang harus diketahui yaitu teknologi ini sudah
mendukung pengembangan hipotesis baru.
4.1 Pembangunan Ontologi
Beberapa ontologi yang ada di wilayah biomedis telah terbukti
berguna dalam Text Mining dan ide
baru dapat dibuat dengan metode kolaborasi dari para ahli.
4.2 Jawaban dari Hipotesis
Alur kerja Text Mining
sangat berguna untuk membantu penelitian dalam hipotesis. Karena di alam sangat
berpotensi menghasilkan banyak data dan hipotesis.
4.3 Sumber tambahan
Karena sesungguhnya data yang ada sangat banyak, Text Mining harus memiliki tambahan
informasi.
Dalam berinteraksi dengan database luar, perawatan harus dilakukan
karena adanya process, input dan output sehingga dengan alat Text
Mining dapat dengan mudah dimasukkan dalam alur kerja bioinformatika
standar. Jika dengan alat Text Mining
dapat memenuhi tantangan yang ada, informasi tersebut akan selalu menjadi aset yang
sangat diperlukan bagi para peniliti di wilayah biomedis.[1]
Referensi
[1]
|
W. A.
Wilco W.M. Fleuren, "Methods," Application of text mining in
the biomedical domain, pp. 97-106, 2015.
|
[2]
|
S. E.
O. S. S. Bambang Kurniawan, "Text Mining," Klasifikasi Konten
Berita Dengan Metode, vol. 1, no. 1, pp. 14-19, 2012.
|
[3]
|
K. I.
P. Sari, PENGEMBANGAN APLIKASI TEXT MINING DENGAN METODE ASSOCIATION
RULE ANALYSIS UNTUK PENCARIAN DOKUMEN, vol. 1, no. 4, pp. 444-456,
2012.
|
No comments:
Post a Comment