Gresnews: Pengumpul Berita dengan Pendekatan Semantik

| 4 Comments | No TrackBacks

Layanan pengumpul berita dengan pendekatan semantik telah diluncurkan dengan wajah baru oleh pembuatnya, Ismail Fahmi, yaitu Gresnews. Kabar beredar lewat Facebook dan Twitter dan dikomentari salah satunya: apakah perubahan nama domain dari Bubunews ke Gresnews menghindari risiko persinggungan nama domain di tangan pengacara? Ismail hanya tersenyum seperti mengiyakan. Saya tidak mengikuti perkembangan Bubunews sebelumnya, sehingga tidak dapat membandingkan edisi Gres dengan pendahulunya.

Pengumpul berita (atau secara umum, tulisan) dengan pendekatan semantik berarti secara otomatis mengaitkan banyak sumber berdasarkan hal-hal yang dianggap bagian dari semantik teks. Pengertian semantik menurut Kamus Besar Bahasa Indonesia,

1 ilmu tt makna kata dan kalimat; pengetahuan mengenai seluk-beluk dan pergeseran arti kata; 2 bagian struktur bahasa yg berhubungan dng makna ungkapan atau struktur makna suatu wicara;

Lebih spesifik lagi berkaitan dengan web, di Wikipedia disebutkan,

the meaning (semantics) of information and services on the web is defined, making it possible for the web to “understand” and satisfy the requests of people and machines to use the web content.

atau

arti (semantik) dari informasi dan layanan di web didefinisikan, membuatnya mungkin bagi web “mengerti” dan memenuhi perimintaan pengguna dan mesin untuk memanfaatkan materi web.

Ringkasnya, diupayakan cara-cara untuk mendapatkan maksud tulisan — misalnya dalam bentuk kata kunci, struktur, hingga bagian-bagian tulisan — yang mendekati cara manusia menggunakan tulisan tersebut sebagai masukan informasi. Sebagai contoh, di Gresnews diawali dengan pendekatan pemantauan topik, garis waktu (timeline), kutipan, pro-kontra pendapat, tren, graf relasi, dan peta. Pengumpul berita akan melakukan pemilahan bagian-bagian berita dan mengaitkan satu dengan yang lain untuk menghasilkan gambaran relasi tersebut.

Kutipan pernyataan tokoh di berita misalnya, saya amati akan menjadi lebih mudah ditemukan setelah dipilah dan ditandai mencolok oleh Gresnews. Ini akan memudahkan pembuatan koleksi kutipan pernyataan figur ala Wikiquotes. Gresnews bahkan menyediakan kisah malang korban penipuan sebagai kutipan. (Malangnya, pada contoh yang saya lihat tadi di sumber aslinya alamat korban tertulis lengkap, sehingga kian terekspos via Gres.)

Tantangan terbesar pisau pemilah Gresnews tentulah keadaan sumber berita yang sebagian masih abai terhadap semantik web. Indikator sederhana pengabaian tersebut terlihat dari kurangnya pemakaian atribut semantik yang sudah disediakan HTML pada tulisan-tulisan di media massa kita. Kecenderungan hanya memuaskan atribut visual yang terlihat langsung oleh pembaca masih lebih dominan dibanding melengkapi bagian semantik. Kata penting misalnya, cukup yang penting terlihat sebagai huruf tebal atau huruf miring, belum dipikirkan perbedaan tag b dan strong atau i dan em. Apalagi untuk beberapa tag HTML lebih lanjut seperti abbr, blockquote, dan q, padahal tag-tag tersebut akan banyak membantu pisau pemilah Gresnews.

Ismail Fahmi Presenting His Thesis about "Semantic Web"

Selamat untuk Ismail Fahmi, doktor bidang semantik web, yang sedang berusaha membumikan ilmu pamungkasnya pada kajian irisan ilmu informatika dan linguistik di Rijksuniversiteit Groningen lewat layanan web populer. Dengan kesemrawutan belantara informasi dari media informasi di Indonesia, saya berharap dia akan telaten menangani ragam kasus seperti halnya komentarnya tentang kata kerja tak-teratur (irregular verbs): jumlah kosakata tak-teratur tersebut sedikit dibanding yang teratur, namun mereka malah lebih menyita sumber daya.

No TrackBacks

TrackBack URL: http://mt4.atijembar.net/mt-tb.cgi/632

4 Comments

Terimakasih Mas Amal atas reviewnya. Ternyata masih inget obrolan kita waktu di Groningen :-)

Masih banyak sekali kekurangan di Gresnews. Misal ‘quote holder’ atau sumber kutipan masih belum dibersihkan dari stop words. Dan masih banyak lagi.

Oleh karena itu, saya saat ini sedang memonitor pendapat dan masukan dari pengguna tentang Gresnews. Kalau kapan-kapan ada saran atau kritik, langsung aja saya di-tag ya mas.

Sekali lagi, terimakasih. Salam dari Amsterdam yang mulai hujan sepanjang hari…

apakah semantik web adakah wujud dari web 3.0 ? apakah semantik itu sama seperti text mining ?

mohon pencerahannya :)

setiap langkah adalah suatu tahapan menuju proses selanjutnya,, saya yakin dengan menyadari kekurangan dan terus memperbaikinya akan menghasilkan kesempurnaan. salam untuk anda yang sedang menunaikan tugas yang mulia

Saya pernah menemukan library POS (part of speech) tagging yang bisa memecah suatu kalimat berdasar subyek, predikat, obyek dan atribut lainnya.

Seandainya library tersebut sudah tersedia untuk Bahasa Indonesia, tentu akan sangat membantu pembuatan aplikasi pemilah berita tersebut.

About this Entry

This page contains a single entry by Ikhlasul Amal published on March 20, 2010 8:12 AM.

Perbaiki Penulisan Informasi "Mailing List" was the previous entry in this blog.

Jejaring Sosial Berbasis Lokasi: Publikasi Pengguna atau Acara? is the next entry in this blog.

Find recent content on the main index or look in the archives to find all content.

OpenID accepted here Learn more about OpenID
Powered by Movable Type 4.261