PERBANDINGAN PEMBOBOTAN KATA DALAM SISTEM TEMU BALIK INFORMASI

Amril Mutoi Siregar

Abstract


ABSTRAK

Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian informasi yang relevan terhadap kebutuhan pengguna, yang diekspresikan dalam query, menjadi input bagi IR system dan selanjutnya diproses oleh system kemudian ditampilkan dokumen yang relevan dengan query tersebut. Salah satu metode pencarian informasi yang relevan dengan query adalah dengan pembobotan kata baik query maupun dokumen. Metode yang sering digunakan adalah pembobotan kata lokal dan pembobotan global, adapun pembobotan kata lokal yang digunakan tf, logaritmic tf, binary tf dan augmented tf dan pembobotan globalnya adalah idf, idfp, idfb. Dalam penelitian ini selain membandingkan algoritma pembobotan kata. Tingkat keberhasilan algoritma di ukur berdasarkan precision, recall dan niap. Penelitian ini setelah dilakukan perbandingan dan analisis hasil algoritma pembobotan, hasil algortima yang baru lebih baik daripada yang lama. Kedepan perlu dilakukan dikombinasikan pembobotan dengan algoritma semantic sehingga mendapatkan hasil yang lebih baik.

Kata kunci : Sistem temu balik informasi, pembobotan, pembobotan kata lokal, pembobotan global, similarity ( kemiripan), vector space model.

Full Text:

PDF

References


DAFTAR PUSTAKA

Baeza-Yates, Ricardo, Berthier Ribeiro-Neto,1999. Modern Information Retrieval. Harlow. Addison.Wesley. Frakes William and Baeza-Yates,Ricardo,1992. Information retrieval data structures & algorithms. Prentice Hall. Grossman,D,1992. IR Book. tp://www.ir.iit.edu/ ~dagr/ cs529/ files/ ir_ book / 7 Maret 2002. Ingwersen, P, 1992. Information Retrieval Interaction. Taylor Graham Publishing. http://www.db.dk/pi/iri [29 Agustus 2005].London. Mandala Rila dan Setiawan, 2002. Peningkatan Performansi Sistem Temu Kembali Informasi dengan Perluasan Quer Secara Otomatis. Departemen Teknik Informatika Institut Teknologi Bandung. Bandung. Manning Christopher D, Prabhakar Raghavan dan Hinrich Schutze,2009. An Introduction To Information Retreival. England. Cambridge University Press. Mizzaro,S,1998. How many relevances in information retrieval interacting with computers,” vol 10(3):305-322.

Rijsbergen C.J,1979. Information Retrieval. Second Edition. Butterworths. London. Salton G,1969. Automatic Text Analysis. Technical Report No. 69-36. Department of Computer Science. Cornell University, Ithaca.New York. Salton G, Wong A and Yang CS,1975. A vector space model for automatic indexing. Communication. ACM 18(11):613–620.

Salton G and Buckley C,1988. Term weighting approaches in automatic text retrieval. Information Processing &Management 24(5):513–523. Sparck Jones K,1972. A statistical interpretation of term specificity and its application in retrieval. Journal of Documentation 28, 11–21. Robertson, S,2005. Understanding inverse document frequency: On theoretical arguments for IDF. Journal of Documentation, Vol. 60, pp. 502–520. England. S.M Jeckson,2002. A Scientist Practitioner Approach. John Wiley dan Sons. Witten et all,1999. Compressing and Indexing document dan Images Second Edition. Morgan Kaufmann Publishers. SanFransisco


Refbacks

  • There are currently no refbacks.