Himpunan dari TF-IDF suatu dokument bisa dianggap sebagai vector,
demikian juga TF-IDF suatu query juga suatu Vector. Karena dua2nya
Vector maka sudut antar kedua vector tersebut bisa dihitung. Suatu
Dokument relevant terhadap Query kalau sudutnya kecil.
david_liauw wrote:
>
>
> tanya dong...
>
> Ada yang tau gak cara mendapatkan Matrix TF-IDF dari Index Lucene
> berdasarkan pencarian dari query tertentu.
>
> Saya sudah berhasil mengindeks semua dokumen bertipe file .doc, .txt,
> .pdf, dan .rtf.
> jika mengambil matriks tf-idf dari keseluruhan dokumen saya sudah
> bisa, namun untuk mengambil berdasarkan hasil query ( dari kata kunci
> tertentu) saya masih mengalami kendala.
>
> tolong bantu saya lagi. THx
>
>