Saya kira matrixnya akan banyak kosongnya (sparsematrix), kenapa untuk
methode penyimpanannya tidak menggunakan sparsematrix implementasi yang
berbasis list saja. Jadi yang disimpan hanya informasi yang tidak kosong
saja. Jadi kalau jumlah dokumentnya 1000000 dan rata 2 keyword tiap
dokument 100 maka tempat yang dibutuhkan kan cuma 100*1000000.
david_liauw wrote:
>
>
> saya lagi buat project data mining untuk clustering dokumen...semua
> dokumen yang terindex di retrieve untuk diambil matrix TF-IDF nya, nah
> atribut yang digunakan cukup besar???
> tolong bantu saya.... thx
>
> --- In jug-indonesia@ yahoogroups. com
> <mailto:jug-indonesia%40yahoogroups.com>, timotius sakti <timotius86@
> ...> wrote:
> >
> > Untuk apa matrix sebesar itu ? Mungkin bisa dijelaskan apa tujuannya
> jadi nanti saya bisa bantu menggunakan cara lain yg juga solve masalah
> anda.
> >
> > - Timotius Sakti
> >
> > visit my blog:
> >
http://nomoreac. wordpress. com <
http://nomoreac.wordpress.com>
> >
> > --- Pada Kam, 2/7/09, david_liauw <david_liauw@ ...> menulis:
> >
> > Dari: david_liauw <david_liauw@ ...>
> > Topik: [JUG-Indonesia] Huge Matrix pake HashMap
> > Kepada: jug-indonesia@ yahoogroups. com
> <mailto:jug-indonesia%40yahoogroups.com>
> > Tanggal: Kamis, 2 Juli, 2009, 1:07 AM
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> > Hi,
> >
> >
> >
> > Tolong bantu dong... Bagaimana membuat Huge Matrix (Matrix berukuran
> besar misalnya Mat[1000000] [1000000] menggunakan HashMap?
> >
> >
> >
> > Thanks yah !
> >
> >
> >
> >
> >
> >
> >
> > Regards,
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> > ____________ _________ _________ _________ _________ _________ _
> > Dapatkan alamat Email baru Anda!
> > Dapatkan nama yang selalu Anda inginkan sebelum diambil orang lain!
> >
http://mail. promotions. yahoo.com/ newdomains/ id/
> <
http://mail.promotions.yahoo.com/newdomains/id/>
> >
>
>