|
View:
New views
2 Messages
—
Rating Filter:
Alert me
|
|
|
DédoublonnageBonjour,
Le SCD Lyon 2 a effectué quelques tests de dédoublonnage dans Koha, à partir d'imports iso2709 depuis notre base Loris ou depuis Electre. Toutefois, certaines informations nous semblent obscures : -Dans la définition des règles de concordance, les critères "offset" et "taille" semblent insensibles à la valeur que l'on a définie. Les résultats sont identiques, que l'on mette "0" ou une valeur plus élevée. -Quel est le rapport entre le score attribué à des points de concordance et le seuil de concordance attribué à l'ensemble de la règle définie? -La notion de réservoir n'est pas très claire : parfois les notices sont préparées pour être traitées, parfois elles sont importées dans le réservoir avant traitement pour import dans la base. Quels sont réellement le rôle et les limites de ce réservoir? Merci par avance des précisions que vous pourrez nous apporter. Cordialement, Camille Espiau-Bechetoille -------------------------- Service Informatique Documentaire Service Commun de la Documentation Université Lumière Lyon 2 86, rue Pasteur (entrée 10, rue Chevreul) 69365 Lyon cedex 07 Tel : 04 78 69 77 23 _______________________________________________ Infos mailing list Infos@... http://listes.koha-fr.org/mailman/listinfo/infos |
|
|
Re: DédoublonnageCamille Espiau-Bechetoille a écrit :
> Bonjour, > > Le SCD Lyon 2 a effectué quelques tests de dédoublonnage dans Koha, à partir d'imports iso2709 depuis notre base Loris ou depuis Electre. > > Toutefois, certaines informations nous semblent obscures : > > -Dans la définition des règles de concordance, les critères "offset" et "taille" semblent insensibles à la valeur que l'on a définie. Les résultats sont identiques, que l'on mette "0" ou une valeur plus élevée. > Normalement, si vous mettez une taille >0 les données considérées pour la règle sont bien taillées selon la taille donnée. Par contre, si taille==0 alors effectivement, c'est toute la donnée qui est considérée et offset n'est pas utilisé. (On peut considèrer cela comme un bug.) > -Quel est le rapport entre le score attribué à des points de concordance et le seuil de concordance attribué à l'ensemble de la règle définie? > > A chaque point de concordance, si la règle concorde, vous augmentez le "score" de la notice du score du point de concordance. Une fois que toutes les points de concordance de la règle ont été considérés, si le score de votre notice est Strictement supérieur au seuil de concordance, alors votre notice est considérée comme ayant correspondance. > -La notion de réservoir n'est pas très claire : parfois les notices sont préparées pour être traitées, parfois elles sont importées dans le réservoir avant traitement pour import dans la base. Quels sont réellement le rôle et les limites de ce réservoir? > mmmm... C'est peut-être le workflow qui a besoin d'être clarifié. Effectivement, quand on passe par une recherche z3950, on fait "comme si" on faisait un import en masse (du stage import), sauf que la partie "vérification"/ recherche de doublon est faite non pas par la machine, mais de façon "visuelle" par l'utilisateur. Je ne sais pas si je suis très clair. J'ai en fait du mal à voir ce qui est envisagé derrière la question. -- Henri-Damien LAURENT BibLibre _______________________________________________ Infos mailing list Infos@... http://listes.koha-fr.org/mailman/listinfo/infos |
| Free embeddable forum powered by Nabble | Forum Help |