Ingmar Lötzsch wrote:
> Egal, was rauskommt, ich empfehle etwas festzulegen, was auf einfachste
> Weise von einem Computer berechenbar ist - am besten ausschließlich mit
> SQL - und möglichst wenig Ausnahmen macht.
>
> - keine Buchstaben weglassen, etwa sss-> SS
> - keine Buchstaben hinzufügen, etwa St. -> SANKT
Ja und nein - ein Dreh- und Angelpunkt ist, ob man den sortname
überhaupt mitgeben muss. Ich würde sagen: nein.
Ich gehe aber davon aus, dass man den sortname mitgeben kann - gerade in
den Fällen, wo er nicht durch eine ganz einfache Regeln reproduziert
werden kann wie
Zeichensatz -> Großschrift
Umlaute -> ausschreiben
Bindestriche, Leerzeichen -> Löschen
In allen komplizierteren Fällen ist der Sortname im export dump
enthalten, nur in den einfachen sollte er automatisch generiert werden.
Bei der Neuerstellung von Einträgen wird ein solcher sortname
automatisch angelegt. Jeder hat die Freiheit, diesen nachzubessern. Auch
solche Änderungen sind natürlich zulässig und mitzugeben.
> Beim letzten Beispiel handelt es sich entweder um eine Abkürzung des
> offiziellen Namens - dann sollte dieser unabgekürzt gespeichert werden,
> etwa "Sankt" statt "St." - oder die offizielle Bezeichnung ist "St.
> ...". Dann wäre es wünschenswert, wenn man es bei St. -> ST belassen könnte.
Da unklar ist, ob und wann es offiziell ist, tendiere ich zum generellen
ausschreiben, sprich Umwandlung in die Form, in der es auch
ausgesprochen wird. Ich habe noch nie
"ess-te-Bindestrich-Georg-Bindestrich-schtra-sse" gehört und würde das
als Sortname "SANKTGEORGSTRASSE" verwenden wollen.
> Es könnte sein, dass manche Gemeinden die Abkürzung als offizielle
> Bezeichnung festlegen, andere nicht.
Kannst du das den Daten selbst ansehen? Ortsnamen sind immerhin halbwegs
bekannt und offiziell - aber schon bei den Zusätzen wird es beliebig
willkürlich. Heisst es "Xyz / Westerwald", "Xyz im Westerwald", "Xyz am
Westerwald", "Xyz (Westerwald)", "Xyz/WW", "Xyz WW." oder wie? Und das
sind nur einige der Variationen um ein einziges Wort herum.
Von den Straßen her habe ich einen rechtt großen Erfahrungsschatz, was
offiziell beliebig falsch gehen kann. Solche Leute wie Gerhard/t
Hauptmann haben es der Stadt noch zusätzlich schwer gemacht ;-)
Was ist dann die Referenz? Der Stadtplan der Stadt, der
Gemeindebeschluss zur (fehlerhaften) Benennung, die korrekte Schreibweise?
Nur mal als Hausnummer: Ich habe mehr als 100 000 Ortseinträge. Bei
einem Drittel davon habe ich lange Namensvarianten. Bei 1895 habe ich
weitere Namensvarianten, z.B. gerade nach Namensänderungen wie Zugewinn
des Status als Bad:
Lobenstein, Thüringen
Lobenstein, Moorbad
Bad Lobenstein
Lobenstein
> Dann könnte man die Forderung
> aufstellen, dass so sortiert wird, als würde überall dieselbe Varainte
> verwendet. Das ist durchaus plausibel, birgt aber die Gefahr, dass die
> Zahl dieser Ausnahmen anwächst und irgendwann unübersichtlich wird.
So läuft's derzeit aber, wenn du mal sortname und name vergleichen
möchtest. Bei manchen Einträgen bin ich mir nicht wirklich sicher -
kannst du auf Anhieb beantworten, wie Hann. Münden ausgesprochen wird?
Schönen Gruß
Martin
--
Mailingliste OpenGeoDB
Listenadresse:
opengeodb@...
Informationen:
http://opengeodb.deMit freundlicher Unterstütztung von php::bar (
http://phpbar.de)