Benutzer Diskussion:Peter200/Bundesstaat New York
Ich kommentiere (und frage) mal hier.
Ich gehe mal davon aus, daß das alle GNIS-Einträge sind, zu denen wir theoretisch einen Eintrag unter Kategorie:Ort in New York haben sollten (oder wollen), mit Ausnahme aller Einträge, die mit
- Town of ...
- City of ...
- Village of ...
beginnen, denn die sollten in
- Kategorie:Town in New York (äquivalent zu den Townships in anderen Staaten)
- Kategorie:City in New York
- Kategorie:Village in New York
einsortiert sein.
- a) Towns
Sind eigentlich Township-Artikel. Sind ungefähr 830 oder so. Stellen kein Problem dar, weil die einzelnen Hamlets, Villages oder CDPs auf deren Gebiet eigene Artikel haben oder haben sollten.
- b) Citys
Hier haben wir eine Doppelfunktion. Einmal XY als Ort und einmal als inkorporierte City. Hab's mal schnell am Bildschirm durchgezählt, sind 60 oder 62 mögliche Einträge. Wir werden keinen getrennten Artikel für Ort und inkorporierte City. Beide haben wohl identische FIPS-Codes, aber unterschiedliche GNIS-IDs.
- c) Villages
Hier gilt dasselbe wie für die Citys, nur sind es viel mehr. Allerdings gibt es die etwas absurde Situation, daß Villages verschiedenen Townships angehören können, ja sogar in unterschiedlichen Countys. Village und Ort haben unterschiedliche GNIS-IDs, aber identische FIPS-Codes.
- d) CDPs
Sind in deiner Liste nicht enthalten. Können sich auf ein Hamlet (bzw. Unincorporated community) oder mehrere beziehen. In unserem Kontext problematisch bei den Hamlets, die dem CDP den Namen geben. Bei diesen wie oben, unterschiedliche GNIS-IDs, FIPS-Code?
- e) Indian Reservations
Als Selbstverwaltungseinheit nicht in allen Bundesstaaten vorhanden. In New York muß jeder Punkt in einer City, einer Town oder eine Indian Reservation liegen. Noch nicht untersucht, aber in unserem Kontext irrelevant, weil Indianerreservate (noch/derzeit) keine Ortsinfobox erhalten.
Den oben genannten Verwaltungseinheiten ist gemeinsam, daß sie einen FIPS-Code haben und zwei GNIS-IDs, einmal als Ort (populated place) und einmal als Verwaltungseinheit (civil). Volkszählungsdaten gibt's für den FIPS-Code bzw. in Zukunft für solche mit einer zweiten GNIS-ID als Verwaltungseinheit.
- f) Countys (Boroughs von New York City)
Können wir hier aussortieren, nicht betroffen von Ortsinfoboxproblematik.
- g) Hamlets (Unincorporated communitys)
Unproblematisch, wenn nicht namengebend für CDP – dann ohne FIPS-Code bzw. nur eine GNIS-ID vorhanden.
Offensichtlich sind unterschiedliche Koordinaten und Höhenangaben vorhanden, wenn es zu einer FIPS-Code-Entität zwei GNIS-Entitäten bestehen.
Probleme:
1. Welcher Datensatz wird in der IB verwendet?
2. Falls beide: wie macht man es dem zufälligen Benutzer verständlich?
3. Wie gleicht man die Daten ab – wie trennt man GNIS-ID1 von GNIS-ID2
4. Künftiges Problem: WikiData
Das wär's mal für's erste und für heute abend. --Matthiasb – Vandale am Werk™ (CallMyCenter) 22:52, 5. Sep. 2012 (CEST)
- In den meisten Punkten gehe ich mit dir konform. Laut GNIS gibt es im Bundesstaat New York nur einen verkappten CDP, darum sind nicht mehrere aufgefüht - stimmt übrigens mit dem Census überein.
- Das Problem betrifft nicht nur zufällige Autoren. Auch Gestandene haben da noch ihre Probleme, teils weil sie die wichtigsten Daten aus der en:wp abschreiben - nach dem Motto: Die müssen es ja wissen - teils weil sie weder den Umgang mit GNIS, Census, NRHP usw nicht kennen. Es gibt im US-Ortsbereich sogar Vielschreiber, die massenhafte Änderungen damit begründen: GNIS weiß auch nicht Alles, ich war da. OR wäre da zwar das Mittel der Wahl, aber da von anderen (darf man nicht schreiben) hofiert, 0 Chance auf Berichtigung.
- Die Reservate sind in anderen Bundesstaaten deutlich vorhanden.
- Was bei National Elevation Dataset die Höhenangaben anbetrifft, erinnere ich mich an einen Text, der die Verwendung des Tiefst- und Höchstpunktes regelt, sowie wann der Mittelwert angegeben wird. Ich finde nur die z. Zt. die Seite nicht mehr.
- Generell brauche ich für die Aufbereitung der Daten für gesamten USA natürlich mehr Zeit, ist alleine fast nicht zu stemmen bei rund 300K relevanten Orten. Und an manche DBs komme ich nicht ran. Dies hier sollte auch nur mal eine Vorausschau sein, wie eine .csv aussehen könnte. --Peter200 (Diskussion) 23:48, 5. Sep. 2012 (CEST)