• Willkommen im Geoclub - dem größten deutschsprachigen Geocaching-Forum. Registriere dich kostenlos, um alle Inhalte zu sehen und neue Beiträge zu erstellen.

caches mit ungültigem XML nach spidern

foobar123

Geonewbie
Im Umkreis von Karlsruhe (35km) gibt es immerhin 6 Caches, die von CW als ungültiges XML abgespeichert werden (nach dem spidern von GC). Das bedeutet dann auch, dass das exportierte GPX file ungültiges XML ist :???: Das Problem sind ungültige Zeichen, die in der Beschreibung sind, und die von CW offensichtlich nicht rausgeworfen werden.

Die Liste der Caches:

gc1aba9
gc1awyh
gcmpqn
gcrkdm
gcx6h3
gcyj57

Vielleicht kann jemand, der sich den XML export schon mal angeschaut hat hier helfen :)
 

MiK

Geoguru
Mich würde als allererstes mal interessieren, wo dieser Zeichensalat her kommt. Für mich sieht das nicht nach Absicht aus.
 
OP
F

foobar123

Geonewbie
MiK schrieb:
Mich würde als allererstes mal interessieren, wo dieser Zeichensalat her kommt. Für mich sieht das nicht nach Absicht aus.

Natürlich nicht. Aber das kann jeder beliebige Müll sein, den irgendein Browser/Editor/etc. hochlädt bzw. beim cpoy&paste oder ähnlichem erzeugt. Browser sind beim darstellen halt gutmütig.

In jedem Fall sollte CW kein ungültiges XML abspeichern und sich beim spidern von HTML Seiten auf gar nichts verlassen, was das den Zeichensalat des Inputs angeht.
 

MiK

Geoguru
Was mich wundert ist, dass sehr ähnlicher Zeichensalat schon öfter aufgetaucht ist. Mich würde mal die Quelle davon interessieren. Das ändert natürlich nichts daran, dass CW das besser abfangen sollte. Allerdings könnte der Export dadurch weiter verlangsamt werden.
 
Oben