• Willkommen im Geoclub - dem größten deutschsprachigen Geocaching-Forum. Registriere dich kostenlos, um alle Inhalte zu sehen und neue Beiträge zu erstellen.

Spidern ist laaagsam!

kurzwelle

Geocacher
Hallo!

Ist es normal, dass das spidern von gc.com so langsam ist? 10 Caches brauchen bei mit fast ne minute!

mfg
 

MiK

Geoguru
kurzwelle schrieb:
Ist es normal, dass das spidern von gc.com so langsam ist? 10 Caches brauchen bei mit fast ne minute!
Hast Du schon mal im Browser nacheinander 10 Caches mit allen Logs bei GC.com geladen? Eine Minute ist da schon fast ne gute Zeit.
 

tituz

Geocacher
MiK schrieb:
kurzwelle schrieb:
Ist es normal, dass das spidern von gc.com so langsam ist? 10 Caches brauchen bei mit fast ne minute!
Hast Du schon mal im Browser nacheinander 10 Caches mit allen Logs bei GC.com geladen? Eine Minute ist da schon fast ne gute Zeit.
Das kannst du doch so nicht vergleichen! Beim Spidern müssen die Listings a nicht im Browser gerendert werden.

10 Caches pro Minute ist aber trotzdem schon ein guter Wert und vermutlich schon nahe dem Auslösewert des Blockers von GC, der ja genau dieses Spidern verhindern soll.

Gruss, Titus

NACHTRAG: Spidern nervt, da es die Bandbreite des Servers für andere Nutzer verringert!
 

MiK

Geoguru
tituz schrieb:
MiK schrieb:
Hast Du schon mal im Browser nacheinander 10 Caches mit allen Logs bei GC.com geladen? Eine Minute ist da schon fast ne gute Zeit.
Das kannst du doch so nicht vergleichen! Beim Spidern müssen die Listings a nicht im Browser gerendert werden.
Das stimmt zwar, ist aber bei GC.com nicht wirklich der begrenzende Faktor.

tituz schrieb:
NACHTRAG: Spidern nervt, da es die Bandbreite des Servers für andere Nutzer verringert!
Stimmt. Ich würde auch lieber über eine vernünftige Server-schonende API auf die DB zugreifen. Gerne auch nur als PM.
 

tituz

Geocacher
MiK schrieb:
...
Stimmt. Ich würde auch lieber über eine vernünftige Server-schonende API auf die DB zugreifen. Gerne auch nur als PM.
Wer würde das nicht. Aber in einer Api kriegt man ja die Werbung nicht mehr so schön an den Mann wie auf der Webseite. ;)
Die PQ sollten m.A. nach für alle Mitglieder freigegeben werden und Spidern noch restriktiver eingeschränkt werden.

Gruss, Titus
 

MiK

Geoguru
PQs sind keine Lösung um sich einen Offline-Bestand zu halten. Das ist einfach nur eine Krücke.

Und wer für sein Gebiet einen Grundbestand hat, verursacht beim Spidern auch nicht mehr Last als über den Browser. Der Spider macht genau das, was man sonst über die Webseiten machen würde.
 

tituz

Geocacher
MiK schrieb:
PQs sind keine Lösung um sich einen Offline-Bestand zu halten. Das ist einfach nur eine Krücke.

Und wer für sein Gebiet einen Grundbestand hat, verursacht beim Spidern auch nicht mehr Last als über den Browser. Der Spider macht genau das, was man sonst über die Webseiten machen würde.
Das sehe ich ich anders. Ist die sicherste Möglichkeit, Änderungen im Listing in das Programm zu bekommen, ohne doch wieder alles Spidern und vergleichen zu müssen.
Es fehlen allerdings derzeit noch die Spoiler- und sonstigen Bilder in der PQ. Wäre schön, sie dort auch optional erhalten zu können, sonst muss doch noch gespidert werden bei Bedarf.

Gruss, Titus
 

Suppenkasper

Geocacher
Das Spidern ging bei mir recht schnell ca. 2.840 Caches in weniger als 1 Stunde. Was bei mir unendlich lange dauert ist das Laden. Da werden pro Cache fast 10 Sekunde gebraucht.

Selbst wenn ich eine bereits vorhandene GPX-Datei aus GSAK nehme geht es nicht schneller.

Was das Spidern betrifft, ist die PQ leider keine wirkliche Alternative, obwohl ich schon seit Jahren mit PQs hantiere, da PQs max 500 Caches enthalten können und wenn ich das richtig in Erinnerung habe max. 5 Logs. Diese Einschränkungen hast du beim Spidern nicht.
 

greiol

Geoguru
wobei man auch zum cachen verdammt oft die bilder braucht und die attribute sind auch praktisch. zumindest für die attribute ist der stub ja schon in der dtd, bloß ausgeliefert werden sie nicht. und wer nicht jedesmal direkt ins auto springt wenn er einen myst gelöst hat, muss das irgendwo speichern. so bauen sich dann halt die eigentlich nicht erwünschten bestände zwangsläufig auf.
 

MiK

Geoguru
Suppenkasper schrieb:
Das Spidern ging bei mir recht schnell ca. 2.840 Caches in weniger als 1 Stunde. Was bei mir unendlich lange dauert ist das Laden. Da werden pro Cache fast 10 Sekunde gebraucht.
Argh! Wenn ich solche Zahlen höre, möchte ich am liebsten jegliche Arbeit für Cachewolf beenden. Leute, ihr wisst doch, dass das Spidern von GC nicht gern gesehen wird. Bitte betreibt es doch in vernünftigem Rahmen.

Meine Profile haben jeweils maximal 250 Caches. Und die habe ich auch nicht auf einmal geladen, sondern nach und nach. Wenn ich dann in dem Gebiet Cachen möchte, spidere ich noch mal in dem Gebiet. Dabei werden nur neue Caches hinzugefügt und Caches, bei denen sich der Status geändert hat aktualisiert. Am Ende aktualisiere ich noch mal die Caches, die ich mir evtl. in den nächsten Tagen vornehmen möchte. Das sind dann insgesamt genau die Seitenaufrufe, die ich sonst auf der Webseite machen würde, um mich in einem Gebiet auf den neuesten Stand zu bringen.

eigengott schrieb:
MiK schrieb:
PQs sind keine Lösung um sich einen Offline-Bestand zu halten.

Dafür sind PQs auch nicht gedacht. Die dienen zum Geocachen. Und dafür braucht man keine riesigen Offline-Bestände.
Ich habe nichts von "riesig" geschrieben. Mir geht es nicht um die Menge an Caches. Die Nachteile der PQs sehe ich in deren Unvollständigkeit und dem umständlichen Weg über Mails anstatt einem direktem Zugriff aus dem Programm heraus.
 

greiol

Geoguru
MiK schrieb:
Mir geht es nicht um die Menge an Caches. Die Nachteile der PQs sehe ich in deren Unvollständigkeit und dem umständlichen Weg über Mails anstatt einem direktem Zugriff aus dem Programm heraus.
tja, http://forums.groundspeak.com/GC/index.php?showtopic=164191&st=0&p=3617154&#entry3617154
 

Engywuck

Geowizard
MiK schrieb:
Suppenkasper schrieb:
Das Spidern ging bei mir recht schnell ca. 2.840 Caches in weniger als 1 Stunde. Was bei mir unendlich lange dauert ist das Laden. Da werden pro Cache fast 10 Sekunde gebraucht.
Argh! Wenn ich solche Zahlen höre, möchte ich am liebsten jegliche Arbeit für Cachewolf beenden. Leute, ihr wisst doch, dass das Spidern von GC nicht gern gesehen wird. Bitte betreibt es doch in vernünftigem Rahmen.
Das Problem scheint mir an der Stelle weniger böse Absicht zu sein, sondern eher Unkenntnis ob der Zusammenhänge, d.h. das "ihr wisst doch" würde ich in vielen Fällen bestreiten. Wenn man weder Computerfreak oder CW-Entwickler oder fleißiger Mitleser hier ist, sondern den Wolf einfach nur benutzt, weil er praktisch ist, ohne sich um tiefere Details kümmern zu können oder wollen, der nutzt hat - ohne böse Absicht - die Funktion "Spider von Geocaching.com". Es ist ja schließlich auch kein Totenkopf dran, der vor der Verwendung warnt.

Gruß,
E.
 

MiK

Geoguru
Zumindest die hier (häufiger) mitlesenden sollten ja Bescheid wissen. Und die werden hier ja auch hauptsächlich angesprochen. Vielleicht hilft ja die neue Möglichkeit, die Anzahl der zu spidernden Caches zu begrenzen. Aber das mit dem Totenkopf ist auch eine gute Idee.
 

Engywuck

Geowizard
MiK schrieb:
Aber das mit dem Totenkopf ist auch eine gute Idee.
Oder beim ersten Verwenden der Spider-Funktion erscheint ein Warn-Fensterchen, das auf die besonderen Umstände des Spiderns hinweist ("erzeugt Serverlast, ist verboten und kann mit Exkommunikation bestraft werden") und das man erst mit "Ja, hab ich gelesen, aber ich will es trotzdem tun" bestätigen muss.

Gruß,
E.
 

greiol

Geoguru
Engywuck schrieb:
Das Problem scheint mir an der Stelle weniger böse Absicht zu sein, sondern eher Unkenntnis ob der Zusammenhänge, d.h. das "ihr wisst doch" würde ich in vielen Fällen bestreiten. Wenn man weder Computerfreak oder CW-Entwickler oder fleißiger Mitleser hier ist, sondern den Wolf einfach nur benutzt, weil er praktisch ist, ohne sich um tiefere Details kümmern zu können oder wollen, der nutzt hat - ohne böse Absicht - die Funktion "Spider von Geocaching.com".
das ist einer der gründe weshalb ich - obwohl es mich juckt - mich bisher nicht um das speicherproblem kümmern mag. es sorgt erst mal für eine "natürliche" bremse.
 

Suppenkasper

Geocacher
In diesem Fall gehöre ich zu der Gruppe, die das Programm Cachewolf noch nicht so recht durchgeholt haben und daher die Menge an Caches gezogen haben.

Aber ich habe den Eindruck, dass wir gerade ein wenig das Ursprüngliche Topic verlassen - Geschwindigkeit des Ladens.

Das Ladeverhalten ist bei mir genauso langsam, wenn ich eine GPX-Datei aus GSAK nehme als wenn ich spidere (ca. 10 Sekunden für einen Cache).

Nehme ich die Datei, die ich von GC bekomme, geht es einwenig schneller ( ca. 1-2 Sekunde pro Cache).

Ich schätze mal, dass es an der Anzahl der enthaltenen Logs liegt, oder?
In "meiner" GSAK-Datei sind es fast alle Logs zu einem Cache während in der GC-Datei nur die letzten 5 Logs sind.


Wie ist das denn beim Spidern? Das erfolgt ja in zwei Schritten.
1. Spidern (ging bei mir relativ schnell)
2. Das Laden, was recht lange dauerte.

Das Spidern erstellt nur eine Liste aller vorhandenen Caches im Umkreis und das Laden arbeitet die Liste ab und lädt dann erst die tatsächlichen Caches? (vereinfacht erklärt)
 

MiK

Geoguru
Beide Schritte gehören zum Spidern. Ansonsten hast Du das Vorgehen richtig erfasst.

Zu Deiner Beobachtung mit den Logs: Das Einsortieren neuer Logs ist recht zeitaufwendig. Wenn man das Spidern beschleunigen möchte, sollte man die Maximalzahl der Logs in den Einstellungen reduzieren. Wenn man sie auf 5 stellt müssen sie auch gar nicht mehr geladen werden.
 
Oben