• Willkommen im Geoclub - dem größten deutschsprachigen Geocaching-Forum. Registriere dich kostenlos, um alle Inhalte zu sehen und neue Beiträge zu erstellen.

Spezielle Geocaching-Suchmaschine

moenk

Administrator
Teammitglied
In Zusammenarbeit mit der Uni Karlsruhe und dem Projekt yacy basteln wir an einer extra Suchmaschine nur für Geocaching. Also wo man dann "PMR" oder "Kegel" oder "Event" suchen kann und dann nur Treffer aus dem Geocaching-Bereich bekommt. Grundlage dafür sind die Seiten, die im Portal eingetragen sind. Wer eine Website hat und da noch nicht drinsteht sollte das mal nachholen.
Spielen kann man schon damit: Einmal oben im Header, oder aber: http://yacy.geocaching-portal.com
 
OP
moenk

moenk

Administrator
Teammitglied
Kann man sogar auf seine eigene Seite einbauen: http://yacy.geocaching-portal.com/ConfigLiveSearch.html
Der Server gehört der Uni Karlsruhe, mit der wir dies Projekt machen, daher die IP.
 

Schnueffler

Geoguru
Ok, ist ja gerade um die Ecke. Sollte der Server also vielleicht irgendwann mal nen Tritt brauchen, sag Bescheid. Dann geh ich gerade mal zu den Nachbarn....
 
OP
moenk

moenk

Administrator
Teammitglied
Trittberechtigt ist Michael Christen, der Meister der Server und des Projekts, aber danke für das Angebot.
Seit heute wird indiziert was die Server hergeben, bin mal gespannt was man dann für Ergebnisse bekommt.
Es wird übrigens alles indiziert was in dieser Liste steht: http://news.geocaching-portal.com/yacy-urls.php
 

JR849

Geowizard
Klasse Idee!
Werden die Treffer irgendwie sortiert (relevanteste oben. etc.)oder einach nur angezeigt?
 
OP
moenk

moenk

Administrator
Teammitglied
Relevante oben - die Kriterien legt des yacy-Meister fest. Ganz stark finde ich aber die Liste der Domains an der rechten Seite und die Vorschläge für weitere Suchbegriffe.
 

fabibr

Geomaster
Wie werden denn die relevanten Seiten eingefügt?
Es gibt ja inzwischen x-Seiten und Blogs übers Cachen, dann noch die Foren, etc. pp
Gibt es dafür ein Formular? Werden bestehende Linksammlungen benutzt?
Oder wie ist das dort?
 
OP
moenk

moenk

Administrator
Teammitglied
Webmaster können die eigene Seite hier anmelden: http://www.geocaching-portal.com/add_link.php
Nur Geocaching-relevante Seiten werden freigeschaltet und gespidert sowie indiziert.
 

zorg

Geocacher
moenk schrieb:
ich bins! :D

zur Relevanz der Treffer: hab noch nicht dran geschraubt, durch die Vielzahl der Datenquellen ist aber auch nicht ein 'spezielles bestes Ranking' für die Geocachingseiten ersichtlich. Daher läuft das in der Standardkonfiguration für Websuche. Falls euch was spezielles auffällt: einfach schreiben.

Indexierungsspeed: ich schraube das gerade runter weil die Anzahl der Zugriffe momentan doch ein wenig höher ist. Momentan sind rund 80000 Seiten im Index. Heute Nacht setzte ich den Crawl-Speed wieder hoch.

Ihr habt hier ganz schön viel Traffic!
 

greiol

Geoguru
zorg schrieb:
Ihr habt hier ganz schön viel Traffic!
es ist kein wunder wenn ihr was zu tun bekommt, da erst mal ein ganzer sack an scripten, styles und ähnlichem kram geladen werden muss damit die hässliche box angezeigt wird. da könnt ihr bestimmt mit einer kleinen änderung allen einen gefallen tun.
 
OP
moenk

moenk

Administrator
Teammitglied
Stört das in der Ladezeit jemand mit den Skripten für die Suchbox?
 

eremiljo

Geocacher
Also mich stört es vor allem, dass gleich beim Tippen mit der Suche begonnen wird. Das erzeugt doch sicher auch ziemlich viel Traffic, bringt dem suchenden aber überhaupt nichts. Bzw. es verwirrt nur weil bei <3 Zeichen sowieso keine Treffer angezeigt werden.
 
OP
moenk

moenk

Administrator
Teammitglied
Das ist ein besonderes Feature - ob es drin bleibt, ist noch nicht sicher. Irgendwann stimmen wir mal drüber ab ;-)
 

zorg

Geocacher
Die Live-Suche ist sicherlich ungewohnt und auch irgendwie ein Experiment. Von der Last her ists kein Problem, der Server sollte 10 Suchanfragen pro Sekunde schaffen, und so schnell tippt nun doch keiner. Sollte die Last höher werden kann man es immer noch abschalten.
Im Suchlog (wird alle drei Stunden automatisch vollständig gelöscht) sieht man interessante Effekte dazu: zum einen ist es erstaunlich dass eine Vielzahl von Anfragen drei oder mehr Wörter hat. 'Normal' wäre ja '1.2' Suchworte, wie bei Google.
Man kann sehen dass viele beim Tippen nach 2 oder 3 Worten erst mal eine kleine Pause von 3-5 Sekunden machen, wohl um zu sehen was dabei raus gekommen ist, und dann wird weiter getippt. Diese kurze Pause sieht man nicht nach den ersten 1-3 Buchstaben, was mir sagt das es nicht direkt stört.

Aber es ist richtig dass diese Funktion ganz genau nur das machen soll, was für das 'Sucherlebnis' optimal ist. Es gibt Überlegungen, die erste Suche nur nach dem 3. Buchstaben oder nur beim Tippen eines ' Space auszulösen, oder wenn man 1-2 Sekunden nicht getippt hat oder so. Vielleicht sind das Alternativen über die man nachdenken kann.

eremiljo schrieb:
Das erzeugt doch sicher auch ziemlich viel Traffic
Der Traffic bei der Suche betrifft den Forumsserver nicht, denn der geht direkt nach Karlsruhe, die Rechner sind mit drei 10-Gigabit Verbindungen dran - das hängt am gleichen Backbone wie das Rechenzentrum, das die LHC-Daten verarbeitet (die sind dort first stage für die Collider-Daten).
Das Such-Widget kommuniziert per JSON, das sieht so aus:
http://yacy.geocaching-portal.com/yacysearch.json?query=moenk
Das Rendern geschieht dann im Browser. Das sind nicht so viele Daten die hin und her gehen.
Wer mag kann die Suchergebnisse auch per Opensearch-Format abrufen, das ist eine Erweiterung von RSS. Die URL ist
http://yacy.geocaching-portal.com/yacysearch.rss?query=moenk

Der Rechner ist übrigens aus einer 'Müllhalde' von einer Ausmusterung des KridKa beim YaCy-Sommerfest aus funktionierenden Einzelteilen zusammengestzt worden.
 

maierkurt

Geowizard
Die Livesuche ist mir erst gar nicht aufgefallen, da ich im Opera Mobile Javascript abgeschaltet habe.
Die Livesuche ist aber nicht zu gebrauchen, da immer wieder die Tastatur verschwindet.
Das ganze ist aber auch ohne Script eine schöne Sache.
 
OP
moenk

moenk

Administrator
Teammitglied
Ich tendiere auch dazu, die Suche ohne AJAX oder was das nun genau ist laufen zu lassen. Es holt die Benutzer einfach eher dort ab, wo sie grad sind. Also nur ein Suchkasten ohne Interaktion, aber für den Test lassen wir das doch mal drin. Und dick und rot wurde von den Mods gefordert, ich denk das ist auch eine ganz gute Idee.
 
OP
moenk

moenk

Administrator
Teammitglied
Die Javascript-Geschichte mit dem "ich tipper was und der sucht schon" scheint nicht so der Erwartungshaltung des durchschnittlichen Geoclub-Users zu entsprechen. Ich hab daher mal auf ein einfaches Suchformular mit Antwortseite umgestellt.
 

zorg

Geocacher
seit gestern gibts auch ein 'did you mean' nach einer Suche. Da werden Vorschläge für alternative Schreibweisen für die Suchworte generiert, das kann man aber besser machen als aktuell indem man ein Wörterbuch benutzt, das bei der Vorschlagsdarstellung genutzt wird.

Hier wäre eine spezielle Wortliste für das Thema Geocaching hilfreich, also nicht einfach ein Wörterbuch der deutschen Sprache, sondern eine Wortliste aus einem GC-Glossar oder ähnlichem.

http://yacy.geocaching-portal.com/yacysearch.html?query=glossar
hilft schon mal solche zu finden, nur müsste man sich hin setzten und aus allen Glossars die Wörter einzeln rausnehmen und in eine lange Wortliste reinschreiben. Freiwillige?
 

zorg

Geocacher
großes Update zur Suchfunktion!

der Suchindex kennt nun zu allen deutschen
- Städtenamen
- Postleitzahlen
- Vorwahlnummern
- KFZ-Kennzeichen
die zugehörigen Geokoordinaten, und stellt diese durch Einblenden einer Karte aus OpenStreetMap in Form eines Thumbnails dar. Die Koordinaten kommen aus der OpenGeoDB.
Sind die Treffer mehrdeutig (bsp. gibt es mehrere Orte mit gleichen Namen) werden einfach alle dargestellt, aber nur bis zu 5 maximal.

Ich dachte mir sowas passt ganz gut hier her und bin gespannt wie das ankommt. Es sind doch relativ viele Ortsbezeichnungen im Log, und da könnte eine Karte doch ganz gut helfen.

man kann also nun einfach nach einer Postleitzahl suchen und bekommt dann u.a. eine Karte angezeigt.

Gleichzeitig wurden die Wortvorschläge aufgewertet, die Funktion kennt jetzt neben dem speziellen Geocaching-Vokabular auch alle deutsche Ortsnamen.
 
Oben