Suchen im virtuellen Heuhaufen

NATUR+PHARMAZIE 12/2000

Teil II: Allgemeine Suchmaschinen für das Internet

Eine im letzten Jahr veröffentlichte Studie von NEC Research hat festgestellt, dass bisher keine der etablierten Suchmaschinen mehr als 16% des Netzes erfassen kann. Trotzdem kann man bei Benutzung der für den jeweiligen Zweck richtigen Suchmaschine meist ein befriedigendes Ergebnis erzielen. Im zweiten Teil dieser Serie werden konkret einige allgemeine Suchmaschinen für das Internet vorgestellt.

Machen Sie sich vor Beginn einer Recherche im Internet zunächst Gedanken darüber, wie häufig und in welchem Zusammenhang ein Begriff auf den gesuchten Seiten vorkommen könnte. Definieren Sie ein oder mehrere Stich- bzw. Schlagworte. Stichworte sind Begriffe, die direkt im Text eines Dokumentes vorkommen und für den Inhalt eine entscheidende Bedeutung haben. Schlagworte sind Begriffe, die zentrale Aspekte eines Textes repräsentieren und daher in einem logisch und hierarchisch aufgebauten Schlagwortverzeichnis Verwendung finden würden. Schlagworte müssen nicht notwendigerweise im Text enthalten sein. Stichworte sind v. a. bei der Verwendung von Volltextsuchmaschinen, Schlagworte bei der Recherche in Katalogen wichtig (vgl. Teil I). Versuchen Sie ggf. sprachliche Variationen und verschiedene Schreibweisen. Wenn Sie zu viele Treffer erhalten, grenzen Sie uner- wünschte Begriffe aus oder spezifizieren Sie den gesuchten Begriff durch Verknüpfungen mit verwandten Begriffen. Sie erhalten in den verschiedenen Suchmaschinen unterschiedliche Ergebnisse. Wenn Sie z. B. bei AltaVista Deutschland (www.altavista.de) den Suchbegriff "Krebs" eingeben, erhalten Sie über 78 000 Treffer, vom Sternzeichen über das Weingut Krebs in Freinsheim bis hin zur Erkrankung. Wenn Sie einen engeren Begriff wie "chronisch myeloische Leukämie" eingeben, erhalten Sie etwas über 3 000 Einträge, wobei die Datenbank alle Seiten listet, die zumindest einen der drei Begriffe enthält. Dabei durchsucht AltaVista zur Zeit etwa 8 Millionen Dokumente. Spezifischer wird die Suche durch eine Verknüpfung mit "UND" oder wenn alle Begriffe in Anführungszeichen gesetzt werden (Phrasierung). In beiden Fällen erhalten Sie etwa 40 Treffer. AltaVista bietet sogar eine automatische Phrasensuche an: häufig gesuchte Suchbegriffe, die aus mehreren Wörtern bestehen, werden automatisch zu Phrasen verknüpft. AltaVista ist eine der ersten und auch heute noch eine der leistungsfähigsten Volltextsuchmaschinen. Neben der Suche nach deutschsprachigen Seiten ist natürlich auch eine Fahndung nach Websites in Englisch oder 23 weiteren Sprachen möglich. Ganz Unentwegte können auch den kompletten Datenbestand in allen Sprachen durchforsten. Fireball hat sich auf deutsche Seiten spezialisiert und durchsucht auch deutschsprachige Seiten auf ausländischen Servern (www.fireball.de). Fireball ist derzeit die umfassendste, schnellste und "intelligenteste" Volltextsuchmaschine im deutschsprachigen Raum. Ein einzigartiges Feature, das eine noch präzisere Suche in den Datenfeldern Zielgruppe, Autor, Urheberrecht, Thema, Seitentyp, Herausgeber zulässt, ist die sog. Feld- oder Detailsuche. Damit eröffnet sich das gesamte Spektrum von Verknüpfungsmöglichkeiten: Nebeneinander stehende Suchworte werden automatisch mit "OR" verknüpft, d. h., nur einer der Suchbegriffe muss im Ergebnis enthalten sein. Sollen mehrere Worte im gesuchten Dokument enthalten sein, so muss mit "AND" verknüpft werden. Die Detailform listet zusätzlich den Inhalt einer Reihe weiterer Meta-Tags. Wenn man die Detailsuche mit dem Suchwort "Krebs" im Titel startet, werden 1153 deutschsprachige Dokumente angezeigt. In der Rubriksuche unter "Krebs und Onkologie" bleiben 696 Seiten. Yahoo (www.yahoo.de) war der weltweit erste hierarchisch aufgebaute Katalog von Webseiten. Ein übersichtliches Menü mit Dutzenden von Untermenüs strukturiert alle Einträge. Der Suchende kann sich so entweder durch Eingabe eines Suchwortes oder durch Blättern im Index seinem Ziel nähern. Für unser Beispiel "Krebs" bedeutet das eine Suche in der Unterrubrik "Gesundheit und Medizin". Hier werden zur Zeit 65 Seiten rund um die Onkologie gelistet. Bei der Eingabe im Suchfeld werden die Kategorien, Titel und Beschreibungen der Indizes durchsucht. Es wird also keine Volltextsuche aller gelisteten Dokumente durchgeführt, sondern eine Suche im redaktionell erarbeiteten Katalog. MetaGer, die Metasuchmaschine der Uni Hannover, durchsucht mehrere deutschsprachige Suchmaschinen mit einer erstaunlichen Geschwindigkeit (www.metager.de). Dazu kommen sinnvolle Konfigurationsmöglichkeiten: Wenn der Button "Teste Treffer auf Existenz" angeklickt wird, wird vor der Ausgabe der Ergebnisse getestet, ob die Seite tatsächlich noch existiert; wenn der Button "Teste Treffer auf Existenz und sortiere nach Änderungsdatum" angeklickt wird, wird sowohl auf Existenz getestet als auch die Ausgabe zeitlich sortiert: die neusten Dokumente kommen zuerst. Das verlängert wegen der vielen Kreuz- und Quer-Anfragen zwar die Suchdauer, erbringt aber ein optimales Suchergebnis. Zusätzlich zu den Links der Metasuche werden Quicktips aus einer eigenen Datenbank ganz oben auf der Ergebnisseite gelistet. Sie werden aus der Analyse einiger Millionen Nutzeranfragen generiert. Mit dem Suchwort "Krebs" erhält man bei der umfangreichen MetaGer-Recherche in 25 deutschsprachigen Suchmaschinen 422 Ergebnisse, wobei die Listung der einzelnen Suchmaschinen-Ergebnisse zum Teil auf die jeweils 10 erstplatzierten Ergebnisse beschränkt ist. Die Auswahl an Suchsystemen ist groß - sowohl für das WWW als auch für andere Internet-Dienste: E-Mail-Adressen, Newsgroups, Computerprogramme etc. Einige Suchmaschinen bieten neben der Web-Suche auch schon das Aufspüren von E-Mail-Adressen und das Stöbern in Newsgroups an. Eine Aufstellung medizinischer Suchmaschinen finden Sie unter www.health-online.de/medlinks.htm. Sie können aber auch zunächst einmal Suchmaschinen für Suchmaschinen testen: www.klug-suchen.de, www.search.com oder www.suchfibel.de. Michael Sarbandi, MPH

Alle im Rahmen dieses Internet-Angebots veröffentlichten Artikel sind urheberrechtlich geschützt. Alle Rechte, auch Übersetzungen und Zweitveröffentlichungen, vorbehalten. Jegliche Vervielfältigung, Verlinkung oder Weiterverbreitung in jedem Medium als Ganzes oder in Teilen bedarf der schriftlichen Zustimmung des Verlags.

x