Bibliometrie

BIBLIOMETRIE

1. Einführung
2. Kurze Geschichte
3. Begriffe
4. Zitatanalyse
5. Anwendungen
6. Bibliometrische Evaluierungsverfahren:
I. Die sogenannte "Peer Review" Methode
II. Anzahl der Veröffentlichungen
III. Zitatanalyse: Problematik
7. Zitate als Retrievalsmethode
I. Zitatengruppen- oder Clusteranalyse
II. Bibliographische Kopplung
8. Das Verzeichnis der Verzeichnisse: SCI
I. Der SCI als Datenquelle
II. Aufbau des Verzeichnisses
III. Bibliometrische Indikatoren der JCR
IV. Aufbau von JCR
V. SCI auf CD-ROM
VI. SCI online
VII. SCI im Internet: Web of Knowledge
a) Web of Science
b) JCR
c) Essential Science Indicators (ESI)
d) ISIHighlyCited.com
e) National Science Indicators Database
VIII. Kritik und Problematik
9. Scopus: eine neue Alternative?
10. SJR: SCImago Journal & Country Rank
11. Präsentation der Ergebnisse
12. Kommentare
13. Literatur

1. Einführung

Wie misst man Wissenschaft und wissenschaftliche Produktion?
Unter Informetrie versteht man die Anwendung mathematischer Methoden auf die Sachverhalte des Informationswesens. Sie ist eine Disziplin im Überscheidungsbereich zwischen Mathematik und Informationswissenschaft. Die Informetrie wird auch Bibliometrie oder Szientometrie genannt.
Der Begriff "Bibliometrie" wurde 1969 von A. Pritchard geprägt. Zweck und Definition der Bibliometrie ist die Anwendung mathematischer und statistischer Methoden zur Erklärung der Prozesse der schriftlichen Mitteilungen, sowie der Natur und des Entwicklungskurses eines Wissenschaftsgebietes, durch Zählung und Analyse der verschiedenen Aspekte der schriftlichen Kommunikation.

Derzeit hat sich die Bibliometrie als die bedeutendste Methode für die Bewertung wissenschaftlicher Arbeiten erwiesen. Sie ist die Metrik des Buchwesens und untersucht unter Einsatz mathematisch-statistischer Methoden die quantitativen Regelhaftigkeiten von Printmedien im Informationsstrom in Beziehung zur Wissenschaftstheorie und Forschung.
Eine modernere Definition von Hawkins lautet: "Quantitative Analyse der bibliographischen Aspekte eines Literaturthemas". Diese Definition hat den Vorteil, dass sie den quantitativen Aspekt dieser Wissenschaft hervorhebt.

Die Zitatanalyse ist ein Gebiet der Bibliometrie, das sich mit dem Studium der Beziehungen zwischen zitierten und zitierenden Arbeiten und ihrer Anwendung als bibliometrische Untersuchungsmethode beschäftigt. Als bibliometrischen Parameter verwendet die Zitatanalyse die Zählung der auf eine bestimmte Arbeit, ein bestimmtes Dokument oder einen bestimmten Verfasser entfallenden Zitate. Je größer die Zitierhäufigkeit ist, desto höher wird ihr Wert veranschlagt.

2. Kurze Geschichte

Die erste bibliometrische Untersuchung erschien 1917 und war eine von Cole und Eales verfasste Veröffentlichung einer statistischen Analyse der Literatur über Anatomie in dem Zeitabschnitt zwischen 1550 und 1860, um die Schwankungen des Interesses in dieser Disziplin zu zeigen.

Im Jahre 1926 veröffentlichte der Chemiker, Mathematiker und Statistiker A. F. Lotka einen Artikel über die wissenschaftliche Produktivität in den Bereichen Chemie und Physik, wobei er feststellte, dass einige wenige Autoren eine hohe Publikationsanzahl erreichen, und dass die größte Zahl der Autoren eine oder zwei Arbeiten innerhalb eines bestimmten Bereiches veröffentlicht. Diese Gesetzmäßigkeit, die besagt, dass die Publikationsanzahl umgekehrt proportional ist zur Anzahl der Autoren, wurde durch viele Untersuchungen bestätigt und ist heute nach seinem Autor als Lotkas Gesetz bekannt.
P. Gross und E. Gross waren 1927 die ersten, die Zitate als bibliometrische Datenquellen verwendeten. Sie zählten und analysierten die in den einzelnen Artikeln einer chemischen Zeitschrift angeführten Zitate, und kamen zu einer Liste von Zeitschriften die sie als unentbehrlich für die chemische Ausbildung betrachteten.

Im Jahre 1934 stellte der Bibliothekar Samuel .C. Bradford ein heute nach ihm bekanntes Gesetz nach der Untersuchung einer Bibliografie zum Thema Geophysik mit insgesamt 326 Zeitschriften auf. Er stellte fest, dass 9 Zeitschriften 429 Artikel enthielten, 59 weitere 499 Artikel und die restlichen 258 noch 404 Artikel.
Nach Bradfords Gesetz finden sich die gleiche Anzahl von Aufsätzen über ein festgelegtes Thema verteilt in jeweils in Gruppen von n0, n1, n2 etc. verschiedenen Zeitschriften, wobei der Parameter n je nach Fachgebiet und Thema verschieden sein kann. Der Parameter n entspricht dem Verhältnis der Anzahl von Zeitschriften zwischen zwei aufeinander folgenden Gruppen. Aus Bradfords Gesetz ergibt sich die Einteilung in Kernzeitschriften, verwandten Zeitschriften und restlichen Zeitschriften für jedes Forschungsgebiet (siehe Beispiel). Bradfords Gesetz wurde 1948[2] von Brian C. Vickery unter der Bezeichnung Bradford's Law of Scattering mathematisch formuliert und stellt ein Potenzgesetz dar.

Das dritte bibliometrische Grundgesetz geht auf die Arbeiten des Philologen Georg K. Zipf in den 1930er Jahren zurück und bestimmt die Erscheinungshäufigkeit eines Wortes im Text. Das Zipfsche Gesetz ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige Verwendung findet das Gesetz in der Linguistik, wo es zum Beispiel die Häufigkeit von Wörtern in einem Text zur Rangfolge in Beziehung setzt (siehe Beispiel). Das Zipfsche Gesetz markierte auch den Beginn der Quantitativen Linguistik.

1966 war in der Sowjetunion das Buch "Nauka o nauke" von G.M. Dobrov mit dem Untertitel "Vvedeniev obscee naukoznanie" erschienen. 1969 wurde diese Veröffentlichung als "Wissenschaftswissenschaft" zum ersten Male in deutscher Sprache herausgegeben. Nach Dobrov ist die Wissenschafts-wissenschaft die komplexe Untersuchung und Verallgemeinerung des Funktionierens wissenschaftlicher Systeme mit dem Ziel, das Potential der Wissenschaft zu verstärken und die Effizienz des wissenschaftlichen Prozesses mit Hilfe organisatorischer Mittel zu erhöhen.
Einige Monate früher als Pritchard hatten Nalimov und Mul'cenko, ebenfalls Russen, den Begriff Szientometrie (Scientometrie) oder Wissenschaftsmetrie (auf russisch "naukometrija") eingeführt. Nach ihrer Definition ist die Szientometrie (engl. scientometrics) die Anwendung quantitativer Methoden auf das Studium der Geschichte der Wissenschaft als Informationsprozess.
Ein anderer Terminus, der auch häufig (stammt aus der DDR) verwendet wird, ist die Informetrie. Dieser Terminus wurde von Blackert und Siegel eingeführt, da viele Arbeiten, die gegenwärtig als bibliometrische gestempelt werden, nicht dem Zweck dienen, einen Beitrag zur Bibliothekswissenschaft zu leisten. Um ihre Beziehung zur Informatik zu betonen, wird dieses Fachgebiet Informetrie benannt und definiert als die Lehre der Anwendung mathematischer Methoden auf die Sachverhalte des Informationswesens zur Beschreibung und Analyse ihrer Phänomene, zum Auffinden ihrer Gesetze und zur Unterstützung ihrer Entscheidungen.
Informetrie, Szientometrie und Bibliometrie überschneiden sich. Die Verwendung des einen oder anderen Terminus hängt sehr stark davon ab, welcher Aspekt, der bibliothekarische, der wissenschaftliche oder der informatische, herauszuheben ist, deshalb wird in dieser Arbeit von Bibliometrie gesprochen.

Seitdem hat diese Art von Untersuchungen ständig mehr Anhänger gefunden. 1969 zählte Pritchard schon über 700 Items. Heute gibt es Zeitschriften, die sich nur mit diesem Thema beschäftigen, wie z.B. Scientometrics, eine Zeitschrift die seit 1978 besteht. Eine vom Autor selbst durchgeführte Literaturrecherche in der Datenbank LISA (Library and Information Science Abstracts) nach dem freien Suchbegriff "scientometric? or bibliometric?" ergab schon Anfang 1990 1262 Treffer, von denen sich 508 mit Zitatanalysen beschäftigen.
Derzeit existiert sogar eine International Society for Scientometrics and Informetrics ISSI, die regelmäßig Tagungen organisiert.
Heutzutage wird es behauptet, ca. 97% zeitgenössischer Wissenschaftler seien an Bibliometrie interessiert (12).

3. Begriffe

Sehr wichtig ist der Unterschied zwischen Zitation bzw. Zitat (engl. citation), Zitierungen (engl. cite) und Referenz (engl. reference).
Formale Aufbau einer wissenschaftlichen Veröffentlichung (engl. paper) zeigt eine standardisierte Struktur:
Titel, Autoren, Anschriften (Affiliation, Corporation), Abstrakt, Deskriptoren, Volltext, Referenzen.
Ein Bestandteil ist die Aufführung der Forschungsergebnisse, auf denen die Arbeit aufbaut. Es wird verlangt, dass der Autor die Verwendung bereits bekannter Methoden oder Resultate zitiert, die zu seiner Arbeit in enger inhaltlicher Beziehung stehen. Die Angabe der Zitate erfolgt in der Form eines vereinheitlichten kurzen Hinweises auf das zitierte Dokument und hängt sehr stark vom zitierenden Verfasser sowie von der Quelle ab, denn jede Zeitschrift oder Datenquelle verwendet besondere Regeln oder Empfehlungen zur Darstellung der Referenzen (Notes for Contributors, Instructions for Authors).
Ebenso kann die Plazierung der Referenzen im Text unterschiedlich sein. Sie können in den fortlaufenden Text eingebettet sein, in einer Fußnote erscheinen, oder meistens in Form einer Literaturliste am Schluss der Veröffentlichung präsentiert werden.
Definition:
Enthält die Veröffentlichung X eine bibliographische Note, in der die Veröffentlichung Y beschrieben oder verwendet wird, dann enthält X (citing document) eine Zitation oder Referenz zu Y, und bekommt Y (cited document) eine Zitierung von X.
Die Referenz (Reference) ist das Anerkenntnis, das der Zitierende gibt (aktiv), und die Zitierung (Citation) ist das Anerkenntnis, das der Zitierte erhält (passiv).

Zitate haben in der Wissenschaft ihre größte Bedeutung. Wissenschaftler sind stets darauf angewiesen, Arbeiten anderer Personen zu verwenden, damit etwa unnötige Wiederholungen eines Experiments verhindert werden. Der Wissenschafter arbeitet sozusagen auf den Schultern eines Riesen (d.h. auf der Erfahrung seiner vielen Vorgänger): Zum Beispiel wird im einleitenden Text einer Dissertation mit Zitaten belegt, welche Aspekte des Themas schon bekannt sind und welche Wissenslücken noch bestehen.
In der Wissenschaft wird davon ausgegangen, dass ein Forscher die Literatur zu seinem Thema kennt und sich mit den bisherigen Erkenntnissen auseinandergesetzt hat. Wenn man etwas von einem anderen Autor übernimmt, muss man die Quelle und gegebenenfalls die Art der Übernahme deutlich machen, sonst setzt man sich dem Vorwurf des Plagiats aus (siehe auch Betrug und Fälschung in der Wissenschaft).
Eine Zitation bezeichnet vor allem in der Bibliothekswissenschaft den direkten Verweis von einer Publikation auf eine andere. Für die Form des Verweises gibt es eine Vielzahl von Systemen und Regeln für Literaturangaben, die in der Regel mindestens Autor, Titel und Jahr einer Publikation enthalten. Während beim Zitat der zitierte Wortlaut oder Sachverhalt im Mittelpunkt steht, bezieht sich die Zitation auf die konkrete Quelle. Der verwandte Ausdruck »Zitierung« bezeichnet in der Regel eher den Vorgang oder die Art und Weise des Zitierens.

Beispiel

4. Zitationsanalyse (oder Zitatanalyse).

Die Zitatanalyse beschäftigt sich mit dem Studium der Beziehungen zwischen zitierten und zitierenden Arbeiten und ihrer Anwendung als Untersuchungsmethode. Sie zeigt, welchen Einfluss die betrachtete Arbeit auf die wissenschaftliche Gemeinschaft hat. Sie misst den "Nutzen" (Auswirkung, Resonanz, Rezeption, Impakt, üblich ist der englischsprachige Terminus technicus "Impact"), den diese Arbeit für andere Wissenschaftler hat oder gehabt hat, sagt aber nichts Endgültiges über ihre Qualität aus. Es ist jedoch sehr wahrscheinlich, dass eine häufig zitierte Arbeit wichtige Informationen enthält.
Zitatanalyse bezeichnet die Auswertung von Zitaten im Rahmen einer empirischen Untersuchung. Als bibliometrische Quellen stehen die zitierten und die zitierenden Arbeiten. Diese Daten werden aus besonderen Verzeichnissen wie z. B. "Science Citation Index" gewonnen, die von den sogenannten "counting houses" (Zitationsdatenbanken) angeboten werden.
Zitatanalyse können auf verschiedenen Stufen der Komplexität vorgenommen werden. Auf der untersten Stufe kann ein einzelnes Dokument, ein Zeitschriftenartikel, Buch oder graue Literatur die Einheit der Analyse sein. Dadurch kann die Frage beantwortet werden, wie oft, wann und von wem das Dokument zitiert worden ist. Auf der nächsten Stufe können alle Veröffentlichungen eines oder mehrerer Autoren, von Körperschaften oder Zeitschriften untersucht werden. Schließlich sind Studien über Universitäten oder alle aus einem Staat stammenden Veröffentlichungen sowie über Eigenschaften und Entwicklung bestimmter Wissensgebiete möglich.

Bei den Zitationsanalysen, wie bei bibliometrischen Analysen oder quantitativen Methoden, sollen immer Zuverlässigkeit (reliability), Gültigkeit (validity) und Relevanz (relevance) geprüft werden.

Zuverlässigkeit (reliability): Eine Messung ist zuverlässig, wenn sie bei gleichen Bedingungen reproduzierbar ist. Jede bibliometrische Messung enthält normalerweise einen bestimmten unsystematischen Fehler (random error), wie z. B. orthographische Fehler. Systematische Fehler (wie z. B. nicht Berücksichtigung aller Veröffentlichungen oder aller Koautoren) sollen aber ausgeschlossen werden.
Vier Kernpunkte sollen dafür berücksichtigt werden:
a) Vollständikeit der erhobenen bibliometrischen Daten (completeness)
b) Erfassung oder Erhebungsumfang der verwendeten Datenquellen oder Datenbanken (coverage of databases)
c) Grenzen der Zitatenanalysen (Fehler)
d) Probleme bei der Auswertung statistischer Daten (sind die Diskrepanzen wirklich signifikant?)

Gültigkeit (validity): Sind die verwendeten bibliometrischen Variablen richtige und gültige Evaluationsindikatoren? Manchmal werden sogar etablierte bibliometrische Indikatoren sehr stark in Frage gestellt.

Relevanz (relevance): Dabei sollen die Einschränkungen bei den möglichen Anwendungen berücksichtigt werden.

Oder wie Tijssen (1992) sehr gut formuliert: "one always has to take into account that any bibliometric measure will only remain a proxy for mapping and assessing the complex system of knowledge production".

5. Anwendungen

Unter den wichtigsten bibliometrischen Anwendungen der Zitatanalyse sind folgende zu erwähnen:

1) Auswahl von Monographien und Zeitschriften in der bibliothekarischen Erwerbung
Ein sehr wichtiges Kriterium für die Erwerbung von Monographien und Zeitschriften, vor allem in Fachbibliotheken, liefert deren Zitierungshäufigkeit, wie zahlreiche Untersuchungen dieser Art illustrieren. Zu diesem Zweck wurde von E. Garfield der sogenannte "Impact Factor" eingeführt, von dem später gesprochen wird.

2) Auswertungen von Sammlungen und Bibliographien
Diese Auswertungsmethoden beruhen vor allem auf der Möglichkeit, "ranking lists" (Ranglisten) aufzustellen. Ranglisten werden auch nach verschiedenen bibliometrischen Indikatoren erstellt (Beispiele sind bei der Beschreibung vom SCI-JCR zu finden). Die gebräuchlichsten Ranglisten sind jene, die nach der Anzahl der erhaltenen Zitierungen aufgebaut werden. Solche Listen werden jedoch mehr für die Auswahl als für die Auswertung von Sammlungen verwendet.

3) Untersuchung der Merkmale von Fachliteraturen
Eines der am meisten untersuchten Merkmale einer Fachliteratur ist das sogenannte "Veralten" (engl. obsolescence). Unter Veralten wird der Verfall mit der Zeit der Gültigkeit und Benutzbarkeit der Information verstanden. Dies ist sehr wichtig für die Bibliothekare, die ständig wachsende Sammlungen in beschränkten Räumen führen. Die Einschätzung des Alterns einer Literatur wird gewöhnlich durch die Verminderung der Zitierungen mit der Zeit angegeben.
Dafür wurde von Brookes der bibliometrische Indikator, das Halbleben oder Halbwertszeit (engl. half life), eingeführt, der später ausführlicher erörtert wird. Diese Untersuchungen können bei Klärung folgenden Fragen helfen: ob eine Zeitschrift rückwärtig ergänzt werden sollte, ob und welcher Teil einer Zeitschrift magaziniert oder makuliert werden könnte und ob und wann eine Zeitschrift gebunden werden sollte.
Als Instrument für den Bestandsaufbau bei Zeitschriften in wissenschaftlichen Bibliotheken könnte sie die Objektivität von Entscheidungen vergrößern, da sie unabhängig von den Einflussnahmen von Benutzergruppen getroffen werden könnten.

4) Historische und soziologische Anwendungen.
Garfield und seine Mitarbeiter vom ISI (Institute for Scientific Information) haben bewiesen, dass:
a) Zitationen eine wichtige Rolle beim Studium der Geschichte der Wissenschaften spielen können,
b) eine graphische Darstellung (genannt "Historiograph") eine schnelle Übersicht über die Entwicklung einer bestimmten Disziplin, die Entwicklung in einem Land oder die Beteiligung einer bestimmten Körperschaft an den ausschlaggebenden Durchbrüchen ergeben kann,
c) solche graphische Darstellungen in der Praxis problemlos zu erhalten sind.
Darunter zählt auch die Ermittlung der "klassisch zitierten" Arbeiten (engl. "citation classics") einer bestimmten Disziplin.
Solche Arbeiten werden mit einer größeren Häufigkeit innerhalb eines Fachgebietes zitiert. Die Festlegung des "klassischen" Niveaus zeigt sich aber nicht so einfach. So kann eine absolute Häufigkeit nicht angenommen werden, da in diesem Fall fast nur Artikel von bestimmten Zeitschriften (jenen mit sehr hohem Impaktfaktor, d.h. Zeitschriften die selbst viel häufiger als alle anderen zitiert werden) "citation classics" wären. Listen von "citation classics" erscheinen regelmäßig in der Zeitschrift "Current contents".

5) Andere bibliometrische Evaluierungsanwendungen
Diese Anwendungen umfassen auch die Einschätzung :
a) der Auswirkung einer individuellen Arbeit ,
b) der Eminenz eines bestimmten Forschers , und
c) des Prestiges und der Leistung einer bestimmten Forschungsanstalt , Firma oder eines Landes.
Zitatanalyse ist heute eine der wichtigsten Methoden der akademischen Evaluation, auch Science policy genannt.

6. Bibliometrische Evaluierungsverfahren

I. Die sogenannte "Peer Review" Methode

Diese Methode verwendet seit mehr als 35 Jahren die National Science Foundation der USA zur Entscheidung, welche Wissenschaftler Forschungsanträge zur Förderung der Wissenschaften erhalten, und dient heutzutage zum gleichen Zweck in den meisten europäischen Ländern, inklusive Österreich. Sie funktioniert auf folgende Weise:
Zuerst verfasst der Kandidat ein schriftliches Ansuchen, in dem er seine frühere Tätigkeit, seine Qualifikationen und seine geplante Forschungsarbeit beschreibt. Dieses Ansuchen erhält der sogenannte Programm-Direktor. Dieser bestimmt, welchem Fachgebiet die vorgeschlagene Arbeit angehört, und wählt dann eine Anzahl von Referenten (Fachleute in diesem Gebiet), die befragt werden, ob der Vorschlag als ausgezeichnet, sehr gut, gut, annehmbar oder schlecht bewertet wird. Aufgrund dieser Bewertungen trifft der Programm-Direktor eine Entscheidung.
Die häufigste Kritik an dieser Methode ist die sogenannte "old boy" (alte Freunde) Hypothese, nach der eine Clique von eminenten Wissenschaftlern begünstigt wird. So würden die Entscheidungen des Programm-Direktors stärker von dem Antragsteller selbst als von seiner vorgeschlagenen Arbeit abhängen.
Diese Methode wird aber nicht zur Einschätzung der Auswirkung einer wissenschaftlichen Arbeit oder der Verdienste eines Wissenschaftlers verwendet, da die für ein objektives Ergebnis benötigte Anzahl der Referenten sehr groß und deswegen unrealistisch wäre.

II. Anzahl der Veröffentlichungen

Hingegen fügt heutzutage jeder Wissenschaftler seinem Lebenslauf eine Liste seiner Veröffentlichungen, vor allem bei Bewerbungen und Preisausschreiben, bei, um seine Verdienste zu dokumentieren.
Im Jahre 1975 schlug der Nobelpreisträger W. Shockely vor, die Anzahl der Arbeiten als Indikator wissenschaftlicher Produktivität heranzuziehen.

Wissenschaftliche Veröffentlichungen beinhalten eine Menge von quantifizierbaren Elementen in bezug auf drei wichtigen Aspekten der wissenschaftlichen Tätigkeit (Tijssen, 1992):
1) Die Menge oder Größe (the size) der wissenschaftlichen Tätigkeit, die sich im Output als Anzahl der Veröffentlichungen widerspiegelt
2) Die Übermittlung der Kenntnisse (Transfer of Knowledge)
3) Die sozialen und kognitiven Netzwerke der Wissenschaft ("the structure) durch die Analyse der Koautoren, Adressen (Affiliations), Listen der Referenzen und der Schlagwörter.

Die Anzahl der Veröffentlichungen ist der einfachste und bekannteste Indikator.
Sie stellt das Gesamtvolumen der Forschungsproduktivität dar, ist aber quantitativer Natur und gibt kaum Information über die Auswirkung und Qualität dieser Arbeiten.
Die wissenschaftliche Produktivität von Autoren hängt vom Forschungsgebiet ab und von anderen sozialen oder individuellen Variablen (z. B. psychologischen, demographischen, usw.).
Die optimale Anzahl wissenschaftlicher Publikationen pro Jahr soll nach Price und Beaver (Mitte der 60er Jahre) etwa eine Arbeit pro Jahr betragen, wenn der Verfasser allein oder maximal mit zwei Koautoren veröffentlicht. Bei Mehrverfasserschaft erhöht sich ständig diese Zahl.
Werden Institutionen verschiedener Größe verglichen, dann wird die Anzahl der Veröffentlichungen pro Wissenschaftler oder Vollzeitäquivalent als Output für Produktivität.
Werden Länder verglichen, dann können sogar dazu andere Indikatoren wie Einwohnerzahl, Bruttosozialprodukt und F&E-Aufgaben herangezogen werden.
In bibliometrischen Analyse wird auch ein sogenannter Leistungsindikator eingeführt, der die verursachten Durchschnittskosten pro Arbeit (bzw. pro Zitierung) angibt (Herbertz & Müller-Hill, 1995).

Wie kommt man zu einer Veröffentlichung?
Erhält der Herausgeber einer wissenschaftlichen Zeitschrift ein Manuskript zur Veröffentlichung, so wählt er qualifizierte Referenten aus, die um ihre Fachmeinung befragt werden. Dem Autor bleibt die Identität der Referenten seiner Arbeit unbekannt, leider und unverständlicherweise wird aber bei Veröffentlichungen in den meisten Zeitschriften den Referenten die Identität des Verfassers der Arbeit nicht verschwiegen, was sehr leicht zu einer subjektiven Meinungsbildung führen kann.
Dies ist der Grund, warum es junge, noch unbekannte Wissenschaftler viel schwieriger als schon etablierte haben, ihre Ergebnisse zu veröffentlichen. Obwohl die Veröffentlichung in einer wissenschaftlichen Zeitschrift bestimmten Qualitätsanforderungen obliegt, sind diese aber von einer Zeitschrift zur anderen sehr unterschiedlich und daher nicht vergleichbar.
Außerdem weist dieser Parameter viele Nachteile auf, von denen zu erwähnen sind:
a) Die Wiederveröffentlichung derselben Arbeit in verschiedenen Versionen in mehreren Zeitschriften:
Dass nur die Anzahl der veröffentlichten Arbeiten als Indikator verwendet wird, kann dazu führen, dass eine Arbeit mehrmals oder in mehreren Teilen veröffentlicht wird, um den Wert dieses Parameters zu erhöhen. Dies beeinträchtigt dessen bibliometrische Aussage.
b) Die Mehrverfasserschaft: Auch die ständig wachsende Anzahl der Arbeiten, die von mehreren Autoren verfasst werden, kann die Analyse verfälschen, da nicht immer alle Verfasser im gleichen Ausmaß beigetragen haben, oder, was häufig der Fall ist, eine Co-Autorschaft willkürlich angegeben wird.
Trotz dieser Einwände wird dieser Indikator noch heute verwendet, und dient der Erstellung anderer, besserer bibliometrischer Parameter.
Nachteil: Die Subjektivität und Willkürlichkeit der Herausgeber wissenschaftlicher Zeitschriften bei der Auswahl von den zu veröffentlichen Arbeiten.

III. Zitatanalyse

In diesem Falle ist der einfachste Indikator die bloße Anzahl der Zitaten. Wie E. Garfield ganz klar formuliert, zeigt dieser Indikator, welche Auswirkung eine konkrete Arbeit auf die wissenschaftliche Gemeinschaft hat; sie misst den Nutzen (engl. "impact"), den diese Arbeit für andere Wissenschaftler hat, denn das Zitieren in einer wissenschaftlichen Publikation bedeutet die Anerkennung der Auswirkung und des Einflusses, die der zitierte Autor auf die betreffende Arbeit ausgeübt hat.
Zitate sind sehr beliebte bibliometrische Untersuchungsparameter, denn sie sind unaufdringlich und sehr leicht zu erhalten. Anders als Fragebogen und Befragungen bedürfen sie nicht der absichtlichen Kooperation des Befragten, was dessen Antwort beeinflussen könnte.
Sie sind "Wegweiser", die nach jeder Information hinterlassen wurden, und die als solche verwendet werden sollen.

Problematik der Zitatanalyse

Falls die Eigenschaften der Untersuchung es ermöglichen, sollten bei der Zitatanalyse zitierende und zitierte Arbeiten nach Autopsie bearbeitet, und die Zitierungsgründe analysiert werden. Eine gute Anwendung des Zitatanalyseverfahrens setzt aber die Kenntnis dieser Probleme voraus, damit, falls möglich, die notwendigen Maßnahmen zu deren Vermeidung getroffen werden können. Nun werden hier die bekanntesten Probleme und Einwände der Zitatanalyse aufgelistet, sowie ihre üblichen Beseitigungsmethoden:
1) Ein typographischer Fehler
Der kann leicht verursachen, dass ein wichtiges Zitat nicht berücksichtigt wird. Solche Fehler können aber bei jeder EDV- Untersuchung auftreten. Nur eine sorgfältige Durchführung der Arbeit kann dieses Problem vermeiden.
2) Die willkürliche Auslassung eines wichtigen Zitates
Sie kann aus verschiedenen Gründen eintreten. Die wichtigsten sind:
a) Die Arbeit, die zitiert werden sollte, ist dem Autor nicht bekannt
In diesem Fall hat sie wahrscheinlich nicht die entsprechende Verbreitung gefunden. Die Zitatanalyse wird dann deren Verfasser die Notwendigkeit einer besseren Mitteilung seiner Arbeit signalisieren. Dieses Phänomen ist in der Bibliometrie unter dem Namen "Mendelsyndrom" bekannt, da der berühmte Artikel von Mendel seinerzeit in einer unbekannten Zeitschrift erschien und unbeachtet blieb. Dabei sollten die sogenannten "schlummernden" Arbeiten erwähnt werden. Darunter versteht man Arbeiten, die ursprünglich sehr wenige Zitate aufzeigten, aber nach einigen Jahren wiederentdeckt und sehr häufig zitiert werden. Bibliometrische Analysen ermöglichen ihre Ermittlung.
b) Das Auslöschen durch Eingemeindung oder Einverleibung (engl. obliteration by incorporation)
Von diesem Phänomen sprach zum ersten Mal der in der Bibliometrie sehr berühmte Forscher Merton. Damit bezeichnete er jene Ideen, die so populär, assimiliert und bekannt geworden sind, dass sie als kollektives Eigentum oder selbstverständliche Hypothese betrachtet und nicht mehr zitiert werden. Diese Ideen sind aber so bekannt, daß sich bei ihnen normalerweise eine bibliometrische Untersuchung erübrigt, oder wenigstens keine gravierende Fehler auftreten können.
c) Anstatt originaler Arbeiten von unbekannten Autoren werden "Review-Artikel" von bekannteren Verfassern zitiert
Unter einem "Review-Artikel" versteht man einen Artikel, der keine neuen Ergebnisse oder Theorien enthält, sondern eine retrospektive, kritische Darstellung der Entwicklung und des Standes der Forschung in einem bestimmten Gebiet. Es gibt sogar Zeitschriften, die hauptsächlich diese Art Arbeiten veröffentlichen, wie z.B. Physics Reports. Solche Artikel, die einen sehr hohen bibliographischen Wert besitzen, werden den in diesem Fach schon bekannten Forschern anvertraut. Aus diesem Grund kann es schon geschehen, dass der zitierende Autor sich auf das Zitat des Review-Artikels beschränkt. Diese Art des Zitierens wird dem sogenannten "Matthew Effekt" zugeschrieben, nach dem bekannte Wissenschaftler eine übertriebene Anzahl von Zitaten erhalten.
d) Die Unzugänglichkeit der Dokumente
Manche Dokumente sind dem zitierenden Verfasser wegen ihrer Sprache, ihrer "tragenden" Zeitschrift (einer eher unbekannten und nicht leicht erhältlichen Zeitschrift) oder Quelle (Report, Preprint, Dissertation oder irgendeine graue Literatur), oder wegen Geheimhaltung nicht leicht zugänglich, und werden aus diesen Gründen nicht zitiert.
e) Die künstliche Beschränkung der Anzahl der Zitate
Die meisten Autoren gehen sehr sparsam mit der Anzahl der Zitate um. Falls die Arbeit eine bestimmte Länge nicht überschreiten soll, wird sicher bei den Referenzen gespart, was vom Gesichtspunkt des Verfassers verständlich ist. Wie die meisten durchgeführten Versuche zeigen, fehlt es an einer Erziehung des Zitierens, die nichts anderes als Berücksichtigung und Anerkennung der Arbeiten der Kollegen bedeuten würde.
f) Ein wichtiger Einwand gegen die Zitatanalyse ist die absichtliche Weglassung von Zitaten aus Konkurrenzgründen.
In fast jedem Gebiet der Wissenschaft bilden sich häufig Gruppen von Wissenschaftlern, die einander konkurrieren und deshalb wenig, wenn nicht gar kein Interesse haben, die Ergebnisse oder Verdienste ihrer Konkurrenten zu verbreiten oder zu zitieren.
In seiner schon oben erwähnten Untersuchung über die Zitierungsgründe hat sich P. Vinkler auch mit den Gründen für die Auslassung eines Zitats beschäftigt. Er fand, dass Zitate aus folgenden Gründen ausgelassen werden:
- 10%, weil die Arbeit noch nicht bekannt war (in dieser Arbeit Grund a)
- 42 %, weil der Autor diese Arbeit nicht so wichtig fand
- 26 %, durch Eingemeindung (b)
- 6 %, weil das Dokument nicht verfügbar war (d)
- 6 %, weil das Dokument falsche Behauptungen beinhaltet
- 10 %, aus anderen Gründen.
In der Studie von Vinkler fehlt leider der Grund, nach dem eher der Review- Artikel eines bekannteren Wissenschaftlers bevorzugt wird. Dieses Ergebnis zeigt jedoch, dass nur etwa 50% der Auslassungen korrekt waren. Gegen solche Vorkommnisse zeigt die Zitatanalyse kein Rezept auf. Die Lösung dieses Problems kann nur von den Wissenschaftlern
3) Das Selbstzitieren
Zu einem gewissen Grade ist das Selbstzitieren gerechtfertigt, weil eine Veröffentlichung oft auf früheren Arbeiten des Verfassers beruht. Das Selbstzitieren kann aber die Anzahl der Zitierungen kaum wesentlich erhöhen, und so die bibliometrische Untersuchung verfälschen.
Außerdem wäre Ausschließen der Selbstzitierungen EDV-mäßig sehr leicht zu erreichen. Bei einer Online-Recherche würde der Befehl " Not Author = " genügen, um Selbstzitierungen ausscheiden zu lassen.
Schwieriger zeigt sich die Ausscheidung von Selbstzitierungen bei Arbeiten, bei denen der Autor nicht als Erstgenannter aufscheint. Dieses Problem fällt aber schon unter:
4) Die Mehrverfasserschaft
Sie wurde schon bei der Verwendung der Anzahl der Veröffentlichungen als bibliometrischer Indikator als Schwierigkeit erwähnt.
Sie kann auch die Interpretation von Zitatanalysen beeinflussen, wie D. Lindsey in seiner Untersuchung gezeigt hat. Vor der Durchführung einer Zitatanalyse über das Werk eines bestimmten Wissenschaftlers wird dessen Bibliographie benötigt, um seine Arbeiten mit anderen Autoren nachweisen zu können. Falls alle Arbeiten, bei denen er als Mitverfasser mitgewirkt hat, nachgewiesen wurden, wie kann sein eigener Verdienst bei jedem Beitrag eingeschätzt und angerechnet werden? Lindsey plädiert für die Einführung einer Korrektur für Mehrverfasserschaft. Solange der einzelne Beitrag jedes Mitwirkenden nicht herauszufinden ist, scheint ihm eine Teilung der Zitate durch die Anzahl der Autoren logisch.
Die Mehrverfasserschaft kommt zunehmend in den meisten Fachgebieten zum Ausdruck. Ein extremes Beispiel gibt ein Artikel aus der Zeitschrift New England Journal of Medicine aus 1993, der von 972 Autoren verfasst wurde aber weniger als 2000 Wörter enthält (d.h. 2 Wörter pro Autor).
5) Gefälligkeitszitierung oder willkürliche Schenkung von Zitaten
Aus Sympathie- oder Allianz gründen können Wissenschaftler einander in übertriebenen Verhältnissen zitieren. Diese Überzitierung ist das Gegenteil von der Auslassung von Zitaten aus Konkurrenzgründen (siehe 2)e)), und für sie gelten die gleichen Kommentare, wie sie schon im obigen Paragraphen diskutiert wurden.
6) Kritische und negative Zitationen
Es wird häufig angenommen, dass kritische und negative Zitate eine Verfälschung der Zitatanalyse zugunsten der "schlechten" Arbeiten bewirken könnten. Jedoch zeigt die Erfahrung, dass"schlechte Arbeiten" kaum zitiert werden. Die meisten Wissenschaftler finden keine Zeit, sich mit solchen Arbeiten zu beschäftigen oder ihnen Beachtung zu schenken. Kritische Zitate sind viel häufiger, haben aber auch bibliometrischen Wert. Kritisch zitierte Arbeiten waren für die zitierenden Autoren genügend wertvoll, um bestritten zu werden, vielleicht weil sie aus ihren Fehlern gelernt haben, oder ganz einfach als Referenz oder Vergleich benützt werden konnten.

7) Die Abhängigkeit vom Fachgebiet
Es wurde schon mehrmals signalisiert, dass die Zitatanalyse sehr stark vom Fachgebiet abhängt. Zum Beispiel erhalten in der Biochemie Artikel im Durchschnitt mehr als 30 Referenzen, in der Mathematik hingegen weniger als 10. Genauso wird in manchen Gebieten viel häufiger veröffentlicht als in anderen. In der Physik zum Beispiel enthalten die Arbeiten über Festkörperphysik viel weniger Zitate als jene über Kern- oder Hochenergiephysik; diese letzten sollen jedoch mehr organische Zitate als jene über Kern- und Festkörperphysik enthalten.
Das Altern der Literatur hängt auch vom Fachgebiet ab. Berücksichtigt man das Alter der zitierten Dokumente, findet man, dass ein großer Anteil der Zitate auf Literatur der letzten Jahre entfällt. Zum Beispiel beträgt die mittlere Halbwertszeit in der Physik 4.6 Jahre (d.h. die Hälfte der Referenzen in physikalischen Zeitschriften datieren von den 4.6 Jahren nach Erscheinen des Artikels), in der Chemie 8.1 Jahre. Diesen aus der Kernphysik stammenden Konzept der Halbwertszeit oder Halbleben, hat Price für die Einschätzung der sogenannten "Härte" einer Wissenschaft (engl. hard science) verwendet.
Nach seiner Definition weisen große Halbwertszeiten auf wenig "harte", wenig "wissenschaftliche" Zeitschriften hin. Während z. B. in den physikalischen Zeitschriften 60% der Referenzen aus den ersten 5 Jahren stammen, sind es in der englischen Literatur nur 10% . Nach Price ist die Physik die "harte Wissenschaft par excellence" (sehr wissenschaftlich), während die englische Literatur eine "nicht so harte" ist.
Solche Unterscheidungen bewirken, dass die Wahrscheinlichkeit der Zitierungen vom Fachgebiet abhängt. Interdisziplinäre Zitatanalyse sollte diese Tatsache nicht unbeachtet lassen.

8) Die Abhängigkeit vom Informationsträger.
Nicht alle Informationsträger werden gleich oft zitiert. So werden Zeitschriften und Bücher mehr zitiert als Reports, Tagungen, und "graue" Literatur. Selbst bei den Zeitschriften allein gibt es große Unterschiede, wie z. B.: die geographischen; so ist die Anzahl der Zitate in russischen Zeitschriften viel kleiner als in amerikanischen, europäischen oder japanischen. Dafür enthalten die amerikanischen Zeitschriften im Durchschnitt mehr organische Zitate als die russischen. Selbst bei den aus gleichem Landstammenden Zeitschriften gibt es welche, die viel häufiger gelesen werden, und deshalb eine größere Wahrscheinlichkeit des Erhaltens von Zitierungen aufweisen.
Um den Impakt der Zeitschriften einschätzen zu können, wurde der sogenannte Impaktfaktor (engl. impact factor) einer Zeitschrift von E. Garfield eingeführt. Die Anzahl der Zitierungen, welche die Gesamtheit der Artikel einer wissenschaftlichen Zeitschrift erhält, könnte schon als ein Indikator ihrer Benutzbarkeit betrachtet werden. Allerdings würden dann umfangreiche Zeitschriften (Zeitschriften mit vielen Artikeln) von vornherein bevorzugt werden gegenüber solchen, die nur wenige Artikel enthalten, und häufig erscheinende Periodika gegenüber seltener erscheinenden. Aus diesem Grund wird die Anzahl der Zitierungen, die in einem bestimmten Zeitraum (üblicherweise ein Zitierungsjahr) auf die Artikel eines Journals aus einem davor liegenden Zeitraum (üblicherweise die beiden Jahre vor dem Zitierungsjahr) fallen, durch die Anzahl dieser Artikel dividiert. Dieser relative Wert wird "impact factor" genannt. Der "impact factor" selbst berücksichtigt nicht den Einfluss von Review-Artikeln.
Jährlich erscheinen in SCI/JCR die Listen der Impaktfaktoren der "wichtigsten" Zeitschriften.
Hier ist auch das nach Garfield benannte "Garfield's law of concentration" (Konzentrationsgesetz) zu berücksichtigen, das nichts anderes als eine Erweiterung des Bradfordschen Gesetzes ist, und nach dem eine relativ kleine Anzahl von Zeitschriften für die große Mehrheit der Veröffentlichungen in einem bestimmten Fachgebiet sorgt, eine überproportional große Zahl von Zitierungen auf sich vereinigt und dadurch einen sehr hohen "Impact Factor" erhält. Dieser Konzentrationseffekt wird verwendet, um die sogenannten "Kernzeitschriften" eines Fachgebietes zu ermitteln.
Diese Tatsache würde Veröffentlichungen aus diesen "privilegierten" Zeitschriften bei Zitatanalysen, wie zum Beispiel der Auswahl der "citation classics" sehr stark begünstigen. Um dieses Problem zu vermeiden, wird es in diesem Fall (Zeitschriften mit kleinem Impaktfaktor) die klassische Häufigkeitszitierungsgrenze auf 100 statt der üblichen 400 herabgesetzt.
9) Die Abhängigkeit von der Art der Arbeit.
Es wird behauptet, dass methodologische Arbeiten immer häufiger zitiert werden, während Theorien und Begriffe durch Eingemeindung im Vergleich weniger Zitate erhalten. Als Illustration dieser Tatsache wird immer die Arbeit von O.H. Lowry erwähnt, in der eine neue Methode zur quantitativen Eiweißbestimmung dargelegt wird und welche einen Rekord an Zitierungen (mehr als 100.000 seit 1951) erhält. Der große Impakt dieser Arbeit bezieht sich nicht darauf, eine methodologische Arbeit zu sein, sondern eine neue Orientierung in diesem Gebiet eröffnet zu haben. Dass diese Arbeit mehr als z. B. die berühmte von Einstein zitiert wird, bedeutet aber sicher nicht, dass sie wichtiger ist. Diese Tatsache, am allerhäufigsten zitiert zu werden, drückt einfach aus, dass sich mit dieser Arbeit derzeit sehr viele Forscher befassen, und dass sich darin die aktuellen Interessen der wissenschaftlichen Gemeinschaft widerspiegeln. Eine ungewöhnlich hohe Zitierungshäufigkeit einer bestimmten Arbeit könnte auch unter besonderen Bedingungen als Anomalie betrachtet werden.

Um diese Probleme (7, 8 und 9) zu vermeiden, schlagen Small & Sweeney den "fractional citation counting" vor. Bei der "Teilanzahl der Zitate" wird nicht die Summe der Zitate sondern deren Bruchteil als Referenz (d.h. 1 dividiert durch die Länge der Referenzliste) berücksichtigt. Erscheint das Zitat in einer Liste von 14 Referenzen, so beträgt dessen "fractional citation countig" nur 1/14.
(Beispiel)

Eine andere Möglichkeit, diese Probleme zu berücksichtigen, ist die Verwendung des sogenannten "bibliometrischen Umfeldes" ("Environment of a scientific publication"). Dieses Umfeld bildet die für jede Analyse ausgewählte Sammlung von wissenschaftlichen Arbeiten, mit denen die betrachteten Arbeiten verglichen werden. Obwohl viele Methoden zur Definition dieses Umfelds vorgeschlagen wurden, hängt seine Auswahl sehr stark von Eigenschaft und Zweck der Studie ab.

Abschließend möchte ich folgende Worten von E. Garfield zitieren:
"...The citation is a precise, unambiguous representation of subject that requires no interpretation and is immune to changes in terminology. In addition, the citation will retains its precision over time. It also can be used in documents written in different languages.."

7. Zitate als Retrievalmethoden

I. Kozitation oder Zitatengruppenanalyse oder engl. Clusteranalysis

Diese Analyse beruht auf zwei Hypothesen:
1) werden zwei Arbeiten von einer dritten gemeinsam zitiert, so gibt es eine kognitive Verknüpfung zwischen beiden, und
2) die Stärke dieser Verknüpfung wird von der Häufigkeit angegeben, mit der die beiden Zeitschriften zusammen zitiert werden.
(Garfield's Formel: S = Co-citations of A+B / (Totalcitations A+B) - (Co-citations of A+B))
Die Gruppe von Arbeiten, die mit einer bestimmten, festgelegten Häufigkeit gemeinsam zitiert werden, bildet ein Cluster. Das Konzept der Cluster oder Gruppen des gemeinsamen Zitierens wurde gleichzeitig von G. Small in Philadelphia und von I.W. Marschakowa in Moskau entwickelt (1973). So werden Cluster oder Verbindungen zwischen Clustern aufgebaut. Die Cluster beziehen sich auf Fächer oder Gebiete, ihre Verbindungen auf interdisziplinäre Beziehungen. Diese Analyse bietet die Möglichkeit, die Struktur der Fachgebiete und deren Beziehung zueinander zu erforschen, sowie die neuen Brennpunkte der Forschungsfronten zu identifizieren. Im "ISI-Atlas of science" wurden verschiedene Ebenen von Cluster verwendet, um "Vernetzungskarten" (engl. nested maps) aufzubauen (mapping science).

Andere Beispiele 2004

Mapping Scientific Publications (Abschnitt aus Ref. Nr. 18)
Diese Methode eignet sich gut für die Analyse und Visualisierung der Struktur und Entwicklung der Wissenschaft und wird in der "science policy" (Evaluation und Kontrolle der Wissenschaft) angewendet.

Praktisches Beispiel von "Cocitation- und Clusteranalyse liefert das Verzeichnis ISR.
Sie zeigt den gleichen Nachteil wie alle Zitatanalysen, und nämlich dass diese immer eine bestimmte Verzögerung mit sich tragen. Diese Verzögerung wird von der notwendigen Zitierungszeit angegeben.
Zitate sind ein "retrospektiver" bibliometrischer Indikator. Diese Verzögerung vermeidet aber die:

II. Bibliographische Kopplung (engl. bibliographic coupling)
Dieser Terminus wurde von Kessler 1963 eingeführt. Zwei Dokumente sind bibliographisch gekoppelt, wenn ihre Referenzenlisten eine oder mehrere Arbeiten teilen. In der bibliographischen Kopplung werden jüngere Arbeiten verbunden, da sie gleiche ältere zitieren. In der Clusteranalyse werden hingegen ältere Arbeiten verbunden, da sie später von jüngeren Arbeiten zusammen zitiert werden.
Die bibliographische Kopplung ist eine innere, statische Verbindung der Dokumente, während die Clusteranalyse eine äußere, dynamische ist.
Der Nachteil der bibliographischen Kopplung ist, dass sie subjektiver Art ist. Die Beziehung zwischen den Dokumenten erfolgt nach den Angaben ihrer eigenen Autoren (die Referenzen werden vom Autor selbst angegeben).
Die bibliographische Kopplung wird im SCI unter dem Befehl "Related Records" (Themenverwandte Dokumente) verwirklicht.

8. DAS VERZEICHNIS DER VERZEICHNISSE: SCI

I. Der SCI als Datenquelle
Der SCI (SCIENCE CITATION INDEX: an international interdisciplinary index to the literature of science, medicine, agriculture, technology, and the behavioral and social sciences) wird von ISI (= Institute for Scientific Information, Philadelphia) seit 1963 herausgegeben (The scientist).
Als Vater dieses Verzeichnisses gilt der amerikanische Chemiker und Bibliothekar Eugene Garfield.

Historical Overview
1960 gründete er das ISI für die Produktion und die Vermarktung des Current-awareness-Dienstes "Current Contents". Garfields größter Erfolg ist jedoch die Weiterentwicklung des in der Rechtsprechung bereits seit langem bekannten Zitierindexes, der "Shepards Citations", gedacht als Nachweis für Präzedenzfälle, die im amerikanischen Rechtssystem eine entscheidende Rolle spielen. Mit dessen Hilfe können alle juristische Entscheidungen, die auf einem bestimmten dokumentierten Fall aufbauen, ihn also zitieren, ermittelt werden.
Die Idee der inhaltlichen Erschließung und Kopplung von Dokumenten über Zitate wurde schon seit Mitte der fünfziger Jahre in den Vereinigten Staaten diskutiert.
Die Verweigerung staatlicher Unterstützung für die Publikation eines beim ISI entwickelten Pilotindexes bewog Garfield das Produkt unter dem Namen SCI ab 1963 selbst zu vermarkten. Damit wurde das Konzept der "Shepards Citations" auf den Bereich der Naturwissenschaften übertragen.
Dieses Verzeichnis ermöglicht sowohl eine Erschließung in Zeitrichtung (Source) als eine gegen die Zeitrichtung (Citation).
1998 erreichte der SCI einen Umfang von ca. 20 Millionen ausgewerteten Dokumenten ("source documents") und über 300 Millionen Zitaten ("citations"). Damit ist er in seiner Größe einzigartig.
Seit 1973 wird der "Social Sciences Citation Index", seit 1978 der "Arts and Humanities Citation Index" herausgegeben.

II. Aufbau des interdisziplinären Verzeichnisses

Der SCI ist eine internationale Zeitschrifteninhaltsbibliographie mit fachlicher Beschränkung auf die Naturwissenschaft, Technik, Medizin und die Verhaltenswissenschaft. Er ist eine fachübergreifende Sammlung bibliographischer Daten aus Fachzeitschriften, die in gedruckter sowie maschinenlesbarer Form als Datenbank angeboten wird. Zum naturwissenschaftlich orientierten SCI kam 1973 der Social Science Citation Index (SSCI) (bis 1972 waren auch die Sozialwissenschaften einbezogen) und 1978 der Arts and Humanities Citation Index (A&HCI) dazu. Zur Erstellung wird zur Zeit insgesamt ein Kernsatz von zusammen 8000 Fachzeitschriften ausgewertet. Für die naturwissenschaftlichen Disziplinen einschließlich Medizin sind es rund 5300 Zeitschriften mit zur Zeit jährlich ca. 650.000 Veröffentlichungen und über 12 Millionen Zitierungen. Dieser Kernsatz umfasst zwar nur etwa 10 Prozent der gegenwärtig weltweit periodisch erscheinenden wissenschaftlichen Zeitschriften, deckt damit aber mehr als 90 Prozent aller Zitierungen ab. Die Auswahl der Kernzeitschriften ist nicht statisch, sondern wird jährlich nach einer Reihe von Kriterien aktualisiert, wobei die Zitierhäufigkeiten eine wesentliche Rolle spielen.
Es scheint zunächst widersinnig, dass eine Datenbank, die selbst keine inhaltliche Wertung von Forschungsergebnissen vornimmt, trotzdem als Instrument für eine Bewertung geeignet sein kann. Doch es gibt ein wesentliches Merkmal, das den SCI von anderen Literatur-Datenbanken unterscheidet und ihn zugleich einmalig macht: In dieser Datenbank sind von jedem Originalartikel neben den bibliographischen Angaben (Titel, Autoren, Quelle) und dem Abstrakt (Inhaltskurzfassung) zusätzlich die Liste aller Literaturverweise (Referenzen) im Anhang der Publikationen gespeichert und durchsuchbar. Dieser Referenzenteil ist sozusagen das Markenzeichen des SCI, der damit die Doppelfunktion einer Literatur- und einer Referenzen-Datenbank einnimmt. Dadurch ist es möglich, alle Veröffentlichungen zu finden, die eine bestimmte Publikation (oder die Publikationen eines Wissenschaftlers, eines Instituts oder eines Fachgebietes usw.) zitieren.

Dieser Index besteht aus folgenden Teilen:

1) SOURCE INDEX: seit 1955 - (bald seit 1945!) enthält die zitierende Literatur:
Aufsätze aus ca. 3.300 Periodika aus allen Ländern in originalen Sprachen
Fachliche Beschränkung auf die Naturwissenschaft, Technik, Medizin und Verhaltenswissenschaft
Titelaufnahme:
Verfasser, Mitverfasser, Sachtitel (engl. + Originalsprache), Art des Beitrages (Letter, Note, Review), Quelle (Abkürzung), Band, Heft-Nr.,
Seitenangabe, Jahrgang, Anzahl der Referenzen, Anschrift des ersten Verfassers
+ Verzeichnung der Co-Autoren (Verw. auf 1.Verf.)
+ Referenzenliste
+ Abstrakt
Anhang: Aufsätze ohne Verfasserangabe (Titel der Zeitschrift)
+ Rezensionen aus 2 Zeitschriften: "Nature" und "Science"

2) CITATION INDEX:
enthält die zitierte Literatur. Sämtliche in den Aufsätzen zitierte Schriften ohne Einschränkungen, aus allen Ländern, in allen Sprachen, aus allen Erscheinungsjahren, aus allen Schriftenklassen
Titelaufnahme:
Erst genannter Verfasser (NUR DER ERSTE), Erscheinungsjahr.- Jahr, Titel oder Zeitschriftentitel (abgekürzt) (kein T. d. Aufsätze), Band, Seit

3) CORPORATE INDEX:
Register zum Source Index:
Titelaufnahme
Hauptteil:
"Geographic section": Institutionen, denen die Autoren d. Aufsätze des Source Index angehören
Nebenteil: "Organization section": Institutionen nach Namen, verweist auf "Geogr. Section"

4) PERMUTERM SUBJECT INDEX (PSI): 1965 -
Stichtwortregister "Permuterm" als Sach-Erschließung
List of full stop words
List of semi-stop words
(verweist auf d. 1. Verfasser.)

5) JCR - JOURNAL CITATION REPORTS (JCR):
"A bibliometric analysis of science journals in the ISI database".
Seit 1975: Eine statistische Analyse der erschlossenen Zitierzusammenhänge. JCR bietet auch "ranking lists" (Ranglisten nach verschiedenen Parametern, siehe unten:Bibliometrische Indikatoren der JCR)
Die Datenbank setzt sich aus JCR Science Edition (ca. 5700 Zeitschriften) und JCR Social Science Edition (ca. 1700 Zeitschriften).
Insgesamt werden rund 7000 Zeitschriften aus der ganzen Welt in rund 200 Fachkategorien ausgewertet.
Der JCR erscheint einmal jährlich (gewöhnlich Ende Juni oder im August) in gedruckter Form und auf CD-ROM. Er ist auch über das Netz erreichbar.
Er entstand als Hilfsmittel für Bibliothekare und Wissenschaftler für die Organisation und Auswertung bibliothekarischer Zeitschriftenbestände, aber dient auch bereits zur Evaluierung von einzelnen Forschern, was nicht sinnvoll ist.

Kumulierungen des Titelmaterials u. aller Register (Papierform):
jährlich + 5-Jahres-Kumulierung.
10-Jahres-Kumulierung.: 1955-64

Die Berichtszeiträume der vier Teile des SCI sind:
1) Source Index (Quellen-Index): ab 1955
2) Permuterm subject index: ab 1966
3) Citation index: ohne rückwärtige Grenze
4) Journal Citation Reports: ab 1975.

Seit 1973: SSCI - Social Sciences Citation Index (Sozialwissenschaften)

Seit 1978: AHCI - Arts and Humanities Citation Index (Geisteswissenschaften)

III. Bibliometrische Indikatoren der JCR
Definitionen der verwendeten bibliometrischen Indikatoren:

1) Die Zitierrate (Total Citations): Zahl aller Zitate, die auf eine bestimmte Zeitschrift oder ein bestimmtes Dokument im untersuchten Zeitperiode entfallen sind.

2) Impact Factor (Impaktfaktor): Anzahl d. Zitierungen / Anzahl d. Artikel
Anzahl d. Zitierungen = alle Zitierungen, die in dem Zitierungsjahr auf die Artikel des betrachteten Journals in einem bestimmten Zeitraum (die beiden Jahre vor dem Zitierungsjahr) entfallen sind / Anzahl d. Artikel in diesen zwei Jahren
Zwei Jahre werden als Zeitraum betrachtet. Garfield rechtfertigt dies damit, daß der durchschnittliche Artikel am häufigsten während der zwei Jahren nach seinem Erscheinungsjahr zitiert wird.
Für manche Fachgebiete ist tatsächlich eine Zeitspanne von 5 Jahren angemessener. ISI bietet auch einen fünfjährigen Impact Faktor.
Eine Ausschließung der Selbstzitierungen wird auch mittels eines revidierten IF-s (Gesamtzahl der Zitierungen minus Selbstzitierungen) angeboten.
Titeländerungen der Zeitschriften sollen bei der IF Berechnung berücksichtigt werden.
Da der IF stark abhängig vom Fachgebiet ist, führte 1987 als erster Hirst einen "Discipline Impact Factor" (Anzahl aller Zitierungen zu Artikeln in Kernzeitschriften eines bestimmten Fachgebietes) ein.
Meiner Meinung nach wäre ein besserer Vorschlag, den IF der Zeitschrift durch den mittleren IF des Fachgebietes, zu dem diese Zeitschrift zugeordnet ist, zu dividieren (ein "Gewichteter IF= GIF").

3) Immediacy Index (Unmittelbarkeitsfaktor oder Zitierschnelligkeit):
Wie viele Artikel einer Zeitschrift noch innerhalb desselben Jahres zitiert worden sind; dabei wird die Anzahl der Zitierungen, die in diesem Jahr für Artikel aus dem gleichen Jahr gezählt wurden durch die Anzahl der in dieser Zeitschrift im gleichen Jahr veröffentlichten Artikel dividiert (ist > 1, wenn einzelne Artikel noch im selben Jahr mehrmals zitiert werden). Dieser Indikator soll ein Maß dafür sein, wie schnell der durchschnittliche Artikel einer bestimmten Zeitschrift zitiert wird, d.h. er misst die Geschwindigkeit der Informationsverbreitung.
Zeitschriften, die wichtige Informationen über neueste Forschungsarbeiten publizieren, werden die Aufmerksamkeit der Wissenschaftler schneller auf sich ziehen.

4) Half-Life (Halbwertszeit):
Man spricht vom Altern der Information und in Analogie zum radioaktiven Zerfall auch von der Halbwertszeit wissenschaftlicher Literatur und meint damit die Zeit, nach der die Zitierungsrate auf die Hälfte ihres anfänglichen Wertes abgesunken ist. Die oben genannten Indikatoren benachteiligen Zeitschriften in Fachgebieten mit großen Halbwertszeiten, da sie insgesamt nur die drei aktuellsten Jahre berücksichtigen. Um für solche Zeitschriften größere Zeiträume einzubeziehen, werden "Citing Half-life" (Halbwertszeit von Zitaten) und "Cited Half-life" (Halbwertszeit von Zitierungen) eingeführt. Citing Half-life bezieht sich auf die Alterstruktur der Referenzen in einer Zeitschrift und bestimmt, vom aktuellen Jahr an rückwärts gerechnet, den Zeitraum, in dem sich 50% aller Referenzen befinden (Zeit, von der die Hälfte der Referenzen einer Zeitschrift in dem betrachteten Jahr stammen).
Cited Half-life bezieht sich auf die Altersstruktur der Zitierungen, die auf eine Zeitschrift entfallen und bezeichnet analog den Zeitraum, in dem 50% aller Zitierungen liegen. Beide messen das Veralten (engl. "obsolescence") und die "Härte" (engl. "hardness") der Zeitschrift.

IV. Aufbau von JCR
Die Zitierdaten der untersuchten Zeitschriften werden dem Benutzer in folgenden Abschnitten angeboten:

1. Abschnitt: "Journal Rankings"
Er dient als Überblick über die wichtigsten Daten und listet sie nach sechs verschiedenen Kriterien auf:
Liste 1 ordnet die Zeitschriften in alphabetischer Ordnung
Liste 2 ordnet die Daten nach Gesamtzitierungen
Liste 3 nach Impact Factor
Liste 4 nach Immediacy Index
Liste 5 nach der Anzahl der veröffentlichten Artikel
Liste 6 nach der Zahl der auf die beiden vorangegangenen Jahre entfallenen Zitierungen

2. Abschnitt: "Source data listing"
Er liefert eine Referenzenanalyse aller Quellenzeitschriften. Jeder Artikel wird nach Typ klassifiziert: Review oder Non-review Artikel. Als Review gilt ein Artikel, der mehr als 100 Referenzen oder das Wort "review" im Sachtitel oder in seiner Beschreibung enthält. Für jede Artikelklasse sowie für beide Klassen gemeinsam wird die Zahl der Artikel, die Anzahl der darin erscheinenden Zitate und der Quotient aus diesen Werten bestimmt. Dieser Abschnitt beantwortet die Frage, ob und in welchem Umfang eine Zeitschrift Review-Artikel veröffentlicht.

3. Abschnitt: "Journal half-life listing"
Dieser Abschnitt bietet in drei Listen Informationen über Halbwertszeiten von Referenzen und Zitierungen von Zeitschriften.
Liste 1 listet für die zehn aktuellsten Jahre die kumulierten Prozentanteile an den Gesamtreferenzen auf. Daraus wird für jede Zeitschrift, die mindestens 100 mal in diesem Jahre zitiert worden sind, das Citing Half-life bestimmt.
Liste 2 listet die kumulierten Prozentanteile an den Gesamtzitierungen auf. Daraus wird, für jede Zeitschrift, das Cited Half-life bestimmt.
Liste 3 ordnet die Zeitschriften nach diesem Merkmal.

4. Abschnitt: "Subject category listing"
Er ordnet die ausgewerteten Zeitschriften einem oder mehreren Fachgebieten zu. Innerhalb der Gruppe werden die Zeitschriften nach deren Impact Factor gereiht. Das Cited Half-life wird auch angegeben.
Ein Register zu dieser Liste verzeichnet zu jeder Zeitschrift die ihr zugeordneten Fachgebiete.

5. Abschnitt: "Citing journal listing"
Für jede Zeitschrift erfolgen die Angaben, welche Zeitschriften und wie häufig sie zitiert hat.
(Folie 17)

6. Abschnitt: "Cited journal listing"
Für jede Zeitschrift erfolgen die Angaben, von welchen Zeitschriften und wie häufig sie zitiert wurde.

Zusätzlich werden alle verzeichneten Zeitschriften nach deren Abkürzung aufgelistet (List of the full titles of citing/cited journals arranged alphabetically by abbreviation).
Die Abkürzung verweist auf den Volltitel. Titeländerungen werden auch alphabetisch verzeichnet (Journal Titel Changes)

V. SCI auf CD-ROM

VI. SCI online

Als Beispiele dienen folgende Online Recherchen in SCI:
1) Wie häufig wird Prof. Hans-Peter Karnthaler zitiert?
2) Wie häufig wird Albert Einstein zitiert?

VII. SCI im Internet

SCI ist im Internet unter "Web of Knowledge" zu finden:

Web of Science*:
The Web of Science (WoS) provides access to over 22 Million bibliographic records covering all fields of research from the past 25 years. It includes the Science Citation Index Expanded, the Social Sciences Citation Index and the Arts & Humanities Citation Index.

Unter "General Search" wird die Suche im Source-Teil durchgeführt:

Die Ergebnisse erhält man in folgender Form:

Durch Anklicken des Links "Cited References" erhält man die zitierten Arbeiten (d.h. die Liste der Referenzen dieser Artbeit):

Durch Anklicken des Buttoms "Find Related Records" erhält man die mit dieser Arbeit ("parent article") bibliographisch gekoppelten Arbeiten:

Unter "Cited Ref Search" wird die Suche im Citation-Teil durchgeführt:

Man erhält folgende Liste der Ergebnisse:

Mit dem Buttom "Search" kann man die zitierende(n) Arbeit(en) finden:

"Select Page" ermöglicht alle zitierten Arbeiten dieses Blattes zu selektieren

und "Search" die zitierenden Arbeiten zu suchen:

Mit "Advanced Search" kann man Recherchen im Source-Teil mit anderen aus dem Citation-Teil verknüpfen:

So kann man zum Beispiel die Selbstzitierungen ausschließen:

Die nicht benötigten Sets kann man mit "Delete Sets" löschen.
Die anderen Sets können auch mit "Save History" gespeichert werden und später mit "Open Searchs" geöffnet werden.

JCR : Journal Citation Reports* :
The two editions of the JCR provide citation data (e.g. journal impact factors) of nearly 5.000 science journals and 1,700 social sciences journals.

Die Suche kann auch in einem bestimmten Fachgebiet (Subject Category) durchgeführt werden:

Die Ergebnisse werden alphabetisch geordnet:

Die können aber auch nach anderen Kriterien (wie z. B. Impact Factor) sortiert werden:

Durch Anklicken des Zeitschriftentitels erhält man die bibliometrische Analyse dieser Zeitschrift:

Unter "Cited Journal" findet man die Zeitschriften, die diese zitieren:

Unter "Citing Journal" findet man die Zeitschriften, die von dieser zitiert werden:

Unter "Trends" kann man sogar die Änderung des Impaktfaktores in den letzten 5 Jahren verfolgen:

Essential Science Indicators (ESI)

Eine bibliometrische Analyse von sowohl Wissenschaftlern, Körperschaften und Ländernals auch Zeitschriften und Artikeln mittels der oben erwähnten Indikatoren wird auch im Internet angeboten und ständig "updated": ISI-Essential Science Indicators.
Essential Science Indicators was updated on January 1, 2003 to cover ten years plus ten months, January 1992 - October 31, 2002

provides internet access to a unique and comprehensive compilation of essential science performance statistics and science trends data derived from ISI's databases. The chief indicators of output, or productivity, are journal article publication counts. For influence and impact measures, ESI employs both total citation counts and cites per paper scores. The former reveals gross influence while the latter shows weighted influence, also called impact.

Unter Citation Rankings: Scientists kann man finden, wie häufig ein bestimmter Forscher zitiert wird.
Nur die am meisten zitierten Autoren werden verzeichnet!
(For scientists the top 1% of names is selected for each of the fields.
Authors are selected for listing that meet a cumulative citation count threshold for the 10+ year period. The thresholds are based on the cutoffs given in the All Years column of the Baseline Percentiles table.
The absence of a scientist name means the author did not meet the citation threshold in any field, siehe Thresholds).

siehe aktuelle Information unter:
http://in-cites.com/thresholds-citation.html

Ein Vergleich mit anderen Forschern aus gleichem Gebiet wird auch angeboten:

Unter Citation Rankings: Institutions kann man finden, wie häufig eine bestimmte Körperschaft zitiert wird:
Nur die am meisten zitierten Körperschaften!
(For institutions the top 1% is selected for each of the fields, siehe Thresholds.
Institutions are selected for listing that meet a cumulative citation count threshold for the 10+ year period. The thresholds are set separately for each field. The thresholds are based on the cutoffs given in the All Years column of the Baseline Percentiles table.
The absence of an institution's name means that the institution did not meet the citation threshold in any field)

Ein Vergleich mit anderen Institutionen aus gleichem Gebiet (z. B. Materials Science) wird auch angeboten:

Unter Citation Rankings: Countries ist die gleiche bibliometrische Analyse für ein bestimmtes Land zu finden:
(for countries top 50%. Countries/Territories are selected for listing that meet a cumulative citation count threshold for the 10+ year period. The thresholds are set separately for each field. The thresholds are based on the cutoffs given in the All Years column of the Baseline Percentiles table.
The absence of a country or territory name means the country/territory did not meet the citation threshold in any field,
siehe Thresholds).

a) citations per paper:

b) Gesamtanzahl der Citations:

Unter Citation Rankings: Journals ist die gleiche bibliometrische Analyse für Zeitschriften zu finden:
(for journals top 50%, siehe Thresholds).

Unter Most Cited Papers: Highly Cited Papers (last 10 years) kann man die in den letzten zehn Jahren am meistens zitierten Arbeiten:

entweder nach dem Gebiet (Physics)

oder nach dem Land (Austria) oder Institution:

Unter Most Cited Papers: Hot Papers (last 2 years) ist die gleiche Bibliometrische Analyse innerhalb der letzten zwei Jahren zu finden:

Unter Citation Analysis Research - Baselines sind zwei andere bibliometrische Analysen zu benützen:

Unter Average Citation Rates wird die mittlere Zitierhäufigkeit je nach dem Fach errechnet (ein Paradebeispiel für die Abhängigkeit der Impaktfaktoren vom Fachgebiet):

(Erklärung: "A value of 9.11, for instance, in the field of Chemistry in 1996 indicates that the average paper in that year has since been cited 9.11 times).

Unter Percentiles wird die Anzahl der Zitierungen verstanden, die eine Arbeit in einem bestimmnten Fachgebiet benötigen wurde, um zum TOP 0,01, 0,10, 1,00 oder 10% in diesem Gebiet zu gehören.

Die Percentiles werden hier errechnet und zeigen, wie sich die Zitierhäufigkeit in einem bestimmnten Fachgebiet innerhalb der letzten zehn Jahren entwickelt hat:

To read this table:
The Percentiles page is divided into sections for each individual scientific field, with the "All Fields" section combining all data. Within each section are rows for the four percentile breakdowns (0.01%, 0.1%, 1%, and 10%). Data for the percentiles are given for the last 10 years, with the "All Years" column using all data for those years.
See the picture above. In the Chemistry portion of the table, a value of 66, for instance, in the 0.01% column for 1998 indicates that the top 0.01% of papers in chemistry journals in that year have since been cited a minimum of 66 times.

Unter Citation Analysis Research Fronts werden die Research Fronts ("current articles can be organized into subject areas according to the clusters of older papers that they cite in common") identifiziert:

Die können nach deren Namen oder innerhalb eines Fachgebietes gesucht werden:

d) ISIHighlyCited.com
…an expert gateway to the most highly influential scientists and scholars worldwide.

ISIHighlyCited.com ermöglicht eine schnelle und einfache Identifizierung der am meisten zitierten Forscher und Körperschaften (weniger als 0,5 %) zwischen 1981-1999.

"This freely accessible Web site gives research professionals working in a variety of occupations an invaluable tool to identify individuals, departments and laboratories that have made fundamental contributions to the advancement of science and technology in recent decades.

ISIHighlyCited.com reveals the face of research--the people behind the accomplishments in 21 broad subject categories in life sciences, medicine, physical sciences, engineering and social sciences. These individuals are the most highly cited within each category for the period 1981-1999, and comprise less than one-half of one percent of all publishing researchers--truly an extraordinary accomplishment.

ISIHighlyCited.com will grow to include the top 250 preeminent individual researchers in each of 21 subject categories who have demonstrated great influence in their field as measured by citations to their work--the intellectual debt acknowledged by their colleagues"

Allgemeine Hinweise:
Ganz angenehm sind die zahlreichen Optionen, die das Sortieren der Ergebnisse nach verschiedenen Kriterien ermöglichen.
In dem Teil Citation fällt außerdem die Einschränkung "nur erster Autor" aus, allerdings nur für diese Arbeiten, die in dem Source Teil verzeichnet werden.

e) National Science Indicators Database
Auch in Produkt von ISI. Eine bibliometrische Datenbank, die Angaben zu nationalen wissenschaftlichen Aktivitäten beinhaltet und eine Zeitspanne von 1981 bis 2003 umfasst.
Grundindikator für jedes Land ist die Zahl der Artikel aus den ISI Zeitschriften und deren Zitierrate. Die Daten sind nach Zeitraum in 24 Fachgruppen (Standard Version) bzw. in 105 (Deluxe Version) recherchierbar (siehe Instructions).
Die Zuverlässigkeit dieser Datenbank hängt von der Genauigkeit der gelisteten Adressen und deren richtige Bearbeitung in der bibliometrischen Analyse ab.

VIII. Kritik und Problematik

Allgemeine Kritik an SCI und an JCR:

1) Umfang des Datenmaterials:

Nur ca. 30 % aller weltweit erschienenen Zeitschriftenartikel werden von JCR ausgewertet.
Nur 19,4 % aller deutschen wissenschaftlichen Veröffentlichungen! Starke Vorliebe für amerikanische und englische Zeitschriften
Nur Zeitschriften (Forschungsberichte nicht eingeschlossen)
Wenige Inhaltskonsequenz
Unregelmäßigkeiten der Erscheinungsmodalitäten von Zeitschriften (z. B. Verändert eine Zeitschrift ihren Sachtitel, erscheint sie in den Rankings und im Citing Journal Listing nur mit ihrem aktuellen Titel)

Adequacy

2) Probleme der Zuverlässigkeit bei der Sammlung und Verarbeitung der JCR-Daten

3) Auswahlpolitik für auszuwertende Zeitschriften

4) Fehler bei der Verarbeitung der Zitierdaten
z. B. Lange (2001) entdeckte, dass JCR die Zeitschrift Education Research durch die Zitierungen der Zeitschrift Education Researcher, die nicht in JCR gelistet ist, über 20 Jahren lang aufwertete (13).

5) Die JCR-Daten sind nicht repräsentativ genug

6) Korrelation von Zitierfrequenzen aus Zitatanalysen und Benutzungs- und Bestellungsfrequenzen in Bibliotheken ist nicht so hoch wie erwartet (Gorraiz & Schlögl 2003) (14)

Assessment
Solutions

Kritik an "Impact Factor":

1) Kritik am Zeitraum der ausgewerteten Daten (aus den beiden letzten Jahren)
Zuerst Widersprach Garfield die Kritik, später allerdings änderte er seine Position und gestand ein, dass in bestimmten Disziplinen ein längerer Zeitraum doch angemessener wäre.

2) Kritik am Umfang der auszuwertenden und ausgewerteten Daten

3) Kritik an der Qualität der ausgewerteten Daten (Selbstzitierungen!, Titeländerungen)

4) Missverständnisse bei der Interpretation: Die Berücksichtigung der Artikeltypen ist eine Voraussetzung für eine genaue Interpretation.

5) Einfluss auf die Verlage und die Publikationsformen
("E. Garfield beherrscht mit absolutistischer Macht die wissenschaftliche Szene. Editors und Verleger von Journals, die zitiert werden wollen, geben sich in Philadelphia die Klinke in die Hand", Lindner)

6) JCR berücksichtigt bei der Berechnung des Impact Faktors Zitierungen zu allen Artikeln und Beiträgen, zählt allerdings nicht alle Dokumenttypen als veröffentlichte Arbeiten (Glänzel und Moed, 2002) (15)

7) Oft wird der IF für die Evaluierung individueller Artikel gleichgesetzt (siehe unten, the bibliographic method for evaluation of research). In manchen Ländern, wie Finnland, Ungarn oder Spanien, ist der IF offizieller Indikator bei der Bewertung des wissenschaftlichen Outputs.
Tatsache jedoch ist, dass bei einem Großanteil del Zeitschriften nur 20% der Artikel 80% der Zitierungen erreichen und ein hoher Prozentsatz nie zitiert wird. Zum Beispiel, in Nature sollten 69% der Artikel unter dem Durchschnitt liegen (16 % der Arbeiten verbuchen mehr als 50% aller Zitate für Nature). Hingegen gibt es Artikel in Zeitschriften mit niedrigem IF, die mehr als 400 Zitierungen erzielen.

The bibliographic method for evaluation of research
This method allots points to an article according to the impact factor of the journal in which it has been published (in general the higher the impact factor, the more difficult to get an article accepted) Such a correlation holds true only statistically but not on an individual article.
It allows easy comparison between individuals, institutions or regions.
Currently based on ISI List of “top” (ranking top 10 or 20%), “standard“(ranking between the top 10/20 and 60%) and “other” journals (different analyses: number of publications or impact per capita, gross national product, money spent for research, or per academic position and university)

8) Der h-Index wurde von Hirsch (2005) zur Bewertung der Forschungsleistungen einer einzelnen Wissenschaftlerin bzw. eines einzelnen Wissenschaftlers vorgeschlagen. Der Hirsch-Index ist nun diejenige Zahl, bei der die Rangnummer mit der Anzahl der Zitierungen übereinstimmt. Ein Hirsch-Index von beispielsweise 40 bedeutet, dass der betreffende Forscher 40 Arbeiten verfasst hat, die alle mindestens 40 Mal zitiert wurden.
("A scientist has index h if h of his/her Np papers have at least h citations each, and the other (Np-h) papers have fewer than h citations each")

Praktische Nachteile von SCI:

1) Nur erster Autor wird zitiert!
In Web of Science werden alle Autoren zitiert, allerdings nur für Artikel, die als Kern-Zeitschriften in der Datenbank indiziert werden.
2) Formale Fehler (Computer-generiertes Verzeichnis)
Sie können von den Autoren der Originaltexte verursacht oder während der verlegerischen Produktion entstanden sein. Diese Fehler sind in Abhängigkeit vom Arbeitsaufwand zum Teil korrigierbar (ca. 1% aller Bandangaben sind fehlerhaft), Mangel an Konsequenz!
3) Probleme mit Homographen (Autoren mit gleichem Namen)
4) teuer

9. Scopus: eine neue Alternative?
Das neue Navigationssystem Scopus™ von Elsevier ist ein Informationssystem, das die Vorteile der Recherche in klassischen Fachdatenbanken mit der Suche und Analyse von Literaturzitaten verbindet. Diese Datenbank, die von Reed Elsevier als Alternative zum ISI Science Citation Index entwickelt worden ist und am 3. November 2004 offiziell gestartet wurde, wird vom Produzenten als "World's Largest Database of Abstracts and Cited References" bezeichnet.
SCOPUS weist 27 Millionen Artikel (abstracts and citations) aus zirka 14.000 Peer-Reviewed Zeitschriftentiteln (d.h. Zeitschriften, deren Artikel von in der Regel wissenschaftlichen Gutachtern geprüft werden) nach, darunter 90% aus den Fachbereichen Medizin, Naturwissenschaften und Technik und
ca. 10% auch aus den Sozial- und Wirtschaftswissenschaften und der Psychologie.
Scopus zeichnet sich durch eine leicht zu bedienende Oberfläche und ermöglicht es darüberhinaus herauszufinden, wie oft Artikel zitiert wurden und das in einer Kollektion von mehr Fachzeitschriften und mehr Autoren als jemals zuvor.
Scopus wird ständig weiterentwickelt.

Kurzanleitung

Suchoberfläche
Die Suchoberfläche ist analog zu Science Direct gestaltet, hier sei daher nur auf einige Besonderheiten hingewiesen:

1) Abstract + Refs
Scopus erfasst – derzeit bis 1999 zurück – auch die Literaturhinweise (Referenzen) der Zeitschriftenaufsätze. Die Referenzen werden mit dem vollen bibliographischen Zitat angegeben und weisen ihrerseits den Link „Abstract + Refs“ auf, wenn der Artikel in Scopus erfasst wird.

2) Cited by
Die Auswertung der Referenzen ermöglicht die Angabe der Zitierungshäufigkeit (Zahl in der Spalte „Cited by“) und die Verlinkung zu den zitierenden Artikeln (klicken Sie auf die Zahl in der Spalte „Cited by“).

3) Fulltext – View at publisher
Elsevier hat - über das Elsevier-Produkt LinkFinder, nicht über SFX - Links zu Volltexten aus von der UB Innsbruck lizenzierten elektronischen Zeitschriften gelegt. Die Links sind durch einen Button „Fulltext“ kenntlich gemacht. Das bedeutet dann, dass ein Volltextzugang für Angehörige dieser Universität besteht.
Der derzeit bereits bei manchen Treffern vorhandene Button „View at publisher“ bedeutet, dass es beim jeweiligen Verlag einen elektronischen Volltext gibt.

Registrierung
Die Validierung erfolgt auf Grund der IP-Adresse Ihres Gerätes, eine Registrierung ist daher nicht notwendig.
Registrierte Benutzer können jedoch zusätzlich folgende Funktionalitäten benutzen:
My Alerts = regelmäßige Email-Benachrichtigungen, wenn neue Artikel zu einem bestimmten Thema oder ein neues Heft einer Zeitschrift erscheinen, bzw. wenn ein bestimmter Artikel zitiert wird
My Profile = Abspeichern von Suchprofilen
Die Registrierungsmöglichkeit finden Sie am Scopus-Bildschirm ganz rechts oben. Ihre Science-Direct-Kennung gilt auch in Scopus

Scopus im Vergleich zum Web of Knowledge
Scopus enthält über 90% der in SCI (Science Citation Index) und SSCI (Social Sciences Citation Index) erfassten Zeitschriften und darüber hinaus weitere 6.500 Zeitschriften. Der Anteil an europäischen Zeitschriften ist in Scopus deutlich höher als im Web of Knowledge.
Zitate ab Publikationsjahr 1999 enthalten die zitierten Arbeiten, und zwar als vollständiges bibliografisches Zitat und nicht in der von den Citation Indices bekannten, sehr abgekürzten Form.
Scopus ermöglicht daher wie die Citation Indices die Durchführung von Zitatanalysen: Bereits in der Trefferliste einer Suche in Scopus wird die Zitationshäufigkeit in der rechten Spalte "Cited by" dargestellt. Klickt man auf die Zahl, so werden die zitierenden Arbeiten aufgelistet. Die Zitationshäufigkeit wird auch für die in den Literaturhinweisen eines Aufsatzes genannten Artikel angegeben.
Die in Scopus angegebene Zitationshäufigkeit einer Arbeit muss mit der Zitationshäufigkeit im SCI nicht notwendigerweise übereinstimmen, denn:
a) In Scopus werden nur Zitationen in Arbeiten ab 1999 angezeigt, ältere Arbeiten erreichen daher im SCI oder SSCI eher mehr Zitationen.
b) In Scopus werden Zitationen in von Scopus erfassten Zeitschriften angezeigt. Da dies deutlich mehr Zeitschriften sind (14.500 im Vergleich zu ca. 9.000 in SCI und SSCI), kommen für Arbeiten ab 1999 unter Umständen mehr Zitationen zu Stande als bei einer Zitatanalyse im SCI oder SSCI.

Die ganze bibliometrische Infrastruktur (wie z. B. Impaktfaktoren der Zeitschriften), die von Garfield für SCI entwickelt wurde, fehlt aber!

Mehr Informationen unter scopus-info.

Vergleich der Inhalte Scopus und Science Citation Index - Ist mehr oder weniger Inhalt besser?
und
Beiträge: Themenschwerpunkt Web of Science - Scopus

10. SJR: SCImago Journal & Country Rank
Die neue Alternative zu JCR und ESI?
The SCImago Journal & Country Rank is a portal that includes the journals and country scientific indicators developed from the information contained in the Scopus® database (Elsevier B.V.). These indicators could be used to assess and analyze scientific domains.
This platform takes its name from the SCImago Journal Rank (SJR) indicatorpdf, developed by SCImago from the widely known algorithm Google PageRank™. This indicator shows the visibility of the journals contained in the Scopus® database from 1996.
SCImago is a research group from the University of Granada, Extremadura, Carlos III (Madrid) and Alcalá de Henares, dedicated to information analysis, representation and retrieval by means of visualisation techniques.
As well as SJR Portal, SCImago has developed The Atlas of Science project, which proposes the creation of an information system whose major aims is to achieve a graphic representation of the IberoAmerican Science Research. Such representation is conceived as a collection of interactive maps, allowing navigation functions throughout the semantic spaces formed by the maps.

SJR (SCImago Journal Rank): The SJR is an indicator that expresses the number of connections that a journal receives through the citation of its documents divided between the total of documents published in the year selected by the publication, weighted according to the amount of incoming and outgoing connections of the sources. See detailed description of SJRPDF.

11. Präsentation der Ergebnisse
Folgende Beispiele dienen als Muster:
a) Auswirkung einer individuellen Arbeit
b) Eminenz eines bestimmten Forschers: Beispiel 1 und Beispiel 2
c) Prestige und Leistung einer bestimmten Forschungsanstalt, (by citation impact oder by total citations), einer Firma oder eines Landes (Österreich 2002)
d) Internationale Vergleiche für ein bestimmtes Fachgebiet
e) Bei Zitatanalysen von Zeitschriften werden die Zitierfrequenzen aller in einer Zeitschrift enthaltenen Artikel summiert und die Summe als Maß für den Wert der Zeitschrift angesehen. Die Auflistung nach verschiedenen Kriterien ist die einfachste Art der Präsentation. Paradebeispiele liefern die Ranking-Listen der JCR. Unter Einsatz der elektronischen Datenverarbeitung sind auch mehrdimensionale Darstellungsarten entwickelt worden.
Besondere Beachtung finden die sogenannten "one-stepmaps" bzw. "two-step maps", bei denen jeweils diejenige Zeitschrift B bestimmt wird, die von einer Zeitschrift A am häufigsten und bzw. am zweithäufigsten zitiert wird. Dabei werden Selbstzitate, d.h. Zitate anderer Artikel der gleichen Zeitschrift nicht berücksichtigt. Bei der Einbeziehung einer definierten Menge von Zeitschriften entsteht ein Netzwerk, in dem die Zuordnung "A zitiert am häufigsten B" durch einen Pfeil repräsentiert wird.

Eine andere sehr gebrauchte Darstellungsmethode ist die Cluster-Analyse, nach der Zeitschriften, die sich gegenseitig häufig zitieren als andere, eine inhaltliche zusammenhängende Gruppe bzw. einen Cluster bilden.
Der Informationswert der Cluster-Analyse basiert auf der Verarbeitung einen großen Menge von elektronisch gespeicherten Zitierdaten und eines ausgefeilten Iterationsprozesses (Software). Wegen ihres riesigen operationalen Aufwandes wird diese Methode meistens nur bei Untersuchungen in der Wissenschaftskunde verwendet.

12. Kommentare

"By citing other works, authors create footprints in the landscape of scholarly achievement".
Diese "Spuren" sind die wichtigsten Instrumente, die uns für das Studium der Entwicklung und Struktur der Wissenschaft zur Verfügung stehen. Obwohl die Häufigkeit des Zitierens einer Arbeit nichts Endgültiges über ihre Qualität, jedoch über ihre Auswirkung aussagt, kann man mit großer Wahrscheinlichkeit behaupten, dass eine häufig zitierte Arbeit, ein wichtiges, wissenschaftliches Ergebnis enthält, oder dass sie, nach den Worten von Cronin, eine tiefe Spur hinterlassen hat.

Die Einführung der Zitate als Bewertungsmethode des Impakts einer Arbeit hat die aktuelle "Veröffentlichungskrankheit" entlarvt: Mehr als ein Drittel dieser Arbeiten werden nicht einmal zitiert. Würden zusätzlich die Selbstzitate betrachtet, stiege diese Zahl dramatisch.
Mehrere Untersuchungen von E. Garfield zeigen, dass die mittlere Zitatenjahresquote von zitierten Veröffentlichungen bei etwa 1,7 liegt oder dass die festgelegte Schwelle der für diese Quote, die bei 15 bis 17 Zitierungen liegt, von weniger als 1 Prozent der im "Science Citation Index" verzeichneten Arbeiten überschritten wird.
Nur extrem wenige Veröffentlichungen werden oft zitiert (z.B. mehr als 100 mal) und sehr viele nur selten (1-10 mal) oder überhaupt nicht. Eine solche unsymmetrische Verteilung wird in Anlehnung an die Untersuchungen über die Verteilung von Einkommen von V. Pareto zu Ende des vorigen Jahrhunderts als Pareto-Verteilung bezeichnet. Fast 50 Prozent aller vom SCIENCE CITATION INDEX erfassten Veröffentlichungen aus dem Zeitraum 1981-1985 wurden im Zeitraum von 5 Jahren nach ihrem Erscheinen kein einziges Mal von anderen Autoren zitiert. Der Anteil der mehr als einmal zitierten Publikationen wurde auf nur 20 Prozent abgeschätzt. Dazu muss einschränkend bemerkt werden, dass 1/4 der erfassten Veröffentlichungen Kurzmitteilungen sind, die in der Regel nicht zitiert werden. Für den Bereich der Naturwissenschaften allein und bei Nichtberücksichtigung der Kurzmitteilungen beträgt der Anteil der nicht
zitierten Veröffentlichungen immerhin noch 23 Prozent (aus einer Zitierungsanalyse der Veröffentlichungen in 1984 und deren Zitierungen bis Ende 1988).

Natürlich gibt es auch Kontroverse über die Gültigkeit dieser Methode und ihre richtige Anwendung und Interpretation. Keine Bewertungsmethode kann aber durchaus objektiv und perfekt sein. Es werden sicher immer einzelne Fälle von Benachteiligungen auftreten, es wird auch sicher immer sehr gute Veröffentlichungen geben, deren Bedeutung und Qualität erst viele Jahre nach ihrem Erscheinen, wenn überhaupt, anerkannt werden.
Solche bibliometrischen Untersuchungen können aber zweifellos einer besseren Orientierung und Beurteilung der wissenschaftlichen Leistung von konkreten Forschern und Forschungsanstalten dienen. Die erfolgreiche Durchführung solcher Analysen setzt aber gute Kenntnisse über diese Methode, deren Schwäche, Mängel und Einschränkungen voraus. Fehlplanungen und -urteilen sind sehr gefährlich, wenn man betrachtet, von welch großer Bedeutung die Interpretation der Ergebnisse sein kann.

13. Literatur

1. Gorraiz, J.: "Die unerträgliche Bedeutung der Zitate".
In: Biblos. Jg. 41 (1992), H. 4, S.193-204.

2. Lawani, S.M.: Bibliometrics: Its Theoretical Foundations, Methods and Applications.
In: Libri. Copenhagen. Jg. 31 (1981), S. 294-315.

3. Pritchard, A.: Statistical Bibliography or Bibliometrics?
In: Journal of Documentation. London. Jg. 25 (1969), H. 4, S. 348-349.

4. Garfield, E.: Is citation analysis a legitime evaluation tool?
In: Scientometrics. Amsterdam. Jg. 1 (1979), S. 359-375.

5. Garfield, E.: In Tribute to Derek John de Solla Price: A Citation Analysis of Little Science, Big Science.
In: Scientometrics. Amsterdam. Jg. 7 (1985), H. 3-6, S. 487-503.

6. Vinkler, P.: A quasi-quantitative citation model.
In: Scientometrics. Amsterdam. Jg. 12 (1987), H. 1-2, S. 47-72.

7. Schlögl, Christian: "Gefahren und Nutzen von bibliometrischen Untersuchungen am Beispiel Informationsmanagement", 26. Österreichischer Bibliothekartag "Produktionsfaktor Wissen", UniversitätsCampus Wien, 19. - 23. September 2000

8. Werner Marx und Gerhard Gramm: Wächst der Wissenschaft das Wissen über den Kopf?

9. Christian Schlögl, Juan Gorraiz, Christoph Bart, Monika Bargmann: "Evaluating two Austrian university departments: Lessons learned ", Scientometrics, Vol. 56, Iss. 3 (2003), S. 289-299 (pdf-version)

10. "Handbook of quantitative studies of science and technology", Van Raan A.F.J. [Editor]
Amsterdam, North Holland, 1988, ISBN 0-444-70537-6

11. Svozil, Karl: "Der Alltag eines “Peers”, Biblos-Schriften 179, 73-94 (2004); presented at the ODOK '03 (Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare), Salzburg, Austria, September 2003

12. Qualität und Quantität wissenschaftlicher Veröffentlichungen : bibliometrische Aspekte der Wissenschaftskommunikation / Maja Jokic ; Rafael Ball. Forschungszentrum Jülich GmbH, Zentralbibliothek . - Jülich : Forschungszentrum, Zentralbibliothek , 2006 . - 186 S. . - (Schriften des Forschungszentrums Jülich : Reihe Bibliothek ; 15 )
ISBN 3-89336-431-5

13. Lange, L. L. (2001): The impact factor as a phantom. Journal of Documentation 58 (2), 175-184

14. "Document delivery as a source for bibliometric analyses: the case of Subito", C Schlögl & J Gorraiz, Journal of Information Science, 32 (3) 2006, pp. 223–237

15. "Journal impact measures in bibliometric research"; Wolfgang Glänzel & Henk F. Moed; Scientometrics; Vol. 53, Nr. 2, S. 171-93

16. Garfield E., "Historiographic Mapping of Knowledge Domains Literature" Keynote Address, Arthur M. Sackler Colloquium on "Mapping Knowledge Domains" Beckman Center of the National Academy of Sciences, Irvine, CA, May 9-11, 2003. Presentation. No:506

17. Tijssen, R.J.W. (1992), Cartography of Science: Scientometric Mapping with Multidimensional Scaling Methods, DSWO Pres, Thesis Leiden University, Leiden.

18. Debackere K, Verbeek A, Luwel M, Zimmermann E: "Measuring progress and evolution in science and technology - I. The multiple uses of bibliometric indicators", INTERNATIONAL JOURNAL OF MANAGEMENT REVIEWS 4 (2): 179-211 (2002)

Elektronische Dokumente zum Thema Bibliometrie, Scientometrie

Benjamin F. Bowman, Werner Marx, Urs Schoepflin:
Anmerkungen zum Einsatz von Zitierungsanalysen für die Forschungsevaluation

Werner Marx, Hermann Schier, Michael Wanitschek:
Kann man Forschungsqualität messen? .
(erschienen im MPG-Spiegel 3/1998)
(Zitierungszahlen als Maß für Resonanz auf wissenschaftliche Aktivität)

Teresa Y. Neely:
The Impact of Electronic Publications on Promotion and Tenure Decisions
(über Bedeutung elektronischer Veröffentlichungen für bibliothekarische Karrieren, primär in wissenschaftlichen Bibliotheken der USA , Oktober 1999)

Tobias Opthof *
Sense and nonsense about the impact factor

Verfasser:
Juan Gorraiz, Österreichische Zentralbibliothek für Physik in Wien, Bibliotheks-und Archivwesen der Universität Wien
(juan.gorraiz@univie.ac.at)