1. Einführung
2. Kurze Geschichte
3. Begriffe
4. Zitatanalyse
5. Anwendungen
6. Bibliometrische Evaluierungsverfahren:
I. Die sogenannte "Peer Review" Methode
II. Anzahl der Veröffentlichungen
III. Zitatanalyse: Problematik
7. Zitate als Retrievalsmethode
I. Zitatengruppen- oder Clusteranalyse
II. Bibliographische Kopplung
8. Das Verzeichnis der Verzeichnisse: SCI
I. Der SCI als Datenquelle
II. Aufbau des Verzeichnisses
III. Bibliometrische Indikatoren der JCR
IV. Aufbau von JCR
V. SCI auf CD-ROM
VI. SCI online
VII. SCI im Internet: Web of Knowledge
a) Web of Science
b) JCR
c) Essential
Science Indicators (ESI)
d) ISIHighlyCited.com
e) National Science Indicators Database
VIII. Kritik und Problematik
9. Scopus: eine
neue Alternative?
10. SJR:
SCImago Journal & Country Rank
11. Präsentation der Ergebnisse
12. Kommentare
13. Literatur
1. Einführung
Wie misst man Wissenschaft und wissenschaftliche
Produktion?
Unter Informetrie versteht man die Anwendung mathematischer Methoden auf die
Sachverhalte des Informationswesens. Sie ist eine Disziplin im Überscheidungsbereich
zwischen Mathematik und Informationswissenschaft. Die Informetrie wird auch
Bibliometrie oder Szientometrie genannt.
Der Begriff "Bibliometrie" wurde 1969 von A. Pritchard geprägt. Zweck
und Definition der Bibliometrie ist die Anwendung mathematischer und statistischer
Methoden zur Erklärung der Prozesse der schriftlichen Mitteilungen, sowie
der Natur und des Entwicklungskurses eines Wissenschaftsgebietes, durch Zählung
und Analyse der verschiedenen Aspekte der schriftlichen Kommunikation.
Derzeit hat sich die Bibliometrie als die bedeutendste Methode für die
Bewertung wissenschaftlicher Arbeiten erwiesen. Sie ist die Metrik des
Buchwesens und untersucht unter Einsatz mathematisch-statistischer Methoden
die quantitativen Regelhaftigkeiten von Printmedien im Informationsstrom in
Beziehung zur Wissenschaftstheorie und Forschung.
Eine modernere Definition von Hawkins lautet: "Quantitative Analyse
der bibliographischen Aspekte eines Literaturthemas". Diese Definition hat den
Vorteil, dass sie den quantitativen Aspekt
dieser Wissenschaft hervorhebt.
Die Zitatanalyse ist ein Gebiet der Bibliometrie, das sich mit dem Studium der Beziehungen zwischen zitierten und zitierenden Arbeiten und ihrer Anwendung als bibliometrische Untersuchungsmethode beschäftigt. Als bibliometrischen Parameter verwendet die Zitatanalyse die Zählung der auf eine bestimmte Arbeit, ein bestimmtes Dokument oder einen bestimmten Verfasser entfallenden Zitate. Je größer die Zitierhäufigkeit ist, desto höher wird ihr Wert veranschlagt.
2. Kurze Geschichte
Die erste bibliometrische Untersuchung erschien 1917 und war eine von Cole und
Eales verfasste Veröffentlichung einer statistischen Analyse der
Literatur über Anatomie in dem Zeitabschnitt zwischen 1550 und 1860, um
die Schwankungen des Interesses in dieser Disziplin zu zeigen.
Im Jahre 1926 veröffentlichte der Chemiker, Mathematiker und Statistiker
A. F. Lotka einen Artikel über die wissenschaftliche Produktivität
in den Bereichen Chemie und Physik, wobei er feststellte, dass einige wenige
Autoren eine hohe Publikationsanzahl erreichen, und dass die größte
Zahl der Autoren eine oder zwei Arbeiten innerhalb eines bestimmten Bereiches
veröffentlicht. Diese Gesetzmäßigkeit, die besagt, dass die
Publikationsanzahl umgekehrt proportional ist zur Anzahl der Autoren,
wurde durch viele Untersuchungen bestätigt und ist heute nach seinem Autor
als Lotkas Gesetz bekannt.
P. Gross und E. Gross waren 1927 die ersten, die Zitate als bibliometrische
Datenquellen verwendeten. Sie zählten und analysierten die in den einzelnen
Artikeln einer chemischen Zeitschrift angeführten Zitate, und kamen zu
einer Liste von Zeitschriften die sie als unentbehrlich für die chemische
Ausbildung betrachteten.
Im Jahre 1934 stellte der Bibliothekar Samuel .C. Bradford ein heute nach ihm
bekanntes Gesetz nach der Untersuchung einer Bibliografie zum Thema Geophysik
mit insgesamt 326 Zeitschriften auf. Er stellte fest, dass 9 Zeitschriften 429
Artikel enthielten, 59 weitere 499 Artikel und die restlichen 258 noch 404 Artikel.
Nach Bradfords Gesetz
finden sich die gleiche Anzahl von Aufsätzen über ein
festgelegtes Thema verteilt in jeweils in Gruppen von n0, n1, n2 etc. verschiedenen
Zeitschriften, wobei der Parameter n je nach Fachgebiet und Thema verschieden
sein kann. Der Parameter n entspricht dem Verhältnis der Anzahl von Zeitschriften
zwischen zwei aufeinander folgenden Gruppen. Aus Bradfords Gesetz ergibt sich
die Einteilung in Kernzeitschriften, verwandten Zeitschriften
und restlichen Zeitschriften für jedes Forschungsgebiet (siehe Beispiel).
Bradfords Gesetz wurde 1948[2] von Brian C. Vickery unter der Bezeichnung Bradford's
Law of Scattering mathematisch formuliert und stellt ein Potenzgesetz dar.
Das dritte bibliometrische Grundgesetz geht auf die Arbeiten des Philologen
Georg K. Zipf in den 1930er Jahren zurück und bestimmt die Erscheinungshäufigkeit
eines Wortes im Text. Das Zipfsche Gesetz ist ein Modell,
mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge
gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige
Verwendung findet das Gesetz in der Linguistik, wo es zum Beispiel die Häufigkeit
von Wörtern in einem Text zur Rangfolge in Beziehung setzt (siehe Beispiel).
Das Zipfsche Gesetz markierte auch den Beginn der Quantitativen Linguistik.
1966 war in der Sowjetunion das Buch "Nauka o nauke" von G.M. Dobrov mit dem
Untertitel "Vvedeniev obscee naukoznanie" erschienen. 1969 wurde diese Veröffentlichung
als "Wissenschaftswissenschaft" zum ersten Male in deutscher Sprache herausgegeben.
Nach Dobrov ist die Wissenschafts-wissenschaft die komplexe Untersuchung und
Verallgemeinerung des Funktionierens wissenschaftlicher Systeme mit dem Ziel,
das Potential der Wissenschaft zu verstärken und die Effizienz des wissenschaftlichen
Prozesses mit Hilfe organisatorischer Mittel zu erhöhen.
Einige Monate früher als Pritchard hatten Nalimov und Mul'cenko, ebenfalls
Russen, den Begriff Szientometrie (Scientometrie) oder Wissenschaftsmetrie
(auf russisch "naukometrija") eingeführt. Nach ihrer Definition ist die
Szientometrie (engl. scientometrics) die Anwendung quantitativer Methoden auf
das Studium der Geschichte der Wissenschaft als Informationsprozess.
Ein anderer Terminus, der auch häufig (stammt aus der DDR) verwendet wird,
ist die Informetrie. Dieser Terminus wurde von Blackert und Siegel eingeführt,
da viele Arbeiten, die gegenwärtig als bibliometrische gestempelt
werden, nicht dem Zweck dienen, einen Beitrag zur Bibliothekswissenschaft zu
leisten. Um ihre Beziehung zur Informatik zu betonen, wird dieses Fachgebiet
Informetrie benannt und definiert als die Lehre der Anwendung mathematischer
Methoden auf die Sachverhalte des Informationswesens zur Beschreibung und Analyse
ihrer Phänomene, zum Auffinden ihrer Gesetze und zur Unterstützung
ihrer Entscheidungen.
Informetrie, Szientometrie und Bibliometrie überschneiden
sich. Die Verwendung des einen oder anderen Terminus hängt
sehr stark davon ab, welcher Aspekt, der bibliothekarische,
der wissenschaftliche oder der informatische, herauszuheben
ist, deshalb wird in dieser Arbeit von Bibliometrie gesprochen.
Seitdem hat diese Art von Untersuchungen ständig mehr Anhänger gefunden.
1969 zählte Pritchard schon über 700 Items. Heute gibt es Zeitschriften,
die sich nur mit diesem Thema beschäftigen, wie z.B. Scientometrics, eine
Zeitschrift die seit 1978 besteht. Eine vom Autor selbst durchgeführte
Literaturrecherche in der Datenbank LISA (Library and Information Science Abstracts)
nach dem freien Suchbegriff "scientometric? or bibliometric?" ergab schon Anfang
1990 1262 Treffer, von denen sich 508 mit Zitatanalysen beschäftigen.
Derzeit existiert sogar eine International Society for Scientometrics and Informetrics
ISSI, die regelmäßig
Tagungen organisiert.
Heutzutage wird es behauptet, ca. 97% zeitgenössischer Wissenschaftler
seien an Bibliometrie interessiert (12).
3. Begriffe
Sehr wichtig ist der Unterschied zwischen Zitation bzw. Zitat
(engl. citation), Zitierungen (engl. cite) und Referenz
(engl. reference).
Formale Aufbau einer wissenschaftlichen Veröffentlichung (engl. paper)
zeigt eine standardisierte Struktur:
Titel, Autoren, Anschriften (Affiliation, Corporation), Abstrakt, Deskriptoren,
Volltext, Referenzen.
Ein Bestandteil ist die Aufführung der Forschungsergebnisse, auf denen
die Arbeit aufbaut. Es wird verlangt, dass der Autor die Verwendung bereits
bekannter Methoden oder Resultate zitiert, die zu seiner Arbeit in enger inhaltlicher
Beziehung stehen. Die Angabe der Zitate erfolgt in der Form eines vereinheitlichten
kurzen Hinweises auf das zitierte Dokument und hängt sehr stark vom zitierenden
Verfasser sowie von der Quelle ab, denn jede Zeitschrift oder Datenquelle verwendet
besondere Regeln oder Empfehlungen zur Darstellung der Referenzen (Notes
for Contributors, Instructions for Authors).
Ebenso kann die Plazierung der Referenzen im Text unterschiedlich sein. Sie
können in den fortlaufenden Text eingebettet sein, in einer Fußnote
erscheinen, oder meistens in Form einer Literaturliste am Schluss der Veröffentlichung
präsentiert werden.
Definition:
Enthält die Veröffentlichung X eine bibliographische Note, in der
die Veröffentlichung Y beschrieben oder verwendet wird, dann enthält
X (citing document) eine Zitation oder Referenz zu Y, und bekommt Y (cited document)
eine Zitierung von X.
Die Referenz (Reference) ist das Anerkenntnis, das der Zitierende
gibt (aktiv), und die Zitierung (Citation) ist das Anerkenntnis, das der Zitierte
erhält (passiv).
Zitate haben in der Wissenschaft ihre größte
Bedeutung. Wissenschaftler sind stets darauf angewiesen, Arbeiten anderer Personen
zu verwenden, damit etwa unnötige Wiederholungen eines Experiments verhindert
werden. Der Wissenschafter arbeitet sozusagen auf den Schultern eines Riesen
(d.h. auf der Erfahrung seiner vielen Vorgänger): Zum Beispiel wird im
einleitenden Text einer Dissertation mit Zitaten belegt, welche Aspekte des
Themas schon bekannt sind und welche Wissenslücken noch bestehen.
In der Wissenschaft wird davon ausgegangen, dass ein Forscher die Literatur
zu seinem Thema kennt und sich mit den bisherigen Erkenntnissen auseinandergesetzt
hat. Wenn man etwas von einem anderen Autor übernimmt, muss man die Quelle
und gegebenenfalls die Art der Übernahme deutlich machen, sonst setzt man
sich dem Vorwurf des Plagiats aus (siehe auch Betrug und Fälschung in der
Wissenschaft).
Eine Zitation bezeichnet vor allem in der Bibliothekswissenschaft den direkten
Verweis von einer Publikation auf eine andere. Für die Form des Verweises
gibt es eine Vielzahl von Systemen und Regeln für Literaturangaben, die
in der Regel mindestens Autor, Titel und Jahr einer Publikation enthalten. Während
beim Zitat der zitierte Wortlaut oder Sachverhalt im Mittelpunkt steht, bezieht
sich die Zitation auf die konkrete Quelle. Der verwandte Ausdruck »Zitierung«
bezeichnet in der Regel eher den Vorgang oder die Art und Weise des Zitierens.
4. Zitationsanalyse
(oder Zitatanalyse).
Die Zitatanalyse beschäftigt sich mit dem Studium der Beziehungen zwischen
zitierten und zitierenden Arbeiten und ihrer Anwendung als Untersuchungsmethode.
Sie zeigt, welchen Einfluss die betrachtete Arbeit auf die wissenschaftliche
Gemeinschaft hat. Sie misst den "Nutzen" (Auswirkung, Resonanz, Rezeption,
Impakt, üblich ist der englischsprachige Terminus technicus "Impact"),
den diese Arbeit für andere Wissenschaftler hat oder gehabt hat, sagt aber
nichts Endgültiges über ihre Qualität aus. Es ist jedoch sehr
wahrscheinlich, dass eine häufig zitierte Arbeit wichtige Informationen
enthält.
Zitatanalyse bezeichnet die Auswertung von Zitaten im Rahmen einer empirischen
Untersuchung. Als bibliometrische Quellen stehen die zitierten und die zitierenden
Arbeiten. Diese Daten werden aus besonderen Verzeichnissen
wie z. B. "Science Citation Index" gewonnen, die von den sogenannten
"counting houses" (Zitationsdatenbanken)
angeboten werden.
Zitatanalyse können auf verschiedenen Stufen der Komplexität vorgenommen
werden. Auf der untersten Stufe kann ein einzelnes Dokument, ein Zeitschriftenartikel,
Buch oder graue Literatur die Einheit der Analyse sein. Dadurch kann die Frage
beantwortet werden, wie oft, wann und von wem das Dokument zitiert worden ist.
Auf der nächsten Stufe können alle Veröffentlichungen eines oder
mehrerer Autoren, von Körperschaften oder Zeitschriften untersucht werden.
Schließlich sind Studien über Universitäten oder alle
aus einem Staat stammenden Veröffentlichungen sowie über Eigenschaften
und Entwicklung bestimmter Wissensgebiete möglich.
Bei den Zitationsanalysen, wie bei bibliometrischen Analysen
oder quantitativen Methoden, sollen immer Zuverlässigkeit
(reliability), Gültigkeit (validity) und Relevanz
(relevance) geprüft werden.
Zuverlässigkeit (reliability): Eine Messung ist zuverlässig,
wenn sie bei gleichen Bedingungen reproduzierbar ist. Jede bibliometrische Messung
enthält normalerweise einen bestimmten unsystematischen Fehler (random
error), wie z. B. orthographische Fehler. Systematische Fehler (wie z. B. nicht
Berücksichtigung aller Veröffentlichungen oder aller Koautoren) sollen
aber ausgeschlossen werden.
Vier Kernpunkte sollen dafür berücksichtigt werden:
a) Vollständikeit der erhobenen bibliometrischen Daten (completeness)
b) Erfassung oder Erhebungsumfang der verwendeten Datenquellen oder Datenbanken
(coverage of databases)
c) Grenzen der Zitatenanalysen (Fehler)
d) Probleme bei der Auswertung statistischer Daten (sind die Diskrepanzen wirklich
signifikant?)
Gültigkeit (validity): Sind die verwendeten bibliometrischen
Variablen richtige und gültige Evaluationsindikatoren? Manchmal werden
sogar etablierte bibliometrische Indikatoren sehr stark in Frage gestellt.
Relevanz (relevance): Dabei sollen die Einschränkungen bei den möglichen
Anwendungen berücksichtigt werden.
Oder wie Tijssen (1992) sehr gut formuliert: "one always has to take
into account that any bibliometric measure will only remain a proxy for mapping
and assessing the complex system of knowledge production".
5. Anwendungen
Unter den wichtigsten bibliometrischen Anwendungen der Zitatanalyse sind
folgende zu erwähnen:
1) Auswahl von Monographien und Zeitschriften in
der bibliothekarischen Erwerbung
Ein sehr wichtiges Kriterium für die Erwerbung von Monographien
und Zeitschriften, vor allem in Fachbibliotheken, liefert deren Zitierungshäufigkeit,
wie zahlreiche Untersuchungen dieser Art illustrieren. Zu diesem
Zweck wurde von E. Garfield der sogenannte "Impact
Factor" eingeführt, von dem später gesprochen wird.
2) Auswertungen von Sammlungen und Bibliographien
Diese Auswertungsmethoden beruhen vor allem auf der Möglichkeit, "ranking
lists" (Ranglisten) aufzustellen. Ranglisten werden auch nach verschiedenen
bibliometrischen Indikatoren erstellt (Beispiele sind bei der Beschreibung
vom SCI-JCR zu finden). Die gebräuchlichsten Ranglisten
sind jene, die nach der Anzahl der erhaltenen Zitierungen aufgebaut werden.
Solche Listen werden jedoch mehr für die Auswahl als für die Auswertung
von Sammlungen verwendet.
3) Untersuchung der Merkmale von Fachliteraturen
Eines der am meisten untersuchten Merkmale einer Fachliteratur
ist das sogenannte "Veralten" (engl. obsolescence). Unter
Veralten wird der Verfall mit der Zeit der Gültigkeit und Benutzbarkeit
der Information verstanden. Dies ist sehr wichtig für die Bibliothekare,
die ständig wachsende Sammlungen in beschränkten Räumen führen.
Die Einschätzung des Alterns einer Literatur wird gewöhnlich durch
die Verminderung der Zitierungen mit der Zeit angegeben.
Dafür wurde von Brookes der bibliometrische Indikator,
das Halbleben oder Halbwertszeit (engl. half life),
eingeführt, der später ausführlicher erörtert wird.
Diese Untersuchungen können bei Klärung folgenden Fragen
helfen:
ob eine Zeitschrift rückwärtig ergänzt werden sollte, ob
und welcher Teil einer Zeitschrift magaziniert oder makuliert werden könnte
und ob und wann eine Zeitschrift gebunden werden sollte.
Als Instrument für den Bestandsaufbau bei Zeitschriften in wissenschaftlichen
Bibliotheken könnte sie die Objektivität von Entscheidungen vergrößern,
da sie unabhängig von den Einflussnahmen von Benutzergruppen getroffen
werden könnten.
4) Historische und soziologische Anwendungen.
Garfield und seine Mitarbeiter vom ISI (Institute for Scientific Information)
haben bewiesen, dass:
a) Zitationen eine wichtige Rolle beim Studium der Geschichte der Wissenschaften
spielen können,
b) eine graphische Darstellung (genannt "Historiograph") eine schnelle
Übersicht über die Entwicklung einer bestimmten Disziplin, die Entwicklung
in einem Land oder die Beteiligung einer bestimmten Körperschaft an den
ausschlaggebenden Durchbrüchen ergeben kann,
c) solche graphische Darstellungen in der Praxis problemlos zu erhalten
sind.
Darunter zählt auch die Ermittlung der "klassisch zitierten" Arbeiten
(engl. "citation classics") einer bestimmten Disziplin.
Solche Arbeiten werden mit einer größeren Häufigkeit
innerhalb eines Fachgebietes zitiert. Die Festlegung des "klassischen"
Niveaus zeigt sich aber nicht so einfach. So kann eine absolute Häufigkeit
nicht angenommen werden, da in diesem Fall fast nur Artikel von bestimmten
Zeitschriften (jenen mit sehr hohem Impaktfaktor, d.h. Zeitschriften die
selbst viel häufiger als alle anderen zitiert werden) "citation classics"
wären. Listen von "citation classics" erscheinen regelmäßig
in der Zeitschrift "Current contents".
5) Andere bibliometrische Evaluierungsanwendungen
Diese Anwendungen umfassen auch die Einschätzung :
a) der Auswirkung einer individuellen Arbeit ,
b) der Eminenz eines bestimmten Forschers ,
und
c) des Prestiges und der Leistung einer bestimmten Forschungsanstalt
, Firma oder eines Landes.
Zitatanalyse ist heute eine der wichtigsten Methoden der akademischen
Evaluation, auch Science policy
genannt.
6. Bibliometrische Evaluierungsverfahren
I. Die sogenannte "Peer
Review" Methode
Diese Methode verwendet seit mehr als 35 Jahren die National Science Foundation
der USA zur Entscheidung, welche Wissenschaftler Forschungsanträge zur
Förderung der Wissenschaften erhalten, und dient heutzutage zum gleichen
Zweck in den meisten europäischen Ländern, inklusive Österreich.
Sie funktioniert auf folgende Weise:
Zuerst verfasst der Kandidat ein schriftliches Ansuchen, in dem er seine frühere
Tätigkeit, seine Qualifikationen und seine geplante Forschungsarbeit beschreibt.
Dieses Ansuchen erhält der sogenannte Programm-Direktor. Dieser bestimmt,
welchem Fachgebiet die vorgeschlagene Arbeit angehört, und wählt dann
eine Anzahl von Referenten (Fachleute in diesem Gebiet), die befragt werden,
ob der Vorschlag als ausgezeichnet, sehr gut, gut, annehmbar oder schlecht bewertet
wird. Aufgrund dieser Bewertungen trifft der Programm-Direktor eine Entscheidung.
Die häufigste Kritik an dieser Methode ist die sogenannte "old boy" (alte
Freunde) Hypothese, nach der eine Clique von eminenten Wissenschaftlern
begünstigt wird. So würden die Entscheidungen des Programm-Direktors
stärker von dem Antragsteller selbst als von seiner vorgeschlagenen Arbeit
abhängen.
Diese Methode wird aber nicht zur Einschätzung der Auswirkung einer wissenschaftlichen
Arbeit oder der Verdienste eines Wissenschaftlers verwendet, da die für
ein objektives Ergebnis benötigte Anzahl der Referenten sehr groß
und deswegen unrealistisch wäre.
II. Anzahl der Veröffentlichungen
Hingegen fügt heutzutage jeder Wissenschaftler seinem Lebenslauf eine Liste
seiner Veröffentlichungen, vor allem bei Bewerbungen und Preisausschreiben,
bei, um seine Verdienste zu dokumentieren.
Im Jahre 1975 schlug der Nobelpreisträger W. Shockely vor, die Anzahl der
Arbeiten als Indikator wissenschaftlicher Produktivität
heranzuziehen.
Wissenschaftliche Veröffentlichungen beinhalten eine Menge von quantifizierbaren
Elementen in bezug auf drei wichtigen Aspekten der wissenschaftlichen Tätigkeit
(Tijssen, 1992):
1) Die Menge oder Größe (the size) der wissenschaftlichen Tätigkeit,
die sich im Output als Anzahl der Veröffentlichungen widerspiegelt
2) Die Übermittlung der Kenntnisse (Transfer of Knowledge)
3) Die sozialen und kognitiven Netzwerke der Wissenschaft ("the structure)
durch die Analyse der Koautoren, Adressen (Affiliations), Listen der Referenzen
und der Schlagwörter.
Die Anzahl der Veröffentlichungen ist der einfachste und bekannteste
Indikator.
Sie stellt das Gesamtvolumen der Forschungsproduktivität dar, ist
aber quantitativer Natur und gibt kaum Information über die Auswirkung
und Qualität dieser Arbeiten.
Die wissenschaftliche Produktivität von Autoren hängt vom Forschungsgebiet
ab und von anderen sozialen oder individuellen Variablen (z. B. psychologischen,
demographischen, usw.).
Die optimale Anzahl wissenschaftlicher Publikationen pro Jahr soll nach Price
und Beaver (Mitte der 60er Jahre) etwa eine Arbeit pro Jahr betragen, wenn der
Verfasser allein oder maximal mit zwei Koautoren veröffentlicht. Bei Mehrverfasserschaft
erhöht sich ständig diese Zahl.
Werden Institutionen verschiedener Größe verglichen, dann wird die
Anzahl der Veröffentlichungen pro Wissenschaftler oder Vollzeitäquivalent
als Output für Produktivität.
Werden Länder verglichen, dann können sogar dazu andere Indikatoren
wie Einwohnerzahl, Bruttosozialprodukt und F&E-Aufgaben herangezogen werden.
In bibliometrischen Analyse wird auch ein sogenannter Leistungsindikator
eingeführt, der die verursachten Durchschnittskosten pro Arbeit
(bzw. pro Zitierung) angibt (Herbertz & Müller-Hill,
1995).
Wie kommt man zu einer Veröffentlichung?
Erhält der Herausgeber einer wissenschaftlichen Zeitschrift ein Manuskript
zur Veröffentlichung, so wählt er qualifizierte Referenten aus, die
um ihre Fachmeinung befragt werden. Dem Autor bleibt die Identität der
Referenten seiner Arbeit unbekannt, leider und unverständlicherweise wird
aber bei Veröffentlichungen in den meisten Zeitschriften den Referenten
die Identität des Verfassers der Arbeit nicht verschwiegen, was sehr leicht
zu einer subjektiven Meinungsbildung führen kann.
Dies ist der Grund, warum es junge, noch unbekannte Wissenschaftler viel schwieriger
als schon etablierte haben, ihre Ergebnisse zu veröffentlichen. Obwohl
die Veröffentlichung in einer wissenschaftlichen Zeitschrift bestimmten
Qualitätsanforderungen obliegt, sind diese aber von einer Zeitschrift zur
anderen sehr unterschiedlich und daher nicht vergleichbar.
Außerdem weist dieser Parameter viele Nachteile auf,
von denen zu erwähnen sind:
a) Die Wiederveröffentlichung derselben Arbeit in verschiedenen Versionen
in mehreren Zeitschriften:
Dass nur die Anzahl der veröffentlichten Arbeiten als Indikator verwendet
wird, kann dazu führen, dass eine Arbeit mehrmals oder in mehreren Teilen
veröffentlicht wird, um den Wert dieses Parameters zu erhöhen. Dies
beeinträchtigt dessen bibliometrische Aussage.
b) Die Mehrverfasserschaft: Auch die ständig wachsende Anzahl der
Arbeiten, die von mehreren Autoren verfasst werden, kann die Analyse verfälschen,
da nicht immer alle Verfasser im gleichen Ausmaß beigetragen haben, oder,
was häufig der Fall ist, eine Co-Autorschaft willkürlich angegeben
wird.
Trotz dieser Einwände wird dieser Indikator noch heute verwendet, und dient
der Erstellung anderer, besserer bibliometrischer Parameter.
Nachteil: Die Subjektivität und Willkürlichkeit der Herausgeber wissenschaftlicher
Zeitschriften bei der Auswahl von den zu veröffentlichen Arbeiten.
III. Zitatanalyse
In diesem Falle ist der einfachste Indikator die bloße Anzahl der Zitaten.
Wie E. Garfield ganz klar formuliert,
zeigt dieser Indikator, welche Auswirkung eine konkrete
Arbeit auf die wissenschaftliche Gemeinschaft hat; sie
misst den Nutzen (engl. "impact"), den diese Arbeit für andere
Wissenschaftler hat, denn das Zitieren in einer wissenschaftlichen
Publikation bedeutet die Anerkennung der Auswirkung und des Einflusses, die
der zitierte Autor auf die betreffende Arbeit ausgeübt hat.
Zitate sind sehr beliebte bibliometrische
Untersuchungsparameter, denn sie sind unaufdringlich und
sehr leicht zu erhalten. Anders als Fragebogen und Befragungen bedürfen
sie nicht der absichtlichen Kooperation des Befragten, was dessen Antwort beeinflussen
könnte.
Sie sind "Wegweiser", die nach jeder Information
hinterlassen wurden, und die als solche verwendet werden
sollen.
Problematik der Zitatanalyse
Falls die Eigenschaften der Untersuchung es ermöglichen,
sollten bei der Zitatanalyse zitierende und zitierte Arbeiten nach Autopsie
bearbeitet, und die Zitierungsgründe analysiert
werden. Eine gute Anwendung des Zitatanalyseverfahrens setzt aber die Kenntnis
dieser Probleme voraus, damit, falls möglich, die notwendigen Maßnahmen
zu deren Vermeidung getroffen werden können. Nun werden hier die bekanntesten
Probleme und Einwände der Zitatanalyse aufgelistet, sowie ihre üblichen
Beseitigungsmethoden:
1) Ein typographischer Fehler
Der kann leicht verursachen, dass ein wichtiges Zitat nicht berücksichtigt
wird. Solche Fehler können aber bei jeder EDV- Untersuchung auftreten.
Nur eine sorgfältige Durchführung der Arbeit kann dieses Problem vermeiden.
2) Die willkürliche Auslassung eines wichtigen Zitates
Sie kann aus verschiedenen Gründen eintreten. Die wichtigsten sind:
a) Die Arbeit, die zitiert werden sollte, ist dem Autor nicht
bekannt
In diesem Fall hat sie wahrscheinlich nicht die entsprechende Verbreitung gefunden.
Die Zitatanalyse wird dann deren Verfasser die Notwendigkeit einer besseren
Mitteilung seiner Arbeit signalisieren. Dieses Phänomen ist in der Bibliometrie
unter dem Namen "Mendelsyndrom" bekannt, da der berühmte Artikel
von Mendel seinerzeit in einer unbekannten Zeitschrift erschien und unbeachtet
blieb. Dabei sollten die sogenannten "schlummernden" Arbeiten erwähnt
werden. Darunter versteht man Arbeiten, die ursprünglich sehr wenige Zitate
aufzeigten, aber nach einigen Jahren wiederentdeckt und sehr häufig zitiert
werden. Bibliometrische Analysen ermöglichen ihre Ermittlung.
b) Das Auslöschen durch Eingemeindung oder Einverleibung
(engl. obliteration by incorporation)
Von diesem Phänomen sprach zum ersten Mal der in der Bibliometrie sehr
berühmte Forscher Merton. Damit bezeichnete er jene Ideen, die so populär,
assimiliert und bekannt geworden sind, dass sie als kollektives Eigentum oder
selbstverständliche Hypothese betrachtet und nicht mehr zitiert werden.
Diese Ideen sind aber so bekannt, daß sich bei ihnen normalerweise eine
bibliometrische Untersuchung erübrigt, oder wenigstens keine gravierende
Fehler auftreten können.
c) Anstatt originaler Arbeiten von unbekannten Autoren werden
"Review-Artikel" von bekannteren Verfassern zitiert
Unter einem "Review-Artikel" versteht man einen Artikel, der keine neuen Ergebnisse
oder Theorien enthält, sondern eine retrospektive, kritische Darstellung
der Entwicklung und des Standes der Forschung in einem bestimmten Gebiet.
Es gibt sogar Zeitschriften, die hauptsächlich diese Art Arbeiten veröffentlichen,
wie z.B. Physics Reports. Solche Artikel, die einen sehr hohen
bibliographischen Wert besitzen, werden den in diesem Fach schon bekannten Forschern
anvertraut. Aus diesem Grund kann es schon geschehen, dass der zitierende Autor
sich auf das Zitat des Review-Artikels beschränkt. Diese Art des Zitierens
wird dem sogenannten "Matthew Effekt" zugeschrieben, nach dem bekannte
Wissenschaftler eine übertriebene Anzahl von Zitaten erhalten.
d) Die Unzugänglichkeit der Dokumente
Manche Dokumente sind dem zitierenden Verfasser wegen ihrer Sprache, ihrer "tragenden"
Zeitschrift (einer eher unbekannten und nicht leicht erhältlichen Zeitschrift)
oder Quelle (Report, Preprint, Dissertation oder irgendeine graue Literatur),
oder wegen Geheimhaltung nicht leicht zugänglich, und werden aus diesen
Gründen nicht zitiert.
e) Die künstliche Beschränkung der Anzahl der Zitate
Die meisten Autoren gehen sehr sparsam mit der Anzahl der Zitate um. Falls die
Arbeit eine bestimmte Länge nicht überschreiten soll, wird sicher
bei den Referenzen gespart, was vom Gesichtspunkt des Verfassers verständlich
ist. Wie die meisten durchgeführten Versuche zeigen, fehlt es an einer
Erziehung des Zitierens, die nichts anderes als Berücksichtigung und Anerkennung
der Arbeiten der Kollegen bedeuten würde.
f) Ein wichtiger Einwand gegen die Zitatanalyse ist die absichtliche
Weglassung von Zitaten aus Konkurrenzgründen.
In fast jedem Gebiet der Wissenschaft bilden sich häufig Gruppen von Wissenschaftlern,
die einander konkurrieren und deshalb wenig, wenn nicht gar kein Interesse haben,
die Ergebnisse oder Verdienste ihrer Konkurrenten zu verbreiten oder zu zitieren.
In seiner schon oben erwähnten Untersuchung über
die Zitierungsgründe hat sich P. Vinkler auch mit den Gründen für
die Auslassung eines Zitats beschäftigt. Er fand, dass Zitate aus folgenden
Gründen ausgelassen werden:
- 10%, weil die Arbeit noch nicht bekannt war (in dieser Arbeit Grund a)
- 42 %, weil der Autor diese Arbeit nicht so wichtig fand
- 26 %, durch Eingemeindung (b)
- 6 %, weil das Dokument nicht verfügbar war (d)
- 6 %, weil das Dokument falsche Behauptungen beinhaltet
- 10 %, aus anderen Gründen.
In der Studie von Vinkler fehlt leider der Grund, nach dem eher der Review-
Artikel eines bekannteren Wissenschaftlers bevorzugt wird. Dieses Ergebnis zeigt
jedoch, dass nur etwa 50% der Auslassungen korrekt waren. Gegen solche
Vorkommnisse zeigt die Zitatanalyse kein Rezept auf. Die Lösung dieses
Problems kann nur von den Wissenschaftlern
3) Das Selbstzitieren
Zu einem gewissen Grade ist das Selbstzitieren gerechtfertigt, weil eine Veröffentlichung
oft auf früheren Arbeiten des Verfassers beruht. Das Selbstzitieren kann
aber die Anzahl der Zitierungen kaum wesentlich erhöhen, und so die bibliometrische
Untersuchung verfälschen.
Außerdem wäre Ausschließen der Selbstzitierungen EDV-mäßig
sehr leicht zu erreichen. Bei einer Online-Recherche würde der Befehl "
Not Author = " genügen, um Selbstzitierungen ausscheiden zu lassen.
Schwieriger zeigt sich die Ausscheidung von Selbstzitierungen bei Arbeiten,
bei denen der Autor nicht als Erstgenannter aufscheint. Dieses Problem fällt
aber schon unter:
4) Die Mehrverfasserschaft
Sie wurde schon bei der Verwendung der Anzahl der Veröffentlichungen als
bibliometrischer Indikator als Schwierigkeit erwähnt.
Sie kann auch die Interpretation von Zitatanalysen beeinflussen, wie D. Lindsey
in seiner Untersuchung gezeigt hat. Vor der Durchführung einer Zitatanalyse
über das Werk eines bestimmten Wissenschaftlers wird dessen Bibliographie
benötigt, um seine Arbeiten mit anderen Autoren nachweisen zu können.
Falls alle Arbeiten, bei denen er als Mitverfasser mitgewirkt hat, nachgewiesen
wurden, wie kann sein eigener Verdienst bei jedem Beitrag eingeschätzt
und angerechnet werden? Lindsey plädiert für die Einführung einer
Korrektur für Mehrverfasserschaft. Solange der einzelne Beitrag jedes Mitwirkenden
nicht herauszufinden ist, scheint ihm eine Teilung der Zitate durch die Anzahl
der Autoren logisch.
Die Mehrverfasserschaft kommt zunehmend in den meisten Fachgebieten zum Ausdruck.
Ein extremes Beispiel gibt ein Artikel aus der Zeitschrift New England Journal
of Medicine aus 1993, der von 972 Autoren verfasst wurde aber weniger als 2000
Wörter enthält (d.h. 2 Wörter pro Autor).
5) Gefälligkeitszitierung oder willkürliche Schenkung von Zitaten
Aus Sympathie- oder Allianz gründen können Wissenschaftler einander
in übertriebenen Verhältnissen zitieren. Diese Überzitierung
ist das Gegenteil von der Auslassung von Zitaten aus Konkurrenzgründen
(siehe 2)e)), und für sie gelten die gleichen Kommentare, wie sie schon
im obigen Paragraphen diskutiert wurden.
6) Kritische und negative Zitationen
Es wird häufig angenommen, dass kritische und negative Zitate eine Verfälschung
der Zitatanalyse zugunsten der "schlechten" Arbeiten bewirken könnten.
Jedoch zeigt die Erfahrung, dass"schlechte Arbeiten" kaum zitiert werden. Die
meisten Wissenschaftler finden keine Zeit, sich mit solchen Arbeiten zu beschäftigen
oder ihnen Beachtung zu schenken. Kritische Zitate sind viel häufiger,
haben aber auch bibliometrischen Wert. Kritisch zitierte Arbeiten waren für
die zitierenden Autoren genügend wertvoll, um bestritten zu werden, vielleicht
weil sie aus ihren Fehlern gelernt haben, oder ganz einfach als Referenz oder
Vergleich benützt werden konnten.
7) Die Abhängigkeit vom Fachgebiet
Es wurde schon mehrmals signalisiert, dass die Zitatanalyse
sehr stark vom Fachgebiet abhängt. Zum Beispiel erhalten in der Biochemie
Artikel im Durchschnitt mehr als 30 Referenzen, in der Mathematik hingegen
weniger als 10. Genauso wird in manchen Gebieten viel häufiger veröffentlicht
als in anderen. In der Physik zum Beispiel enthalten die Arbeiten über
Festkörperphysik viel weniger Zitate als jene über Kern- oder Hochenergiephysik;
diese letzten sollen jedoch mehr organische Zitate als jene über Kern-
und Festkörperphysik enthalten.
Das Altern der Literatur hängt auch vom Fachgebiet ab. Berücksichtigt
man das Alter der zitierten Dokumente, findet man, dass ein großer Anteil
der Zitate auf Literatur der letzten Jahre entfällt. Zum Beispiel beträgt
die mittlere Halbwertszeit in der Physik 4.6 Jahre (d.h. die Hälfte der
Referenzen in physikalischen Zeitschriften datieren von den 4.6 Jahren nach
Erscheinen des Artikels), in der Chemie 8.1 Jahre. Diesen aus der Kernphysik
stammenden Konzept der Halbwertszeit oder Halbleben, hat Price für
die Einschätzung der sogenannten "Härte" einer Wissenschaft
(engl. hard science) verwendet.
Nach seiner Definition weisen große Halbwertszeiten auf wenig "harte",
wenig "wissenschaftliche" Zeitschriften hin. Während z. B. in den physikalischen
Zeitschriften 60% der Referenzen aus den ersten 5 Jahren stammen, sind es in
der englischen Literatur nur 10% . Nach Price ist die Physik die "harte Wissenschaft
par excellence" (sehr wissenschaftlich), während die englische Literatur
eine "nicht so harte" ist.
Solche Unterscheidungen bewirken, dass die Wahrscheinlichkeit
der Zitierungen vom Fachgebiet abhängt. Interdisziplinäre
Zitatanalyse sollte diese Tatsache nicht unbeachtet lassen.
8) Die Abhängigkeit vom Informationsträger.
Nicht alle Informationsträger werden gleich oft zitiert. So werden Zeitschriften
und Bücher mehr zitiert als Reports, Tagungen, und "graue" Literatur. Selbst
bei den Zeitschriften allein gibt es große Unterschiede, wie z. B.: die
geographischen; so ist die Anzahl der Zitate in russischen Zeitschriften
viel kleiner als in amerikanischen, europäischen oder japanischen. Dafür
enthalten die amerikanischen Zeitschriften im Durchschnitt mehr organische Zitate
als die russischen. Selbst bei den aus gleichem Landstammenden Zeitschriften
gibt es welche, die viel häufiger gelesen werden, und deshalb eine größere
Wahrscheinlichkeit des Erhaltens von Zitierungen aufweisen.
Um den Impakt der Zeitschriften einschätzen zu können,
wurde der sogenannte Impaktfaktor (engl. impact
factor) einer Zeitschrift von E. Garfield eingeführt.
Die Anzahl der Zitierungen, welche die Gesamtheit der Artikel einer wissenschaftlichen
Zeitschrift erhält, könnte schon als ein Indikator ihrer Benutzbarkeit
betrachtet werden. Allerdings würden dann umfangreiche Zeitschriften
(Zeitschriften mit vielen Artikeln) von vornherein bevorzugt werden gegenüber
solchen, die nur wenige Artikel enthalten, und häufig erscheinende Periodika
gegenüber seltener erscheinenden. Aus diesem
Grund wird die Anzahl der Zitierungen, die in einem bestimmten Zeitraum (üblicherweise
ein Zitierungsjahr) auf die Artikel eines Journals aus einem davor liegenden
Zeitraum (üblicherweise die beiden Jahre vor dem Zitierungsjahr) fallen,
durch die Anzahl dieser Artikel dividiert. Dieser relative Wert wird "impact
factor" genannt. Der "impact factor" selbst berücksichtigt nicht den Einfluss
von Review-Artikeln.
Jährlich erscheinen in SCI/JCR die Listen der Impaktfaktoren
der "wichtigsten" Zeitschriften.
Hier ist auch das nach Garfield benannte "Garfield's law
of concentration" (Konzentrationsgesetz) zu berücksichtigen, das
nichts anderes als eine Erweiterung des Bradfordschen Gesetzes ist, und nach
dem eine relativ kleine Anzahl von Zeitschriften für die große Mehrheit
der Veröffentlichungen in einem bestimmten Fachgebiet sorgt, eine überproportional
große Zahl von Zitierungen auf sich vereinigt und dadurch einen sehr hohen
"Impact Factor" erhält. Dieser Konzentrationseffekt wird verwendet, um
die sogenannten "Kernzeitschriften" eines Fachgebietes zu ermitteln.
Diese Tatsache würde Veröffentlichungen aus diesen "privilegierten"
Zeitschriften bei Zitatanalysen, wie zum Beispiel der Auswahl der "citation
classics" sehr stark begünstigen. Um dieses Problem zu vermeiden, wird
es in diesem Fall (Zeitschriften mit kleinem Impaktfaktor) die klassische Häufigkeitszitierungsgrenze
auf 100 statt der üblichen 400 herabgesetzt.
9) Die Abhängigkeit von der Art der Arbeit.
Es wird behauptet, dass methodologische Arbeiten immer häufiger zitiert
werden, während Theorien und Begriffe durch Eingemeindung im Vergleich
weniger Zitate erhalten. Als Illustration dieser Tatsache wird immer die Arbeit
von O.H. Lowry erwähnt, in der eine neue Methode zur quantitativen Eiweißbestimmung
dargelegt wird und welche einen Rekord an Zitierungen (mehr als 100.000 seit
1951) erhält. Der große Impakt dieser Arbeit bezieht sich nicht darauf,
eine methodologische Arbeit zu sein, sondern eine neue Orientierung in diesem
Gebiet eröffnet zu haben. Dass diese Arbeit mehr als z. B. die berühmte
von Einstein zitiert wird, bedeutet aber sicher nicht, dass sie wichtiger ist.
Diese Tatsache, am allerhäufigsten zitiert zu werden, drückt einfach
aus, dass sich mit dieser Arbeit derzeit sehr viele Forscher befassen, und dass
sich darin die aktuellen Interessen der wissenschaftlichen Gemeinschaft widerspiegeln.
Eine ungewöhnlich hohe Zitierungshäufigkeit einer bestimmten
Arbeit könnte auch unter besonderen Bedingungen als Anomalie betrachtet
werden.
Um diese Probleme (7, 8 und 9) zu vermeiden, schlagen
Small & Sweeney den "fractional citation counting" vor. Bei
der "Teilanzahl der Zitate" wird nicht die Summe der Zitate sondern deren
Bruchteil als Referenz (d.h. 1 dividiert durch die Länge der Referenzliste)
berücksichtigt. Erscheint das Zitat in einer Liste von 14 Referenzen,
so beträgt dessen "fractional citation countig" nur 1/14.
(Beispiel)
Eine andere Möglichkeit, diese Probleme zu berücksichtigen, ist die Verwendung des sogenannten "bibliometrischen Umfeldes" ("Environment of a scientific publication"). Dieses Umfeld bildet die für jede Analyse ausgewählte Sammlung von wissenschaftlichen Arbeiten, mit denen die betrachteten Arbeiten verglichen werden. Obwohl viele Methoden zur Definition dieses Umfelds vorgeschlagen wurden, hängt seine Auswahl sehr stark von Eigenschaft und Zweck der Studie ab.
Abschließend möchte ich folgende Worten von E. Garfield
zitieren:
"...The citation is a precise, unambiguous representation of subject that
requires no interpretation and is immune to changes in terminology. In addition,
the citation will retains its precision over time. It also can be used in documents
written in different languages.."
7. Zitate als Retrievalmethoden
I. Kozitation oder
Zitatengruppenanalyse oder engl. Clusteranalysis
Diese Analyse beruht auf zwei Hypothesen:
1) werden zwei Arbeiten von einer dritten gemeinsam zitiert, so gibt es eine
kognitive Verknüpfung zwischen beiden, und
2) die Stärke dieser Verknüpfung wird von der Häufigkeit angegeben,
mit der die beiden Zeitschriften zusammen zitiert werden.
(Garfield's Formel: S = Co-citations of A+B / (Totalcitations A+B)
- (Co-citations of A+B))
Die Gruppe von Arbeiten, die mit einer bestimmten, festgelegten Häufigkeit
gemeinsam zitiert werden, bildet ein Cluster. Das Konzept der Cluster
oder Gruppen des gemeinsamen Zitierens wurde gleichzeitig von G. Small in Philadelphia
und von I.W. Marschakowa in Moskau entwickelt (1973). So werden Cluster oder
Verbindungen zwischen Clustern aufgebaut. Die Cluster beziehen sich auf Fächer
oder Gebiete, ihre Verbindungen auf interdisziplinäre Beziehungen. Diese
Analyse bietet die Möglichkeit, die Struktur der Fachgebiete und deren
Beziehung zueinander zu erforschen, sowie die neuen Brennpunkte der Forschungsfronten
zu identifizieren. Im "ISI-Atlas of science" wurden verschiedene Ebenen
von Cluster verwendet, um "Vernetzungskarten" (engl. nested maps) aufzubauen
(mapping science).
Mapping Scientific Publications
(Abschnitt aus Ref. Nr. 18)
Diese Methode eignet sich gut für die Analyse und
Visualisierung der Struktur und Entwicklung der Wissenschaft und wird in der
"science policy" (Evaluation und Kontrolle der Wissenschaft) angewendet.
Praktisches Beispiel von "Cocitation- und Clusteranalyse liefert das Verzeichnis
ISR.
Sie zeigt den gleichen Nachteil wie alle Zitatanalysen, und nämlich
dass diese immer eine bestimmte Verzögerung mit sich tragen. Diese Verzögerung
wird von der notwendigen Zitierungszeit angegeben.
Zitate sind ein "retrospektiver" bibliometrischer Indikator.
Diese Verzögerung vermeidet aber die:
II. Bibliographische
Kopplung (engl. bibliographic coupling)
Dieser Terminus wurde von Kessler 1963 eingeführt. Zwei
Dokumente sind bibliographisch gekoppelt, wenn ihre Referenzenlisten eine oder
mehrere Arbeiten teilen. In der bibliographischen Kopplung werden jüngere
Arbeiten verbunden, da sie gleiche ältere zitieren. In der Clusteranalyse
werden hingegen ältere Arbeiten verbunden, da sie
später von jüngeren Arbeiten zusammen zitiert werden.
Die bibliographische Kopplung ist eine innere, statische Verbindung der
Dokumente, während die Clusteranalyse eine äußere, dynamische
ist.
Der Nachteil der bibliographischen Kopplung ist, dass sie subjektiver Art ist.
Die Beziehung zwischen den Dokumenten erfolgt nach den Angaben
ihrer eigenen Autoren (die Referenzen werden vom Autor
selbst angegeben).
Die bibliographische Kopplung wird im SCI unter dem Befehl "Related Records"
(Themenverwandte Dokumente) verwirklicht.
8. DAS VERZEICHNIS DER VERZEICHNISSE: SCI
I. Der SCI als Datenquelle
Der SCI (SCIENCE CITATION INDEX: an international interdisciplinary
index to the literature of science, medicine, agriculture, technology, and the
behavioral and social sciences) wird von ISI
(= Institute for Scientific Information, Philadelphia) seit 1963 herausgegeben
(The scientist).
Als Vater dieses Verzeichnisses gilt der amerikanische Chemiker
und Bibliothekar Eugene Garfield.
Historical Overview
1960 gründete er das ISI für die Produktion und die Vermarktung des
Current-awareness-Dienstes "Current Contents". Garfields größter
Erfolg ist jedoch die Weiterentwicklung des in der Rechtsprechung bereits seit
langem bekannten Zitierindexes, der "Shepards Citations", gedacht als Nachweis
für Präzedenzfälle, die im amerikanischen Rechtssystem eine entscheidende
Rolle spielen. Mit dessen Hilfe können alle juristische Entscheidungen,
die auf einem bestimmten dokumentierten Fall aufbauen, ihn also zitieren, ermittelt
werden.
Die Idee der inhaltlichen Erschließung und Kopplung von Dokumenten über
Zitate wurde schon seit Mitte der fünfziger Jahre in den Vereinigten Staaten
diskutiert.
Die Verweigerung staatlicher Unterstützung für die Publikation eines
beim ISI entwickelten Pilotindexes bewog Garfield das Produkt unter dem Namen
SCI ab 1963 selbst zu vermarkten. Damit wurde das Konzept der "Shepards Citations"
auf den Bereich der Naturwissenschaften übertragen.
Dieses Verzeichnis ermöglicht sowohl eine Erschließung
in Zeitrichtung (Source) als eine gegen die Zeitrichtung (Citation).
1998 erreichte der SCI einen Umfang von ca. 20 Millionen ausgewerteten
Dokumenten ("source documents") und über 300 Millionen Zitaten
("citations"). Damit ist er in seiner Größe einzigartig.
Seit 1973 wird der "Social Sciences Citation Index", seit
1978 der "Arts and Humanities Citation Index"
herausgegeben.
II. Aufbau des interdisziplinären Verzeichnisses
Der SCI ist eine internationale Zeitschrifteninhaltsbibliographie
mit fachlicher Beschränkung auf die Naturwissenschaft,
Technik, Medizin und die Verhaltenswissenschaft. Er ist eine fachübergreifende
Sammlung bibliographischer Daten aus Fachzeitschriften, die in gedruckter sowie
maschinenlesbarer Form als Datenbank angeboten wird. Zum naturwissenschaftlich
orientierten SCI kam 1973 der Social Science Citation Index (SSCI) (bis 1972
waren auch die Sozialwissenschaften einbezogen) und 1978 der Arts and Humanities
Citation Index (A&HCI) dazu. Zur Erstellung wird zur Zeit insgesamt ein
Kernsatz von zusammen 8000 Fachzeitschriften ausgewertet. Für die naturwissenschaftlichen
Disziplinen einschließlich Medizin sind es rund 5300 Zeitschriften mit
zur Zeit jährlich ca. 650.000 Veröffentlichungen und über 12
Millionen Zitierungen. Dieser Kernsatz umfasst zwar nur etwa 10 Prozent der
gegenwärtig weltweit periodisch erscheinenden wissenschaftlichen Zeitschriften,
deckt damit aber mehr als 90 Prozent aller Zitierungen ab. Die Auswahl der Kernzeitschriften
ist nicht statisch, sondern wird jährlich nach einer Reihe von Kriterien
aktualisiert, wobei die Zitierhäufigkeiten eine wesentliche Rolle spielen.
Es scheint zunächst widersinnig, dass eine Datenbank, die
selbst keine inhaltliche Wertung von Forschungsergebnissen vornimmt, trotzdem
als Instrument für eine Bewertung geeignet sein kann. Doch es gibt ein
wesentliches Merkmal, das den SCI von anderen Literatur-Datenbanken unterscheidet
und ihn zugleich einmalig macht: In dieser Datenbank sind von jedem Originalartikel
neben den bibliographischen Angaben (Titel, Autoren, Quelle) und dem Abstrakt
(Inhaltskurzfassung) zusätzlich die Liste aller Literaturverweise (Referenzen)
im Anhang der Publikationen gespeichert und durchsuchbar. Dieser Referenzenteil
ist sozusagen das Markenzeichen des SCI, der damit die Doppelfunktion einer
Literatur- und einer Referenzen-Datenbank einnimmt. Dadurch ist es möglich,
alle Veröffentlichungen zu finden, die eine bestimmte Publikation (oder
die Publikationen eines Wissenschaftlers, eines Instituts oder eines Fachgebietes
usw.) zitieren.
Dieser Index besteht aus folgenden Teilen:
1) SOURCE INDEX: seit 1955 - (bald seit 1945!)
enthält die zitierende Literatur:
Aufsätze aus ca. 3.300 Periodika
aus allen Ländern in originalen Sprachen
Fachliche Beschränkung auf die Naturwissenschaft, Technik, Medizin
und Verhaltenswissenschaft
Titelaufnahme:
Verfasser, Mitverfasser, Sachtitel (engl. + Originalsprache), Art des
Beitrages (Letter, Note, Review), Quelle (Abkürzung), Band, Heft-Nr.,
Seitenangabe, Jahrgang, Anzahl der Referenzen, Anschrift des ersten
Verfassers
+ Verzeichnung der Co-Autoren (Verw. auf 1.Verf.)
+ Referenzenliste
+ Abstrakt
Anhang: Aufsätze ohne Verfasserangabe (Titel der Zeitschrift)
+ Rezensionen aus 2 Zeitschriften: "Nature" und "Science"
2) CITATION INDEX:
enthält die zitierte Literatur. Sämtliche in den Aufsätzen
zitierte Schriften ohne Einschränkungen, aus allen Ländern,
in allen Sprachen, aus allen Erscheinungsjahren, aus allen Schriftenklassen
Titelaufnahme:
Erst genannter Verfasser (NUR DER ERSTE), Erscheinungsjahr.-
Jahr, Titel oder Zeitschriftentitel (abgekürzt) (kein T.
d. Aufsätze), Band, Seit
3) CORPORATE INDEX:
Register zum Source Index:
Titelaufnahme
Hauptteil:
"Geographic section": Institutionen, denen die Autoren d. Aufsätze
des Source Index angehören
Nebenteil: "Organization section": Institutionen nach Namen, verweist
auf "Geogr. Section"
4) PERMUTERM SUBJECT INDEX
(PSI):
1965 -
Stichtwortregister "Permuterm" als Sach-Erschließung
List of full stop words
List of semi-stop words
(verweist auf d. 1. Verfasser.)
5) JCR - JOURNAL CITATION REPORTS (JCR):
"A bibliometric analysis of science journals in the ISI database".
Seit 1975: Eine statistische Analyse der erschlossenen Zitierzusammenhänge.
JCR bietet auch "ranking lists" (Ranglisten nach verschiedenen Parametern, siehe
unten:Bibliometrische Indikatoren der JCR)
Die Datenbank setzt sich aus JCR Science Edition (ca. 5700 Zeitschriften) und
JCR Social Science Edition (ca. 1700 Zeitschriften).
Insgesamt werden rund 7000 Zeitschriften aus der ganzen Welt in rund 200 Fachkategorien
ausgewertet.
Der JCR erscheint einmal jährlich (gewöhnlich Ende Juni oder im August)
in gedruckter Form und auf CD-ROM. Er ist auch über das Netz erreichbar.
Er entstand als Hilfsmittel für Bibliothekare und Wissenschaftler für
die Organisation und Auswertung bibliothekarischer Zeitschriftenbestände,
aber dient auch bereits zur Evaluierung von einzelnen Forschern, was nicht sinnvoll
ist.
Kumulierungen des Titelmaterials u. aller Register (Papierform):
jährlich + 5-Jahres-Kumulierung.
10-Jahres-Kumulierung.: 1955-64
Die Berichtszeiträume der vier Teile des SCI
sind:
1) Source Index (Quellen-Index): ab 1955
2) Permuterm subject index: ab 1966
3) Citation index: ohne rückwärtige Grenze
4) Journal Citation Reports: ab 1975.
Seit 1973: SSCI - Social Sciences Citation Index (Sozialwissenschaften)
Seit 1978: AHCI - Arts and Humanities Citation Index (Geisteswissenschaften)
III. Bibliometrische Indikatoren der
JCR
Definitionen der verwendeten bibliometrischen Indikatoren:
1) Die Zitierrate (Total Citations): Zahl aller Zitate, die auf eine bestimmte Zeitschrift oder ein bestimmtes Dokument im untersuchten Zeitperiode entfallen sind.
2) Impact Factor (Impaktfaktor):
Anzahl d. Zitierungen / Anzahl d. Artikel
Anzahl d. Zitierungen = alle Zitierungen, die in dem Zitierungsjahr auf die
Artikel des betrachteten Journals in einem bestimmten Zeitraum (die beiden Jahre
vor dem Zitierungsjahr) entfallen sind / Anzahl d. Artikel in diesen zwei Jahren
Zwei Jahre werden als Zeitraum betrachtet. Garfield rechtfertigt dies
damit, daß der durchschnittliche Artikel am häufigsten während
der zwei Jahren nach seinem Erscheinungsjahr zitiert wird.
Für manche Fachgebiete ist tatsächlich eine Zeitspanne
von 5 Jahren angemessener. ISI bietet auch einen fünfjährigen Impact
Faktor.
Eine Ausschließung der Selbstzitierungen wird auch mittels eines revidierten
IF-s (Gesamtzahl der Zitierungen minus Selbstzitierungen) angeboten.
Titeländerungen der Zeitschriften sollen bei der IF Berechnung berücksichtigt
werden.
Da der IF stark abhängig vom Fachgebiet ist, führte 1987 als erster
Hirst einen "Discipline Impact Factor" (Anzahl aller Zitierungen zu
Artikeln in Kernzeitschriften eines bestimmten Fachgebietes) ein.
Meiner Meinung nach wäre ein besserer Vorschlag, den IF der Zeitschrift
durch den mittleren IF des Fachgebietes, zu dem diese Zeitschrift zugeordnet
ist, zu dividieren (ein "Gewichteter IF= GIF").
3)
Immediacy Index (Unmittelbarkeitsfaktor oder Zitierschnelligkeit):
Wie viele Artikel einer Zeitschrift noch innerhalb desselben Jahres zitiert
worden sind; dabei wird die Anzahl der Zitierungen, die in diesem Jahr für
Artikel aus dem gleichen Jahr gezählt wurden durch die Anzahl der in dieser
Zeitschrift im gleichen Jahr veröffentlichten Artikel dividiert
(ist > 1, wenn einzelne Artikel noch im selben Jahr mehrmals zitiert werden).
Dieser Indikator soll ein Maß dafür sein, wie schnell der durchschnittliche
Artikel einer bestimmten Zeitschrift zitiert wird, d.h. er misst die Geschwindigkeit
der Informationsverbreitung.
Zeitschriften, die wichtige Informationen über neueste Forschungsarbeiten
publizieren, werden die Aufmerksamkeit der Wissenschaftler schneller auf
sich ziehen.
4) Half-Life (Halbwertszeit):
Man spricht vom Altern der Information und in Analogie zum radioaktiven Zerfall
auch von der Halbwertszeit wissenschaftlicher Literatur und meint damit die
Zeit, nach der die Zitierungsrate auf die Hälfte ihres anfänglichen
Wertes abgesunken ist. Die oben genannten Indikatoren benachteiligen Zeitschriften
in Fachgebieten mit großen Halbwertszeiten, da sie insgesamt
nur die drei aktuellsten Jahre berücksichtigen. Um für solche Zeitschriften
größere Zeiträume einzubeziehen, werden "Citing Half-life"
(Halbwertszeit von Zitaten) und "Cited Half-life" (Halbwertszeit von
Zitierungen) eingeführt. Citing Half-life bezieht sich auf
die Alterstruktur der Referenzen in einer Zeitschrift und bestimmt, vom aktuellen
Jahr an rückwärts gerechnet, den Zeitraum, in dem sich 50% aller
Referenzen befinden (Zeit, von der die Hälfte der Referenzen einer Zeitschrift
in dem betrachteten Jahr stammen).
Cited Half-life bezieht sich auf die Altersstruktur der Zitierungen,
die auf eine Zeitschrift entfallen und bezeichnet analog den Zeitraum,
in dem 50% aller Zitierungen liegen. Beide messen das Veralten (engl.
"obsolescence") und die "Härte" (engl. "hardness")
der Zeitschrift.
IV. Aufbau von JCR
Die Zitierdaten der untersuchten Zeitschriften werden
dem Benutzer in folgenden Abschnitten angeboten:
1. Abschnitt: "Journal Rankings"
Er dient als Überblick über die wichtigsten
Daten und listet sie nach sechs verschiedenen Kriterien auf:
Liste 1 ordnet die Zeitschriften
in alphabetischer Ordnung
Liste 2 ordnet die Daten nach Gesamtzitierungen
Liste 3 nach Impact Factor
Liste 4 nach Immediacy Index
Liste 5 nach der Anzahl der veröffentlichten Artikel
Liste 6 nach der Zahl der auf die beiden vorangegangenen Jahre
entfallenen Zitierungen
2. Abschnitt: "Source data listing"
Er liefert eine Referenzenanalyse aller Quellenzeitschriften.
Jeder Artikel wird nach Typ klassifiziert: Review oder Non-review
Artikel. Als Review gilt ein Artikel, der mehr als 100 Referenzen oder
das Wort "review" im Sachtitel oder in seiner Beschreibung enthält.
Für jede Artikelklasse sowie für beide Klassen gemeinsam wird
die Zahl der Artikel, die Anzahl der darin erscheinenden Zitate und
der Quotient aus diesen Werten bestimmt. Dieser Abschnitt beantwortet die
Frage, ob und in welchem Umfang eine Zeitschrift Review-Artikel veröffentlicht.
3. Abschnitt: "Journal half-life
listing"
Dieser Abschnitt bietet in drei Listen Informationen
über Halbwertszeiten von Referenzen und Zitierungen von Zeitschriften.
Liste 1 listet für die zehn aktuellsten Jahre die
kumulierten Prozentanteile an den Gesamtreferenzen auf. Daraus wird für
jede Zeitschrift, die mindestens 100 mal in diesem Jahre zitiert worden
sind, das Citing Half-life bestimmt.
Liste 2 listet die kumulierten Prozentanteile an den
Gesamtzitierungen auf. Daraus wird, für jede
Zeitschrift, das Cited Half-life bestimmt.
Liste 3 ordnet die Zeitschriften nach diesem Merkmal.
4. Abschnitt: "Subject category
listing"
Er ordnet die ausgewerteten Zeitschriften einem oder
mehreren Fachgebieten zu. Innerhalb der Gruppe werden die Zeitschriften
nach deren Impact Factor gereiht. Das Cited Half-life wird auch angegeben.
Ein Register zu dieser Liste
verzeichnet zu jeder Zeitschrift die ihr zugeordneten Fachgebiete.
5. Abschnitt: "Citing journal listing"
Für jede Zeitschrift erfolgen die Angaben, welche
Zeitschriften und wie häufig sie zitiert hat.
(Folie 17)
6. Abschnitt: "Cited journal listing"
Für jede Zeitschrift erfolgen die Angaben, von welchen
Zeitschriften und wie häufig sie zitiert wurde.
Zusätzlich werden alle verzeichneten Zeitschriften
nach deren Abkürzung aufgelistet (List of the full titles of
citing/cited journals arranged alphabetically by abbreviation).
Die Abkürzung verweist auf den Volltitel. Titeländerungen
werden auch alphabetisch verzeichnet (Journal Titel Changes)
Als Beispiele dienen folgende Online Recherchen
in SCI:
1) Wie häufig wird
Prof. Hans-Peter Karnthaler zitiert?
2) Wie häufig wird
Albert Einstein zitiert?
SCI ist im Internet unter "Web of Knowledge" zu finden:
Web
of Science*:
The Web of Science (WoS) provides access to over 22 Million bibliographic
records covering all fields of research from the past 25 years. It includes
the Science Citation Index Expanded, the Social Sciences Citation Index and
the Arts & Humanities Citation Index.
Unter "General Search"
wird die Suche im Source-Teil durchgeführt:
Die Ergebnisse erhält man in folgender Form:
Durch Anklicken des Links "Cited References" erhält man die zitierten Arbeiten (d.h. die Liste der Referenzen dieser Artbeit):
Durch Anklicken des Buttoms "Find
Related Records" erhält man die mit dieser Arbeit ("parent
article") bibliographisch gekoppelten Arbeiten:
Unter "Cited Ref Search" wird die Suche im Citation-Teil durchgeführt:
Man erhält folgende Liste der Ergebnisse:
Mit dem Buttom "Search" kann man die zitierende(n) Arbeit(en) finden:
"Select Page" ermöglicht alle zitierten Arbeiten dieses Blattes zu selektieren
und "Search" die zitierenden Arbeiten zu suchen:
Mit "Advanced
Search" kann man Recherchen im Source-Teil mit anderen aus dem
Citation-Teil verknüpfen:
So kann man zum Beispiel die Selbstzitierungen ausschließen:
Die nicht benötigten Sets kann man mit "Delete
Sets" löschen.
Die anderen Sets können auch mit "Save History"
gespeichert werden und später mit "Open
Searchs" geöffnet werden.
JCR
: Journal Citation Reports* :
The two editions of the JCR provide citation data (e.g. journal
impact factors) of nearly 5.000 science journals and 1,700 social sciences journals.
Die Suche kann auch in einem bestimmten Fachgebiet (Subject Category) durchgeführt werden:
Die Ergebnisse werden alphabetisch geordnet:
Die können aber auch nach anderen Kriterien (wie z. B. Impact Factor) sortiert werden:
Durch Anklicken des Zeitschriftentitels erhält man die bibliometrische Analyse dieser Zeitschrift:
Unter "Cited Journal" findet man die Zeitschriften, die diese zitieren:
Unter "Citing Journal" findet man die Zeitschriften, die von dieser zitiert werden:
Unter "Trends" kann man sogar die Änderung des Impaktfaktores in den letzten 5 Jahren verfolgen:
Essential
Science Indicators (ESI)
Eine bibliometrische Analyse von sowohl Wissenschaftlern, Körperschaften
und Ländernals auch Zeitschriften und Artikeln mittels der oben erwähnten
Indikatoren wird auch
im Internet angeboten und ständig "updated": ISI-Essential
Science Indicators.
Essential Science Indicators was updated on January
1, 2003 to cover ten years plus ten months, January 1992 - October 31, 2002
provides internet access to a unique and comprehensive compilation
of essential science performance statistics and science trends data derived
from ISI's databases. The chief indicators of output, or productivity, are journal
article publication counts. For influence and impact measures, ESI employs both
total citation counts and cites per paper scores. The former reveals gross influence
while the latter shows weighted influence, also called impact.
Unter Citation Rankings:
Scientists kann man finden, wie häufig ein bestimmter Forscher
zitiert wird.
Nur die am meisten zitierten Autoren werden verzeichnet!
(For scientists the top 1% of names is selected for each of the fields. Authors are selected for listing that meet a cumulative
citation count threshold for the 10+ year period. The thresholds are based on
the cutoffs given in the All Years column of the Baseline Percentiles table.
The absence of a scientist name means the author did not meet the citation threshold
in any field, siehe Thresholds).
siehe aktuelle Information unter:
http://in-cites.com/thresholds-citation.html
Ein Vergleich mit anderen Forschern aus gleichem Gebiet wird auch angeboten:
Unter Citation Rankings:
Institutions kann man finden, wie häufig eine bestimmte Körperschaft
zitiert wird:
Nur die am meisten zitierten Körperschaften!
(For institutions the top 1% is selected for each of the fields, siehe Thresholds.
Institutions are selected for listing that meet a cumulative citation count
threshold for the 10+ year period. The thresholds are set separately for each
field. The thresholds are based on the cutoffs given in the All Years column
of the Baseline Percentiles table.
The absence of an institution's name means that the institution did not meet
the citation threshold in any field)
Ein Vergleich mit anderen Institutionen aus gleichem Gebiet
(z. B. Materials Science) wird auch angeboten:
Unter Citation Rankings:
Countries ist die gleiche bibliometrische Analyse für ein bestimmtes
Land zu finden:
(for countries top 50%. Countries/Territories are selected for listing that
meet a cumulative citation count threshold for the 10+ year period. The thresholds
are set separately for each field. The thresholds are based on the cutoffs given
in the All Years column of the Baseline Percentiles table.
The absence of a country or territory name means the country/territory did not
meet the citation threshold in any field,
siehe Thresholds).
a) citations per paper:
b) Gesamtanzahl der Citations:
Unter Citation Rankings:
Journals ist die gleiche bibliometrische Analyse für Zeitschriften
zu finden:
(for journals top 50%, siehe Thresholds).
Unter Most Cited Papers: Highly Cited Papers (last 10 years) kann man die in den letzten zehn Jahren am meistens zitierten Arbeiten:
entweder nach dem Gebiet (Physics)
oder nach dem Land (Austria) oder Institution:
Unter Most Cited Papers:
Hot Papers (last 2 years) ist
die gleiche Bibliometrische Analyse innerhalb der letzten zwei Jahren zu finden:
Unter Citation Analysis Research - Baselines sind zwei andere bibliometrische Analysen zu benützen:
Unter Average Citation Rates wird die mittlere Zitierhäufigkeit je nach dem Fach errechnet (ein Paradebeispiel für die Abhängigkeit der Impaktfaktoren vom Fachgebiet):
(Erklärung: "A value of 9.11, for instance, in the field of Chemistry
in 1996 indicates that the average paper in that year has since been cited 9.11
times).
Unter Percentiles wird die Anzahl
der Zitierungen verstanden, die eine Arbeit in einem bestimmnten Fachgebiet
benötigen wurde, um zum TOP 0,01, 0,10, 1,00 oder 10% in diesem Gebiet
zu gehören.
Die Percentiles werden hier errechnet und zeigen, wie sich die Zitierhäufigkeit in einem bestimmnten Fachgebiet innerhalb der letzten zehn Jahren entwickelt hat:
To read this table:
The Percentiles page is divided into sections for each individual scientific
field, with the "All Fields" section combining all data. Within each
section are rows for the four percentile breakdowns (0.01%, 0.1%, 1%, and 10%).
Data for the percentiles are given for the last 10 years, with the "All
Years" column using all data for those years.
See the picture above. In the Chemistry portion of the table, a value of 66,
for instance, in the 0.01% column for 1998 indicates that the top 0.01% of papers
in chemistry journals in that year have since been cited a minimum of 66 times.
Unter Citation Analysis
Research Fronts werden die Research Fronts ("current
articles can be organized into subject areas according to the clusters of older
papers that they cite in common") identifiziert:
Die können nach deren Namen oder innerhalb eines Fachgebietes gesucht werden:
d)
ISIHighlyCited.com
an expert gateway to
the most highly influential scientists and scholars worldwide.
ISIHighlyCited.com ermöglicht eine schnelle und einfache Identifizierung der am meisten zitierten Forscher und Körperschaften (weniger als 0,5 %) zwischen 1981-1999.
"This freely accessible Web site gives research professionals working in a variety of occupations an invaluable tool to identify individuals, departments and laboratories that have made fundamental contributions to the advancement of science and technology in recent decades.
ISIHighlyCited.com reveals the face of research--the people behind the accomplishments in 21 broad subject categories in life sciences, medicine, physical sciences, engineering and social sciences. These individuals are the most highly cited within each category for the period 1981-1999, and comprise less than one-half of one percent of all publishing researchers--truly an extraordinary accomplishment.
ISIHighlyCited.com will grow to include the top 250 preeminent individual researchers in each of 21 subject categories who have demonstrated great influence in their field as measured by citations to their work--the intellectual debt acknowledged by their colleagues"
Allgemeine Hinweise:
Ganz angenehm sind die zahlreichen Optionen, die das Sortieren
der Ergebnisse nach verschiedenen Kriterien ermöglichen.
In dem Teil Citation fällt außerdem die Einschränkung
"nur erster Autor" aus, allerdings nur für diese Arbeiten, die in
dem Source Teil verzeichnet werden.
e)
National Science Indicators Database
Auch in Produkt von ISI. Eine bibliometrische Datenbank, die Angaben
zu nationalen wissenschaftlichen Aktivitäten beinhaltet und eine Zeitspanne
von 1981 bis 2003 umfasst.
Grundindikator für jedes Land ist die Zahl der Artikel aus den ISI Zeitschriften
und deren Zitierrate. Die Daten sind nach Zeitraum in 24 Fachgruppen (Standard
Version) bzw. in 105 (Deluxe Version) recherchierbar (siehe Instructions).
Die Zuverlässigkeit dieser Datenbank hängt von der Genauigkeit der
gelisteten Adressen und deren richtige Bearbeitung in der bibliometrischen Analyse
ab.
Allgemeine Kritik an SCI und an JCR:
1) Umfang des Datenmaterials:
3) Auswahlpolitik für auszuwertende Zeitschriften
4) Fehler bei der Verarbeitung der Zitierdaten
z. B. Lange (2001) entdeckte, dass JCR die Zeitschrift Education
Research durch die Zitierungen der Zeitschrift Education Researcher, die nicht
in JCR gelistet ist, über 20 Jahren lang aufwertete (13).
5) Die JCR-Daten sind nicht repräsentativ genug
6) Korrelation von Zitierfrequenzen aus Zitatanalysen und Benutzungs- und Bestellungsfrequenzen in Bibliotheken ist nicht so hoch wie erwartet (Gorraiz & Schlögl 2003) (14)
Kritik an "Impact Factor":
1) Kritik am Zeitraum der ausgewerteten Daten (aus den beiden
letzten Jahren)
Zuerst Widersprach Garfield die Kritik, später allerdings
änderte er seine Position und gestand ein, dass in bestimmten Disziplinen
ein längerer Zeitraum doch angemessener wäre.
2) Kritik am Umfang der auszuwertenden und ausgewerteten Daten
3) Kritik an der Qualität der ausgewerteten Daten (Selbstzitierungen!,
Titeländerungen)
4) Missverständnisse bei der Interpretation: Die
Berücksichtigung der Artikeltypen ist eine Voraussetzung für eine
genaue Interpretation.
5) Einfluss auf die Verlage und die Publikationsformen
("E. Garfield beherrscht mit absolutistischer Macht die wissenschaftliche
Szene. Editors und Verleger von Journals, die zitiert werden wollen, geben sich
in Philadelphia die Klinke in die Hand", Lindner)
6) JCR berücksichtigt bei der Berechnung des Impact Faktors Zitierungen zu allen Artikeln und Beiträgen, zählt allerdings nicht alle Dokumenttypen als veröffentlichte Arbeiten (Glänzel und Moed, 2002) (15)
7) Oft wird der IF für die Evaluierung individueller Artikel
gleichgesetzt (siehe unten, the bibliographic method for evaluation of research).
In manchen Ländern, wie Finnland, Ungarn oder Spanien, ist der IF offizieller
Indikator bei der Bewertung des wissenschaftlichen Outputs.
Tatsache jedoch ist, dass bei einem Großanteil del Zeitschriften nur 20%
der Artikel 80% der Zitierungen erreichen und ein hoher Prozentsatz nie zitiert
wird. Zum Beispiel, in Nature sollten 69% der Artikel unter dem Durchschnitt
liegen (16 % der Arbeiten verbuchen mehr als 50% aller Zitate für Nature).
Hingegen gibt es Artikel in Zeitschriften mit niedrigem
IF, die mehr als 400 Zitierungen erzielen.
The bibliographic method for evaluation of research
This method allots points to an article according to the impact factor of the
journal in which it has been published (in general the higher the impact factor,
the more difficult to get an article accepted) Such a correlation holds true
only statistically but not on an individual article.
It allows easy comparison between individuals, institutions or regions.
Currently based on ISI List of “top” (ranking top 10 or 20%), “standard“(ranking
between the top 10/20 and 60%) and “other” journals (different analyses:
number of publications or impact per capita, gross national product, money spent
for research, or per academic position and university)
8) Der h-Index
wurde von Hirsch (2005) zur Bewertung der Forschungsleistungen einer einzelnen
Wissenschaftlerin bzw. eines einzelnen Wissenschaftlers vorgeschlagen. Der
Hirsch-Index ist nun diejenige Zahl, bei der die Rangnummer mit der Anzahl der
Zitierungen übereinstimmt. Ein Hirsch-Index von beispielsweise 40
bedeutet, dass der betreffende Forscher 40 Arbeiten verfasst hat, die alle mindestens
40 Mal zitiert wurden.
("A scientist has index h if h of his/her Np papers have at least h citations
each, and the other (Np-h) papers have fewer than h citations each")
Praktische Nachteile von SCI:
1) Nur erster Autor wird zitiert!
In Web of Science werden alle Autoren zitiert, allerdings nur für Artikel,
die als Kern-Zeitschriften in der Datenbank indiziert werden.
2) Formale Fehler (Computer-generiertes Verzeichnis)
Sie können von den Autoren der Originaltexte verursacht oder
während der verlegerischen Produktion entstanden sein. Diese Fehler sind
in Abhängigkeit vom Arbeitsaufwand zum Teil korrigierbar (ca. 1% aller
Bandangaben sind fehlerhaft), Mangel an Konsequenz!
3) Probleme mit Homographen (Autoren mit gleichem Namen)
4) teuer
9. Scopus:
eine neue Alternative?
Das neue Navigationssystem Scopus von Elsevier ist ein Informationssystem,
das die Vorteile der Recherche in klassischen Fachdatenbanken mit der Suche
und Analyse von Literaturzitaten verbindet. Diese Datenbank, die von Reed Elsevier
als Alternative zum ISI Science Citation Index entwickelt worden ist und am
3. November 2004 offiziell gestartet wurde, wird vom Produzenten als "World's
Largest Database of Abstracts and Cited References" bezeichnet.
SCOPUS weist 27 Millionen Artikel (abstracts and citations)
aus zirka 14.000 Peer-Reviewed Zeitschriftentiteln (d.h. Zeitschriften, deren
Artikel von in der Regel wissenschaftlichen Gutachtern geprüft werden)
nach, darunter 90% aus den Fachbereichen Medizin, Naturwissenschaften
und Technik und
ca. 10% auch aus den Sozial- und Wirtschaftswissenschaften und der Psychologie.
Scopus zeichnet sich durch eine leicht zu bedienende
Oberfläche und ermöglicht es darüberhinaus
herauszufinden, wie oft Artikel zitiert wurden und das in einer Kollektion von
mehr Fachzeitschriften und mehr Autoren als jemals zuvor.
Scopus wird ständig weiterentwickelt.
Suchoberfläche
Die Suchoberfläche ist analog zu Science Direct gestaltet,
hier sei daher nur auf einige Besonderheiten hingewiesen:
1) Abstract + Refs
Scopus erfasst derzeit bis 1999 zurück auch die Literaturhinweise
(Referenzen) der Zeitschriftenaufsätze. Die Referenzen
werden mit dem vollen bibliographischen Zitat angegeben und weisen ihrerseits
den Link Abstract + Refs auf, wenn der Artikel in Scopus erfasst
wird.
2) Cited by
Die Auswertung der Referenzen ermöglicht die Angabe der Zitierungshäufigkeit
(Zahl in der Spalte Cited by) und die Verlinkung zu den zitierenden
Artikeln (klicken Sie auf die Zahl in der Spalte Cited by).
3) Fulltext View at publisher
Elsevier hat - über das Elsevier-Produkt LinkFinder, nicht über SFX
- Links zu Volltexten aus von der UB Innsbruck lizenzierten elektronischen Zeitschriften
gelegt. Die Links sind durch einen Button Fulltext kenntlich gemacht.
Das bedeutet dann, dass ein Volltextzugang für Angehörige dieser Universität
besteht.
Der derzeit bereits bei manchen Treffern vorhandene Button
View at publisher bedeutet, dass es beim jeweiligen Verlag einen
elektronischen Volltext gibt.
Registrierung
Die Validierung erfolgt auf Grund der IP-Adresse Ihres Gerätes, eine Registrierung
ist daher nicht notwendig.
Registrierte Benutzer können jedoch zusätzlich
folgende Funktionalitäten benutzen:
My Alerts = regelmäßige Email-Benachrichtigungen,
wenn neue Artikel zu einem bestimmten Thema oder ein neues Heft einer Zeitschrift
erscheinen, bzw. wenn ein bestimmter Artikel zitiert wird
My Profile = Abspeichern von Suchprofilen
Die Registrierungsmöglichkeit finden Sie am Scopus-Bildschirm ganz rechts
oben. Ihre Science-Direct-Kennung gilt auch in Scopus
Scopus im Vergleich zum Web of Knowledge
Scopus enthält über 90% der in SCI (Science Citation Index) und SSCI
(Social Sciences Citation Index) erfassten Zeitschriften und darüber hinaus
weitere 6.500 Zeitschriften. Der Anteil an europäischen Zeitschriften ist
in Scopus deutlich höher als im Web of Knowledge.
Zitate ab Publikationsjahr 1999 enthalten die zitierten
Arbeiten, und zwar als vollständiges bibliografisches Zitat und nicht in
der von den Citation Indices bekannten, sehr abgekürzten Form.
Scopus ermöglicht daher wie die Citation Indices
die Durchführung von Zitatanalysen: Bereits in der Trefferliste einer Suche
in Scopus wird die Zitationshäufigkeit in der rechten Spalte "Cited
by" dargestellt. Klickt man auf die Zahl, so werden die zitierenden Arbeiten
aufgelistet. Die Zitationshäufigkeit wird auch für die in den Literaturhinweisen
eines Aufsatzes genannten Artikel angegeben.
Die in Scopus angegebene Zitationshäufigkeit einer
Arbeit muss mit der Zitationshäufigkeit im SCI nicht notwendigerweise übereinstimmen,
denn:
a) In Scopus werden nur Zitationen in Arbeiten ab 1999
angezeigt, ältere Arbeiten erreichen daher im SCI oder SSCI eher mehr Zitationen.
b) In Scopus werden Zitationen in von Scopus erfassten Zeitschriften angezeigt.
Da dies deutlich mehr Zeitschriften sind (14.500 im Vergleich zu ca. 9.000 in
SCI und SSCI), kommen für Arbeiten ab 1999 unter Umständen mehr Zitationen
zu Stande als bei einer Zitatanalyse im SCI oder SSCI.
Die ganze bibliometrische Infrastruktur (wie z. B. Impaktfaktoren
der Zeitschriften), die von Garfield für SCI entwickelt wurde, fehlt aber!
Mehr Informationen unter scopus-info.
Vergleich der Inhalte Scopus und Science Citation
Index - Ist mehr oder weniger Inhalt besser?
und
Beiträge:
Themenschwerpunkt Web of Science - Scopus
10.
SJR: SCImago Journal & Country Rank
Die neue Alternative zu JCR und ESI?
The SCImago Journal & Country Rank is a portal that includes
the journals and country scientific indicators developed from the information
contained in the Scopus® database (Elsevier B.V.). These indicators could
be used to assess and analyze scientific domains.
This platform takes its name from the SCImago Journal
Rank (SJR) indicatorpdf, developed by SCImago from the widely known algorithm
Google PageRank™. This indicator shows the visibility of the journals
contained in the Scopus® database from 1996.
SCImago is a research group from the University of Granada,
Extremadura, Carlos III (Madrid) and Alcalá de Henares, dedicated to
information analysis, representation and retrieval by means of visualisation
techniques.
As well as SJR Portal, SCImago has developed The Atlas
of Science project, which proposes the creation of an information system whose
major aims is to achieve a graphic representation of the IberoAmerican Science
Research. Such representation is conceived as a collection of interactive maps,
allowing navigation functions throughout the semantic spaces formed by the maps.
SJR (SCImago Journal Rank): The SJR is an indicator that expresses the number of connections that a journal receives through the citation of its documents divided between the total of documents published in the year selected by the publication, weighted according to the amount of incoming and outgoing connections of the sources. See detailed description of SJRPDF.
11. Präsentation der Ergebnisse
Folgende Beispiele dienen als Muster:
a) Auswirkung einer individuellen
Arbeit
b) Eminenz eines bestimmten Forschers: Beispiel
1 und Beispiel 2
c) Prestige und Leistung einer bestimmten Forschungsanstalt,
(by citation impact oder by total
citations), einer Firma oder eines Landes (Österreich
2002)
d) Internationale Vergleiche für ein bestimmtes
Fachgebiet
e) Bei Zitatanalysen von Zeitschriften werden die Zitierfrequenzen aller
in einer Zeitschrift enthaltenen Artikel summiert und die Summe als Maß
für den Wert der Zeitschrift angesehen. Die Auflistung nach verschiedenen
Kriterien ist die einfachste Art der Präsentation. Paradebeispiele liefern
die Ranking-Listen der JCR. Unter Einsatz der elektronischen Datenverarbeitung
sind auch mehrdimensionale Darstellungsarten entwickelt worden.
Besondere Beachtung finden die sogenannten "one-stepmaps" bzw.
"two-step maps", bei denen jeweils diejenige
Zeitschrift B bestimmt wird, die von einer Zeitschrift A am häufigsten
und bzw. am zweithäufigsten zitiert wird. Dabei werden Selbstzitate, d.h.
Zitate anderer Artikel der gleichen Zeitschrift nicht berücksichtigt. Bei
der Einbeziehung einer definierten Menge von Zeitschriften entsteht ein Netzwerk,
in dem die Zuordnung "A zitiert am häufigsten B" durch einen Pfeil
repräsentiert wird.
Eine andere sehr gebrauchte Darstellungsmethode ist die Cluster-Analyse,
nach der Zeitschriften, die sich gegenseitig häufig zitieren als andere,
eine inhaltliche zusammenhängende Gruppe bzw. einen Cluster bilden.
Der Informationswert der Cluster-Analyse basiert auf der Verarbeitung einen
großen Menge von elektronisch gespeicherten Zitierdaten und eines ausgefeilten
Iterationsprozesses (Software). Wegen ihres riesigen operationalen Aufwandes
wird diese Methode meistens nur bei Untersuchungen in der Wissenschaftskunde
verwendet.
"By citing other works, authors create footprints in
the landscape of scholarly achievement".
Diese "Spuren" sind die wichtigsten Instrumente, die uns für
das Studium der Entwicklung und Struktur der Wissenschaft zur Verfügung
stehen. Obwohl die Häufigkeit des Zitierens einer Arbeit nichts Endgültiges
über ihre Qualität, jedoch über ihre Auswirkung aussagt,
kann man mit großer Wahrscheinlichkeit behaupten, dass eine häufig
zitierte Arbeit, ein wichtiges, wissenschaftliches Ergebnis enthält, oder
dass sie, nach den Worten von Cronin, eine tiefe Spur hinterlassen hat.
Die Einführung der Zitate als Bewertungsmethode des Impakts
einer Arbeit hat die aktuelle "Veröffentlichungskrankheit" entlarvt:
Mehr als ein Drittel dieser Arbeiten werden nicht einmal zitiert.
Würden zusätzlich die Selbstzitate betrachtet, stiege diese Zahl dramatisch.
Mehrere Untersuchungen von E. Garfield zeigen, dass die mittlere
Zitatenjahresquote von zitierten Veröffentlichungen bei etwa 1,7 liegt
oder dass die festgelegte Schwelle der für diese Quote, die bei 15 bis
17 Zitierungen liegt, von weniger als 1 Prozent der im "Science Citation Index"
verzeichneten Arbeiten überschritten wird.
Nur extrem wenige Veröffentlichungen werden oft zitiert (z.B.
mehr als 100 mal) und sehr viele nur selten (1-10 mal) oder überhaupt nicht.
Eine solche unsymmetrische Verteilung wird in Anlehnung an die Untersuchungen
über die Verteilung von Einkommen von V. Pareto zu Ende des vorigen Jahrhunderts
als Pareto-Verteilung bezeichnet. Fast 50 Prozent aller vom SCIENCE CITATION
INDEX erfassten Veröffentlichungen aus dem Zeitraum 1981-1985 wurden im
Zeitraum von 5 Jahren nach ihrem Erscheinen kein einziges Mal von anderen Autoren
zitiert. Der Anteil der mehr als einmal zitierten Publikationen wurde auf nur
20 Prozent abgeschätzt. Dazu muss einschränkend bemerkt werden, dass
1/4 der erfassten Veröffentlichungen Kurzmitteilungen sind, die in der
Regel nicht zitiert werden. Für den Bereich der Naturwissenschaften allein
und bei Nichtberücksichtigung der Kurzmitteilungen beträgt der Anteil
der nicht
zitierten Veröffentlichungen immerhin noch 23 Prozent
(aus einer Zitierungsanalyse der Veröffentlichungen in 1984 und deren
Zitierungen bis Ende 1988).
Natürlich gibt es auch Kontroverse über die
Gültigkeit
dieser Methode und ihre richtige Anwendung und Interpretation. Keine
Bewertungsmethode kann aber durchaus objektiv und perfekt sein. Es werden
sicher immer einzelne Fälle von Benachteiligungen auftreten, es wird
auch sicher immer sehr gute Veröffentlichungen geben, deren Bedeutung
und Qualität erst viele Jahre nach ihrem Erscheinen, wenn überhaupt,
anerkannt werden.
Solche bibliometrischen Untersuchungen können aber
zweifellos einer besseren Orientierung und Beurteilung der wissenschaftlichen
Leistung von konkreten Forschern und Forschungsanstalten dienen. Die erfolgreiche
Durchführung solcher Analysen setzt aber gute Kenntnisse über
diese Methode, deren Schwäche, Mängel und Einschränkungen
voraus. Fehlplanungen und -urteilen sind sehr gefährlich, wenn man
betrachtet, von welch großer Bedeutung die Interpretation der Ergebnisse
sein kann.
1. Gorraiz, J.: "Die unerträgliche Bedeutung der
Zitate".
In: Biblos. Jg. 41 (1992), H. 4, S.193-204.
2. Lawani, S.M.: Bibliometrics: Its Theoretical Foundations,
Methods and Applications.
In: Libri. Copenhagen. Jg. 31 (1981),
S. 294-315.
3. Pritchard, A.: Statistical Bibliography or Bibliometrics?
In: Journal of Documentation. London.
Jg. 25 (1969), H. 4, S. 348-349.
4. Garfield, E.: Is citation analysis a legitime evaluation
tool?
In: Scientometrics. Amsterdam. Jg.
1 (1979), S. 359-375.
5. Garfield, E.: In Tribute to Derek John de Solla Price:
A Citation Analysis of Little Science, Big Science.
In: Scientometrics. Amsterdam. Jg. 7 (1985),
H. 3-6, S. 487-503.
6. Vinkler, P.: A quasi-quantitative citation model.
In: Scientometrics. Amsterdam. Jg. 12 (1987),
H. 1-2, S. 47-72.
7. Schlögl, Christian: "Gefahren und Nutzen von bibliometrischen Untersuchungen am Beispiel Informationsmanagement", 26. Österreichischer Bibliothekartag "Produktionsfaktor Wissen", UniversitätsCampus Wien, 19. - 23. September 2000
8. Werner Marx und Gerhard Gramm: Wächst der Wissenschaft das Wissen über den Kopf?
9. Christian Schlögl, Juan Gorraiz, Christoph Bart, Monika Bargmann: "Evaluating two Austrian university departments: Lessons learned ", Scientometrics, Vol. 56, Iss. 3 (2003), S. 289-299 (pdf-version)
10. "Handbook of quantitative studies of science and technology",
Van Raan A.F.J. [Editor]
Amsterdam, North Holland, 1988, ISBN 0-444-70537-6
11. Svozil, Karl: "Der Alltag eines Peers, Biblos-Schriften 179, 73-94 (2004); presented at the ODOK '03 (Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare), Salzburg, Austria, September 2003
12. Qualität und Quantität wissenschaftlicher Veröffentlichungen
: bibliometrische Aspekte der Wissenschaftskommunikation / Maja Jokic ; Rafael
Ball. Forschungszentrum Jülich GmbH, Zentralbibliothek . - Jülich
: Forschungszentrum, Zentralbibliothek , 2006 . - 186 S. . - (Schriften des
Forschungszentrums Jülich : Reihe Bibliothek ; 15 )
ISBN 3-89336-431-5
13. Lange, L. L. (2001): The impact factor as a phantom. Journal of Documentation 58 (2), 175-184
14. "Document delivery as a source for bibliometric analyses: the case of Subito", C Schlögl & J Gorraiz, Journal of Information Science, 32 (3) 2006, pp. 223–237
15. "Journal impact measures in bibliometric research"; Wolfgang Glänzel & Henk F. Moed; Scientometrics; Vol. 53, Nr. 2, S. 171-93
16. Garfield E., "Historiographic Mapping of Knowledge Domains Literature" Keynote Address, Arthur M. Sackler Colloquium on "Mapping Knowledge Domains" Beckman Center of the National Academy of Sciences, Irvine, CA, May 9-11, 2003. Presentation. No:506
17. Tijssen, R.J.W. (1992), Cartography of Science: Scientometric Mapping with Multidimensional Scaling Methods, DSWO Pres, Thesis Leiden University, Leiden.
18. Debackere K, Verbeek A, Luwel M, Zimmermann E: "Measuring
progress and evolution in science and technology - I. The multiple uses of bibliometric
indicators", INTERNATIONAL JOURNAL OF MANAGEMENT REVIEWS 4 (2): 179-211
(2002)
Elektronische Dokumente zum Thema Bibliometrie, Scientometrie
Benjamin F. Bowman, Werner Marx, Urs Schoepflin:
Anmerkungen zum Einsatz
von Zitierungsanalysen für die Forschungsevaluation
Werner Marx, Hermann Schier, Michael Wanitschek:
Kann man Forschungsqualität
messen? .
(erschienen im MPG-Spiegel 3/1998)
(Zitierungszahlen als Maß für Resonanz auf wissenschaftliche
Aktivität)
Teresa Y. Neely:
The Impact
of Electronic Publications on Promotion and Tenure Decisions
(über Bedeutung elektronischer Veröffentlichungen für
bibliothekarische Karrieren, primär in wissenschaftlichen Bibliotheken
der USA , Oktober 1999)
Tobias Opthof *
Sense
and nonsense about the impact factor