Top-Fragen
Zeitleiste
Chat
Kontext
H-Index
bibliometrische Kennzahl für das Ansehen eines Wissenschaftlers Aus Wikipedia, der freien Enzyklopädie
Remove ads
Der h-Index ist eine Kennzahl für die weltweite Wahrnehmung eines Wissenschaftlers in Fachkreisen. Die Kennzahl basiert auf bibliometrischen Analysen von Zitationen der Veröffentlichungen des Wissenschaftlers. Ein hoher h-Index ergibt sich, wenn eine erhebliche Anzahl von Veröffentlichungen des Wissenschaftlers häufig in anderen Veröffentlichungen zitiert wird. Der 2005 von dem Physiker Jorge E. Hirsch vorgeschlagene Bewertungsindex wird gelegentlich auch als Hirsch-Index, Hirschfaktor, Hirsch-Koeffizient oder h-number bezeichnet. Neuere groß angelegte bibliometrische Untersuchungen haben jedoch gezeigt, dass der Zusammenhang zwischen h-Index und durch die wissenschaftliche Gemeinschaft verliehenen Auszeichnungen seit den 1990er-Jahren deutlich abgenommen hat und alternative, auf einer fraktionalen Zuordnung von Zitationen beruhende Kennzahlen in dieser Hinsicht stabilere Ergebnisse liefern.[1]




Der h-Index eines Wissenschaftlers kann im Laufe der Zeit nicht sinken; andererseits kann er auch nicht allein über die Anzahl seiner Veröffentlichungen steigen.
Der h-Index kann auch posthum steigen. Nach oben begrenzt ist er mit der Anzahl der Veröffentlichungen eines Autors.
Remove ads
Definition
Zusammenfassung
Kontext
Der h-Index eines Wissenschaftlers wurde definiert als die größte Zahl , für die gilt: Veröffentlichungen dieses Wissenschaftlers wurden mindestens -mal zitiert.[2]
Äquivalent dazu ist die folgende Definition: Ein Wissenschaftler hat einen Hirsch-Index , wenn von seinen insgesamt Veröffentlichungen mindestens -mal und die restlichen Veröffentlichungen höchstens -mal zitiert wurden.
Zur Ermittlung kann man alle Veröffentlichungen des Autors nach Zitierhäufigkeiten absteigend aufreihen und so weit durchzählen, bis die -te Veröffentlichung weniger als Zitierungen hat; dann ist .
Laut Hirsch ist ein h-Index von 20 nach 20 Jahren Forschungsaktivität das Zeichen eines erfolgreichen Wissenschaftlers. Ein h-Index von 40 nach 20 Jahren Forschungsaktivität zeige den außergewöhnlichen Wissenschaftler an, der wahrscheinlich nur in Top-Universitäten und großen Forschungslabors gefunden werden könne. Einen h-Index von 60 und höher nach 20 Jahren Forschungsaktivität weisen laut Hirsch nur einzigartige Persönlichkeiten auf.[2]
Remove ads
Beispiele zur Berechnung
Zusammenfassung
Kontext
Einige Beispiele von Autoren mit jeweils 10 Veröffentlichungen:
- Bei Zitathäufigkeiten 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 ist der Hirschfaktor 5, weil fünf Veröffentlichungen mindestens fünfmal, die restlichen höchstens fünfmal zitiert wurden. Die sechste Veröffentlichung wurde ebenfalls fünfmal zitiert, sie kann aber nicht mitgezählt werden, weil der Hirschfaktor damit auf 6 steigen würde, und fünf Zitierungen somit nicht mehr ausreichen würden.
- Bei Zitathäufigkeiten 100, 100, 2, 2, 2, 2, 2, 2, 2, 2 ist der Hirschfaktor 2, weil zwei Veröffentlichungen mindestens zweimal, die restlichen höchstens zweimal zitiert wurden.
- Bei Zitathäufigkeiten 100, 100, 9, 8, 3, 2, 2, 1, 1, 0 ist der Hirschfaktor 4, weil vier Veröffentlichungen mindestens viermal, die restlichen höchstens viermal zitiert wurden.
Beispiel mit zeitlichem Verlauf
- Bei Veröffentlichung der ersten Arbeit ist diese noch nicht zitiert. Der Autor hat den Hirschfaktor 0.
- Die Arbeit wird irgendwann erstmals zitiert. Der Autor hat den Hirschfaktor 1.
- Der Autor wird noch einmal zitiert. Er behält den Hirschfaktor 1.
- Der Autor schreibt einen neuen Artikel. Er behält den Hirschfaktor 1.
- Auch der zweite Artikel wird einmal zitiert. Er behält den Hirschfaktor 1.
- Nach einiger Zeit sind alle Artikel genau zweimal zitiert. Er erhält den Hirschfaktor 2.
- Die nächsten fünf Artikel erscheinen, ohne zitiert zu werden. Er behält den Hirschfaktor 2.
- Als alle Arbeiten zweimal zitiert sind, bleibt der Hirschfaktor bei 2.
- Der Autor hat mittlerweile zwei Arbeiten, die jeweils zehnmal zitiert sind, und fünf weitere, die nur zweimal zitiert sind. Hirschfaktor 2.
- Eine neue bahnbrechende Arbeit erscheint und wird gleich nach Veröffentlichung zweimal zitiert. Der Autor behält den Hirschfaktor 2.
- Als diese dritte Arbeit ein drittes Mal zitiert wird, erhöht sich der Hirschfaktor auf 3.
- Der Autor hat mittlerweile drei Arbeiten, die jeweils elfmal zitiert sind, und fünf weitere, die dreimal zitiert sind. Hirschfaktor 3.
- Der Autor schreibt weitere drei Artikel, die jedoch nirgends zitiert werden. Der Hirschfaktor bleibt bei 3.
- Ein bisher nur dreimal zitierter Artikel wird ein viertes Mal zitiert. Der Hirschfaktor steigt auf 4.
Remove ads
Hintergründe
Zusammenfassung
Kontext
Der h-Index zur Bewertung wissenschaftlicher Leistungen wurde 2005 von dem argentinischen Physiker Jorge E. Hirsch in den Proceedings of the National Academy of Sciences vorgeschlagen.[2]
Als Datengrundlage zur Berechnung des bibliometrischen Indikators sind diverse Datenquellen denkbar, die Zitierungen nachweisen. Hirsch selbst schlug vor, maßgeblich die Daten des Web of Science zu benutzen, da diese seinerzeit die verlässlichste und umfassendste Datengrundlage darstellten.
Inzwischen kann der h-Index in vielen Zitationsdatenbanken ermittelt werden, z. B. in Google Scholar, wenn der Autor ein Profil hat.
Eine groß angelegte empirische Studie zu vier Fächern (Biologie, Informatik, Ökonomie und Physik) hat die Eignung des h-Index und anderer Zitationskennzahlen als Indikatoren wissenschaftlicher Reputation systematisch untersucht, indem jeweils 1000 hochzitierte Forschende pro Fach über ihre Veröffentlichungen und Zitationen in den Datenbanken Scopus und Google Scholar nachverfolgt wurden.[1] Für diese 4000 Personen wurden seit 1970 insgesamt rund 1,3 Millionen Veröffentlichungen mit etwa 102 Millionen Zitationen in Scopus sowie 2,6 Millionen Veröffentlichungen mit rund 221 Millionen Zitationen in Google Scholar ausgewertet.[1] Als Näherung für wissenschaftliche Reputation dienten über 10.000 vergebene Preise und Mitgliedschaften in wissenschaftlichen Akademien und Fachgesellschaften, welche den Forschenden der Stichprobe zugeordnet wurden.[1]
In der Studie wurden für jedes Jahr ab 1990 Ranglisten der betrachteten Personen nach verschiedenen Kennzahlen (unter anderem h-Index, Gesamtzitationszahl, g-Index und weitere Varianten) gebildet und mit Ranglisten nach der Zahl und Art der genannten Auszeichnungen verglichen.[1] Als Maß für die Übereinstimmung der Rangreihen diente dabei unter anderem Kendalls τ, das die Stärke der Rangkorrelation zwischen Kennzahl und Auszeichnungsrang misst.[1]
Beispiel mit unterschiedlichen Datenbasen
Am Beispiel des theoretischen Physikers Stephen W. Hawking (1942–2018) lässt sich der Einfluss der für die Ermittlung des h-Indexes verwendeten Datenbasis gut veranschaulichen. Die Erhebung der Daten erfolgte am 15. Juni 2017:
Entwicklung
Der h-Index wird nicht nur als Kennzahl für Autoren verwendet, sondern auch für Institutionen, Arbeitsgruppen, Länder oder Zeitschriften. Für bestimmte Zwecke werden auch Varianten genutzt (s. u.).
Eigenschaften
Der h-Index hat einige Vorteile gegenüber anderen Kennzahlen (wie zum Beispiel der Gesamtanzahl von Zitationen eines Autors oder dem Impact-Faktor), da die Zitationen einer einzigen, viel-zitierten Veröffentlichung keinen großen Einfluss auf den Index haben. Dies kann aber auch als Nachteil interpretiert werden, da eventuell bahnbrechende Artikel nicht entsprechend gewürdigt werden (es kommt quasi zu einer harmonischen Angleichung der Bewertung der Zitate). Außerdem wird weder die Zahl der Koautoren noch die Tatsache berücksichtigt, ob die zitierte Veröffentlichung eine Originalarbeit oder ein Übersichtsartikel ist. Generell ist zu beachten, dass durch Zitationen die (unterschiedlich begründete) „Popularität“ und nicht notwendigerweise die wissenschaftliche Relevanz einer Veröffentlichung gemessen wird; so hätte der früh verstorbene Évariste Galois trotz seiner grundlegenden Arbeiten für die Mathematik nur einen h-index von 2, und Albert Einstein hätte nach dem Annus Mirabilis einen h-index von 4 gehabt.
Grundsätzlich haben junge Forscher niedrigere h-Indizes als ältere im gleichen Fach, da sie noch weniger publiziert haben. In Fächern, in denen weniger publiziert und zitiert wird, sind die h-Indizes niedriger als in Fächern mit hohem Output. Obwohl eine hohe Produktivität nicht zwangsläufig mit einem höheren Index belohnt wird, so kann der h-Index maximal so hoch wie die Anzahl an Veröffentlichungen sein.
Die erwähnte groß angelegte Studie zeigte, dass der h-Index – ebenso wie andere einfache Zitationskennzahlen – bis etwa 2010 noch relativ gut mit der Verleihung prestigeträchtiger wissenschaftlicher Preise und Mitgliedschaften korrelierte, seine Aussagekraft als Reputationsmaß aber seither deutlich abgenommen hat.[1] Im physikalischen Datensatz auf Basis von Scopus sank beispielsweise Kendalls τ zwischen Ranglisten nach h-Index und nach Auszeichnungen von Werten um 0,33–0,36 in den 1990er- und 2000er-Jahren auf 0,00 im Jahr 2019.[1] Ähnliche, wenn auch feldspezifisch unterschiedliche Rückgänge wurden in Biologie, Informatik und Ökonomie sowie für Analysen auf Grundlage von Google-Scholar-Daten beobachtet.[1]
Auch die Fähigkeit des h-Index zur Prognose zukünftiger Auszeichnungen auf Basis der Kennzahl in einem früheren Jahr nahm im Untersuchungszeitraum ab, während fraktionale Varianten eine über die Zeit weitgehend stabile Vorhersagekraft aufwiesen.[1] In den Analysen wurde die prognostische Güte dadurch gemessen, wie stark Ranglisten nach den bibliometrischen Kennzahlen eines Jahres mit Ranglisten nach Auszeichnungen fünf Jahre später übereinstimmen, wobei der klassische h-Index im Mittel eine sinkende und fraktionale Maße eine weitgehend konstante Korrelation erreichten.[1]
Bei den fraktionalen Kennzahlen werden Zitationen nicht vollständig jeder aufgeführten Person zugeschrieben, sondern anteilig auf die Koautorinnen und Koautoren eines Artikels verteilt, typischerweise durch Division der Zitationszahl durch die Zahl der Autorinnen und Autoren.[1] Ein fraktionales Analogon des h-Index (oft als h-frac bezeichnet), bei dem der Schwellenwert nicht auf die vollen, sondern auf die fraktional gewichteten Zitationszahlen angewendet wird, erwies sich im Rahmen dieser Untersuchung als robustester Indikator und erzielte im Mittel höhere Korrelationen mit wissenschaftlichen Auszeichnungen als alle getesteten alternativen Kennzahlen.[1] Über alle untersuchten Felder und Datenquellen hinweg erreichte dieses Maß im Jahr 2019 einen durchschnittlichen Kendall-τ-Wert von etwa 0,32, während der klassische h-Index nur auf ungefähr 0,16 kam.[1] Auch hinsichtlich der Prognose zukünftiger Auszeichnungen lag das fraktionale Maß mit durchschnittlichen τ-Werten von rund 0,33 über den beobachteten Zeitraum deutlich vor dem klassischen h-Index, dessen Prognosegüte von etwa 0,32 Mitte der 2000er-Jahre auf rund 0,24 in den 2010er-Jahren zurückging.[1]
Probleme
Die Erhebung der Grunddaten stellt eine große Schwierigkeit dar. Mit der von Hirsch vorgeschlagenen Datengrundlage (Web of Science von Clarivate) werden unter anderem Buchveröffentlichungen schlecht erfasst, was die Ergebnisse der Erhebung stark beeinflusst. Insbesondere in den Sozial- und Geisteswissenschaften können weitere Veröffentlichungen wie z. B. Buchrezensionen bedeutend sein, ohne dass diese häufig zitiert und damit im h-Index berücksichtigt werden. Wird die Erhebung hingegen auf eine nicht kontrollierte, größere Datengrundlage wissenschaftlicher Veröffentlichungen erweitert (z. B. Google Scholar), so kann der h-Index durch viele Selbstreferenzierungen gezielt manipuliert und leicht in die Höhe getrieben werden, wie 2011 an der Universität Grenoble demonstriert wurde.[3] Deshalb sind h-Indizes immer mit der zugrundeliegenden Datenbank und dem Erhebungsdatum anzugeben. Ferner ist die Abgrenzung von Autoren mit gleichen Namen ein Problem.[4] Durch Verwendung von Identifikatoren wie ORCID wird eine korrekte Zuordnung erreicht.
Ein weiterer Problembereich betrifft die stark gewachsene Größe vieler Autorenteams und insbesondere sogenannte Hyperautorenschaft, bei der große Konsortien hunderte oder tausende Personen als Koautorinnen und Koautoren auflisten und diese auf einer Vielzahl gemeinsamer Veröffentlichungen erscheinen.[1] In dem physikalischen Datensatz der genannten empirischen Studie stieg die mittlere Zahl der Koautorinnen und Koautoren pro Veröffentlichung bei hochzitierten Forschenden von 78 im Jahr 1994 über 121 im Jahr 2004 auf 952 im Jahr 2019, wobei 10 % der Personen im Jahr 2019 durchschnittlich mehr als 2441 Mitautorinnen und Mitautoren pro Veröffentlichung aufwiesen.[1] Parallel dazu nahm der Anteil der hochzitierten Physikerinnen und Physiker, die im Durchschnitt weniger als zehn Koautorinnen und Koautoren pro Artikel hatten, von 84 % im Jahr 1980 stark ab, während 2019 rund 68 % mehr als 100 Koautorinnen und Koautoren pro Veröffentlichung aufwiesen.[1]
Da der h-Index allen aufgeführten Personen die volle Zitationszahl der gemeinsam verfassten Arbeiten zuschreibt, können Forschende in solchen Großkollaborationen sehr hohe h-Indizes erreichen, ohne dass sich daraus notwendigerweise der individuelle Beitrag zu den jeweiligen Arbeiten ablesen lässt.[1] In der genannten Studie zeigte sich, dass insbesondere Personen aus Großkollaborationen sehr hohe h-Indizes akkumulierten, während ihre fraktionalen Indikatoren wie der h-frac meist deutlich niedrigere Werte aufwiesen und damit weniger stark von Hyperautorenschaft beeinflusst waren.[1]
Die Autorinnen und Autoren der Untersuchung argumentieren zudem, dass fraktionale Kennzahlen zwar die inflationsartige Wirkung immer größerer Autorenteams auf Zitationsmetriken neutralisieren, zugleich aber produktive Kooperation nicht bestrafen, da Forschende mit hohen fraktionalen Werten im Durchschnitt weiterhin in moderat großen Teams publizieren.[1] Unter den Physikerinnen und Physikern mit den höchsten Werten des fraktionalen h-Index lagen die mittleren Teamgrößen typischerweise im Bereich von etwa vier bis sechs Koautorinnen und Koautoren pro Artikel, während Hyperautoren mit tausenden von Koautorinnen und Koautoren zwar sehr hohe klassische h-Indizes, jedoch nur moderate fraktionale Werte erreichten.[1]
Die Bedeutung, die der h-Index und vergleichbare bibliometrische Maße für die Karriere von Wissenschaftlern haben, führt zu Optimierungsstrategien, die sich negativ auf die wissenschaftliche Kultur auswirken. So kann es etwa zielführend sein, eine Veröffentlichung in mehrere Teile zu zerlegen und einzeln zu publizieren, eigennutzenorientiert mit Selbstzitaten. Eine weitere mögliche Strategie besteht darin, Gruppen („Denkschulen“) von 10 bis 15 Wissenschaftlern zu bilden, die eine eigene Zeitschrift oder ein ähnliches Veröffentlichungsorgan gründen und sich darin gegenseitig häufig zitieren. Ebenso sind Zitationszirkel (auch als Zitierkartelle bezeichnet) eine Möglichkeit, um den persönlichen Faktor besserzustellen. Dabei schließen sich Gruppen von Wissenschaftlern zusammen, die sich gegenseitig bei Veröffentlichung zitieren oder die Gruppenmitglieder bei (absehbar zitierfähigen) Veröffentlichungen als Co-Autoren berücksichtigen. Diese Praktiken können die Seriosität der Wissenschaft untergraben.[5] Entsprechend gibt es Stimmen, den h-Index aufzulösen[6] oder die zahlreichen Defizite des h-Index durch Änderungen zu beheben.[7][8][9][10][11][12] Als Konsequenz der beschriebenen empirischen Befunde wird vorgeschlagen, den klassischen h-Index bei der Bewertung individueller wissenschaftlicher Leistungen kritisch zu hinterfragen und stattdessen stärker fraktionale Maße wie den h-frac zu berücksichtigen.[1]
Remove ads
Wissenschaftler mit hohen h-Indizes
Zusammenfassung
Kontext
Wissenschaftler mit den höchsten h-Indizes nach Hirsch
Zur Zeit der Veröffentlichung des Hirsch-Indexes hatte Edward Witten mit 120 den höchsten h-Index unter Physikern. Andere bekannte Physiker erreichten einen h-Index von 62 bis 107. Für Forscher in Biologie und Biomedizin errechnete Hirsch anhand der Zitierungen in den Jahren von 1983 bis 2002 ebenfalls einen h-Index. Den höchsten h-Index dieser Fachgruppe aus dieser Zeit besaß Solomon H. Snyder mit 191, die folgenden 9 Forscher der Rangfolge hatten h-Indizes von 160 bis 120.[2]
Beispiele für h-Indizes 2021
Die folgenden Beispiele geben den Stand am 7. Mai 2021 laut der Datenbank Scopus wieder.
Remove ads
Literatur
- J. E. Hirsch: An index to quantify an individual’s scientific research output. In: Proceedings of the National Academy of Sciences. Band 102, Nummer 46, November 2005, ISSN 0027-8424, S. 16569–16572, doi:10.1073/pnas.0507655102, PMID 16275915, PMC 1283832 (freier Volltext), arxiv:physics/0508025.
- J. E. Hirsch: An index to quantify an individual’s scientific research output that takes into account the effect of multiple coauthorship. In: Scientometrics. 85, 2010, S. 741–754, doi:10.1007/s11192-010-0193-9. (auch arxiv:0911.3144).
- M. Richter: Was misst der h-Index (nicht)? – Kritische Überlegungen zu einer populären Kennzahl für Forschungsleistungen. In: WiSt – Wirtschaftswissenschaftliches Studium. Band 47, Nummer 12, Dezember 2018, S. 64–68.
- A. Sidiropoulos, D. Katsaros, Y. Manolopoulos: Generalized h-index for Disclosing Latent Facts in Citation Networks. In: arXiv. 2006, arxiv:cs/0607066.
- P. Ball: Achievement index climbs the ranks. In: Nature. Band 448, Nummer 7155, August 2007, ISSN 1476-4687, S. 737, doi:10.1038/448737a, PMID 17700666.
- V. Koltun, D. Hafner: The h-index is no longer an effective correlate of scientific reputation. In: PLOS ONE. Band 16, Nummer 6, 2021, e0253397, doi:10.1371/journal.pone.0253397.
Remove ads
Weblinks
Commons: Hirsch index – Sammlung von Bildern, Videos und Audiodateien
- Harzing.com – Publish or Perish Auf Google-Scholar-Daten basierendes kostenloses Analysetool zur Ermittlung des Hirsch-Faktors
- ISI Web of Knowledge – Datenbank die H-Index Auswertung beinhaltet (Zugang nur nach Anmeldung oder über z. B. Campus-Logins)
- SCImagojr.com – H-Index für Zeitschriften (nicht auf Personenebene)
- Der h-Index – Berechnung und Bedeutung der bibliometrischen Kennzahl, Video-Tutorial (deutsch)
Remove ads
Einzelnachweise
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
