Un récent commentaire de mixlamalice m'a rappelé un autre fait, en matière de bibliométrie, que "tout le monde" connait, mais que personne ne connait.

Les grandeurs bibliométriques ne peuvent se comparer que discipline par discipline, et même sous-discipline par sous-discipline, et entre auteurs du même âge. Pour l'âge, c'est une évidence : si j'arrêtais immédiatement de publier (note pour mes co-auteurs : je plaisante...), mon H-index continuerait de croître, mécaniquement, pendant un certain temps. Pour les disciplines, il faut prendre conscience de la différence qu'il y a entre la Physique et, mettons, les Mathématiques. Tout le monde a en tête la fameuse étagère qui devrait grandir d'un metre par jour rien que pour conserver l'ensemble des publications en Physique. Il est clair que personne ne les lit toutes, ces fameuses publications. On est dans le quantitatif (...mais le nombre de citations par article étant en proportion du nombre total de publications, le facteur d'impact devient vite très grand...)

À l'inverse, les Mathématiques font le pari de la qualité : peu d'articles, mais ils sont très denses. Du coup, la qualité d'un article s'évalue pour lui même, sans avoir besoin de tenir compte de la revue dans laquelle il est paru. Mais les facteurs d'impact sont beaucoup plus faibles.

On a aussi des différences dans la façon de compter les auteurs. Pour une grosse expérience de physique, comme le CERN, l'ensemble des chercheurs du CERN est mis comme auteur dans la publication (3 pages d'auteurs, 3 pages de résultats, 3 pages de bibliographie...). C'est logique : il est impossible de faire le tri entre ceux qui ont effectivement travaillé à l'expérience et les autres. Pour mes papiers en informatique, je ne place comme auteur que les gens qui ont effectivement fourni un apport utile à la publication, classés par l'importance de leurs contributions. Ce qui donne des papiers à 2-3 auteurs, parfois 5 pour des collaborations entre 2 universités. Les mathématiciens sont des spécialistes des publis à un auteur. Ça aussi, ça joue sur le nombre de publications par auteur.

Où je veux en venir, avec ma porte ouverte ? Ici : comme personne ne peut avoir lu l'ensemble des publications en Physique (Chimie, Biologie...), ni même l'ensemble des publications d'un seul auteur, l'utilisation d'outils bibliométriques s'est probablement imposé... D'où la nécessité d'avoir des bases bibliographiques exhaustives, et probablement des gens qui passent un certain temps à débugger ISI/Scopus/... (pour vérifier que leurs publis sont bien dedans). À l'inverse, des disciplines plus petites (comme les mathématiques ou l'informatique), où il est possible de lire l'ensemble des publis d'un auteur donné, ont moins besoin d'une base comme ISI. Il y a aussi le côté "mono-éditeur" : accéder à l'ACM Digital Library me donne 50-60 % des publis d'un auteur, et 80 % de ses publis de rang A.

Bref, si les bases comme ISI sont incomplètes en Informatique, c'est peut-être simplement parce que jusqu'ici on n'en avait pas besoin...