l Combien de livres ont été publiés dans le monde depuis l'invention de l'imprimerie ? Quelle est la taille du savoir écrit produit par l'humanité ? Selon les algorithmes de Google, la réponse est proche de 130 millions. Google reconnaît qu'il est en fait pratiquement impossible de faire le compte de tous les livres écrits. Certains ont disparu à jamais comme dans l'incendie de la bibliothèque d'Alexandrie. Mais Google Books, qui s'est fixé pour tâche colossale et controversée de cataloguer l'ensemble du savoir écrit de la planète, a besoin d'une estimation même relativement imprécise de la tâche à accomplir et du nombre d'ouvrages à scanner et numériser. L'ingénieur Leonid Taycher explique la difficulté d'une telle évaluation, à commencer par savoir ce qu'est un livre et ce qui n'en est pas un. Google a finalement décidé de le définir par un certain volume écrit. «L'une des définitions du livre qui nous a aidé est celle d'un tome, un volume idéal. Un tome peut avoir des millions de copies ou seulement exister à un ou deux exemplaires». Google admet que cette définition est imparfaite mais utilisable et similaire à la norme. Cette norme, qui vise à identifier les livres et éviter les plagiats, existe seulement depuis trois à quatre décennies et uniquement dans le monde occidental. Elle ne peut donc servir de seule référence à Google Books qui a multiplié les accords dans le monde avec les librairies pour scanner le plus grand nombre d'ouvrages et a collecté plus de 150 sources de données sur les livres existants. Il existerait en fait un milliard de livres différents répertoriés dans les librairies de la planète, mais les algorithmes de Google conçus pour détecter les doublons, ont ramené ce nombre à 210 millions d'ouvrages uniques. Ensuite, ce nombre a été à nouveau réduit en tenant compte des millions de microfiches, enregistrements sonores, cartes, vidéos... pour arriver à 146 millions. Enfin, Google Books a soustrait les publications gouvernementales et administratives pour parvenir à un peu moins de 130 millions de «vrais» livres représentant le savoir écrit de l'humanité.