Google собирается добавить в свой каталог 130 млн наименований книг


Разработчики Google Books надеются добавить около 130 миллионов наименований книг (столько печатных изданий, по мнению Google, существует сейчас на свете) в каталог сервиса, который индексирует сведения о книгах в магазинах и библиотеках, а также публикует редкие издания онлайн, сообщается в четверг в блоге Google.

Чтобы создать свой собственный цифровой каталог книг, Google пришлось исследовать существующие каталоги. В качестве источников использовалась база ISBN (мировой стандарт идентификаторов книг), библиотека Конгресса США и другие.

"Когда работаешь в компании, которая взялась оцифровать все книги в мире, то непременно сталкиваешься с вопросом: а сколько же на свете книг?" - говорится в записи в официальном блоге.

Существующие каталоги, по словам представителей Google, обладают различными недостатками и не дают ответа на вопрос о реальном количестве книг, выпущенных на сегодняшний день. Так, ISBN распространен преимущественно на Западе, существует лишь с 60-х годов, и в его базе нет более ранних изданий. Кроме того, порой ISBN используется не только для книг, но и для разных видов "печатной продукции" - от наклеек на CD-диски до бирок для одежды.

Подсчет усложняется еще и тем фактом, что большинство библиотек ведет учет лишь наименований, считая все издания одной книги как одну учетную единицу.

Таким образом, Google должен будет найти дополнительные источники данных, а также отработать более совершенные алгоритмы фильтрации полученного массива информации на предмет некорректных и дублирующихся записей.

На момент публикации сообщения сотрудники корпорации насчитали 129,865 миллионов наименований печатных изданий. Цифра будет уточняться – обещают в Google.

Источник: РИА "Новости"