Концепция WWW "указать и кликнуть" сделала просмотр содержимого Интернет таким же лёгким, как и открыть дверь нажав на неё пальцем-индексом, но каждый новый сетевой сёрфер скоро узнаёт, что очень часто запросы остаются без ответа. Широко известный URL может поменяться из-за изменения конфигурации компьютера, реорганизации файловой системы или изменения в организационной структуре и : выдать пользователю ошибку 404 - Файл Не Найден!
Коллекции современных библиотек, архивов и музеев содержат постоянно увеличивающееся количество цифрового контента - текстов, изображений, аудио-визуальной информации. Непредсказуемая мобильность перемещения ресурсов Интернет является для них серьёзной проблемой. Необходимы инструменты позволяющие управлять подобными хранилищами и решать проблемы местоположения ресурса. Одним из решений является развитие системы URI (Universal Resource Indificator) и взаимодействие её на прикладном уровне с системой URN (Universal Resource Name), разрабатываемой комитетом IETF (Internet Engineering Task Force).
На сегодня существует несколько проектов, основанных на принципе URN.
DOI (Digital Object Identifier - Цифровой Идентификатор Объекта) - уникальный номер созданный для идентификации части интеллектуальной собственности в онлайновой среде. DOI состоит из двух частей - префикса и суффикса, разделённых левым слэшем. Поскольку регистрация в этой системе платная мы выбрали ее бесплатный вариант решения - Handle System
Получение handle в отличие от DOI бесплатно. Единственное условие состоит в том, чтобы номер был зарегистрирован на сервере http://www.handle.net. Необходимо отметить, что несмотря на потраченные нами усилия и переписку с разработчиками, нам так и не удалось установить эту систему в РГБ. Более того, разработчики не смогли нам указать другую организацию с работающей системой Handle System.
В результате, мы приняли решение использовать механизм Persistent URL (purl), предложенный OCLC. Суть механизма состоит в том, что для каждого объекта, нуждающегося в неизменной, постоянной ссылке, создаётся уникальная ссылка-идентификатор на специальном сервере постоянных адресов организации, которая в состоянии гарантировать сохранность такой ссылки на протяжении длительного времени. Такими организациями являются, например, национальные библиотеки, так как они имеют стабильное финансирование и государственную поддержку. При этом при обращении к ссылке на сервере постоянных адресов происходит поиск соответствия идентификатора и адреса, по которому в данный момент доступен интересующий объёкт, и перенаправление на найденный адрес.
В OCLC был разработан пакет программного обеспечения, позволяющий реализовать вышеописанный механизм. Этот пакет доступен для бесплатного скачивания на сайте http://purl.org, в том числе и для ОС Linux. Однако последняя версия ПО для ОС Linux доступна только в исходных кодах, в то время как для ОС Solaris и ряда других коммерческих клонов ОС Unix она доступна в скомпилированном варианте. Версии PURL для ОС Windows не существует, что может являться определённым препятствием для внедрения данного механизма обеспечения постоянных ссылок в некоторых организациях.
Так как последняя версия PURL для ОС Linux существует только в исходных кодах, то была предпринята попытка скачать и установить именно её. При этом оказалось, что значительную часть дистрибутива занимает версия PURL, скомпилированная для ОС Solaris, что вызвало определённое недоумение, т.к. ОС Linux не позволяет запускать двоичные файлы этой ОС. Другим непонятным моментом стало наличие в дистрибутиве исходных кодов двух версий web-сервера Apache, одна из которых нигде и никак не используется.
После прочтения инструкции пакет был скомпилирован и установлен, и продемонстрировал частичную работоспособность: при помощи Web-интерфейса управления постоянными ссылками были доступны такие функции, как регистрации и авторизации владельцев ссылок, создание нового соответствия, поиск постоянных ссылок. Однако перенаправления на текущий адрес объекта не происходило. В результате переписки с разработчиками ПО и самостоятельного исследования исходных кодов пакета, выяснилось, что неработоспособность механизма перехода на текущую ссылку зависела от несогласованности документации и используемых по умолчанию конфигурационных файлов.
Тем не менее, благодаря именно этой нестыковке, было получено более точное представление о возможностях ПО PURL и выявлены некоторые его слабые стороны. Так, слабыми сторонами можно считать следующие моменты:
- Значительная интеграция механизма перехода на текущую ссылку и web-сервера Apache. Существующая структура ПО требует наличие отдельного экземпляра ПО web-сервера Apache, в то время как решение на базе виртуального web-сервера было бы более предпочтительным.
- Реализация механизма PURL на нескольких языках программирования (perl, c). Использование различных языков программирования усложняет создание доработок ПО и поиск в нём ошибок.
- Использование нереляционной БД и текстовых файлов для хранения информации о постоянных ссылках. При использовании реляционной СУБД ряд алгоритмов, используемых в ПО PURL, мог быть существенно упрощен, а надежность хранения данных и скорость их обработки могла быть существенно выше
- Невозможность автоматического создания доменов верхнего уровня через web-интерфейс. Для создания требуется отредактировать соответствующий конфигурационный файл и перезапустить сервер PURL
- Отсутствие поддержки ОС Windows
Тем не менее, несмотря на ряд недостатков, ПО PURL, разработанное OCLC, позволяет, при наличии компьютера под управлением ОС Unix, внедрить систему постоянных ссылок в короткие сроки с минимальными затратами.