О проекте Российского центра биологических данных (РЦБД)

1. Введение (постановка задачи).

1.1. Краткий обзор состояния проблемы (сравнение с зарубежной практикой).

В конце 80-х гг. компьютеризация охватила биологические учреждения. В последние годы получили развитие международные проекты по унификации и сбору данных о фауне и флоре (GBIF, Systema Naturae 2000, Species 2000, The Tree of Life, All Species Foundation, FishBase, Fauna Europea и др.), в том числе и по морским (CoML, ArcOD, CAML, WoRMS, ERMS и др.). Но при всем разнообразии существующих проектов и подходов, из-за отсутствия квалифицированных специалистов по многим группам животных, появляющиеся в Интернете списки видов часто грешат ошибками в латинских названиях и другими таксономическими погрешностями. В проекте WoRMS (the World Register of Marine Species) сейчас предпринимается попытка создания сети общения специалистов по систематике морских животных для более эффективного использования опыта ведущих ученых по различным вопросам описания фауны Мирового океана.

1.2. Обоснование предлагаемого пути и методов решения задачи.

Зоологический институт РАН одним из первых учреждений зоологического профиля начал компьютеризацию исследований в России, в конце семидесятых годов прошлого столетия. В 1988 г. была создана Межлабораторная группа, которой было поручено «выяснение объема и состава отдельных таксонов животных СССР, учет их изученности и обеспеченности специалистами, поддержание этих сведений в соответствии с новейшими данными и формированию на основе этих сведений головных разделов машинных банков данных и кадастров».

К настоящему времени завершено несколько проектов по компьютеризации изучения биологического разнообразия (ЗООИНТ, БИОДИВ, ЗООДИВ). Создан достаточно оснащенный информационный центр. Локальная компьютерная сеть Института состоит из трех сегментов, соединённых оптоволоконным кабелем. В сеть включены более 200 персональных компьютеров и 10 серверов. Локальная сеть соединена с глобальной сетью оптоволоконным Интернет-каналом связи провайдера Петерстар, который имеет симметричную скорость 2 Мбит/сек. Таким образом, практически все сотрудники Института имеют доступ к современным мировым информационным ресурсам и могут использовать любые доступные на сегодняшний день информационные сервисы, от электронной почты до удалённого доступа к электронным библиотекам.

Веб-портал института, расположенный на одном из серверов Института, практически бесперебойно работает несколько лет. Он содержит более 21 тысячи страниц и более 45 тысяч изображений общим объёмом более 6 гигабайт (не учитывая объём интерактивных баз данных). За 2007 год портал посетило более 3.5 миллионов посетителей, запросивших более 20 миллионов страниц портала.

Используя весь накопленный потенциал, информационная группа и специалисты из других подразделений Института начали осуществлять работы по созданию Центра биологических данных МПГ и обеспечению сбора и накопления этих данных.

2. Цель работы.

Цель проекта состоит в создании технологии сбора, накопления и обмена биологическими данными, полученными по программе МПГ 2007/08, и их интеграции в информационную систему МПГ-Инфо.

3. Задачи работы.

— Разработка технологии по управлению биологическими данными в организации — центре данных Международного Полярного года (МПГ) 2007/08;

— Создание каталога данных по тематике проекта, доступного пользователям;

— Сбор данных экспедиционных наблюдений и научных проектов национальной программы МПГ 2007/08 по профилю деятельности центра, зарегистрированные в базе метаданных и включенные в информационные ресурсы системы МПГ-Инфо.

4. Перечень и объем работы.

Планируемая работа состоит в:

4.1. обеспечении приемки, каталогизации и накоплении материалов экспедиционных наблюдений и научных исследований от организаций — исполнителей проектов МПГ по направлению, закрепленному за центром МПГ;

4.2. проведении синтаксического, семантического и экспертного контроля данных;

4.3. формировании полных и качественных баз биологических данных из однотипных массивов данных, полученных в отдельных экспедициях или экспериментах;

4.4. обеспечении долговременного гарантированного хранения данных и метаданных МПГ путем записи накопленных данных, метаданных и их каталогов на технические носители информации (лазерные диски);

4.5. расширении информационных ресурсов в целях МПГ посредством привлечения данных из других источников, включая коммерческие и международные организации;

4.6. пополнении таблиц кодов и словаря параметров;

4.7. мониторинге сбора данных и метаданных;

4.8. предоставление данных и метаданных МПГ по запросам пользователей.

5. Организация работы.

Технические решения должны быть скоординированы с системными решениями и обеспечивать интеграцию информационных ресурсов в МПГ-Инфо.

Коды и классификаторы, используемые в качестве информационно-лингвистического обеспечения технологии, должны быть совместимы с Общими Кодами и Классификаторами ЕСИМО.

Будет подготовлена эксплуатационная документация на информационно-технологический комплекс.

Каталог данных должен содержать информацию, позволяющую идентифицировать данные и связанные метаданные, источник и время их поступления, другую информацию, облегчающую поиск и извлечение данных. Каталог будет создан в среде реляционных баз данных.

Массивы данных должны быть зарегистрированы в системе МПГ-Инфо. Структурная организация массивов данных должна позволять предоставление их пользователям в полном виде, а также в виде выборок групп отдельных записей или элементов. Массивы должны сохраняться и предоставляться пользователям в форматах, предусмотренных Планом управления данными МПГ.

6. Ожидаемые результаты работы и отчетность.

Научно-техническая продукция будет состоять из следующих составных частей:

— Технологии по управлению биологическими данными в организации — центре данных Международного Полярного года (МПГ) 2007/08;

— Каталога данных по тематике проекта, доступный пользователям;

— Данных экспедиционных наблюдений и научных проектов национальной программы МПГ 2007/08 по профилю деятельности центра, зарегистрированные в базе метаданных и включенные в информационные ресурсы системы МПГ-Инфо.

Должна быть подготовлена эксплуатационная документация на информационно-технологический комплекс, включающая:

— Общее описание технологии;

— Описание информационной базы;

— Руководство по ведению технологии.

Публикации по теме проекта.

Smirnov I. 1993. Working out a databank on marine invertebrates. In: Abstracts of 8th International Echinoderm Conference. Dijon, September 6 - 10, 1993. P. 111.

Smirnov I., Lobanov A., Dianov M. 1994. Information system for Antarctic marine animals. In: Abstracts of SCAR SIXTH BIOLOGY SYMPOSIUM: Antarctic Communities: Species, Structure and Survival. Venice, 30 May - 3 June, 1994. P. 247.

Скарлато О.А., Старобогатов Я.И., Лобанов А.Л., Смирнов И.С. Базы данных по зоологической систематике и сведения о высших таксонах животных // Зоологический журнал. 1994, Т. 73, Вып.12. С.100-116.

Скарлато О.А., Старобогатов Я.И., Лобанов А.Л., Смирнов И.С. Биоразнообразие и возможности его анализа с применением компьютерных банков данных // Биоразнообразие. Степень таксономической изученности, М., Наука, 1994, С.20-41.

Gavrilo M., Sirenko B., Smirnov I., Lobanov A. et al. Initial Survey of Russian Data Sources // INSROP working paper. 1995. N 9. P. 1-103. (6,18, 103 стр.)

Смирнов И.С., А.Л. Лобанов, М.Б. Дианов, А.А. Голиков. О возможном использовании информационно-поисковой системы "OCEAN" для исследования морских водорослей. Тезисы докладов II совещания "Компьютерные базы данных в ботанических исследованиях", 17-19 апреля 1995. С.-Петербург, стр. 53,54.

Smirnov I.S., A.L. Lobanov, Yu.B. Okolodkov. The PLANTCOD classifier and the OCEAN information retrieval system applied to studies on Arctic marine dinoflagellate biodiversity. In Abstracts of International Conference "Problems of the studying of the Arctic algae, fungi and moss biodiversity", 1995. P. 16, 17.

Смирнов И.С., А.В. Смирнов. "ОКЕАН" - банк данных по коллекциям морских беспозвоночных Зоологического института РАН // Базы данных и компьютерная графика в зоологических исследованиях, Труды Зоологического института, т. 269, Санкт-Петербург, 1997: 133-135.

Смирнов И.С., Лобанов А.Л., Околодков Ю.Б. Использование классификатора "PLANTCOD" и ИПС "OCEAN" для исследования биоразнообразия арктических морских водорослей. Третье совещание "Компьютерные базы данных в ботанических исследованиях" Санкт-Петербург, 20-22 мая 1997 года, Ботанический институт РАН. Программа и тезисы докладов. 1997. С. 45.

Голиков А.А., И.С. Смирнов, А.Ф. Алимов, А.Л. Лобанов. Проблемы формирования банка данных на основе коллекций морских беспозвоночных Зоологического института РАН. Современное состояние планктона и бентоса, проблемы сохранения биоразнообразия арктических морей. Тезисы докладов международной конференции г. Мурманск, 27-30 апреля 1998 г. Мурманск. 1998. с. 35,36.

Лобанов А.Л., И.С. Смирнов, А.А. Голиков, Е.А. Воронина. База данных ихтиологических коллекций Зоологического института. Современное состояние планктона и бентоса, проблемы сохранения биоразнообразия арктических морей. Тезисы докладов международной конференции г. Мурманск, 27-30 апреля 1998 г. Мурманск. 1998. с. 69,70.

Golikov A.A., I.S. Smirnov, A.L. Lobanov, M.B. Dianov. Results of development of information retrieval system on marine invertebrates collection in Zoological Institute (OCEAN). Information Retrieval Systems in Biodiversity Research. Proceedings of the Zoological Institute RAS, v. 278, (Abstracts of the International Symposium), S.-Petersburg, 1999: 102-103. (in Russian and in English)

Voronina E.P., I.S. Smirnov, A.A. Golikov. The computer approaches to the ichthyological studies in Zoological Institute RAS. Information Retrieval Systems in Biodiversity Research. Proceedings of the Zoological Institute RAS, v. 278, (Abstracts of the International Symposium), S.-Petersburg, 1999: 116. (in Russian and in English)

Смирнов И.С., А.В. Неелов, А.А. Голиков. История биологической океанологии, базы данных и глобальная экология // История отечественной океанологии. Тезисы докладов II Международной конференции, 20-24 сентября 1999 г., Калининград, 1999: 140-142.

Лобанов А.Л., Дианов М.Б., Смирнов И.С. Зоогеографическое районирование на основе баз данных находок таксонов // Методологические проблемы развития зоологии. Тезисы докладов Международной конференции, посвященной 275-летию Российской академии наук (26-29 октября 1999 г., г. Санкт-Петербург), Санкт-Петербург, 1999: 43-46. (по-русски и по-английски).

Smirnov I.S., A.A. Golikov, A. Rachor, D. Piepenburg. Study of long-term changes of ophiurid fauna (Echinodermata, Ophiuroidea) in the Barents Sea with application of statistical methods. Proceedings of the First International BASIS Research Conference. St. Petersburg, Russia February 22-25, 1998. University of Munster, Germany, 1999: 410-411.

Smirnov I. Station list of brittle stars from the Weddell Sea. In: Biodiversity of the Weddell Sea: macrozoobenthic species (demersal fish included) sampled during the expedition ANT XIII/3 (EASIZ I) with RV "Polarstern", Berichte zur Polarforschung (Reports on Polar Research). N 372. 2000. S. 90-95.

Смирнов И.С., А.Л. Лобанов, М.Б. Дианов, А.А. Голиков, А.Ф. Алимов, А.В. Неелов, М.В. Гаврило. Создание информационно-поисковой системы по экологии бентоса и птиц Антарктики (ECOANT) на основе электронной коллекции беспозвоночных, рыб и птиц. Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Сборник докладов Третьей Всероссийской конференции. RCDL'2001. Петрозаводск, 11-13 сентября 2001 г. - Карельский научных центр РАН, 2001. с. 197-198.

Смирнов И.С., Лобанов А.Л. Офиуры Антарктики: коллекции и базы данных // Бюллетень МОИП, отд. геол., 2002, Т. 77, вып. 1, С. 80, 81. (0,06, 1 стр.)

Смирнов И.С., А.Л. Лобанов, А.А. Голиков, А.В. Неелов, Е.П. Воронина. Информационно-поисковая система "Океан" по коллекциям беспозвоночных и рыб Зоологического института РАН. Информационные ресурсы об океане - актуальные проблемы формирования, распространения и использования в научных исследованиях и в морской деятельности. Тезисы докладов конференции (8-10 октября 2002 г., г. Обнинск). - Изд. отдел ВНИГМИ-МЦД, 2002. с. 73, 74.

Смирнов И.С., А.Л. Лобанов, А.А. Голиков, А.В. Неелов, Е.П. Воронина. Информационно-поисковая система "ЭКОАНТ" по экологии и коллекциям антарктических морских беспозвоночных и рыб // Исследования и охрана окружающей среды Антарктики. Тезисы докладов научной конференции, 13-15 ноября 2002 г., Санкт-Петербург, 2002: 99-101.

Smirnov I.S., A.L. Lobanov, A.A. Golikov, E.P. Voronina, A.V. Neyelov. Information retrieval system "OCEAN" // Information Systems on Biodiversity of Species & Ecosystems. Scientific program & abstracts, SPb. 2003. pp. 15.

Voronina E.P., I.S. Smirnov, A.L. Lobanov, A.A. Golikov, A.V. Neyelov. "ECOANT" - information retrieval system on ecology and collections of the Antarctic marine animals // Information Systems on Biodiversity of Species & Ecosystems. Scientific program & abstracts, SPb. 2003. pp. 64.

Voronina E.P., Nazarkin M.V., Smirnov I.S. Information systems as a tool of ichthyological investigations at the Zoological Institute of the Russian Academy of sciences, St. Petersburg// XI European Congress of Ichthyology (ECI XI), Abstract volume, September 6-10, 2004, Tallinn, Estonia. Estonian Marine Institute Report Series No. 12, Edited by T. Saat, 2004. pp. 98.

Смирнов И.С., Е.П. Воронина, А.Л. Лобанов, А.А. Голиков, А.В. Неелов. Создание информационно-поисковых систем по коллекциям морских животных (рыб и беспозвоночных) в Зоологическом институте РАН // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Шестой Всероссийской научной конференции RCDL'2004, (Пущино, 29 сентября - 1 октября 2004 г.): - Москва, типография ООО "Мультипринт", 2004: 30-33. (на русском языке с английским резюме)

Smirnov I.S., E.P. Voronina, A.L. Lobanov & A.V. Neyelov. 2004. The information system of the marine animals collection (fish and invertebrates) in the Zoological Institute Russian Academy of Sciences. Ocean Biodiversity Informatics. International Conference on Marine Biodiversity Data Management. Hamburg, Germany: 29/11-1/12/2004: 27.

Смирнов И.С., А.Ф. Алимов, А.Г. Кирейчук, Е.П. Воронина, А.Л. Лобанов. Международные проекты по созданию электронных коллекций морских животных: первые результаты // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Седьмой Всероссийской научной конференции (RCDL'2005). Ярославль, 4 - 6 октября 2005 г. - Ярославль: Ярославский государственный университет им. П.Г. Демидова, 2005: 134-137. (на русском языке с английским резюме)

Пугачев О.Н., Алимов А.Ф., Лобанов А.Л., Кривохатский В.А., Смирнов И.С. Первые итоги разработки информационной системы по биоразнообразию России (BIODIV-ZOODIV) // "Информационные системы и web-порталы по разнообразию видов и экосистем". Материалы международн. симпозиума. Борок, 28 ноября - 1 декабря 2006 г., Москва, Тов-во науч. изд. КМК, 2006. С. 170-173.

Smirnov Igor S., Andrei L. Lobanov, Alexei A. Golikov, Elena P. Voronina & Alexey V. Neyelov. Creation of the information retrieval system for collections of the marine animals (fish and invertebrates) at the Zoological Institute of the Russian Academy of Sciences // In: Vanden Berghe, E., W. Appeltans, M.J. Costello, Pissierssens P. (Eds). Proceedings of Ocean Biodiversity Informatics: an international conference on marine biodiversity data management Hamburg, Germany, 29 November - 1 December, 2004. Paris, UNESCO/IOC, VLIZ, BSH, 2007. P. 177-186. (IOC Workshop Report, 202) (VLIZ Special Publication, 37) ISSN 1377-0950

Смирнов И.С., О.Н. Пугачев, А.Л. Лобанов, А.Ф. Алимов, Е.П. Воронина. Электронные коллекции Зоологического института по морским животным и метаданные // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Девятой Всероссийской научной конференции Девятой Всероссийской научной конференции RCDL'2007. (Переславль-Залесский, Россия, 15 - 18 октября 2007 г.). Переславль-Залесский: изд-во Университет города Переславля, 2007: 122-127. (на русском языке с английским резюме) (ISBN 978-5-901795-09-5)

Смирнов И.С., Пугачев О.Н., Лобанов А.Л., Алимов А.Ф., Воронина Е.П. Стандартизация описаний баз данных по биоразнообразию и ее роль в интеграции междисциплинарных ресурсов Интернета // Интернет и современное общество. Труды X Всероссийской объединенной конференции, (23-25 октября 2007 г., г. СПбГУ), Санкт-Петербург, 2007: 146-148. (ISBN 978-5-8465-0740-1)

Smirnov I.S. 2008. Development of Information retrieval system on Polar marine invertebrate's collection in Zoological Institute ("OCEAN"). In: Abstract volume of SCAR/IASC IPY OPEN SCIENCE CONFERENCE: Polar Research-Arctic and Antarctic Perspective in the International Polar Year. St. Petersburg, Russia, July 8th - 11th 2008. P. 436. Poster S4.5/P23.

Халиков Р.Г., Дианов М.Б., А.Л. Лобанов, И.С. Смирнов, А.А. Голиков. Проблемы и результаты разработки проекта ИСиБР "Информационная система по биоразнообрaзию животных России" // Научный сервис в сети ИНТЕРНЕТ: решение больших задач: Труды Всероссийской научной конференции (22-27 сентября 2008 г., г. Новороссийск). - М.: Изд-во МГУ, 2008. с. 382-383. (ISBN 978-5-211-05616-9)

Лобанов А.Л., И.С. Смирнов, М.Б. Дианов, А.А. Голиков, Р.Г. Халиков. Эволюция стандарта ZOOCOD - концепции отражения зоологических иерархических классификаций в плоских таблицах реляционных баз данных // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Десятой Всероссийской научной конференции RCDL'2008 (Дубна, Россия, 7-11 октября 2008 г.): - Дубна: ОИЯИ, 2008: 326-332. (на русском языке с английским резюме)