ЗООИНТ - ЗООлогическая ИНТегрированная информационно-поисковая система

ZOOINT - ZOOlogical INTegrated retrieval system



Итоги проекта ЗООИНТ
и его дальнейшие
перспективы


 

И.С. Смирнов



История развития проекта ЗООИНТ

 

Интенсивная компьютеризация, происходившая в СССР с начала 80-х годов, не обошла стороной и зоологические учреждения и не могла не затронуть очень трудоемкие и кропотливые работы по сбору, инвентаризации и хранению коллекций - основы основ для изучения биоразнообразия (Алимов, 1999; Лобанов и др., 1999; Смирнов, Рысс, 1999).

Огромные коллекционные материалы Зоологического института РАН и большое число высококвалифицированных зоологов-систематиков послужили благоприятной средой для создания баз данных (БД), а затем и информационно-поисковых систем (ИПС) по систематике животных (Смирнов и др., 1995).

Hаучные коллекции института насчитывают более 50 миллионов этикетированных экземпляров животных. А объем необработанных материалов не поддается даже примерной оценке. Институт уже много лет ведет разработки, направленные на компьютеризацию основных процессов накопления и анализа этой информации.

Современные компьютерные технологии, используемые при накоплении, хранении и переработке информации по систематике и фаунистике животных постепенно меняют существующее положение. Формализованные и стандартизированные данные, хранящиеся в компьютере, при желании автора, доступны всем заинтересованным лицам, могут быть тиражированы или переданы по линиям связи в удаленные пункты, выставлены в сети Интернет. Hеопубликованные материалы становятся более пригодными для дополнения, анализа и обработки. Таким образом, обеспечивается настоящая преемственность между специалистами разных поколений.

Работа по компьютеризации основных процессов накопления и анализа коллекционных, экспертных и литературных данных по систематике и фаунистике различных таксонов животных была начата в Зоологическом институте с появлением в 1987 г. терминала БЭСМ-6, а в 1988 г. - СМ-1420. Приобретение персональных компьютеров в 1989-90 гг. ускорило разработку прикладных программ для зоологов (Скарлато, и др., 1989).

В 1991 г. родилась идея создания интегрированного пакета программ, который бы мог обеспечить ввод информации о коллекциях и одновременно позволил анализировать накопленные данные с помощью различных запросов (Smirnov, 1993; Smirnov et al., 1994).

В 1993 г. эта идея ИПС по зоологии получила поддержку Российского Фонда Фундаментальных Исследований (проект N 93-04-21216 "Система компьютерной интегрированной обработки данных по биоразнообразию животных (ЗООИНТ)") (Lobanov at all, 1994; Смирнов и др., 1995).

В самом начале проект возглавлял академик Орест Александрович Скарлато (Скарлато и др., 1994а,б), поддерживавший развитие компьютерных технологий в Институте, но к сожалению, безвременно ушедший 13 октября 1994 г. По согласованию с РФФИ преемником Ореста Александровича стал Александр Федорович Алимов, не менее активный поборник новых компьютерных методов в биологии. В течение многих лет Александр Федорович возглавлял компьютерный совет, который стоял у истоков компьютеризации Института и создания разнообразных зоологических баз данных. Активными участниками проекта были Елена Петровна Воронина, Михаил Борисович Дианов, Андрей Львович Лобанов, Сергей Глебович Медведев, Игорь Сергеевич Смирнов, Евгений Павлович Соколов и София Давидовна Степаньянц.

За три года, прошедших с начала проекта, удалось разработать систему, которая была названа ЗООИНТ (ЗООлогическая ИНТегрированная система), на основе системы управления базами данных (СУБД) FoxPro для DOS.

В 1996 г. разработка проекта была продолжена под руководством Александра Федоровича Алимова и при поддержке РФФИ (грант N 96-07-89086). Проект получил название "Развитие интегрированной системы ZOOINT для использования зоологических баз данных". К выше перечисленным специалистам, участникам проекта, присоединились: Марк Габриэлович Волкович, Алексей Александрович Голиков, Елена Николаевна Мухина, Алексей Владимирович Смирнов, Ярослав Игоревич Старобогатов, Александр Анатольевич Стекольников и Андрей Валерьевич Стекольщиков (Smirnov et al., 1996; Соколов и др., 1997; Лобанов и др., 1997; Смирнов и др., 1997; Smirnov et al., 1997; Смирнов и др., 1999).

 

Изменения, происходившие в процессе разработки проекта ЗООИНТ

 

В ходе выполнения проект немного трансформировался и дал результаты, несколько отличающиеся от планировавшихся ранее, но даже более ценные.

После появления первой пилотной версии ИПС возникла настоятельная потребность в связывании в единую сеть, поначалу компьютеров разработчиков, а затем и институтских подразделений, которые могли бы пополнять БД и использовать уже накопленные данные в своих целях. Это был первый толчок к дальнейшему развитию системы ЗООИНТ. В 1995-96 гг. с помощью вышеупомянутого гранта РФФИ и поддержки других проектов, удалось объединить несколько компьютеров в локальную сеть и начать освоение сетевой технологии (монтаж и эксплуатация) и сетевой грамотности (специальные программы и навыки работы в сети).

Таким образом, система ЗООИНТ, которая первоначально мыслилась как набор прикладных программ для отдельного зоолога или специалиста-прикладника, переросла в ИПС, требующую для своего развития компьютерной сети, вначале локальной, а затем и выходящей на сети более высокого уровня.

Вторым мощным толчком к развитию компьютерных зоологических систем стало появление мультимедийной технологии, которая резко расширяет возможности накопления, хранения и использования зоологической информации (особенно изображений). Это позволило распространять разрабатываемую ИПС ЗООИНТ на долговечных лазерных дисках CD-ROM для пользователей, не имеющих выхода в Интернет.

Технология мультимедиа подразумевает использование в компьютерных продуктах цветных изображений, звуков и движущихся изображений (анимаций и видеофильмов), требующих для хранения таких больших объемов памяти (десятки и сотни мегабайт), которые ранее были недоступны на большинстве персональных компьютеров до появления лазерных дисков CD-ROM.

Разрабатываемая в Зоологическом институте при поддержке РФФИ (гранты N 93-07-21216 и 96-07-89086), ЗООлогическая ИНТегрированная компьютерная система ЗООИНТ с самого начала была ориентирована на эффективное использование сведений по номенклатуре, систематике, географическому распространению и симбиотическим связям животных. В качестве основного источника данных предусматривалось использование уникальных коллекционных материалов Зоологического института и экспертные данные специалистов. За предыдущие годы коллективом участников проекта проделана огромная работа. Результаты первых трех лет исследований были доложены на совещаниях ADBIS'94 и ISS'95, а также опубликованы в "Вестнике РФФИ", данные последующих лет докладывались на компьютерных конференциях в Ботаническом институте и на ADBIS'96 и ADBIS'97 (Lobanov et al., 1994; Смирнов и др., 1995а; Смирнов и др., 1995б; Smirnov et al., 1996; Smirnov et al., 1997).

К 1999 г. система ЗООИНТ поддерживалась СУБД FoxPro для DOS в локальной сети из 7 компьютеров. Был также создан сайт об информационно-поисковой системе ЗООИНТ в сети Интернет (http://www.zin.ru/projects/zooint_r/index.html).

В течение 1996-1999 гг. большое внимание было уделено созданию локальной сети и адаптации ИПС к работе в этой сети.

Конкретные результаты можно представить следующим образом: 1) разработана концепция и инфологическая структура системы ЗООИНТ; 2) создана работающая версия системы на базе СУБД FoxPro для DOS; 3) созданы фаунистические базы данных по отдельным группам животных, а именно: гидроидам, змеехвосткам, жукам и птицам; 4) создан генеральный компьютерный классификатор животных до уровня семейств; 5) система адаптирована к работе в локальной сети.

11 марта 1999 г. по итогам конкурса был поддержан проект "Информационно-поисковая система ЗООИНТ по биоразнообразию животных" (N 99-07-90315), который по-прежнему возглавил Александр Федорович Алимов (Смирнов, Рысс, 1999; Lobanov et al., 2000; Алимов и др., 2001). Основной целью проекта служила разработка комплекса программных средств для работы с классификацией животного мира, которые станут базой для создания конкретных БД и ИПС систематического, экологического и коллекционного характера.

К 1999 г. ИПС в сетевом варианте была, в основном, принадлежностью только двух лабораторий института, - из-за проблем с финансированием не удалось нарастить сеть до минимально необходимых размеров. По независящим от Института причинам, был потерян доступ в Интернет через академическую сеть РОКСОН.

В последнем проекте 1999 г. делалась ставка на интенсивное развитие локальной общеинститутской сети, которая позволила бы объединить усилия специалистов-зоологов по вводу данных по разным группам животных и, главное, воспользоваться уже накопленной в базах данных информацией. Предполагалось что, ИПС ЗООИНТ с использованием электронных изображений животных должна была стать не только более информативной, но и более привлекательной для образовательных целей. Благодаря усилиям администрации, Институт, наконец, получил постоянный и достаточно быстрый доступ в Интернет. Была запланирована реализация удаленного доступа к таксономической информации, с возможностью работать с базами данных ИПС ЗООИНТ в режиме on-line. Это потребовало не только обновления компьютерного парка разработчиков и пользователей, но и освоения новых программных средств: языка HTML, операционной системы Windows NT, технологии Active Server Pages (ASP) и др. (Алимов и др., 2001).

Первоначально ИПС мыслилась состоящей из 4 основных блоков: классификация животных, распространение, коллекции и библиография.

Затем в ходе разработки система была дополнена следующими двумя блоками: симбиотические связи и специалисты, изучающие данных животных. Включение "симбиотического" блока повлекло за собой необходимость разработки и создания компьютерного классификатора растений.

В силу сложившихся в зоологических учреждениях России предпочтений на первом этапе создания ИПС нами была выбрана СУБД dBase III+, которая уступила место FoxBase, и, наконец, последняя трансформировалась в FoxPro, сначала под MS DOS, затем под Windows.

К сожалению, система FoxPro, приобретенная корпорацией Microsoft, практически прекратила свое развитие.

Тем не менее, освоение этих относительно несложных СУБД позволило зоологам, не привлекая сторонних специалистов, полагаясь только на свои силы, приступить к проектированию и созданию зоологических БД (при низком уровне заработной платы, который существует в академических учреждениях, привлечь со стороны высококвалифицированных программистов было нереально). Первые трудности были преодолены с помощью оригинальной разработки одного из авторов ИПС ЗООИНТ А.Л.Лобанова - компьютерного классификатора ЗООКОД, который позволил создать за короткий срок центральный блок ИПС - блок систематики (Лобанов, Сергеев, 1986; Лобанов, 1986; Лобанов, Зайцев, 1993; Лобанов, Смирнов, 1997; Лобанов и др., 1999).

Данные о географических находках животных решено было вводить в 2-х видах (форматах): в виде координат и в виде названий мест находок с привязкой к большим населенным пунктам или географическим объектам.

В 2001 году система ЗООИНТ развивалась по 3 основным направлениям: 1) доработанный окончательный проект развития общеинститутской локальной сети (ЛВС), стал осуществляться очень интенсивно при поддержке РФФИ и дирекции Института: дополнительно, более 30 компьютеров получили доступ к локальной сети и выход в Интернет. К сожалению, пока, в силу особенностей расположения подразделений в старом здании Института, не удалось подсоединить к ЛВС ряд компьютеров пользователей работающих с базами данных; 2) с помощью разработанной в 1999-2000 гг. технологии подготовки изданий зоологических ИПС на компакт-дисках, был записан третий вариант CD-ROM с усовершенствованной версией системы ЗООИНТ и информацией о развивающемся Web-портале Института; 3) на институтском сайте обновлялась информация о проекте и справочник, базирующийся на введенных в систему данных. При непосредственном участии специалистов, разрабатывающих проект, в мае 2001 г. проведен международный симпозиум "Информационные и телекоммуникационные ресурсы в зоологии и ботанике", который позволил не только собрать специалистов и обсудить насущные задачи биологической информатики в очередной раз, но и подвести некоторые итоги развития компьютеризации в зоологии и ботанике в масштабах СНГ и частично мирового сообщества за последние два года.

Произведенная при подготовке обзора для совещания "Информационные и телекоммуникационные ресурсы в зоологии и ботанике" проверка, существующих родственных проектов в сети Интернет, показывает высокий уровень отечественных разработок. К сожалению, многие попытки создания за рубежом информационных систем по фауне мира или даже отдельного региона до сих пор остаются не реализованными (например, знаменитый проект "прошлого" века Species2000). Наиболее близки к решению отдельных вопросов создания коллекционных баз данных и представления их в сети Интернет ученые Национального Музея Естественной истории Соединенных Штатов Америки в г. Вашингтоне, округ Колумбия (www.nmnh.si.edu/cgi-bin/wdb/iz/pci/form). Правда, блок иллюстраций для этой ИПС пока отсутствует. Классификаторы по важнейшим группам животных уже созданы и за рубежом, но по тщательности заполнения наши базы превосходят то, что нам уже известно для выпущенных дисков CD-ROM и списков, выставленных в сети Интернет. Как уже нами отмечалось, ЗООИНТ продолжает быть инициализирующей точкой, и, прежде всего, конечно, для России, что в определенной степени подтвердило майское совещание "Информационные и телекоммуникационные ресурсы в зоологии и ботанике" (Алимов и др., 2001).

 

Направления развития и трансформация ветвей ИПС ЗООИНТ

 

По мере разработки проекта отдельные аспекты ЗООИНТ превратились в самостоятельные направления.

Многолетняя работа над коллекционными базами данных дала целое дерево ответвлений. Центральный ствол представлен интегрированной системой ЗООИНТ. Основное внимание при развитии ИПС ЗООИНТ было уделено коллекционным данным.

Одна из ветвей ИПС ЗООИНТ дала систему ОКЕАН, которая коллективно используется и усовершенствуется в лаборатории морских исследований и лаборатории ихтиологии. ИПС ОКЕАН направлена на ввод и хранение данных по коллекциям морских животных (Смирнов, Смирнов, 1997; Васильева, Голиков, 1999; Воронина, Смирнов, Голиков, 1999).

Мощное ответвление представлено системой по мировой фауне блох PARHOST, развиваемой С.Г.Медведевым с коллегами (Медведев, 2001).

Вторая ветвь системы ЗООИНТ развивается с участием А.Ф.Алимова, В.Е.Панова и их коллег. Это ИПС INVADER, которая служит для накопления и анализа данных об организмах-вторженцах. Она хорошо представлена на нашем Интернет-сервере (Lobanov et al., 2000). Система по видам-вселенцам - Региональный Центр по Биологическим Инвазиям (РЦБИ) - www.zin.ru/projects/invasions/rus/index.html; версия на английском языке - http://www.zin.ru/projects/invasions/index.html.

Параллельно с сайтом ИПС ЗООИНТ создавались сайты по биоразнообразию, отражающие широкий спектр информации о двух важных группах насекомых - жуках и блохах, это соответственно - www.zin.ru/animalia/coleoptera и - www.zin.ru/animalia/siphonaptera.

Продолжающиеся развиваться сайты по жукам и блохам, по насыщенности информации и углубленной проработке темы не имеют аналогов в русском Интернете, о чем говорит высокая посещаемость данных страниц (в 2001 г. жуки - около 77 тысяч посещений в год, блохи - около 76 тысяч).

Своеобразной интеграцией всех перечисленных направлений является DIALOBIS - концепция построения комплексных биологических руководств на компакт-дисках с использованием элементов мультимедиа (Лобанов и др., 1999).

Успешное развитие ЛВС Института, работа над проектом ЗООИНТ и ее результаты инициировали разработку новых зоологических информационных проектов по различным группам животных и некоторые из них получили в 2000-2001 гг. гранты Российского фонда фундаментальных исследований - 00-07-90304в, 00-07-90287в, 00-07- 90288в, 01-07-90284в, соответственно, это - пресноводные рыбы, простейшие, пресмыкающиеся и насекомые. Пресноводные рыбы России - проект, которым руководит Н.Г.Богуцкая (www.zin.ru/Animalia/Pisces/index.html); Протисты - электронная коллекция, проект, разрабатываемый А.О.Фроловым с коллегами (http://www.zin.ru/Animalia/Protista/index.html); Таксономическая и коллекционная интерактивная база данных по мировой фауне насекомых ZInsecta (руководитель В.А.Кривохатский - www.zin.ru/projects/ZInsecta/index.html). Развивает самостоятельно сайт по круглым червям А.Ю.Рысс (Класс Nematoda: www.zin.ru/Animalia/Nematoda/index.html).

Представляет интерес проект ЭКОАНТ - информационно-поисковая система по ЭКОлогии морского бентоса АНТарктики - www.zin.ru/projects/ecoant/index.html.

 

Стандарт ZOOCOD

 

Одной из проблем создания баз данных и ИПС по зоологии является проблема представления иерархической классификации. Эта проблема была решена путем создания классификатора, специализированной таксономической базы данных, получившей название ЗООКОД или ZOOCOD. Этот стандарт был разработан в конце 80-х годов в ЗИН РАН А.Л.Лобановым для преобразования иерархических классификаций в плоскую реляционную таблицу, таким образом, чтобы все сведения, которые содержатся в систематическом списке, были отражены в соответствующих полях классификатора (Лобанов, Сергеев, 1986; Лобанов, 1986; Лобанов, Зайцев, 1991).

Усовершенствование и многократные испытания стандарта ZOOCOD привели к его широкому распространению (ЗИН, БИН, ИПЭЭ, МГПИ, Нижегородск. ГУ и др.) и появлению новой версии ZOOCOD3.

Практически во всех создаваемых в ЗИН РАН базах данных есть таксономические блоки. В большинстве этих блоков для отражения иерархических классификаций в плоских реляционных таблицах используется концепция ZOOCOD2, подробно описанная ранее (Лобанов, Смирнов, 1997б). Для полного представления классификации и синонимии в этой концепции используются поля: LATNAM (латинское название таксона), RANCOD (код таксономического ранга), SYSCOD (цифровой систематический код), SYN (код синонимии), ABBR (уникальный мнемонический код таксона). В последние годы, в связи со спецификой разработок, использующих стандартные управляющие элементы и диалоговые панели Windows, концепция ZOOCOD претерпела значительные изменения и сейчас правильнее говорить уже о 3-ей версии - ZOOCOD3. К описанному ранее набору полей теперь добавлены поля KEY (уникальный цифровой код таксона) и PARENT (значение KEY для ближайшего родителя). Эти поля позволяют пользоваться специфическим элементом Windows, изображающим иерархию таксонов в виде дерева. Хотя эти два поля полностью отражают многоуровневую иерархию, они неудобны для быстрого поиска всех потомков одного таксона. Для решения этой проблемы изменены правила заполнения поля SYSCOD (в новом виде оно называется HIERCOD). Его значениям приданы строгая и полная иерархичность, ширина поля делается равной максимальному числу уровней иерархии в таблице, а для заполнения используются не только цифры, но и все идущие за ними символы. Поле SYSCOD заполняется специальной утилитой, но зато поиск потомков заданного таксона выполняется молниеносно и предельно просто - наложением фильтра с полностью оптимизируемым условием. Правила заполнения поля LATNAM тоже изменены - в этом поле теперь хранится полное название таксона (т.е. биномен для видов и триномен для подвидовых таксонов).

Увеличившееся за последнее время число попыток создания таксономических электронных списков, таблиц и БД потребовало разработки некоторых первичных правил унификации и систематических баз данных.

Некоторые основные положения и стандарты построения биологических (таксономических) баз данных, которые должны облегчить общение биологов и создание интегрированных систем:

1. Должна использоваться реляционная модель баз данных.

2. В соответствии с требованиями нормализации баз данных информационные системы должны включать отдельные таблицы по каждому аспекту сведений о животных или растениях.

3. Каждый элемент сведений должен храниться в конкретной системе только в одной записи одной таблицы. Это правило влечет за собой широкое использование словарей и классификаторов (или тезаурусов - словарей с иерархической структурой и родо-видовыми отношениями между понятиями).

4. В основе системы должны лежать классификаторы животных, растений, грибов, бактерий и других царств живых организмов.

5. Часто используемые биологами данные о географическом распространении организмов должны быть строго разделены на отдельные аспекты (административно-территориальный, физико-географический, биогеографический, ландшафтный, природно-зональный и т.п.). Термины каждого аспекта должны быть зафиксированы в классификаторах.

6. Добиться ведения разных баз данных в одной СУБД невозможно даже внутри одного института и к этому не нужно стремиться. Важно только использовать профессиональные коммерческие СУБД, имеющие проверенные механизмы импорта и экспорта. В качестве критерия пригодности СУБД предлагается использовать формат DBF (dBaseIII). Если СУБД не способна импортировать или экспортировать этот формат, то ее не следует использовать.

7. Для обеспечения простоты обмена данными между СУБД, работающими в разных версиях операционных систем, следует ограничить длину имен файлов 8 символами, длин расширений имен 3 символами, а названия полей баз данных 10 символами; при этом использовать во всех этих именах только латинские строчные буквы, цифры и символ подчеркивания (при этом не использовать разницу между заглавными и строчными буквами, если какая-то система такую возможность поддерживает). В системах, где длина символьного поля не ограничивается или может быть очень большой, не делать длину поля более 254 символов.

8. Если для представления иерархии не используется стандарт ZOOCOD, то все же нужно стремиться к соблюдению некоторых правил, облегчающих переход к этому стандарту:

а) для указания ранга таксона или понятия использовать только одно поле таблицы, приводя в нем коды или полные названия рангов;

б) иметь поле с уникальным кодом таксона и использовать эти коды для связи с таблицами фактов о таксонах;

в) в отдельном поле отмечать факт синонимии, указывая уникальный код валидного названия для каждого синонимичного;

г) иметь поле для указания систематического порядка записей (упорядочение по нему должно создавать аналог "систематического списка", который привычен и необходим большинству биологов);

д) наличие двух полей, отражающих иерархию способом, принятым теперь в приложениях для Windows (поля для отражения иерархии методом TreeView), ни в коей мере не отменяет необходимость пунктов а) и г), так как эти два поля не отражают истинные ранги таксонов и нужный порядок среди дочерних таксонов одного родительского.

 

Для тех, кто знаком со стандартом ЗООКОД разработаны правила заполнения таксономических БД стандарта ZOOCOD3:

 

В создаваемой базе данных специалистом заполняются только поля: LATNAM и RANCOD (всегда обязательно), GENUS (только для синонимичных названий ранга вида и ниже), AUTHOR и YEAR (желательно), SYN (только для невалидных таксонов), ALTGEN (по желанию, только для видов и инфравидовых таксонов, описанных в другом роде).

Одна запись в базе данных должна соответствовать строго одному таксону одного уровня, обозначаемого в поле RANCOD цифровым кодом. В поле LATNAM всегда вносится одно единственное слово - латинское название, соответствующее данному таксономическому уровню. Hикакие обозначения рангов (типа var., m., ssp. и т.п.) в это поле не вносятся. Поле GENUS, содержащее после окончательного построения классификатора все предшествующие слову из поля LATNAM латинские названия, необходимые для создания полного би-, три- или тетраномена для таксонов ранга вида и ниже, заполняется только для синонимичных названий ранга вида и ниже, но не во всех случаях, а только тогда, когда хотя бы одно из нужных названий (родовое, видовое или подвидовое) не совпадает с ближайшим к синониму валидным названием (если двигаться вверх, к началу базу данных). Hо заполнять это поле (если оно вообще заполняется) нужно полностью, вписывая туда все элементы полного латинского названия, которые предшествуют слову, занесенному в поле LATNAM. Hапример, если для синонимичного подвида родовое название совпадает с вышестоящим валидным родом, а видовое не совпадает с вышестоящим валидным видовым, то вписать в поле GENUS нужно и родовое, и видовое. Точно также вписываются оба эти названия, если совпадает видовое название, но не совпадает родовое.

В поле SYN знаком "равно" (=) отмечаются все невалидные названия (синонимы разного типа и т.п.). Подряд может идти любое число записей с синонимами, важно только чтобы соответствующее им валидное название стояло точно перед ними. Для таксонов, которые не являются синонимами в строгом смысле, а просто понижены в ранге (ранее имели ранг как у валидного, а теперь входят в него) допустимо ставить вместо "=" знак ">".

В поле AUTHOR записывается(ются) автор(ы) названия только того таксона, которому посвящена запись (названия, занесенного в LATNAM). Желательно при заполнении этого поля использовать базу данных (словарь) со стандартными написаниями фамилий авторов. Год описания таксона заносится в поле YEAR. В поле ALTGEN заносится открывающая круглая скобка (только для описанных в другом роде таксонов ранга вида и ниже).

Затем специальными программами (их можно объединить в одну) заполняются поля: GENUS (для валидных таксонов ранга вида и ниже), ABBR и SYSCOD. Эти поля необходимы для стандарта ZOOCOD2. Для работы с программами, использующими возможности Windows (в первую очередь - для представления иерархии в виде интерактивного древа - "TreeView"), необходимы поля KEY и PARENT, также заполняемые специальной программой. Наконец, поле HIERCOD, использование которого в любых случаях более целесообразно, чем аналогичного SYSCOD, тоже заполняется программно. В итоге классификатор может иметь вид, показанный в таблице.

Таблица

Имя поля Тип Длина Hазначение
Поля необходимые для работы в DOS

GENUS

LATNAM

AUTHOR

YEAR

RANCOD

SYN

ALTGEN

ABBR

SYSCOD

C

C

C

C

N

C

C

C

C

60

25

45

4

2

1

1

14

18

недостающие до полного названия вышестоящие термины (род - для вида, род и вид - для подвида, род, вид и подвид - для разновидности или формы)

латинское название (одно слово для данного ранга)

автор таксона

год описания таксона

код ранга таксона

код синонима

отметка описания в другом роде

аббревиатура таксона (возможна замена полем KEY)

систематический код (необязателен при наличии HIERCOD)

Поля необходимые для работы в Windows

HIERCOD

KEY

PARENT

C

C

C

32

10

10

полностью иерархический систематический код (длина поля зависит от числа таксономических рангов в классификаторе)

уникальный код названия (генерируется автоматически)

значение KEY у вышестоящего таксона

(C – символьное поле, N – цифровое поле)

 

От информационно-поисковой системы к информационно-аналитической

 

Используя концепцию ЗООКОД, С.Г.Медведев распространил применение этого стандарта на географические и морфологические названия и понятия, что помогло ему создать очень эффективно работающую систему по блохам мировой фауны (Медведев, 1999, 2001; Медведев, Лобанов, 1999).

Для обобщения большого числа коллекционных данных и литературных материалов по мировой фауне отряда блох в 1996-2002 годах в ЗИН РАН была создана и постоянно развивается компьютерная база данных. К настоящему времени 70 таблиц этой БД содержат 76 тыс. записей объемом 49 Mb, а их работу обеспечивают 150 оригинальных программ. Языками программирования БД являются FoxPro и Fortran. Программы и структура таблиц этой системы обеспечивают не только поиск данных, но и позволяют реализовать ряд эвристических алгоритмов, что по существу делает эту БД информационно-аналитической системой (ИАС). ИАС по мировой фауне блох позволяет не только накапливать первичную информацию, но и проводить всесторонний анализ закономерностей географического распространения и паразито-хозяинных связей представителей этой группы насекомых. В перспективе эта ИАС станет основой для подготовки соответствующего тома «Фауны России» и ее электронной версии.

В основу ИАС были положены специализированные таблицы-классификаторы, каждая из которых упорядочивает и структурирует разнообразие соответственно таксонов паразитов (блох), хозяев (млекопитающих или птиц), физико-географических объектов и административных территорий и т.д. В качестве стандарта для этих иерархических таблиц был выбран стандарт таблиц ZOOCOD2 (см. Лобанов, Зайцев, 1991; Лобанов, Смирнов, 1997), так как он наиболее полно отражает сложные иерархические классификации. Основные поля классификатора в стандарте ZOOCOD2 следующие. Поле RANCOD отражает иерархию категорий таксонов. Поле SYSCOD поддерживает порядок уже конкретных таксонов, отражает соответствие синонимов валидным названиям и дополнительно описывает в удобной форме иерархию таксонов. Поле ABBR дает короткое и уникальное мнемоническое обозначение таксонов. Последнее поле является основным при построении на основе исходных таблиц-классификаторов фактографических таблиц ИАС. Логическая простота и гибкость кодов стандарта ZOOCOD2 позволяют использовать как основные, так и промежуточные таксономические категории, производить автоматические обобщения данных о подчиненных таксонах для вышестоящих таксонов, оперировать с синонимичными названиями таксонов наряду с валидными, практически неограниченно детализировать иерархические схемы классификаций. По существу каждая таблица этого стандарта представляет собой тезаурус, построенный по иерархическому принципу.

Надо подчеркнуть, что имеющаяся в ZOOCOD2 возможность отразить соподчинение не только таксонов основных категорий (например, таких как вид, род, семейство, отряд, класс и тип), но и промежуточных между ними (в частности, таких как триба, когорта, под- и надрод и т.п.) является важным преимуществом этого стандарта. Это связано с тем, что промежуточные категории широко применяются в современной биологической систематике и имеют большое значение для установления новых закономерностей филогенеза и коэволюции.

Основу ИАС составляют 6 таблиц - иерархических классификаторов стандарта ZOOCOD2, построенных по одному принципу. Таблица по мировой фауне блох (включает 3877 записей, 1.1 Mb) была создана в соответствии с оригинальной классификацией отряда и каталогами видовых названий таксонов блох, а также с данными других источников. Оригинальная таблица по млекопитающим (8045 записей, 1.8 Mb) была создана в 1995 г. (Медведев, 1999) по литературным источникам, а затем позднее в 1998-1999 гг. дополнена с помощью файлов Смитсоновского музея, выставленных в Internet. Таблица по мировой фауне птиц (11451 записей, 2.5 Mb) была подготовлена в лаборатории орнитологии и герпетологии ЗИН РАН и в процессе работы над ИАС дополнена фамилиями авторов названий таксонов и годами их описаний. К основным БД относятся также 3 оригинальные БД или классификаторы зоогеографических и административных регионов, а также физико-географических объектов мира. Зоогеографический классификатор содержит 41 запись наименований зоогеографических областей, подобластей и провинций в соответствии с принятым делением суши. Иерархический классификатор административных территорий (9000 записей, 1.8 Mb) включает наименования около 3835 областей, штатов и провинций, более 3565 наименований районов для всех стран мира и территорий. В нем использованы 25 иерархических уровней. Кроме того, ряд названий снабжен указаниями на ранее применявшиеся наименования административных территорий.

Таблица физико-географических объектов состоит из 27600 записей (7.3 Mb). Она была создана в результате анализа 10 географических атласов (в частности, «Атлас мира» (1954), «The Times Atlas» (1998) и др.), более 100 обзорных карт различных стран мира, аэронавигационных и топографических карт масштаба 1 : 1000000-2500000. В нее вошли наименования 1730 гор, 1400 хребтов, 1200 озер, 2000 островов, 6300 рек и т.д. с их выявленными на данный момент синонимами или другими формами написания. Все выше перечисленные объекты классифицированы в соответствии с их принадлежностью к 103 физико-географическим странам, 309 областям и 846 подобластям, приведенным в "Физико-географическом атласе мира" (1964) и учебнике "Физической географии СССР" (1966). Объем и степень подробности таблицы физико-географических объектов, а также ее дифференцированность на уровни классификации (они систематизированы по 22 таксономическим категориям), создают необходимые предпосылки как для ее дальнейшей детализации при описании локальных регионов, так и для интерпретации данных о распространении блох и, возможно, других групп животных. Следует отметить то, что обе географические таблицы позволят постепенно не только накапливать, но и использовать в процессе работы все многообразие синонимичных названий и форм написания.

Созданный для ИАС по мировой фауне блох классификатор административных территорий имеет только 2 сопоставимых аналога - "Тезаурус информационно-поисковый по территориальному аспекту картографических источников" (Москва, "ЦНИИГА и К", 1982) и "World Geographical Scheme for Recording Plant Distributions" (Hollis, Brummitt, 1992). От обоих аналогов административный классификатор ИАС по мировой фауне блох отличается почти вдвое большим объемом, гораздо более подробной иерархией категорий (20 в ИАС против 7 в "Тезаурусе.." и 5 в "World Scheme..") и строгим использованием только административно-территориальных понятий. Классификатор физико-географических регионов по своему объему и детальности иерархии вообще не имеет аналогов в мире.

 

Заключение

 

Разрабатываемые для ИПС ЗООИНТ программы позволят вести полноценный поиск в базе данных о таксонах, быстро просматривать выборочные списки таксонов, полученные по любому запросу или их сочетанию. Специальная программа визуализирует любой список в виде дерева классификации таксонов. Важным свойством всех этих программ будет способность обрабатывать не только полный набор таксонов, но и произвольные выборочные списки. Это позволит проводить сложные многоаспектные поиски в несколько приемов, сохраняя каждый промежуточный результат.

Интегрированный пакет ЗООИНТ открывает широкие перспективы для объединения усилий различных экспертов по обобщению зоологической информации и тем самым ведет к созданию мощных банков зоологической информации, которая может использоваться экологами, специалистами сельского хозяйства и природоохранных органов, учащимися и студентами школ и вузов через компьютерные сети или с помощью тиражирования лазерных дисков (CD-ROM).

Авторы проекта считают, что данная разработка позволит не только облегчить труд зоологов, обеспечить экологов легко доступной таксономический информацией, но и поднимет биологические исследования на новый уровень. Трудно переоценить роль данной информационной системы для сбора и верификации колоссальной информации, которая сосредоточена в коллекциях Зоологического и других институтов и практически малодоступна для специалистов других областей науки и народного хозяйства.

 

Литература

 

Алимов А.Ф., Лобанов А.Л., Пугачев О.Н.. Сравнительный анализ реляционного и сетевого подходов к созданию банков данных по систематике, экологии и географическому распространению животных // Журнал общей биологии, 1993, т. 54, N 1, с. 96-103.

Алимов А.Ф. Компьютеризация биологического учреждения (на примере Зоологического института РАН)// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 6,7.

Алимов А.Ф., Смирнов И.С., Рысс А.Ю., Дианов М.Б., Лобанов А.Л., Голиков А.А. Современные биологические электронные публикации: коллекции, идентификационные системы и базы данных// Информационные и телекоммуникационные ресурсы в зоологии и ботанике. Тезисы 2-го международного симпозиума. СПб. 2001. с. 5-19.

Васильева А.Б., Голиков А.А. Проблемы возникающие при работе нескольких пользователей с одной базой данных ИПС "ОКЕАН"// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 115, 116.

Воронина Е.П., Смирнов И.С., Голиков А.А. Компьютерные методы в ихтиологических исследованиях Зоологического института// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 116, 117.

Лобанов А.Л., Сергеев Г.Е. Проект классификатора названий животных и принцип представления информации об распространении в структуре биологических баз данных// Принципы и методы экоинформатики. М.,1986, с. 214-215

Лобанов А.Л. Линейно-иерархическая структура баз данных о таксонах животных// Принципы и методы экоинформатики. М.,1986, с.293-295.

Лобанов А.Л., Зайцев М.В. Создание компьютерных баз данных по систематике млекопитающих на основе классификатора названий животных "ZOOCOD"// Вопросы систематики, фаунистики и палеонтологии мелких млекопитающих (Труды Зоологического института РАH, т. 243). СПб, 1991, с. 180-198.

Lobanov A., Sokolov E., Smirnov I. ZOOINT - an integrated system for zoological data bases // ADBIS'94. Proceedings of the International Workshop on Advances in Databases and Information Systems. May 23-26, 1994. Moscow, 1994. P. 270,271.

Лобанов А.Л., Смирнов И.С., Алимов А.Ф., Дианов М.Б., Степаньянц С.Д. Интегрированная информационная система ЗООИНТ: современное состояние и перспективы. Отчетная научная сессия по итогам 1996 года. Тезисы докладов. 8-10 апреля 1997. Издание Зоологического института, 1997а: 23-25.

Лобанов А.Л., Смирнов И.С.. Принципы построения и использования классификаторов животных в стандарте ZOOCOD // Базы данных и компьютерная графика в зоологических исследованиях, Труды Зоологического института, т. 269, Санкт-Петербург, 1997б: 66-75.

Лобанов А.Л., А.Ф., Дианов М.Б., Рысс А.Ю. Современные типы биологических электронных публикаций: CD-ROM и Internet// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999а: 39-44.

Лобанов А.Л., А.Ф., Дианов М.Б., Смирнов И.С. Результаты разработок и использования зоологических информационно-поисковых систем// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999б: 54, 55.

Lobanov A.L., Dianov M.B., Medvedev S.G., Panov V.E., Smirnov I.S. Presentation and use of zoological information in the global Internet network. Trudy Zool. Inst. Ross. Akad. Nauk, 286, 2000: 87-92.

Медведев С.Г. Опыт создания базы данных по мировой фауне блох на основе иерархических классификаторов// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 68, 69.

Медведев С.Г., Лобанов А.Л. Информационно-аналитическая система по мировой фауне блох (Siphonaptera): результаты и перспективы развития// Энтомологическое обозрение, 78(3), 1999: 732-748.

Медведев С.Г. Таксономические базы данных: перспективы развития аналитических возможностей// Информационные и телекоммуникационные ресурсы в зоологии и ботанике. Тезисы 2-го международного симпозиума. СПб. 2001. с. 21-39.

Скарлато О.А., Алимов А.Ф., Лобанов А.Л., Умнов А.А. Машинные банки данных - подход к кадастру животного мира. // Всесоюзное совещание по проблеме кадастра и учета животного мира. Научно-информац. материалы к совещ// Уфа, 1989, с.56-64.

Скарлато О.А., Старобогатов Я.И., Лобанов А.Л., Смирнов И.С. Базы данных по зоологической систематике и сведения о высших таксонах животных// Зоологический журнал. 1994а, Т. 73, Вып.12. С.100-116.

Скарлато О.А., Старобогатов Я.И., Лобанов А.Л., Смирнов И.С. Биоразнообразие и возможности его анализа с применением компьютерных банков данных// Биоразнообразие. Степень таксономической изученности, М., Наука, 1994б, С.20-41.

Smirnov I. 1993. Working out a databank on marine invertebrates. - In: Abstracts of 8th International Echinoderm Conference. Dijon, September 6 - 10, 1993. P. 111.

Smirnov I., Lobanov A., Dianov M. 1994. Information system for Antarctic marine animals. - In: Abstracts of SCAR SIXTH BIOLOGY SYMPOSIUM: Antarctic Communities: Species, Structure and Survival. Venice, 30 May - 3 June, 1994. P. 247.

Смирнов И.С., Лобанов А.Л., Соколов Е.П., Дианов М.Б. РФФИ Развитие интегрированной системы ЗООИНТ для зоологических баз данных. Тезисы конференции "Информационные системы в науке -95", 10-12 января 1995а. Москва, стр. 101-103.

Смирнов И.С., Лобанов А.Л., Соколов Е.П., Дианов М.Б. Информационно-поисковая система ЗООИНТ для зоологии// Вестник РФФИ, N 2. 1995б. стр. 34-36

Smirnov I.S., Lobanov A.L., Alimov A.F., Dianov M.B., Medvedev S.G. Development of Information Retrieval Systems for Zoology// Proceedings of the Third International Workshop on Advances in Databases and Information Systems, (ADBIS'96). September 10-13, 1996. V. 2, Moscow, 1996. P. 60-63.

Смирнов И.С., Лобанов А.Л., Алимов А.Ф., Дианов М.Б. Развитие интегрированной системы "BIOINT". Третье совещание "Компьютерные базы данных в ботанических исследованиях" Санкт-Петербург, 20-22 мая 1997 года, Ботанический институт РАН. Программа и тезисы докладов. 1997. стр. 44,45.

Смирнов И.С., Смирнов А.В. "ОКЕАН" - банк данных по коллекциям морских беспозвоночных Зоологического института РАH // Базы данных и компьютерная графика в зоологических исследованиях, Труды Зоологического института, т. 269, Санкт-Петербург, 1997: 133-135.

Smirnov I.S., Lobanov A.L., Alimov A.F., Dianov M.B., Golikov A.A., Stepanjants S.D. Integrated Information System ZOOINT: the Present State and Prospects // Proceedings of the First East-European Symposium on Advances in Databases and Information Systems (ADBIS'97). St.-Petersburg, September 2-5, 1997. V. 2, 1997. P. 112-114.

Смирнов И.С., Лобанов А.Л., Алимов А.Ф., Дианов М.Б.. Итоги развития зоологической интегрированной информационной системы ЗООИНТ// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 113, 114.

Смирнов И.С., Рысс А.Ю. Биологические коллекции и базы данных// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 30-38.

Смирнов И.С., Лобанов А.Л., Дианов М.Б., Голиков А.А., Алимов А.Ф. Зоологические виртуальные музеи: настоящее и будущее// Научный сервис в сети Интернет: Труды Всероссийской научной конференции (24-29 сентября 2001 г., г. Новороссийск). - М.: Изд-во МГУ, 2001. с. 22-24.

Соколов Е.П., Смирнов И.С., Лобанов А.Л. Интегрированная система ZOOINT для ведения и использования зоологических баз данных // Базы данных и компьютерная графика в зоологических исследованиях, Труды Зоологического института, т. 269, Санкт-Петербург, 1997: 136-144.



Проекты и разработки, появившиеся в результате развития системы ЗООИНТ (информация в сети Интернет):

ИПС "ЭКОАНТ"
Информационно-аналитическая система PARHOST
Научно-информационный веб-сайт "Жуки (Coleoptera) и колеоптерологи"
ИПС "CNAMF"
ИПС "ОКЕАН"
ЗООКОД - концепция отражения зоологических иерархий в реляционных базах данных
Электронная публикация "Пресноводные рыбы России"
ДИАЛОБИС - концепция создания зоологических мультимедийных пособий
Интерактивная ИПС "ZINsecta"
Информационная система "Биоразнообразие России"
Научно-информационный веб-сайт Регионального центра по биологическим инвазиям
Диалоговая биологическая идентификационная система PICKEY
Научно-информационный веб-сайт "Блохи (Siphonaptera)"
Научно-информационный веб-сайт "Нематоды (Nematoda)"



Возврат на главную страницу ZOOINT