Работен пакет 3. Дигитализиране на колекциите

Ръководител: доц. Борислав Георгиев

Този РП е фокусиран върху дигитализирането на значителна част (около 50%) от единиците в колекциите и публикуването на тази дигитална информация, организирана в база-данни. Предвиждаме около 25% от записите в базата-данни да бъдат придружени с дигитални изображения на образци. Като цяло, в рамките на продължителността на този проект (4 години), планираме да дигитализираме 1 000 000 единици – 500 000 единици от колекциите на ИБЕИ–БАН и 500 000 единици от колекциите на НПМ–БАН. Дейности: (1) създаване на план за дигитализация и технически проект за осигуряване на безпроблемен поток на процеса на дигитализация, както и управление и координация на процеса на дигитализация; (2) организиране, провеждане и наблюдение на дигитални дейности, включително основна работа по дигитализацията на колекциите и подготовка на бази-данни, както и контрол на качеството и проверка на дигитализацията; (3) обработка на данни, включително обработка на дигиталните записи и снимки, за да бъдат публикувани и свободно достъпни. За да отговорим на нуждите на DiSSCo-BG, свързани с масовата дигитализация, ще бъдат направени инвестиции в технически области като снемане на изображения, услуги за електронна инфраструктура, напр. ресурси за съхранение, компютърна обработка, мрежи, инструменти за управление на данни, сигурност, достъп и т.н., чрез значителни инвестиции, управлявани в РП 2. Разработената уеб-базирана Информационна система на колекциите (ИСК) ще се използва за съхранение и достъп до изчерпателната информация за колекциите на ИБЕИ–БАН и НПМ– БАН. Тази уеб-публикувана и свободно достъпна база-данни ще се състои от два компонента – Дигитален каталог на колекците (ДКК), съдържащ информацията за записите в колекциите, идентична с тази в регистрите на хартия, и Библиотека с дигитални изображения (БДИ), съдържаща дигитални изображения. И двата модула ще могат да „общуват постоянно“. ИСК ще бъде изградена с помощта на софтуер на свободен достъп, напр. софтуер, подобен на PostgreSQL, може да бъде използван като интегрирана среда на база-данни; софтуер, подобен на PostGIS, ще се използва за пространствени (гео-реферирани) данни. Номенклатурата на базата-данни ще бъде в съответствие с основните стандарти на Darwin Core, както и с стандартите GBIF, за да се даде възможност за оперативна съвместимост на данните. ИСК ще поддържа редица функции като например:
  • едновременно експортиране на цялата информация (напр. при “бекъп” – създаване на резервни копия)
  • експортиране на избрани, филтрирани данни (напр. при специфични запитвания от изследователите)
  • изготвяне на карта с географското местоположение на всяка отделна единица
  • възможност за показване на данни на сайтовете на ИБЕИ–БАН и НПМ–БАН
  • едновременно импортиране от други, вече съществуващи, но различни софтуерни бази- данни
  • възможност за автоматично споделяне на информация в други бази данни, като паневропейски DiSSCo RI портал и други
За да се подобри и улесни целия процес и достъпността на данните, ще бъде разработена и мобилна (базирана на Android) версия. Значително внимание ще бъде обърнато на сигурността на ИСК, както и на разпределението на достъпа до данните. Публичният профил ще предоставя основна информация за всяка отделна колекционна единица (под “колекционна единица”, на английски “collection lot”, тук и навсякъде в текста се разбира екземпляр, или група от екземпляри, или част от екземпляр, представен в колекционните регистри и в базата-данни като отделен запис и съществуващ в колекцията с уникален етикет). Нивата на достъп в низходящ ред ще бъдат: мениджър на бази данни, администратори, модератори и редови потребител. ИСК ще бъде качен на виртуален сървър, което осигурява значително повече гъвкавост в работата, както и по-добра информационна сигурност. ИСК ще се архивира като две резервни копия на седмична база, като едно от тях ще използва капацитета за съхранение на Института за информационни и комуникационни технологии – БАН, и едно на външно съхранение.
Цели на Работен пакет 3
  • Координиране и надзор на процеса на дигитализация.
  • Координиране на консултациите с лица за контакт на паневропейския DiSSCo RI с цел уеднаквяване на стандартите.
  • Изграждане на рамка за управление на дигитализацията – основни дейности по дигитализация; ресурси за дигитализация; стратегия за дигитализация; план за дигитализация; управление на дейности по дигитализация.
  • Основна работа по дигитализацията на биологичните колекции – цифрово преобразуване на биологични обекти и попълване на бази-данни.
  • Контрол на качеството и проверка на дигитализираните записи – мониторинг на процеса на дигитализация
  • Управление на данни и споделяне на данни, включително улавяне на мета-данни – процес на управление на данни
  • Осигуряване на портал за свободен достъп до публикуваните данни
Описание на работата
Задача 3.1. Общо управление и координиране на процеса на дигитализация
Ръководител на задачата: доц. Борислав Георгиев
Дейности:
  • Изготвяне на плана за дигитализация: а) приоритети във времето; б) определяне на кои части и кои колекции; в) възлагане на конкретни отговорности; г) определяне на формати, стандарти, технологии, съхранение и поддръжка; д) определяне на правила за споделяне на данни – достъп до мета-данни и интелектуална собственост; е) разпределяне на ресурси – финансиране, съоръжения, оборудване и експертиза (месеци 1, 2)
  • Организация на управлението на дигитализацията (месеци 2, 3). Управлението за дигитализация се състои от принципи, политики, процедури, роли и отговорности, свързани с дейностите по дигитализация
  • Редовни месечни срещи на РПС3 и технически експерти от съответния работен пакет за координиране на дейности, свързани с процеса на дигитализация (двудневни срещи през месеците 1, 2, 3 и еднодневни срещи през месеците 4–48)
  • Редовни срещи на РПС3 с ИС (еднодневна среща месечно през първата година и всеки втори месец след това)
  • Координиране на контактите с ръководни органи на DiSSCo RI, като Научен консултативен съвет на DiSSCo и Технически консултативен съвет на DiSSCo, за да се синхронизира напредъкът на работния процес по дигитализация с този на паневропейския DiSSCo RI (редовни онлайн срещи и физически срещи в рамките на DiSSCO RI и свързани с тях проекти)
  • Преглед на дейностите по дигитализация (месеци 12, 18, 24, 30, 36, 42). Дейностите по дигитализация трябва да бъдат проверявани за: (а) изпълнение на плана за дигитализация; (б) възможно подобрение на организацията на дейностите по дигитализация; (в) ефективно използване на дигиталните активи
Задача 3.2. Дигитализиране на образци от колекции.
Ръководители на задачата: доц. Ростислав Бекчиев, Валери Георгиев и Юрий Корнилев
Тази задача е планирана за месеци 1-47. Тя включва дейностите от основните етапи на процеса на дигитализация. Приемането на стандарти за дигитализация е основен компонент на режима на качество и е от съществено значение за производството на стандартизирани дигитални активи. Тази задача включва и основния процес на дигитализация, който трябва да се извърши на ниво отдели и/или на ниво колекции.
Дейности
  • Разпределение и подреждане на оборудването за дигитализация (хардуер, софтуер и съоръжения, необходими за създаване, управление и споделяне на дигитални активи) по отдели и колекции (месеци 1-6, 13-17, 25-28, 37-38). Графикът на тази дейност е в съответствие с изпълнението на Задачи 2.3 и 2.4 на РП2
  • Определяне на стандарти за дигитализация: дигитални формати; дигитални файлове; типове изображения; брандиране (вграждане на лого на институциите в изображения); управление на обекти (добавяне на QR кодове към хербарийни листове и етикети на животински образци); стандарти за мета-данни (месеци 1, 2). Тази дейност включва също така разглеждане и адаптиране на добри практики чрез приемане на широко използвани стандарти, одобрени от TDWG и GBIF
  • Организиране и изпълнение на основните етапи на дигитализация и бази-данни по отдели и колекции (месеци 3–47)
  • Контрол на качеството на дигитализация и на нанасянето на данните по отдели и колекции (мониторинг; верифициране) (месеци 4–47)
Задача 3.3. Управление на данни
Ръководители на задачата: доц. Георги Попгеоргиев и Валери Георгиев
Тази задача е планирана за цялото времетраене на проекта и е насочена към осигуряване на междинни и крайни дейности в процеса на дигитализация. Управлението на данните е административен процес, който включва придобиване, потвърждаване, съхраняване, защита и обработка на данни за да се гарантира достъпността, надеждността и актуалността на данните за потребителите.
Дейности
  • Разработване на дизайн и архитектура на база данни (месеци 1, 2)
  • Изготвяне на инструменти за каптиране на мета-данни (месеци 2, 3)
  • Подготовка за съхранение на данни (локално, архивно, оперативно) и защита на набори от данни (месеци 3, 4)
  • Придобиване, организиране и валидиране на набори от данни (месеци 4–48)
  • Обединяване и уеднаквяване на различни бази данни, ако има такива (месеци 4-9)
  • Подготовка на инструмент за споделяне на данни (месеци 6, 7)
  • Подготовка на инструменти за експлоатация за използване на дигитални активи (месеци 7, 8)
  • Осигуряване на достъп до наборите от данни за колекцията в мрежата за крайната потребителска аудитория (месеци 46-48)
Отчетни документи по РП 3
  • Д3.01: Рамка за управление на дигитализацията и план за дигитализация (отчет) (месец 2)
  • Д3.02: Модел на управление на дигитализацията (отчет) (месец 3)
  • Д3.03: Внедряване на модулен софтуер за оперативна съвместимост (отчет) (месец 4)
  • Д3.04: Управление на платформа на набори от данни (отчет) (месец 9)
  • Д3.05–Р3.07: Годишен доклад за напредъка на дигитализацията (месеци 13, 25, 37)
  • Д3.08: Окончателен доклад за дигитализацията (месец 48)
Ключови събития по РП 3
  • К3.1: Среща на РПС3 с ИС и заинтересованите страни – одобрение на рамката за управление на дигитализацията и план за дигитализация (месец 2)
  • К3.2: Среща на РПС3 и заинтересованите страни – одобрение на управлението на дигитализацията (месец 3)
  • К3.3: Среща на РПС3 и заинтересованите страни – одобрение на система за управление на мета-данни и системи за съхранение на данни; одобрение на структурата на портала за данни за свободен достъп до DiSSCO-BG наборите данни (месец 3)
  • К3.4: Среща на РПС3 и заинтересованите страни – одобрение на инструменти за обмен на данни и инструменти за експлоатация; одобрение на управлението на платформата с набори данни (месец 9)
  • К3.5: Среща на РПС3 и заинтересованите страни – приемане на резултатите от дигитализацията и мониторинга (месец 47)