Работен пакет 3. Дигитализиране на колекциите
Ръководител: доц. Борислав Георгиев
Този РП е фокусиран върху дигитализирането на значителна част (около 50%) от единиците в колекциите
и публикуването на тази дигитална информация, организирана в база-данни. Предвиждаме около 25% от
записите в базата-данни да бъдат придружени с дигитални изображения на образци. Като цяло, в рамките
на продължителността на този проект (4 години), планираме да дигитализираме 1 000 000 единици – 500 000
единици от колекциите на ИБЕИ–БАН и 500 000 единици от колекциите на НПМ–БАН.
Дейности:
(1) създаване на план за дигитализация и технически проект за осигуряване на безпроблемен поток на процеса
на дигитализация, както и управление и координация на процеса на дигитализация;
(2) организиране, провеждане и наблюдение на дигитални дейности, включително основна работа по дигитализацията
на колекциите и подготовка на бази-данни, както и контрол на качеството и проверка на дигитализацията;
(3) обработка на данни, включително обработка на дигиталните записи и снимки, за да бъдат публикувани
и свободно достъпни.
За да отговорим на нуждите на DiSSCo-BG, свързани с масовата дигитализация, ще бъдат направени инвестиции
в технически области като снемане на изображения, услуги за електронна инфраструктура, напр. ресурси за
съхранение, компютърна обработка, мрежи, инструменти за управление на данни, сигурност, достъп и т.н.,
чрез значителни инвестиции, управлявани в РП 2.
Разработената уеб-базирана Информационна система на колекциите (ИСК) ще се използва за съхранение и
достъп до изчерпателната информация за колекциите на ИБЕИ–БАН и НПМ– БАН. Тази уеб-публикувана и свободно
достъпна база-данни ще се състои от два компонента – Дигитален каталог на колекците (ДКК), съдържащ
информацията за записите в колекциите, идентична с тази в регистрите на хартия, и Библиотека с дигитални
изображения (БДИ), съдържаща дигитални изображения. И двата модула ще могат да „общуват постоянно“.
ИСК ще бъде изградена с помощта на софтуер на свободен достъп, напр. софтуер, подобен на PostgreSQL,
може да бъде използван като интегрирана среда на база-данни; софтуер, подобен на PostGIS, ще се използва
за пространствени (гео-реферирани) данни. Номенклатурата на базата-данни ще бъде в съответствие с основните
стандарти на Darwin Core, както и с стандартите GBIF, за да се даде възможност за оперативна съвместимост на данните.
ИСК ще поддържа редица функции като например:
Ръководител на задачата: доц. Борислав Георгиев
Дейности:
Ръководители на задачата: доц. Ростислав Бекчиев, Валери Георгиев и Юрий Корнилев
Тази задача е планирана за месеци 1-47. Тя включва дейностите от основните етапи на процеса на дигитализация. Приемането на стандарти за дигитализация е основен компонент на режима на качество и е от съществено значение за производството на стандартизирани дигитални активи. Тази задача включва и основния процес на дигитализация, който трябва да се извърши на ниво отдели и/или на ниво колекции.
Дейности
Ръководители на задачата: доц. Георги Попгеоргиев и Валери Георгиев
Тази задача е планирана за цялото времетраене на проекта и е насочена към осигуряване на междинни и крайни дейности в процеса на дигитализация. Управлението на данните е административен процес, който включва придобиване, потвърждаване, съхраняване, защита и обработка на данни за да се гарантира достъпността, надеждността и актуалността на данните за потребителите.
Дейности
- едновременно експортиране на цялата информация (напр. при “бекъп” – създаване на резервни копия)
- експортиране на избрани, филтрирани данни (напр. при специфични запитвания от изследователите)
- изготвяне на карта с географското местоположение на всяка отделна единица
- възможност за показване на данни на сайтовете на ИБЕИ–БАН и НПМ–БАН
- едновременно импортиране от други, вече съществуващи, но различни софтуерни бази- данни
- възможност за автоматично споделяне на информация в други бази данни, като паневропейски DiSSCo RI портал и други
Цели на Работен пакет 3
- Координиране и надзор на процеса на дигитализация.
- Координиране на консултациите с лица за контакт на паневропейския DiSSCo RI с цел уеднаквяване на стандартите.
- Изграждане на рамка за управление на дигитализацията – основни дейности по дигитализация; ресурси за дигитализация; стратегия за дигитализация; план за дигитализация; управление на дейности по дигитализация.
- Основна работа по дигитализацията на биологичните колекции – цифрово преобразуване на биологични обекти и попълване на бази-данни.
- Контрол на качеството и проверка на дигитализираните записи – мониторинг на процеса на дигитализация
- Управление на данни и споделяне на данни, включително улавяне на мета-данни – процес на управление на данни
- Осигуряване на портал за свободен достъп до публикуваните данни
Описание на работата
Задача 3.1. Общо управление и координиране на процеса на дигитализацияРъководител на задачата: доц. Борислав Георгиев
Дейности:
- Изготвяне на плана за дигитализация: а) приоритети във времето; б) определяне на кои части и кои колекции; в) възлагане на конкретни отговорности; г) определяне на формати, стандарти, технологии, съхранение и поддръжка; д) определяне на правила за споделяне на данни – достъп до мета-данни и интелектуална собственост; е) разпределяне на ресурси – финансиране, съоръжения, оборудване и експертиза (месеци 1, 2)
- Организация на управлението на дигитализацията (месеци 2, 3). Управлението за дигитализация се състои от принципи, политики, процедури, роли и отговорности, свързани с дейностите по дигитализация
- Редовни месечни срещи на РПС3 и технически експерти от съответния работен пакет за координиране на дейности, свързани с процеса на дигитализация (двудневни срещи през месеците 1, 2, 3 и еднодневни срещи през месеците 4–48)
- Редовни срещи на РПС3 с ИС (еднодневна среща месечно през първата година и всеки втори месец след това)
- Координиране на контактите с ръководни органи на DiSSCo RI, като Научен консултативен съвет на DiSSCo и Технически консултативен съвет на DiSSCo, за да се синхронизира напредъкът на работния процес по дигитализация с този на паневропейския DiSSCo RI (редовни онлайн срещи и физически срещи в рамките на DiSSCO RI и свързани с тях проекти)
- Преглед на дейностите по дигитализация (месеци 12, 18, 24, 30, 36, 42). Дейностите по дигитализация трябва да бъдат проверявани за: (а) изпълнение на плана за дигитализация; (б) възможно подобрение на организацията на дейностите по дигитализация; (в) ефективно използване на дигиталните активи
Ръководители на задачата: доц. Ростислав Бекчиев, Валери Георгиев и Юрий Корнилев
Тази задача е планирана за месеци 1-47. Тя включва дейностите от основните етапи на процеса на дигитализация. Приемането на стандарти за дигитализация е основен компонент на режима на качество и е от съществено значение за производството на стандартизирани дигитални активи. Тази задача включва и основния процес на дигитализация, който трябва да се извърши на ниво отдели и/или на ниво колекции.
Дейности
- Разпределение и подреждане на оборудването за дигитализация (хардуер, софтуер и съоръжения, необходими за създаване, управление и споделяне на дигитални активи) по отдели и колекции (месеци 1-6, 13-17, 25-28, 37-38). Графикът на тази дейност е в съответствие с изпълнението на Задачи 2.3 и 2.4 на РП2
- Определяне на стандарти за дигитализация: дигитални формати; дигитални файлове; типове изображения; брандиране (вграждане на лого на институциите в изображения); управление на обекти (добавяне на QR кодове към хербарийни листове и етикети на животински образци); стандарти за мета-данни (месеци 1, 2). Тази дейност включва също така разглеждане и адаптиране на добри практики чрез приемане на широко използвани стандарти, одобрени от TDWG и GBIF
- Организиране и изпълнение на основните етапи на дигитализация и бази-данни по отдели и колекции (месеци 3–47)
- Контрол на качеството на дигитализация и на нанасянето на данните по отдели и колекции (мониторинг; верифициране) (месеци 4–47)
Ръководители на задачата: доц. Георги Попгеоргиев и Валери Георгиев
Тази задача е планирана за цялото времетраене на проекта и е насочена към осигуряване на междинни и крайни дейности в процеса на дигитализация. Управлението на данните е административен процес, който включва придобиване, потвърждаване, съхраняване, защита и обработка на данни за да се гарантира достъпността, надеждността и актуалността на данните за потребителите.
Дейности
- Разработване на дизайн и архитектура на база данни (месеци 1, 2)
- Изготвяне на инструменти за каптиране на мета-данни (месеци 2, 3)
- Подготовка за съхранение на данни (локално, архивно, оперативно) и защита на набори от данни (месеци 3, 4)
- Придобиване, организиране и валидиране на набори от данни (месеци 4–48)
- Обединяване и уеднаквяване на различни бази данни, ако има такива (месеци 4-9)
- Подготовка на инструмент за споделяне на данни (месеци 6, 7)
- Подготовка на инструменти за експлоатация за използване на дигитални активи (месеци 7, 8)
- Осигуряване на достъп до наборите от данни за колекцията в мрежата за крайната потребителска аудитория (месеци 46-48)
Отчетни документи по РП 3
- Д3.01: Рамка за управление на дигитализацията и план за дигитализация (отчет) (месец 2)
- Д3.02: Модел на управление на дигитализацията (отчет) (месец 3)
- Д3.03: Внедряване на модулен софтуер за оперативна съвместимост (отчет) (месец 4)
- Д3.04: Управление на платформа на набори от данни (отчет) (месец 9)
- Д3.05–Р3.07: Годишен доклад за напредъка на дигитализацията (месеци 13, 25, 37)
- Д3.08: Окончателен доклад за дигитализацията (месец 48)
Ключови събития по РП 3
- К3.1: Среща на РПС3 с ИС и заинтересованите страни – одобрение на рамката за управление на дигитализацията и план за дигитализация (месец 2)
- К3.2: Среща на РПС3 и заинтересованите страни – одобрение на управлението на дигитализацията (месец 3)
- К3.3: Среща на РПС3 и заинтересованите страни – одобрение на система за управление на мета-данни и системи за съхранение на данни; одобрение на структурата на портала за данни за свободен достъп до DiSSCO-BG наборите данни (месец 3)
- К3.4: Среща на РПС3 и заинтересованите страни – одобрение на инструменти за обмен на данни и инструменти за експлоатация; одобрение на управлението на платформата с набори данни (месец 9)
- К3.5: Среща на РПС3 и заинтересованите страни – приемане на резултатите от дигитализацията и мониторинга (месец 47)