апрель 2019

Особливості використання нереляційної бази даних на основі графової моделі даних


Малініна Валерія Олександрівна Малініна В. О. , Ляшенко О. А.
Химия и современные технологии
Abstract / Full Text

Особливості використання нереляційної бази даних на основі графової моделі даних / Химия и современные технологии : Метериалы ІХ Международной научно-технической конференции студентов, аспирантов и молодых ученых «Химия и современные технологии», 2019. – C. 28-29


В наш час інформація відіграє важливу роль в житті. У сучасному світі інформації стає настільки багато, що людство створює все нові способи її зберігання і пошуку. Одними із головних серед таких способів є бази даних (БД).

Більшість баз даний для інформаційних систем були реалізовані на реляційних системах управління базами даних (СУБД). Графова база даних являє собою NoSQL, що використовує графову модель даних. Бази даних NoSQL представляють гідну відповідь сучасним викликам в області обсягів і складності даних, що зберігається.

Реляційні бази даних добре зарекомендували себе завдяки стабільній роботі, можливості контролю паралельного доступу і механізмам інтеграції. Реляційні бази даних містять таблиці, основними параметрами яких є набори рядків і стовпців. Зберігання, отримання таких складних типів даних, а також управління ними з використанням традиційних підходів, що ґрунтуються на використанні баз даних реляційного типу, стають все більш складними. Для того, щоб ввести в систему новий тип даних, потрібна ручна настройка.

Граф – це набір вершин і ребер. У графах об’єкти представлені вузлами, а способи, якими ці об’єкти з’єднані між собою, – взаємозв’язками. Ця універсальна структура дозволяє моделювати різноманітні сценарії: від будівлі космічної ракети до будівництва системи доріг, від поставки харчування до історії хвороби населення, і багато іншого.

Постає задача створення бази даних для зберігання та пошуку інформації про фільми та відомості про них: акторів, режисерів, жанр тощо. Така предметна область має великий обсяг даних, але всі вони однотипні. Для вирішення тих завдань, де дані тісно пов’язані між собою у відношеннях, які можуть заглиблюватися в кілька рівнів, призначені, в першу чергу, графові бази даних.

На рисeyre 1 зображена мережа взаємодії фільмів та акторів. В кожному вузлі розташовується назва фільму, наочно демонструючи його місце в мережі. На рисунки вони позначені червоними колами. В фіолетових колах відображені роки народження акторів, які приймали участь у зйомках фільму. Вузли з’єднані взаємозв’язками, що визначають додатковий семантичний контекст. На відміну від реляційної БД зв’язки в графовій моделі можуть містити типи, атрибути і значення. Тип даних – це схема, що описує повторювану сторінку. Всі фільми мають поля «актор», «режисер», «жанр». Тобто тип даних – це опис всіх об’єктів даного типу, в якому зберігається інформація про назву фільму, жанр, до якого він відноситься, ПІБ режисера фільму, ПІБ акторів, які приймали участь у зйомках тощо. Для актора описом об’єктів  буде зв’язок з конкретним фільмом, а саме: назву фільму, жанр, до якого він відноситься, ПІБ режисера фільму. У кожного актора може бути більше, ніж двонаправлений зв’язок з фільмом. На рисунку наочно відображено сплетіння вузлів між собою – це демонстрація того, що деякі актори приймали участь не тільки в одному фільмі.

Рисунок 1 – Мережа взаємодії фільмів та акторів

Даний приклад розглянуто у графовій базі даних Neo4j.

Однією з вагомих причин вибору графової бази даних є великий приріст продуктивності при роботі з взаємопов’язаними даними, в порівнянні з реляційними базами даних і NoSQL-сховищами. На відміну від реляційних баз даних, де облік взаємозв’язків інтенсивно погіршує продуктивність запитів на великих наборах даних, продуктивність графових баз даних залишається незмінною зі збільшенням обсягу збережених даних.

Таким чином, нереляційна база даних є простим та зручним інструментом для роботи зі взаємопов’язаними даними. Інформаційні системи, що базуються на графових базах даних повністю відповідають сучасним потребам, особливо при такому швидкому збільшенні потоку даних, які потрібно обробляти без втрати минулих даних.

References
  1. Графові бази даних. Нові можливості для роботи зі зв’язаними даними: Пер. з англ. – СПБ.: ТОВ "Альфа-книга", 2016. – 258 с. : Ил. – Парал. тит. англ.