Download - А.Власов. "Нижнеуровневая масштабируемая реализация ISO15926"

Уровни работы с ISO 15926

«Ассемблер» ISO 15926:2 - EXPRESS actual_individual, class_of_class

Аксиомы ISO 15926:7 - First Order Logic ActualIndididual(x) → PossibleIndividual(x)

«Темплейты» ISO 15926:7 (FOL/rewriting) ApprovalTriple(x, y, z) ↔ Approval(x) &

hasApproved(x, y) & hasApprover(x, z) OIM (Object Information Model) Domain specific templates???

DSL — internal/external (e.g. Python)

Историческая перспектива

«Ассемблер» 15926:2 слишком сложен для неспециалистов

Решение — ввели «темплейты» 15926:7 fact oriented определены поверх аксиоматики на языке

First Order Logic (Prover9) аксиомы/темплейты нормативны в 15926:7,

т.е. де-факто reference implementation Альтеранативный вариант — ISO 15926:8

реализация поверх OWL Широкий набор OWL инструментария

Проверка целостности

Основа реализации — проверка целостности описаний

К примеру, исключить случаи, когда ActualIndividual одновременно является ClassOfIndividual

«Референсная» проверка — относительно аксиоматики 15926:7

«Разворачиваем» темплейты Проверяем, что полученный набор

утверждений выполним относительно аксиоматики

Проверка целостности с помощью логик

FOL provers (или model finders) e.g. Prover9 (and lots of others)

Трансляция в DL logics Provers: FaCT++, Pellet, RacerPro, HermiT

Трансляция в SAT (propositional logics) Не уверен, что всегда возможна прямая

трансляци, но можно использовать incremental подход

Другие логики HOL/Type-theory Избыточно, но удобно для встраивания в

языки и для мета-теор. целей

Зачем делать свою реализацию?

Производительность/масштабируемость FOL слишком мощная для 15926:7: гибко, но

медленно К примеру, тормозит на абстрактных класс из-за недетерминизма (OR-branching) Большие размеры моделей O(a*n)/O(b*n2) для унарных/бинарных

предикатов Все описание обрабатывается одновременно возможно разбиение на подзадачи

Зачем делать свою реализацию? (продолжение)

Поиск и индексация в хранилищах данных опирается на те же структуры данных

Создание инструментария и DSL Быстрая проверка на ошибки критична для

юзабилити Сообщения об ошибках К примеру, Осман уже реализовал :)

Мега-мета-проект: 15926L :)

Общая идея алгоритмов проверки целостности

Пытаемся строить модель/интерпретацию для описания

для каждого класса (отношения) задаем список инстансов (пар), которые ему принадлежат

Проверяем (конечную) модель на соответствие аксиомам

Медленно, нужны оптимизации сотни предикатов/1000+ аксиом бинарные отношения - O(n2) недетерминизм

Надо учитывать особенности аксиоматики

Построение модели

• T — теория (аксиомы), F — формула вида & | (плюс предикаты и константы)∃

• Берем все константы — исходное множество инстансов

• F преобразуем дизъюнктивную форму вида (A&B&C)|(D&E&F)|..|(X&Y&Z)– Or-branching — экспонента в worst-case

• Перебираем конъюнкты A(a)&B(b)&C(d)– Исходное множество утверждений– Выводим новые, используя аксиомы– Если модель непротиворечива - win

• Все конъюнкты противоречивы - fail

Построение модели (аксиомы)

• A(x)&..&B(x) → C(x)– Если все A(a)..B(a) есть в текущей

модели, добавляем C(a)• A(x)&..&B(x) → C(x)|D(x)

– Or-branching– Дважды-экспоненциально в worst-case!

• ~(A(x)&..B(x))– Эквивалентно A(x)&..&B(x) → False– Если аксиома применима — противоречие

• A(x)&..&B(x) → u Φ(u,x)∃– Добавляем новые инстансы в модель– Потенциально неограниченные модели!– В 15926:2 к счастью ограниченны :)

Особенности аксиоматики 15926:2

Единственный источник конфликтов disjoint аксиомы (one_of(Class1, Class2 etc))

Достаточно конечных моделей намекается в стандарте :)

Похоже можно избавится от бинарных отношений (e.g. hasClassifier(x,y))

Резко сокращает размеры моделей «Линейные» (компактные) модели В стандарте не намекается, но скорее всего :)

Недетерминизм в основном вызван трансляцией abstract class, но не только

Альтернативный вариант

Проверка целостности как проверка типов некоторого языка программирования

Изначально так и примерно и было — EXPRESS language

Удобнее для встраивания в DSL Проблемы с использованием сущ. языков Множественное наследование Oneof (далеко не во всех языках) Недетерминизм Abstract class трансляция

Алтернативный вариант (продолжение)

Осман уже что-то сделал :) Скорее всего проблемы с недетерминизмом

Оптизимации алгоритма Инкрементальный (проверяем по частям) Компактные модели оптимизации недетерминизма оптимизации AND-branhing, быстрые

проверки конфликтов Хранилище данных Можно сделать эффективнее чем triple-store