ПРЕДСТАВЛЕНИЕ МЕТАДАННЫХ ДЛЯ ПУБЛИКАЦИЙ ПО БИОЛОГИИ И МЕДИЦИНЕ В СЕМАНТИЧЕСКОМ ВЕБЕ
В самых общих терминах, метаданные - это данные о данных. Более точное определение: метаданные - это структурированные данные, описывающие хаpaктеристики информационных объектов (в частности, ресурсов Веба) и имеющие целью способствовать их поиску, идентификации и оценке, а также управлению этими объектами.
Метаданные играют ключевую роль в Семантическом вебе. С их помощью выполняется семантическая аннотация веб-ресурсов. Метаданные передают (частично) семантику ресурсов. Другими словами, метаданные, выполняющие семантическую аннотацию веб-ресурса - это на самом деле формально представленное знание, (частично) содержащиеся в этом ресурсе.
Семантические аннотации записываются в соответствующем языке представления знаний. Обычно используются концептуальные языки, основанные на терминологической логике (или логике описаний - description logic) [1].
В простейшем случае семантическая аннотация представляет собой список терминов (в данном языке терминологической логики) и утверждений. Например, мы можем задать термин Менингит причина.Вирус причина.Вирус, (1) который обозначает менингит, вызываемый вирусом и только вирусом. Другими словами, этот термин определяет вирусный менингит, и мы можем записать утверждение
Вирусный Менингит = Менингит причина.Вирус причина.Вирус (2)
Таким образом, предложение выражает утверждение о кореферентности (синонимии) атомарного термина Вирусный Менингит и составного термина (1).
Между терминами также можно устанавливать отношение включения: t1 t2, если класс объектов, определяемый термином t1, содержится в классе объектов, определяемом термином t2. Другими словами, если t1 t2, то термин t2 является более общим, чем термин t1.
Совокупность терминов и утверждений указанного вида, записанных для данной области, составляет онтологию этой области.
Ключевым понятием аннотированных ресурсов в Интернете является релевантность терминов. Степень релевантности ρ (t1,t2) - это некоторое число из интервала [0,1]. Если ρ(t1,t2)=1, то эти два термина кореферентны (что означает их полную релевантность); если ρ(t1,t2)=0, то термины не релевантны.
Как отметил Заде в [2]: «Релевантность - центральное понятие для поиска. Фактически, начальный успех Google в большой мере обязан простому, но хитроумному алгоритму ранжирования в соответствии с оценкой релевантности».
Онтологию можно рассматривать как граф, вершинами которого служат термины, а дуги отвечают отношению непосредственного следования по включению. Релевантность можно определить, используя заданную на этом графе метрику. Конечно, такого типа релевантность является лишь некоторым приближением. Формальная экспликация понятия релевантности является весьма трудной задачей. Заметим, что Заде относит это понятие к нечетким.
В настоящее время комитет W3C (World Wide Web Consorcium) в качестве стандарта для языков спецификации веб-онтологий предложил язык OWL (Ontology Web Language). На самом деле OWL имеет три диалекта: OWL Lite, OWL DL и OWL full. Эти диалекты связаны последовательно отношением синтаксического и семантического включения. Таким образом, если это отношение обозначим символом <, то будем иметь: OWL Lite < OWL DL < OWL Full. Эти языки, однако, имеют некоторые недостатки:
- атрибуты объектов представляются как роли, что не естественно, когда значением атрибута является тип данных;
- отсутствуют средства для спецификации составных типов данных, а это затрудняет совместимость онтологий с объектно-ориентированными базами данных.
2. Составление онтологий на основе Бинарной Модели Знаний
Мы предлагаем использовать для составления онтологий в области биологии и медицины язык «Бинарная Модель Знаний» (БМЗ) [3], [4]. БМЗ лишен вышеуказанных недостатков языков OWL.
Онтология (концептуальная схема), записанная в БМЗ, содержит два вида понятий: классы и бинарные связи. (Заметим, что связи могут также выступать в роли классов.) Структура понятий (универсумы понятий) задается с помощью структурных предложений, имеющих следующий абстpaктный синтаксис.
• Элементарными структурными предложениями являются:
C[A:T], C[A:D], C[A:D(*)], C[A:D(m,n)], (C L D).
Здесь C и D - имена понятий (классов или бинарных связей), L - имя бинарной связи, А - имя атрибута, Т - спецификация типа данных (значений атрибута), m ≤ n - натуральные числа. Выражение D(*) обозначает понятие, экземплярами которого служат конечные множества экземпляров понятия D, а экземплярами понятия D(m,n) являются те экземпляры понятия D(*), число элементов в которых не меньше, чем m и не больше, чем n. Атрибуты можно обозначать теми же именами, что и понятия. Например, выражение C[E:E] - допустимое обозначение для элементарного структурного предложения (но вместо него можно писать просто C[E] ).
• Произвольные структурные предложения получаются соединением «хвостов» элементарных предложений с одинаковыми «головами».
Например, соединяя элементарные предложения C[E], C[K:Integer], C[A: D(*)] и С[B: (Integer(*), LIST(String)], получаем структурное предложение C[E, K: Integer, A: D(*), B: (Integer(*), LIST(String)]. Это предложение определяет универсум UC понятия С, элементами которого являются кортежи [E: x, K: y, A: z, B: u], где x - суррогат (системное имя - идентификатор объекта), y - целое число, z - конечное множество суррогатов, u - элемент абстpaктного типа данных (Integer(*), LIST (String)).
БМЗ включает язык для спецификации типов данных. Типы данных могут быть примитивными (такими, как Integer, String и т.п.) или составными, т.е. абстpaктными типами данных, определяемыми экспертом при помощи заданных конструкторов типов. Для спецификации операций, действующих на абстpaктном типе данных используется подъязык функционального программирования. Этот подъязык играет роль хостязыка. БМЗ также включает запросный язык (к базам данных, структурированным в соответствии со подсхемами структурной спецификации).
Спецификация экстенсионалов понятий дается при помощи следующих типов предложений:
- логические предложения. Примером является предложение вида EACH C(α) L SOME D(β), где α и β - атрибутные условия;
- предложений, специфицирующих поведение объектов.
Примером являются продукция
X IN C(α), Y IN D(β) ==> DELETE f(X,Y) FROM E;
INSERT g(X,Y) INTO; ASSERT φ,
где f и g - функции, выраженные в хост-языке, а φ - логическое или модальное предложение) ;
- модальных предложений. Примером является
FUTURE EXIST X IN С(K=0) AND f
(X) =/= 1.
Замечание. Для того, чтобы сделать предложения БМЗ более читаемыми, мы можем использовать конкретный синтаксис, близкий, например, к тому, который обычно применяется в объектно-ориентированных базах данных и знаний, в частности, в такой системе как DEGAS, [5].
В БМЗ имеются две стратегии вывода (логической дедукции): прямой и обратный вывод. Прямой вывод имеет преимущество перед обратным выводом в зависимости от того, когда решается задача противоречивсти схемы. Но при вычислении ответов на запросы более эффективен обратный вывод.
Приведем пример онтологии, записанной в языке БМЗ.
Болезнь[Этиология: Фактор (*), Хаpaктер_течения: String,
Способы_лечения: Способ_лечения (*),
Патологич_изменения:Орган (*),...], (Орган Входит_в Система),
Система ISA Нервная_система | Иммунная_система |
Пищеварит _ систем а | Ре спираторная_система |
Мышечная_система | Гормональная_система |...
Внутренняя_болезнь ISA Болезнь,
Внутренняя_Болезнь[Категория: (Гастроэнтерология |
Гематология|Кардиология|Нефрология |Пульмонология)],
Место_поражения:
Орган(*)],
Гепатит ISA Внутренняя_болезнь,
Печень ISA Орган,
Гепатит = Внутренняя_болезнь (Место_поражение = Печень) Вирусный_гепатит = Гепатит (Этиология.Фактор = Вирус),
Г е п а т и т _ С = В и р у с н ы й _ г е п а т и т
(Вирус.Назв = С).
Работа выполнена при финансовой поддержке РФФИ (проект № 08-0100465)
СПИСОК ЛИТЕРАТУРЫ:
- Baader, D. Calvanese, D. McGuinness, D.Nardi, P. Patel-Schneider (eds.) The Description Logic Handbook (theory, implementation and applications). - Cambridge University Press, USA, 2003.
- L.A. Zadeh. From search machine to question answering systems - problems of world knowledge, relevance and precisiation. In: E. Sanchez (ed.) Fuzzy Logic and th Semantic Web. - Elsevier, 2006.
- G.S. Plesniewicz. Binary Data and Knowledge Model // Proceedings of the 6th Joint Conference on Knowledge-based Software Engineering, IOS Press, 2004.
- Г.С. Плесневич. Бинарная модель знаний // III-й Международный научнотехнический семинар «Интегрированные модели и мягкие вычисления в искусственном интеллекте». Сб. научных трудов (Коломна, май 2005). - М: Физматлит, 2005.
- J. van den Akker, A. Siebes. DEGAS: a database of autonomous objects // Information Systems, v. 22, No. 3, 1997.
Статья в формате PDF 112 KB...
03 05 2024 7:35:58
Статья в формате PDF 203 KB...
02 05 2024 11:44:45
Статья в формате PDF 114 KB...
01 05 2024 19:14:18
Статья в формате PDF 102 KB...
30 04 2024 12:26:57
Статья в формате PDF 101 KB...
29 04 2024 0:44:55
Статья в формате PDF 306 KB...
27 04 2024 2:26:47
Статья в формате PDF 153 KB...
26 04 2024 3:40:34
Статья в формате PDF 267 KB...
25 04 2024 12:37:14
Статья в формате PDF 148 KB...
24 04 2024 5:21:17
Статья в формате PDF 270 KB...
23 04 2024 11:54:35
Статья в формате PDF 312 KB...
22 04 2024 23:58:17
Установлено, что предпосевное замачивание семян и опрыскивание вегетирующих растений хлопчатника (Gossipium hirsutum L.) растворами сочетаний фитогормонов кинетина (КН) и гибберелловой кислоты (ГК) и совместно с витаминами никотиновой кислотой (НК) и пантотеновой кислотой (ПК) эффективно стимулирует полевую всхожесть семян, рост стeбля и образование побегов, среднюю площадь листа и общую фотосинтетическую листовую поверхность, улучшение водного режима. Также отмечено увеличение числа коробочек, длины волокна и выхода волокна с растения от 34,6 до 60,4 %. Наиболее эффективно предпосевное замачивание семян сочетанием фитогормонов совместно с витаминами. ...
21 04 2024 17:35:23
Статья в формате PDF 256 KB...
20 04 2024 17:31:19
19 04 2024 11:12:34
Статья в формате PDF 143 KB...
18 04 2024 14:58:19
Статья в формате PDF 108 KB...
17 04 2024 8:47:38
Статья в формате PDF 100 KB...
16 04 2024 11:25:28
Статья в формате PDF 245 KB...
15 04 2024 10:21:25
Статья в формате PDF 111 KB...
14 04 2024 8:31:14
Статья в формате PDF 250 KB...
13 04 2024 8:10:15
12 04 2024 1:54:39
Методика диагональной сегментарной амплитудометрии, заключающаяся в регистрации амплитуды колебаний активного и реактивного сопротивления тканей человеческого организма, широко используемая в медицинской пpaктике, начинает применяться в спорте для контроля за функциональным состоянием спортсменов в различные периоды учебно-тренировочного процесса. Результаты, полученные данным методом, показывают, что различия в проводимости тканей определяются видом спорта, а также квалификацией спортсменов. Проводимость тканей более устойчива в подготовительный период по сравнению с соревновательным. Суммарная нестабильность проводимости тканей выше на соревнованиях более высокого уровня. ...
11 04 2024 17:54:29
Статья в формате PDF 261 KB...
10 04 2024 16:41:27
Слепая кишка белой крысы имеет форму изогнутого чаще вправо конуса или рога, илеоцекальный угол располагается по средней линии или рядом с нею. Реже полукольцевидная слепая кишка крысы находится влево от средней линии и петель подвздошной кишки. ...
09 04 2024 3:23:39
Статья в формате PDF 111 KB...
08 04 2024 13:19:37
Статья в формате PDF 298 KB...
07 04 2024 14:47:41
06 04 2024 1:39:50
Статья в формате PDF 141 KB...
05 04 2024 2:53:58
В статье представлены актуальные данные о проблеме урогeнитaльного xлaмидиоза. Рассмотрены современные вопросы эпидемиологии, патогенеза и терапии инфекции. ...
04 04 2024 21:55:45
Статья в формате PDF 103 KB...
03 04 2024 14:53:30
Статья в формате PDF 201 KB...
02 04 2024 5:55:37
Статья в формате PDF 131 KB...
01 04 2024 12:17:55
Статья в формате PDF 254 KB...
31 03 2024 8:42:39
Статья в формате PDF 129 KB...
30 03 2024 0:26:33
В работе сформулированы принципы валеологического мировоззрения как образца устремлений, выполняющих ориентационную, нормирующую, прогностическую функции в отношении здоровья и здорового образа жизни. ...
29 03 2024 3:48:21
Статья в формате PDF 236 KB...
28 03 2024 20:37:11
Статья в формате PDF 170 KB...
27 03 2024 19:19:24
26 03 2024 23:43:49
Статья в формате PDF 148 KB...
25 03 2024 4:23:15
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::