Опубликовано в сборнике:
ПРОБЛЕМНО-ИНФОРМАЦИОННЫЙ ПОДХОД К ИСПОЛЬЗОВАНИЮ СРЕДСТВ СОВРЕМЕННОГО ОБРАЗОВАНИЯ: ВОПРОСЫ ТЕОРИИ И ПРАКТИКИ
Материалы XIV Всероссийской научно-практической конференции с международным участием «Образование на грани тысячелетий». Отв. ред. Л.И. Колесник. Нижневартовск, 2019. С.78-81.
Издательство: Нижневартовский государственный университет (Нижневартовск)
https://elibrary.ru/item.asp?id=37127214
|
|
|
Аннотация
Применение методов машинного обучения для формирования личных образовательных траекторий за счет полной, частичной автоматизации – важное направление в развитии современных цифровых систем. В докладе приводятся модели представления знаний при применении методов машинного обучения для предсказания образовательной траектории учащегося.
Ключевые слова: анализ больших данных, модели представления данных, рекуррентная нейронная сеть, моделирование поведения учащегося, предсказание образовательной траектории, повышение точности предсказания образовательной траектории, образовательная траектория.
В области искусственного интеллекта понятие «знание» часто определяют через понятие «логический вывод», например: «знания – это формализованная информация, на которую ссылаются и которую используют в процессе логического вывода» [1, с. 6]. Однако наиболее конструктивным для создания компьютерных систем является определение категории знания через категорию данных. Наиболее четкое и строгое определение с точки зрения соотношения данных и знаний ввел Д.А. Поспелов, который выделил шесть характеристик, усложняющих данные и превращающие их в знания: внутренняя интерпретируемость, структурированность, связность, шкалирование, семантическая метрика, наличие активности [4, с. 26–27. 10, с. 70–90].
В своей статье «Из истории искусственного интеллекта: история искусственного интеллекта до середины 80-х годов» Д.А.Поспелов выделяет следующие задачи, решаемые представлением знаний как ведущим направлением искусственного интеллекта:
«...а) как собрать знания о проблемной области и, в частности, как получить с помощью опроса эти знания от специалистов в данной области;
б) как представить эти знания в базе знаний в форме, удобной для последующей обработки на ЭВМ; в) как сохранить непротиворечивость и достичь полноты знаний при объединении знаний, получаемых из различных источников;
г) как классифицировать собранные знания и как обобщать их в процессе накопления;
д) как их использовать при решении различных задач» [10, с. 70–90]. В свою очередь, Э.В. Попов [9, с. 86–88], а также Э.В.Попов, И.Б. Фоминых, Е.Б. Кисель, М.Д. Шапот [12, с. 25] особый акцент делают на выделение двух проблем, связанных с представлением знаний: ЧТО представлять и КАК представлять. И подчеркивают, что в искусственном интеллекте основной акцент делался на второй проблеме в ущерб первой; также они отмечают, что эти две проблемы не независимы друг от друга, так как «...в некотором выбранном способе представления невозможно (либо в принципе, либо эффективно) выразить некоторое ЧТО» [11, с. 54].
Первым критерием классификации является концептуальный подход к представлению знаний. При этом можно выделить следующие подходы: символьный (это традиционные модели, такие как фреймы, семантические сети, продукции), коннекционистский подход (нейронные сети), эмерджентный подход (применение принципов эволюции и самоорганизации – эволюционные вычисления, генетические алгоритмы и т.д.; применение моделей социальных систем – решение задачи сообществом интеллектуальных агентов), а также смешанный подход, когда в одной модели объединяются, например, нейронные сети и продукционные системы.
Такое деление не очень принято в отечественной литературе, но, тем не менее, достаточно распространено в иностранной [6, с. 109–111]. Часто в качестве одной из ключевых современных проблем представления знаний называют объединение символьных и коннекционистских подходов. Одной из концепций, объединяющей разные подходы (нечеткую логику, нейронные сети, генетические алгоритмы) является концепция «мягких вычислений» [14, с. 73–77].
Второй критерий связан с понятиями тезауруса и онтологии. А.С. Нариньяни даже ввел аббревиатуру ТЕОН, которая символизирует необходимость объединения этих двух подходов для разработки систем, реализующих в той или иной степени понимание естественного языка.
Как определено Ю.Н. Филипповичем и А.В. Прохоровым в их исследовании «Семантика информационных технологий: Опыты словарно-тезаурусного описания» «...формализацию знаний путем именования предметов и отношений между ними словами-понятиями естественного языка называют тезаурусным описанием, а результаты такого описания – тезаурусами» [13, с. 101]. Иначе говоря, тезаурус можно рассматривать как модель парадигматической структуры плана содержания языка [5, с. 180–182]. Основная идея словаря-тезауруса заключается в том, что он как бы «противоположен» обычному толковому словарю: в толковом словаре вхо-дами являются слова, упорядоченные по тому или иному признаку (обычно по алфавиту), а выходами толкования этих слов; в тезаурусе же все наоборот – входом являются «идеи» («смыслы», «когнитивные области»), упорядоченные тем или иным способом, а выходом – слова, выражающие данные «смыслы» [5, с. 182].
Что касается онтологии, то единого мнения о том, что это такое, нет. Рассмотрим определения, данные в статье Р. Мизогучи «Шаг в направлении инженерии онтологий» [7, с. 11–37]: 1) онтология –явная спецификация концептуализации; 2) онтология – некоторая теория (совокупность) понятий, или словарь понятий, используемых в качестве строительных кирпичиков систем обработки информации; 3) онтология –соглашение о совместно используемых (shared) концептуализациях. Формально модель онтологии задается следующей тройкой [16, с. 11–37]:
O = (X, R, Ф),
где X –конечное множество концептов предметной области, R –конечное множество отношений между концептами, Ф – конечное множество функций интерпретации, которые задаются на множестве X и/или R.
Третий критерий связан с традиционным делением моделей представления знаний на логические и эвристические, и рассмотрением базовых формализмов представления знаний, таких как семантические сети, логика предикатов, продукции и т.д.
В логических моделях представления знаний отношения, существующие между отдельными единицами знаний, выражаются исключительно средствами того логико-математического языка, который используется для представления знаний. В основе всех логических моделей лежит понятие формальной логической системы (теории):
M = <T, P, A, F>,
Здесь T –множество базовых элементов, P –множество синтаксических правил, позволяющих строить из T синтаксически правильные выражения, A –множество априорно истинных выражений (аксиом), F –семантические правила или правила вывода, которые используются для формального вывода из аксиом и ранее выведенных истинных выражений других истинных выражений.
Эвристические модели представления знаний, в отличие от логических, имеют разнообразный набор средств, передающих специфические особенности конкретной предметной области [12, с. 117]. Следуя к эвристическим моделям в работе «Статические и динамические экспертные системы» отнесены сетевые, продукционные, фреймовые и объектно-ориентированные модели; также дополнительно добавлен класс специальных эвристических моделей представления знаний –сюда можно отнести, например, алгебраические подходы к представлению знаний [2, с. 52–64].
В основе сетевых моделей лежит понятие сети, образованной помеченными вершинами и дугами; где вершины сети представляют некоторые сущности (объекты, события, процессы, явления), а дуги – семантические отношения между сущностями, которые они связывают (например, отношения «часть-целое», «причина – следствие», «объект –свойство объекта», и многие другие) [12, с. 124].
Фрейм-представления были предложены М. Минским [8, с. 23–26]. Фрейм можно понимать как структуру данных, предназначенную для представления некоторой стандартной, стереотипной ситуации. Каждый фрейм имеет слоты, а каждый слот, в свою очередь, может иметь определенное значение; можно выделять фреймы-прототипы и фреймы-экземпляры, реализуя, таким образом, отношение обобщения / конкретизации. К слотам могут быть привязаны условия, которые должны выполняться, чтобы произошло получение слотом конкретного значения или процедуры, которые вызываются при обращении к слоту для получения его значения, также слоты могут иметь значения по умолчанию. Объектно-ориентированный подход фактически является развитием фреймового; в его основе лежат понятия объекта и класса [12, с. 99–102]. В качестве трех китов, на которых основан объектно-ориентированный подход, или, более конкретно, объектно-ориентированное программирование, часто называют инкапсуляцию, наследование и полиморфизм. Гради Буч выделяет 7 главных элементов объектной модели: абстрагирование, инкапсуляция, модульность, иерархия, типизация, параллелизм, сохраняемость [3, с. 301–322].
В продукционном подходе знания представляются в виде множества правил «ЕСЛИ, ТО». Такое представление знаний для моделирования на компьютере процесса принятия решений первым предложил использовать А. Ньюэлл.
В архитектуре программных систем продукций традиционно выделяют три основных компонента: базу данных, в которой хранится текущая информация о решаемой задаче; базу знаний –множество продукций; интерпретатор (машину вывода), выполняющий преобразование базы данных на основе продукций с использованием некоторой стратегии вывода [15, с.81].
Литература
1. Аванесов В.С. Основы педагогической теории измерений // Педагогические измерения. 2004. No 1. С.15–21.
2. Бениаминов Е.М. Алгебраические методы в теории баз данных и представлении знаний. М.: Научный мир, 2003. 184 с.
3. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на C++, 2-е изд./Пер. с англ. М.: «Издательство Бином», СПб.: «Невский диалект», 2000. 560 с., ил.
4. Достоверный и правдоподобный вывод в интеллектуальных системах / Под ред. В.Н. Вагина, Д.А. Поспелова. М.: ФИЗМАТЛИТ, 2004. 704 с.
5. Кобозева И.М. Лингвистическая семантика: Учебник. Изд. 3-е, стереотипное. М.: КомКнига, 2007. 352 с. (Новый лингвистический учебник).
6. Люгер, Джордж Ф. Искусственный интеллект: стратегии и методы решения сложных проблем, 4-е издание. : Пер. с англ. М.: Издательский дом «Вильямс», 2003. –864 с. : ил..
7. Мизогучи Р. Шаг в направлении инженерии онтологий // Новости искусственного интеллекта. 2000. No 1-2. С. 11–37.
8. Минский М. Фреймы для представления знаний. М.: Энергия, 1979. 152 с. 9. Попов Э.В. Общение с ЭВМ на естественном языке. Изд. 2-е, стереотипное. М.: Едиториал УРСС, 2004. 360 с.
10. Поспелов Д.А. Из истории искусственного интеллекта: история искусственного интеллекта до середины 80-х годов // Новости искусственного интеллекта. 1994. No 4. С. 70–90.
11. Смолин Д.В. Введение в искусственный интеллект: конспект лекций. 2-е изд., перераб. М.: ФИЗМАТЛИТ, 2007. 264 с.
12.Статические и динамические экспертные системы: Учеб. пособие. М.: Финансы и статистика, 1996. 320 с.: ил.
13. Филиппович Ю.Н., Прохоров А.В. Семантика информационных технологий: Опыты словарно-тезаурусного описания. С предисловием А.И.Новикова М.: МГУП, 2002. 368 с.
14. Ярушкина Н.Г. Основы теории нечетких и гибридных систем: Учеб. пособие. М.: Финансы и статистика, 2004. 320 с.
15. Яхно Т.М. Системы продукций: структура, технология, применение. ВЦ РАН, Новосибирск. 1990. 127 с.
16. Soh L.-K., Blank, T. Integrating Case-Based Reasoning and Meta-Learning for a Self-Improving Intelligent Tutoring System // International Journal of Artificial Intelligence in Education. 2008. No 18. P.27–58