Применение технологии оперативной аналитической обработки данных в задачах здравоохранения




Дата канвертавання24.04.2016
Памер63.6 Kb.
Применение технологии оперативной аналитической обработки
данных в задачах здравоохранения

Л.Ф. Ноженкова

Институт вычислительного моделирования СО РАН, г. Красноярск


expert@icm.krasn.ru
Технология оперативной аналитической обработки многомерных данных OLAP (On-line Analytical Processing) является одной из быстро развивающихся и широко применяемых новых информационных технологий. В основе OLAP-технологии лежит многомерная логическая модель данных. Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса. Например, для планирования медицинской помощи это могут быть: виды медицинской помощи, территории, профили, классы болезней и т.п. Практически всегда в качестве одного из измерений используется время. Внутри куба находятся данные, количественно характеризующие процесс, – так называемые «меры», будем называть их показателями. Пользователь, анализирующий информацию, может "нарезать" куб по разным направлениям, получать сводные (например, по годам, территориям) или, наоборот, детальные (по отдельным заболеваниям) данные и осуществлять другие операции, необходимые для анализа. Поскольку аналитик всегда оперирует некими суммарными данными, в базах данных OLAP практически всегда хранятся наряду с детальными данными и так называемые агрегаты, то есть заранее вычисленные показатели. Хранение заранее вычисленных агрегатов – основной способ повышения скорости выполнения OLAP-запросов.

    Важнейшим элементом OLAP-технологии является требование к наглядности представления анализируемых данных. Обычно используется представление многомерного куба в виде кросс-таблицы – плоской таблицы со сложными шапками. Соответственно операции над многомерным кубом реализуются как операции над кросс-таблицей. Например, операция вращения куба заключается в перестановке строк и столбцов, в изменении порядка подчиненности измерений внутри строк/столбцов, а также в перенесении части измерений из строк в столбцы и наоборот.

    Для потребителя информации применение OLAP обеспечивает высокую гибкость получаемых решений за счет возможности интерактивного изменения результата. Специалист получает не жестко регламентированный отчет, а инструментарий для творческого исследования задачи. Возможность свободной манипуляции данными упрощает получение необходимых наборов данных. Важным преимуществом OLAP является использование специалистом знакомых терминов из предметной области.



Наибольшее применение технология OLAP получила в финансово-промышленной сфере, где, как правило, решение конкретной аналитической задачи укладывается в рамки одного многомерного куба. При этом классические OLAP-решения мало пригодны к использованию в прикладных областях, где необходим комплексный анализ данных, связанный с реализацией сложных аналитических алгоритмов. Примером прикладной области, в которой указанные проблемы не позволяют эффективно применять традиционные средства OLAP-технологии, является здравоохранение. Например, методы расчета аналитических показателей и решения задач планирования медицинской помощи представляют собой сложные многошаговые процессы анализа многомерных данных. Возникает необходимость поэтапной обработки данных.

Коллективом отдела прикладной информатики Института вычислительного моделирования СО РАН предложен новый подход к решению разнообразных задач с применением OLAP-технологии, основанный на построении комплексов так называемых «OLAP-моделей» [1, 2, 3, 5]. OLAP-модель является описанием процесса расчета одной аналитической задачи. Структурно аналитическая модель состоит из исходных данных, витрины данных, информационного куба и операций над ним, способов представления результатов вычисления. Важным моментом построения модели является возможность сохранения в источнике данных результатов расчета. Такой подход позволяет применять поэтапный процесс анализа данных, то есть анализировать ранее полученные результаты. Необходимость поэтапной обработки данных возникает в случаях, когда для получения конечных результатов требуется сложная обработка исходных данных, как например, для планирования медицинской помощи [3].

Для автоматизации поэтапного анализа модели объединяются в комплексы. Перед созданием комплекса моделей задачу необходимо декомпозировать задачу на подзадачи таким образом, чтобы каждая подзадача могла быть представлена OLAP-моделью [3, 5]. В рамках одного расчета модели образуют последовательно выполняемую цепочку, при этом данные, рассчитанные одной моделью, в дальнейшем используются другими моделями.

Разработаны средства создания OLAP-приложений с адаптированным для специалистов предметной области интерфейсом [4]. Инструментарий разработки адаптированных интерфейсов позволяет создавать ориентированные на конкретную задачу OLAP-приложения на основе инструментального ядра, ограждая пользователя от ее сложной внутренней организации и сохраняя при этом весь функционал системы. Важным требованием к разрабатываемым приложениям является отражение специфики и традиций конкретной предметной области, в том числе, создание и применение словаря терминов соответствующей прикладной области.

Представленная технология и программные средства применяются для решения решается большого количества задач здравоохранения и обязательного медицинского страхования в Красноярском крае.

Для автоматизации сбора и аналитической обработки данных государственной медицинской статистической отчетности разработана OLAP-система СтатЭкспресс [2]. Система позволяет формировать и корректировать формы статотчетности. При этом автоматически формируется структура базы статистических данных. Поддерживается многоуровневый процесс сбора статистических данных с применением внутритабличных и межтабличных контролей. Выполняется формирование сводов, расчет показателей, подготовка отчетов. Система позволяет наглядно представлять результаты аналитической обработки как в форме кросс-таблиц, так и в виде диаграмм и картограмм. Имеется встроенная геоинформационная система. В Красноярском крае система работает с 2002 года. В настоящее время она применяется и в других регионах и отраслях. Временные затраты для адаптации и развертывания системы в любом регионе – не более одного года. Например, чтобы полностью автоматизировать сбор данных в системе социальной защиты населения Красноярского края, понадобилось всего полгода.

Система СтатЭкспресс послужила основой для создания системы ТПГГ [3], предназначенной для поддержки ежегодного формирования территориальных программ государственных гарантий оказания населению бесплатной медицинской помощи. За счет применения технологии OLAP-моделирования система позволяет представить необходимые расчеты объемов и финансирования медицинской помощи в виде комплекса OLAP-моделей. Такой подход, с одной стороны, обеспечивает гибкость в реализации и возможность корректировки методики расчетов. С другой стороны, если методика не меняется, то для расчета ТПГГ на следующий год необходимо ввести минимальное количество данных: система автоматически проводит расчет на следующий год на основе собранных данных статотчетности.

Разработанные средства организации хранения и оперативной аналитической обработки данных послужили основой для создания и использования централизованного хранилища медицинских данных регионального уровня. Фактологические данные в хранилище стекаются из множества информационных систем, работающих в учреждениях здравоохранения и обязательного медицинского страхования. Состав информации в хранилище данных направлен на анализ эффективности деятельности медицинских учреждений в системе здравоохранения региона и оказывает существенную помощь в решении задач оперативного управления и планирования. Медицинская информация разнородна и включает статистические (обобщенные) и другие типы данных. Для анализа данных в хранилище разработана OLAP-система «Аналитик» [4, 5]. На основе универсальной OLAP-системы «Аналитик» решено большое количество аналитических задач – анализ медико-демографических данных, определение потребности и объема капитальных вложений по объектам здравоохранения, анализ эффективности регионального здравоохранения. Построены специализированные OLAP-приложения, например, «Здоровье матери и ребенка». Для увеличения наглядности представления результатов оперативного аналитического моделирования разработаны средства отображения на электронной карте [6]. Полученные результаты применены для информационно-аналитической поддержки задач национального проекта «Здоровье» по реструктуризации сети медицинских учреждений.


Работа выполнена при поддержке гранта Президента для ведущих научных школ № НШ-3431.2008.9 и гранта по проекту № 7 Программы фундаментальных исследований Президиума РАН № 14.

Литература




  1. Виноградов К.А., Корчагин Е.Е., Никитина М.И., Л.Ф. Ноженкова. Информационные технологии в управлении региональным здравоохранением / Красноярск.: КМИАЦ, 2004. – 312 с.

  2. Евдокимов Д.А., Ишенин П.П. Аналитические функции системы «СтатЭкспресс» // Материалы Конференции молодых ученых Института вычислительного моделирования СО АРН. – Красноярск: ИВМ СО РАН, 2004. – С. 20-24.

  3. Ноженков А.И., Коробко А.В., Никитина М.И. Информационно-аналитическая поддержка формирования территориальной программы бесплатной медицинской помощи // Вестник КрасГАУ. – 2006. – № 13. – С.108-113.

  4. Ишенин П.П. Создание готовых приложений на базе информационно-аналитической системы «АНАЛИТИК» // Информационно-аналитические системы и технологии в здравоохранении и обязательном медицинском страховании // Труды всероссийской конференции. – Красноярск: КМИАЦ, 2004. – С. 227-232.

  5. Исаева О.С. Построение информационных моделей для OLAP-анализа медико-демографических данных // Журнал «Открытое образование». Приложение. – Красноярск: – ООО «Экспресс-Офсет», 2006. – С. 65-73.

  6. Евсюков А.А., Ноженкова Л.Ф. Оперативное геомоделирование сети медицинских учреждений // Вестник КрасГАУ. – 2006. – № 13. – С.114-118.


База данных защищена авторским правом ©shkola.of.by 2016
звярнуцца да адміністрацыі

    Галоўная старонка