Оглавление

37.Современные архитектуры ВМС.. 2

38. Принципы работы ЭВМ... 2

39. Функциональное назначение и структура ОС.. 3

40. Технические и программные средства объединения ЭВМ в систему. 5

41.      Технология обслуживания запроса пользователя в составе вычислительной системы.. 7

42. Архитектура СУБД. Взаимодействие СУБД с операционной системой ЭВМ... 8

43. Локальные базы данных: определение, назначение, характеристики, принципы построения. 9

44. Распределенные базы данных: определение, назначение, характеристики, принципы построения. 9

45. Реляционная модель данных. 9

46. Нормализация отношений в реляционных моделях. Понятие F+ и X+. 10

47. Представление структур данных в памяти ЭВМ. Физическое представление данных. 11

48. Стратегия поиска данных в памяти ЭВМ... 12

49. Файловая организация данных. 12

50. Обработка данных в файлах. 14

51. Архитектуры банков данных. 14

52. Состав и назначение функциональных компонент банка данных. 15

53.Базовые компоненты банка данных, их назначение , функционирование , реализация. 16

54. Серверы данных: области применения, основные характеристики и особенности. 17

47.      Структура интеллектуальной системы. 18

48.      Основные подходы к формированию базы знаний интеллектуальной системы.. 19

49.      Интеллектуальный анализ данных. 20

50.      Инструментальные средства для разработки интеллектуальных систем. 21

51.      Интеллектуальные агенты. 22

 

 

37.Современные архитектуры ВМС

 

В основу построения большинства ЭВМ положены принципы, сформулированные в 1945 г. Джоном фон Нейманом:

  1. Принцип программного управления (программа состоит из набора команд, которые выполняются процессором автоматически друг за другом в заданной последовательности).
  2. Принцип однородности памяти (программы и данные хранятся в одной и той же памяти; над командами можно выполнять такие же действия, как и над данными).
  3. Принцип адресности (основная память структурно состоит из пронумерованных ячеек).

ЭВМ, построенные на этих принципах, имеют классическую архитектуру (архитектуру фон Неймана).

В основу архитектуры современных персональных компьютеров положен магистрально-модульный принцип. Модульный принцип позволяет потребителю самому комплектовать нужную ему конфигурацию компьютера и производить при необходимости ее модернизацию. Модульная организация компьютера опирается на магистральный (шинный) принцип обмена информацией между устройствами.

Магистраль включает в себя три многоразрядные шины:

Шины представляют собой многопроводные линии.
Шина данных. По этой шине данные передаются между различными устройствами. Например, считанные из оперативной памяти данные могут быть переданы процессору для обработки, а затем полученные данные могут быть отправлены обратно в оперативную память для хранения. Таким образом, данные по шине данных могут передаваться от устройства к устройству в любом направлении.
Разрядность шины данных определяется разрядностью процессора, т.е. количеством двоичных разрядов, которые процессор обрабатывает за один такт. Разрядность процессоров постоянно увеличивалась по мере развития компьютерной техники.

http://infosgs.narod.ru/19_files/image002.jpg

Магистрально-модульное устройство компьютера

Шина адреса. Выбор устройства или ячейки памяти, куда пересылаются или откуда считываются данные по шине данных, производит процессор. Каждое устройство или ячейка оперативной памяти имеет свой адрес. Адрес передается по адресной шине, причем сигналы по ней передаются в одном направлении от процессора к оперативной памяти и устройствам (однонаправленная шина).Разрядность шины адреса определяет адресное пространство процессора, т.е. количество ячеек оперативной памяти, которые могут иметь уникальные адреса. Разрядность шины адреса постоянно увеличивалась и в современных персональных компьютерах составляет 32 бит.

Шина управления. По шине управления передаются сиг­налы, определяющие характер обмена информацией по ма­гистрали. Сигналы управления определяют какую операцию считывание или запись информации из памяти нужно производить, синхронизируют обмен информацией между устройствами и т.д.

38. Принципы работы ЭВМ

 

http://www.schoolinfo.ioso.ru/1.gif

Принцип работы ЭВМ рассматривается на примере персонального компьютера.

На схеме представлена структура ПК. Основу ПК составляет системный блок, в котором размещены:

Там же находятся платы: сетевая, видеопамяти, обработки звука, модем (модулятор-демодулятор), интерфейсные платы, обслуживающие устройства ввода-вывода: клавиатуры, дисплея, "мыши", принтера и др.

Все функциональные узлы ПК связаны между собой через системную магистраль, представляющую из себя более трёх десятков упорядоченных микропроводников, сформированных на печатной плате.

Микропроцессор служит для обработки информации: он выбирает команды из внутренней памяти (ОЗУ или ПЗУ), расшифровывает и затем исполняет их, производя арифметические и логические операции. Получает данные из устройства ввода и посылает результаты на устройства вывода. Он вырабатывает также сигналы управления и синхронизации для согласованной работы его внутренних узлов, контролирует работу системной магистрали и всех периферийных устройств. Упрощённая схема микропроцессора представлена на нижней схеме (выделена штриховой линией с надписью ЦП). В его состав входят: арифметико-логическое устройство (АЛУ), выполняющее арифметические и логические операции над двоичными числами; блок регистров общего назначения (РОН), используемых для временного хранения обрабатываемой информации (R0 - R5), указателя стека (R6) и счётчика команд (R7); устройство управления (УУ), определяющее порядок работы всех узлов микропроцессора. Одной из важнейших характеристик микропроцессора является его разрядность, определяемая числом разрядов АЛУ и РОН. Современные микропроцессоры имеют 16- , 32- и 64-разрядную длину двоичного числа, а также до 200 и более различных внутренних команд.

Обработка информации осуществляется по программе, которая представляет собой последовательность команд, направляющих работу компьютера. Команда состоит из кода операции и адреса. Код операции сообщает микропроцессору, что нужно сделать, какую выполнить операцию: сложить, сравнить, переслать, очистить и т.д. Адрес указывает место, где находятся данные, подлежащие обработке. Команды бывают безадресные, одноадресные и двухадресные. Например, двухадресная команда сложения выглядет так:

ADD

Адрес источника

Адрес приёмника

 

 

39. Функциональное назначение и структура ОС

 

Операционная система компьютера представляет собой комплекс взаимосвязанных программ, который обеспечивает управление аппаратурой компьютера и прикладными программами, а также действует как интерфейс между аппаратурой, прикладными программами и пользователем.

Основные функции ОС:

  1. Выполнение по запросу программ тех достаточно элементарных (низкоуровневых) действий, которые являются общими для большинства программ и часто встречаются почти во всех программах (ввод и вывод данных, запуск и остановка других программ, выделение и освобождение дополнительной памяти и др.).
  2. Загрузка программ в оперативную память и их выполнение.
  3. Стандартизованный доступ к периферийным устройствам (устройства ввода-вывода).
  4. Управление оперативной памятью (распределение между процессами, организация виртуальной памяти).
  5. Управление доступом к данным на энергонезависимых носителях (таких как жёсткий диск, оптические диски и др.), организованным в той или иной файловой системе.
  6. Обеспечение пользовательского интерфейса.
  7. Сетевые операции, поддержка стека сетевых протоколов.

Операционные системы могут иметь различную структуру (архитектуру). Различают монолитные системы, системы, основанные на микроядре, экзоядре и многоуровневые. Все наиболее популярные ОС общего назначения (Win, Unix) имеют многоуровневую структуру. Остальные варианты относятся, в основном, к ОС реального времени.


 

Многоуровневая структура - ОС как иерархия уровней. Уровни образуются группами функций операционной системы - файловая система, управление процессами и устройствами и т.п. Каждый уровень может взаимодействовать только со своим непосредственным соседом - выше- или нижележащим уровнем. Прикладные программы или модули самой операционной системы передают запросы вверх и вниз по этим уровням.

Пример – структура Unix

 

 

 

40. Технические и программные средства объединения ЭВМ в систему

 

Есть три основных способа организации межкомпьютерной связи:

·    объединение двух рядом расположенных компьютеров через их коммуникационные порты посредством специального кабеля;

·    передача данных от одного компьютера к другому посредством модема с помощью проводных или спутниковых линий связи;

·    объединение компьютеров в компьютерную сеть.

Часто при организации связи между двумя компьютерами за одним компьютером закрепляется роль поставщика ресурсов (программ, данных и т.д.), а за другим — роль пользователя этих ресурсов. В этом случае первый компьютер называется сервером, а второй — клиентом или рабочей станцией. Работать можно только на компьютере-клиенте под управлением специального программного обеспечения.

 Программное обеспечение (ПО) вычислительных сетей обеспе­чивает организацию коллективного доступа к вычислительным и информационным ресурсам сети, динамическое распределе­ние и перераспределение ресурсов сети с целью повышения оперативности обработки информации и максимальной заг­рузки аппаратных средств, а также в случае отказа и выхода из строя отдельных технических средств и т.д.

Для соединение используется специальное оборудование:

·    Сетевые кабели (коаксиальные, состоящие из двух изолированных между собой концентрических проводников, из которых внешний имеет вид трубки; оптоволоконные; кабели на витых парах, образованные двумя переплетёнными друг с другом проводами, и др.).

·    Коннекторы (соединители) для подключения кабелей к компьютеру; разъёмы для соединения отрезков кабеля.

·    Сетевые интерфейсные адаптеры для приёма и передачи данных. В соответствии с определённым протоколом управляют доступом к среде передачи данных. Размещаются в системных блоках компьютеров, подключенных к сети.
К разъёмам адаптеров подключается сетевой кабель.

·    Трансиверы повышают уровень качества передачи данных по кабелю, отвечают за приём сигналов из сети и обнаружение конфликтов.

·    Хабы (концентраторы) и коммутирующие хабы (коммутаторы) расширяют топологические, функциональные и скоростные возможности компьютерных сетей. Хаб с набором разнотипных портов позволяет объединять сегменты сетей с различными кабельными системами. К порту хаба можно подключать как отдельный узел сети, так и другой хаб или сегмент кабеля.

·    Повторители (репитеры) усиливают сигналы, передаваемые по кабелю при его большой длине.

Операционная система сети включает в себя набор управляющих и обслуживающих программ, обеспечивающих:

§ межпрограммный метод доступа (возможность организации связи между отдельными прикладными программами комплек­са, реализуемыми в различных узлах сети);

§ доступ отдельных прикладных программ к ресурсам сети (и в первую очередь к устройствам ввода-вывода);

§ синхронизацию работы прикладных программных средств в условиях их обращения к одному и тому же вычислительному ресурсу;

§ обмен информацией между программами с использованием сетевых "почтовых ящиков";

§ выполнение команд оператора с терминала, подключен­ного к одному из узлов сети, на каком-либо устройстве, подклю­ченном к другому удаленному узлу вычислительной сети;

§ удаленный ввод заданий, вводимых с любого терминала, и их выполнение на любой ЭВМ в пакетном или  оперативном режиме;

§ обмен наборами данных (файлами) между ЭВМ сети;

§ доступ к файлам, хранимым в удаленных ЭВМ, и обработку этих файлов;

§ защиту данных и вычислительных ресурсов сети от несанкционированного доступа;

§ выдачу различного рода справок об использовании ин­формационных, программных и технических ресурсов сети;

§ передачу текстовых сообщений с одного терминала поль­зователя на другие (электронная почта).


 

41.   Технология обслуживания запроса пользователя в составе вычислительной системы

 

БД – совокупность данных, отражающая состояние объекта и его отношение с рассматриваемой предметной областью.

Банк Данных  - система спец образом организованных баз данных, программных, технических  и языковых средств, предназначенных для целенаправленного накопления и многоцелевого использования данных.

СУБД  - совокупность языковых и программных средств для создания, ведения и совместного использования баз данных многими пользователями.

       Итак, приложение, которому требуется  передать  некоторые  данные  на

периферийное устройство, обращается с запросом на выполнение операции ввода-

вывода к  операционной  системе.  В  запросе  указываются:  адрес  данных  в

оперативной памяти, идентифицирующая информация о периферийном устройстве  и

операция, которую  надо  выполнить.  Получив  запрос,  операционная  система

запускает соответствующий драйвер, передавая ему в качестве параметра  адрес

выводимых данных. Дальнейшие действия по  выполнению  операции  ввода-вывода

со стороны компьютера реализуются совместно  драйвером  и  контроллером  ПУ.

Контроллер работает  под  управлением  драйвера.  Контроллеры  ПУ  принимают

команды и  данные  от  драйвера  в  свой  внутренний  буфер,  который  часто

называется  регистром,  или   портом,   а   затем   производят   необходимые

преобразования данных и команд, полученных от  драйвера,  в  соответствии  с

форматами, понятными устройству  управления  ПУ,  и  выдают  их  на  внешний

интерфейс.

       Распределение обязанностей между драйвером и контроллером может  быть

разным, но чаще  всего  контроллер  поддерживает  набор  простых  команд  по

управлению    периферийным     устройством,     а     драйвер     определяет

последовательность  их   выполнения,   заставляя   периферийное   устройство

совершать  более  сложные  действия  по  некоторому   алгоритму.   Например,

контроллер принтера  может  поддерживать  такие  элементарные  команды,  как

«Печать символа», «Перевод строки», «Возврат каретки» и  т.  п.  Драйвер  же

принтера с помощью этих команд организует печать строк символов,  разделение

документа на страницы и другие более высокоуровневые операции. Для одного  и

того же контроллера можно разработать различные драйверы, которые с  помощью

одного  и  того  же  набора  доступных  команд  будут  реализовывать  разные

алгоритмы управления ПУ.


 42. Архитектура СУБД. Взаимодействие СУБД с операционной системой ЭВМ

 

СУБД- совокупность языковых и программных средств, для создания, ведения и совместного использования БД многими пользователями.

СУБД использует во время своей работы концептуальную модель данных, О.С., подсистемы и конкретные процедуры, написанные пользователем.

Функции, которые выполняют современные СУБД:

1.                  Определение данных. СУБД допускают определение 3-х типов данных:

- внешняя среда

- концептуальная модель данных

- внутренняя схема

2. Функции по обработке данных СУБД должна уметь обрабатывать запросы пользователей на выборку, изменение или удаление. СУБД должна работать с планируемыми и не планируемыми запросами.

3. Безопасность и целостность данных. СУБД должна контролировать пользовательские запросы и пресекать попытки нарушения правил безопасности и целостности, определённые администратором БД

4. Восстановление данных и дублирование. СУБД должна осуществлять контроль над восстановлением данных и созданием архивов для дублирования.

5. Наличие словаря донных. СУБД должна обеспечивать функции ведения словаря данных. Это данные и данных (метаданные)

6. Производительность СУБД должна выполнять свои функции с максимально возможной эффективностью.

Концепция – способ рассмотрения сложных объектов и систем

Концептуальная модель – описание способа рассмотрения сложных объектов и систем.

Системный анализ объекта.

Концептуальная модель объекта:

So=<Soи, Soм, Soорг, Sоэк, Sоэн>

Где:     Soи – информационная страта объекта

Soм – материальная страта объекта

Soорг – организационная страта объекта

Sоэк – экономическая страта объекта

Sоэн – энергетическая страта объекта

Компоненты или слои – страты.

Графическая интерпретация концептуальной модели:

Банки данных – рассматриваем Soи

Soи =<Smи, Sjи, Swи, Sjmи, Smjи>

Где:     Smи – структурный аспект информационной страты

Sjи – функциональный аспект информационной страты

Swи – аспект управления информационной страты

Sjmи –функционально-структурный аспект информационной страты

Smjи –структурно-функциональный аспект информационной страты

Структурный аспект инф. страты связан с тем как организованы данные в нашей информационной системе. В реализации на ЭВМ – это БД.

Функциональный аспект ин страты связан с тем как организуется взаимосвязь между пользователем и ЭВМ при обработке данных. В реализации – это интерфейс или структура экранных форм.

Аспект управления инф страты связан с деятельностью  администратора БД, который отвечает за целостность и сохранность данных.

43. Локальные базы данных: определение, назначение, характеристики, принципы построения.

 

Локальная база данных - база данных, размещенная на одном или нескольких носителях на одном компьютере.

Данные локальной базы данных (файлы данных) находятся на одном (локальном) устройстве, в качестве которого может выступать диск компьютера или сетевой диск (диск другого компьютера, работающего в сети).

Для обеспечения разделения данных (доступа к данным) между несколькими пользователями, в качестве которых выступают программы, работающие на одном или нескольких компьютерах, в локальных базах данных применяется метод, получивший название блокировка файлов. Суть этого метода заключается в том, что пока данные используются одним пользователем, другой пользователь не может работать с этими данными, т. е. данные для него закрыты, заблокированы.

Paradox, dBase, FoxPro и Access — это локальные базы данных.

44. Распределенные базы данных: определение, назначение, характеристики, принципы построения

 

Распределенная база данных - совокупность баз данных, физически распределенная по взаимосвязанным ресурсам вычислительной сети и доступная для совместного использования.
Распределенная база данных - территориально распределенная совокупность локальных баз данных, объединенных согласованными принципами организации, комплектования и эксплуатации, а также каналами связи, и доступная для совместного использования.

45. Реляционная модель данных

 

Реляционная модель данных - разработанная Э.Коддом в 1970г. логическая модель данных, описывающая:

- структуры данных в виде (изменяющихся во времени) наборов отношений;

- теоретико-множественные операции над данными: объединение, пересечение, разность и декартово произведение;

- специальные реляционные операции: селекция, проекция, соединение и деление; а также

- специальные правила, обеспечивающие целостность данных.

           

Реляционная модель данных

А1

А2

А3

Аn

К

 

 

 

 

 

О

 

 

 

 

 

Р

 

 

 

 

 

Т

д

о

м

е

н

Е

 

 

 

 

 

Ж

Каждому атрибуту ставится в соответствии множество конкретных значений – доменов данного атрибута.

Каждая стока является множеством значений взятых по одному из домена каждого имени атрибута. Строка отношений называется картежом.

В множестве имен атрибутов существует такое подмножество, что картежи отношений м.б. однозначно определены значениями соответствующих атрибутов подмножества. Такое подмножество называется ключом отношения

{A1, A2, A3,…., An,}

R (A1, A2, A3,…., An,) – схема отношения.

Реляционная модель имеет математическое описание:

            {R1 (A12, A12, A13,…., A1n1,)

            {R2 (A21, A22, A23,…., A2n2,)

            {………………….

Для математического описания БД существует реляционная алгебра, реляционное исчисление доменов и реляционное исчисление кортежей.

46. Нормализация отношений в реляционных моделях. Понятие F+ и X+

 

Элементы теории нормальных форм

В реляц базах схема отношений содержит как структур, так и семантич инф-ию. Структурная инф-ия связана с объявленным отношением. Семантическая инф-ия выражается мн-вом функциональных зависимостей между атрибутами отношений. Некот функ зависимости могут быть нежелательными из-за побоч эффектов или аномалий, к-рые они вызывают при модификации БД. В этом случае наличие нежелат функ зависимостей выдляют в процедуре,к-рая наз-ся декомпозицией, при к-рой данной мн-во зависимостей заменяется др мн-вом,к-рое является проекцией первого.

Нормализация – это пошаговый процесс замены данной схемы отношения другой схемой, в к-рой отношения имеют более простую и регулярную форму. Декомпозиция должна сохранять эквивалентность схем при замене одной схемы на др. Декомпозиция без потерь гарантирует обратимость.

® должно $ естест соединение отношений R1 и R2 , к-рые должны восстанавливать отношение R.

Нормализация базируется на понятиях функ зависимости и полной функциональной зависимости.

Функциональная зависимость – если дано отношение R(A,B), то атрибут В в отношении R функционально зависит от атр А, если в каждый момент времени каждому значению атр А соотетствует не более чем 1 значение атр В.

ƒ:А®В

Полная функциональная зависимость – если дано R(A,B,C,D) и А, В являются составным ключом. Если (АВ)®С (т.е. атрибут полностью зависит от составного ключа), то имеем полную функ зависимость. Если атр-т частично зависит от ключа, т.е А®D, то это неполная функ зависимость.

Для нормализации отношений разработано 5 нормальных форм.

Понятие F+ и X+.

F+ - замыкание множества F.

Определение функциональной зависимости F+

Мн-во функциональных зависимостей F+ которое является расширением мн-ва F=<F1, F2…> присущее отношению R(ABCD)

Существует 2-а способа:

  1. Провести анализ заполненной БД
  2. Использовать правило вывода.

возникают функциональные зависимости Е<...>, то что есть в отношении R необходимо, что бы они были F+={},

для чтобы не вычислять F, вычисляют X, которое является подмножеством F

R - это смотрите картинку из вопроса 2 метода проетирования БД

 

47. Представление структур данных в памяти ЭВМ. Физическое представление данных.

 

Современные СУБД облд-т высоким быстродействием поиска инф в БД. Это быстродействие реализ за счет 2х методов

 – 1.Использование SQL для запросов. Это реляционный язык, кот использует элементы реляц алгебры и реляц исчисления кортежей. В реляционной системе запросов сущ возм-ть выбора эффективности стратегии д/вычисл реляцион выражения. Этот процесс выполняет оптимизатор. Он позволяет сократить кол-во операций, кот необходимы для выполнения запросов.

- 2.  Работа с совр структурами таблиц.

Можно выделить логическую структуру данных и физическое представление данных. Для представл дан-х на физиче-м уровне сущ 2 метода-

1 метод – любому элементу данных указ-ся адрес памяти. Размещение данных и их выборка производятся по известному адресу.

2 метод. – содержимое ключа конкретн записи преобра-ся опред метод в адрес памяти вычисл системы. Размещение данных и их выборка производ по знач-ю ключа, т.е. опре-ся содержимым самих данных. 

1 метод представления данных.  Линейный список с последовательным распределением памяти и с  связанным распределением памяти.

Пусть есть опред тип записи с набором экземпляров записи. Будем считать, что запись из Эл-в данных хранится целиком и раздел-ся на атрибуты или элементы данных после выборки записи.

Линейный список – мин упорядоч записи, когда номера записей следуют одна за другой. 

N   количество записей в списке; m   размер записи в байтах; β – адрес базы (указывает начало вектора дан-ных в памяти); i – текущая запись в списке; αi – адрес фи-зической памяти.

 

 

 

 

Преимущества: высокое быстродействие поиска и раз-мещения записей (используется адресная функция или алгоритм).

Недостатки: при изменении размера записи необходимо перезаписывать весь линейный список; Введение дополнительных записей может привести к перезаписи линейных списков.

Связанное распределение памяти

При связ распределении памяти Эл-ты списка имеют указатели на адрес хранения хранения след элемента. Связ распред в памяти – это более сложный и гибкий способ хранения лин списка.

N =106 – кол-во узлов. При связ распределении значение узла списка м/получить только путем просмотра указателей, хранящихся в записи. Связанный список позволяет модифицировать стру-ру списка, т.е. вставки и удаление производ просто.

При объединении этих 2-х типов списков получили ин-дексные файлы (связанный линейный список с исполь-зованием индексов).

Имеется список из N элементов; в каждый вводится по 2 дополнительных поля для указания адреса следующего элемента и для связи с индексом. При поиске сперва загружается в память индекс (линейный список с последовательным распределением памяти) потом – искомая запись ‘yi‘. При добавлении происходит реиндексация файла.

Быстродействие увеличивается на 4 порядка.

48. Стратегия поиска данных в памяти ЭВМ

Современные СУБД облд-т высоким быстродействием поиска инф в БД. Это быстродействие реализ за счет 2х методов

 – 1.Использование SQL для запросов. Это реляционный язык, кот использует элементы реляц алгебры и реляц исчисления кортежей. В реляционной системе запросов сущ возм-ть выбора эффективности стратегии д/вычисл реляцион выражения. Этот процесс выполняет оптимизатор. Он позволяет сократить кол-во операций, кот необходимы для выполнения запросов.

- 2.  Работа с совр структурами таблиц.

Циклический список

Это связ лин список, замкнутый кольцом(кольцевая структура)

Голова списка – фиксированная стр-ра с заданным адресом. В ней располагается указатель на 1й узел, служебная инф, а именно идентификатор списка, колво узлов в списке.

Наряду с однонаправленными исп-ся 2х направл цикл списки, где вводятся указатели и можно проходить по этим спискам в обр сторону.

 Существует 3 типа указателей – действительный, относительный и символический.

Дейтсв адреса исп-ся, когда необх получить быстрод-е списка. Недостаток – необходима  жесткая привязка к конкрет месту памяти. Если список перемещать, то нужно менять адреса во всех указателях.

Оносит адреса – позволяют размещать узлы в люб месте памяти и на разл устройствах без изменений значений указателей, изменяется только базовый адрес.

Символ адреса – позвол перемещать отд узлы относ-но друг друга, удалять записи без изменения значения указателей в отсальных записях списка. Недостаток – быстродействие сист уменьшается из-за использ универсальных структур. Универсальность – всегда большая сложность, но и гибкость.

49. Файловая организация данных.

В этом методе исп. Некотор. выч операция, котор. Преобраз значение ключа в соотв. Адрес памяти.

Эти методы дел-ся на 2 группы:

1)         методы,  в котор адресная фун-я реализует взаимно-однознач соотв  адресов и ключей

2)         методы рандемизации или хемирования в котор адресная фун-я реализ только однознач соотв вид ключа и адреса записи, обратное преобр-е – невозможно

1 Методы 1-ой группы

а) методы адресации с помощью ключа, эквивал адресу.

В этом методе в запись в кач-ве адрес памяти, по котор размещ-ся запись. В этом случае мы имеем дело с ключом адреса. Недостаток метода: ключи проеобр-ся во множ-ва, котор имеют м/у собой большие разрывы, т.е. сущ-ет много незапол-ых пр-ва.

2 Методы рендомезации или хэширования

Они основаны на вероятностных алгоритмах. Адресная фун-я которая строится на вероят-ых алгоритмах наз-ся хэш-функция.

Методы построения хэш-фун-ий:

- метод квадратов;

- деления;

- умножения;

- сдвига разрядов;

- преобр-я основания счисления;

- деления номиналов;

Метод постр-я хэш-фун-ий выбирают по 2 критериям:

1)         плотность заполнения адресного простр-ва;

2)         min кол-во поллизионных ситуаций

По этим признакам лучшим явл метод деления.

Метод деления

h(key)=mod(key, m)

h() – хэш-фун-я

key – значение ключа записи

m – число близкое к max размеру адресного пр-ва, отведённого для записи

mod – остаток от деления значения key на m

Метод разрешения коллизий

1.         метод открытой адресации

2.         метод цепочек

Метод открытой адресации

h(key)=mod(key, 1000)

key1=4957397

key2=0597397

h(key1)=397

h(key2)=397

rh(h(key2))=mod(397/1000)=mod(3970/1000)=970

Недостатки метода повторного хэширования

1)         мы имеем фиксир-ый размер таблицы где размещаются значения

2)         связан с удалением записи из адресного пр-ва

 

 Если удалить r1 и попытаться найти r2, т о нам будет сказано, что в позиции P такой записи не сущ-ет.

Метод цепочек

В нём исп- ся след струк-ра:

 

 

 

 

50. Обработка данных в файлах

Метод организации обр-ки файлов

Будем считать, что записи БД хранятся во внешней памяти, а их обработка производиться в ОП. М/у ОЗУ и внешней памятью обмен произ-ся блоками или страницами. Размер страниц зависит от конкрет реализации, но обычно это число кратно 28  Блоки обычно запролняются не полностью, выделяется основная область памяти и область переполнения (во внеш-ей памяти)

Основная область имеет схему, сост-я из блоков:

Предполаг-ем, что каждый файл имеет фиксир формат записи поля в каждой записи располаг-ся в одном и том же порядке, и для каждого поля предусмотрено опред число байтов, котор устанав-ся при генерации БД. Каждому полю уст-ся свой тип и это помогает проводить интерпретацию при считывании битов.

Над файлом треб-ся выполнить след типичные операции:

- включить запись;

- удалить запись;

- модернизировать запись.

Введём скоростную хар-ку обра-ки файлов БД.

Назовём передачу блока данных из ОЗУ во внешнюю память и наоборот доступом к блоку. Основной оперцией и основным критерием организации того или иного вида файлов явл кол-во доступов к блоку.

51. Архитектуры банков данных

 

Банк Данных – система, специальным образом организованных:

  1. базы данных
  2. программных средств
  3. технических средств
  4. языковых средств, предназначенных для централизации и коллективного многоцелевого использования данных.

Различие между логическим и физическим представлением данных было признано в 1973г. Существует комитет ANS/SPARC, который предложил 3-х уровневую архитектуру банков данных:

  1. концептуальный уровень
  2. внешний уровень
  3. внутренний уровень (пользовательский)

 

 

 

 


Концептуальный уровень – концептуальная модель данных (описание способа рассмотрения сложных объектов и систем).

Внешний уровень получается из концептуальной модели и является логическим представлением для пользователя.

Внутренний уровень обеспечивает физический взгляд на БД, т.е. на дисководы, на физические адреса, индексы и указатели.

            Реализация 3-х уровней требует наличие СУБД,  кот. обеспечит преобразования между этими 3-мя уровнями. Эти преобразования объемные, поэтому треб. высокоскоростная машина.

            Современные 3-х уровневые системы банков данных реализ.  физическую и логическую независимость данных.

            Физическая независимость данных – независимость операций хранения и обработки данных от используемых технических средств. Она обеспечивается операционной системой и системой драйверов, которые имеют свои логические имена. Операционная система оперирует с именами драйверов и тем самым обеспечивает хранение данных на любых носителях.

            Логическая независимость данных обеспечивается за счет разделения имен атрибутов и конкретного содержания этих атрибутов, т.е. за счет разделения концептуальной модели и конкретного содержания этих  элементов. В объектно-ориент. СУБД программа реализуется таким образом, что для них используются имена концептуальной модели данных. Это обеспечивает логическую независимость данных. Конкретная программа не зависит от данных, которые в ней будут использованы.

 

52. Состав и назначение функциональных компонент банка данных

 

Функциональный аспект информационной страты

Sjи =<x, y, F, Pj, T>

Где:     x – вектор входных воздействий

            y – вектор выходных реакций системы

            F – функция преобразования вектора x в y

            Pj - параметр функции преобразования

T – параметр, который указывает на то что необходимо рассмотреть как первые 4 параметра изменяются во времени

Функция преобразования F интерпретируется след. образом: информация из входных документов или векторов X1…Хn заполняет БД. Этот процесс определяет те функции, которые должен реализовать пользовательский интерфейс в проектируемой системе. Необходимо определить выбор вида работ, систему ввода информации, её корректировку и формулировку.

Набор выходных векторов Y1…Yn определяет те операции над данными, которые производятся с использованием всей структуры БД. Эти процессы так же определяют те функции, которые должны быть включены в пользовательский интерфейс (формирование различных отчётов, справок, ответы на запросы, формирование требуемых текстов).

Обобщая сказанное можно определить что функция преобразования F  - это набор тех функций, которые должен реализовывать пользовательский интерфейс.

Каждая функция реализуется в виде экранной формы или объекта СУБД.

Pj - параметр функции преобразования, который обычно интерпретируется как нормативно справочная информация, характерная для объектов автоматизации.

Т – изменение первых 4-х параметров во времени.

53.Базовые компоненты банка данных, их назначение , функционирование , реализация

 

Банк данных является сложной человеко-машинной системой, включающей в свой состав различные взаимосвязанные и взаимозависимые компоненты (рис. 1.1).

Информационная компонента. Ядром БнД является база данных. База данных — это поименованная совокупность взаимосвязанных данных, находящихся под управлением СУБД.

В базах данных может наблюдаться избыточность информации. Она может быть вызвана спецификой используемой модели данных, не позволяющей полностью устранить дублирование, или технологическими причинами (обеспечение большей надежности, сокращение времени реакции системы и др.).

Но это должна быть управляемая избыточность, причины и цели возникновения которой известны администратору базы данных и управляются как им, так и СУБД. В технической документации некоторых СУБД в состав БД включаются не только собственно хранимые данные о предметной области, но и описания БД. Более правильно описания БД считать самостоятельными компонентами БнД. Описания БД относятся к метаинформации, т. е. информации об информации. Описание баз данных часто называют схемой. Кроме того, в БнД могут присутствовать описания отдельных частей баз данных с точки зрения отдельных пользователей — подсхемы. Кроме описания БД в состав метаинформации, хранимой в БнД, может включаться информация о предметной области, необходимая для проектирования системы, о пользователя БнД, о проектных решениях и некоторая другая информация. Централизованное хранилище метаинформации называется словарём данных. Роль словарной системы особенно возрастает при использовании средств автоматизированного проектирования информационных систем Для большинства из них словарь  является ядром всей системы.  К БнД не относятся немашинные документы, служащие источниками информации, вводимой в БД, файлы входной и выходной информации, архивные файлы, выходные документы. Однако многие СУБД включают в свой состав языковые средства для описания этих компонентов. В этом случае сами описания, используемые в процессе функционирования БнД, будут входить в его состав.

Программные средства БнД. Программные средства БнД представляют собой сложный комплекс, обеспечивающий взаимодействие всех частей информационной системы при ее функционировании (рис. 1.2).

Основу программных средств БнД представляет СУБД. .В ней можно выделить ядро СУБД, обеспечивающее организацию ввода, обработки и хранения данных, а также другие компоненты, обеспечивающие настройку системы, средства тестирования, утилиты,обеспечивающие выполнение вспомогательных функций, таких, как восстановление баз данных, сбор статистики о функционировании БнД и др. Важной компонентой СУБД являются трансляторы или компиляторы для используемых ею языковых средств. Подавляющее большинство СУБД работает в среде универсальных операционных систем и взаимодействует с ОС при обработке обращений к БнД. Поэтому можно считать, что ОС также входит в состав БнД. Для обработки запросов к БД пишутся соответствующие программы, которые представляют прикладное программное обеспечение БнД. Языковые средства БнД. Являются важнейшей компонентой банков данных, т.к. в конечном счете они обеспечивают интерфейс пользователей разных категорий с банком данных. Языковые средства большинства СУБД относятся к языкам четвертого поколения (к первому поколению языков относят машинные языки, ко второму — символические языки ассемблера, к третьему — алгоритмические языки типа PL, COBOL и т. п., которые в 60-е годы назывались языками высокого уровня, но уровень которых гораздо ниже, чем у языков четвертого поколения).

54. Серверы данных: области применения, основные характеристики и особенности

 

Термин "сервер баз данных" обычно используют для обозначения всей СУБД, основанной на архитектуре "клиент-сервер", включая и серверную, и клиентскую части. Такие системы предназначены для хранения и обеспечения доступа к базам данных.

Хотя обычно одна база данных целиком хранится в одном узле сети и поддерживается одним сервером, серверы баз данных представляют собой простое и дешевое приближение к распределенным базам данных, поскольку общая база данных доступна для всех пользователей локальной сети.

Принципы взаимодействия между клиентскими и серверными частями

Доступ к базе данных от прикладной программы или пользователя производится путем обращения к клиентской части системы. В качестве основного интерфейса между клиентской и серверной частями выступает язык баз данных SQL.

Серверы баз данных, интерфейс которых основан исключительно на языке SQL, обладают своими преимуществами и своими недостатками. Очевидное преимущество - стандартность интерфейса. В пределе, хотя пока это не совсем так, клиентские части любой SQL-ориентированной СУБД могли бы работать с любым SQL-сервером вне зависимости от того, кто его произвел. Недостаток тоже довольно очевиден. При таком высоком уровне интерфейса между клиентской и серверной частями системы на стороне клиента работает слишком мало программ СУБД. Это нормально, если на стороне клиента используется маломощная рабочая станция. Но если клиентский компьютер обладает достаточной мощностью, то часто возникает желание возложить на него больше функций управления базами данных, разгрузив сервер, который является узким местом всей системы.

Одним из перспективных направлений СУБД является гибкое конфигурирование системы, при котором распределение функций между клиентской и пользовательской частями СУБД определяется при установке системы.

Типичное разделение функций между клиентами и серверами

В типичном на сегодняшний день случае на стороне клиента СУБД работает только такое программное обеспечение, которое не имеет непосредственного доступа к базам данных, а обращается для этого к серверу с использованием языка SQL.

В некоторых случаях хотелось бы включить в состав клиентской части системы некоторые функции для работы с "локальным кэшем" базы данных, т.е. с той ее частью, которая интенсивно используется клиентской прикладной программой. В современной технологии это можно сделать только путем формального создания на стороне клиента локальной копии сервера базы данных и рассмотрения всей системы как набора взаимодействующих серверов.

Требования к аппаратным возможностям и базовому программному обеспечению клиентов и серверов

Требования к аппаратуре и программному обеспечению клиентских и серверных компьютеров различаются в зависимости от вида использования системы.

Если разделение между клиентом и сервером достаточно жесткое, то пользователям, работающим на рабочих станциях или персональных компьютерах, абсолютно все равно, какая аппаратура и операционная система работают на сервере, лишь бы он справлялся с возникающим потоком запросов.

Но если могут возникнуть потребности перераспределения функций между клиентом и сервером, то уже совсем не все равно, какие операционные системы используются.

 

47.             Структура интеллектуальной системы.

№6 Структура ИИС

 

Объяснения в ЭС строятся на основе значений объектов. Значения объектов заполняются на основании ответов пользователей на вопросы ЭС.

Вторым фактором, влияющим на реализацию объяснений в ЭС являются правила БЗ. Основываясь на правилах, ЭС заполняет значения объектов высокого уровня (на которые не требуется ответ пользователя) и логическими заключениями приходит к выбранной пользователем цели опроса.

Преференции = предпочтения

Интеллектуальная система (ИС, англ. intelligent system) — это техническая или программная система, способная решать задачи, традиционно считающиеся творческими, принадлежащие конкретной предметной области, знания о которой хранятся в памяти такой системы. Структура интеллектуальной системы включает три основных блока — базу знаний, решатель и интеллектуальный интерфейс.[1]

Интеллектуальные системы изучаются группой наук, объединяемых под названием «искусственный интеллект».

 

48.             Основные подходы к формированию базы знаний интеллектуальной системы

Основные подходы к приобритению знаний:

1. Приобритение знаний от экспертов (см. вопрос 45).

2. Автоматическое формирование БЗ

Процесс приобритения знаний включает следующие этапы:

1.      Извлечение знаний из источника (могут быть: эксперт, БД, ...).

2.      Организация знаний обеспечивает эффективное решение задач.

3.      Представление знаний, в виде понятном для ИС.

4.      Ввод знаний в систему.

5.      Проверка введенных данных на тестовом примере.

6.      Корректировка знаний.

7.      Результат формирования БЗ.

 

Автоматическое формирование БЗ на основе анализа знаний (см. вопрос 42).

Приобритение знаний от экспертов.

            Процесс приобретения знаний включает следующие этапы:

1.      Извлечение знаний из источника (могут быть: эксперт, БД, ...).

2.      Организация знаний обеспечивает эффективное решение задач.

3.      Представление знаний, в виде понятном для ИС.

4.      Ввод знаний в систему.

5.      Проверка введенных данных на тестовом примере.

6.      Корректировка знаний.

7.      Результат формирования БЗ.

8.      Основные подходы к приобретению знаний:

9.      Приобретение знаний от экспертов.

10.  Автоматическое формирование БЗ на основе анализа знаний.

            Для приобритения знаний от экспертов используются редакторы БД. Ввод знаний осуществляется в интерактивном режиме. Используется специально разработанный экран. Формы обеспечивают удобный ввод знаний в систему, с сохранением их целостности.

Автоматическое формирование БЗ.

Самая первая ЭС, где использовался этот подход – DENDRAL. Система по экспертным данным определяет структуру молекул.

Система состоит из 3х модулей:

          План

          Генерация

          Проверка

Планирование – на основе анализа спектограмм формируются списки требуемых и запрещенных объектов.

Пример:

Если Х1 и Х2 – пики интенсивности, такие, что Х1 + Х2 = М + 28

Х1 – 28 = пик интенсивности,

М – молекулярный вес,

Х2 – 28 = пик интенсивности,

То молекула содержит кетоновую группу.

Генератор формирует возможную структуру молекулы.

Проверка моделирует масспектрограммы (???) полученых молекул и сравнивает их с исходными масспектрограммами.

Модули:

1.Интерпритации

2.Генерации правил

3.Модификации правил

Ипользует масспектрограммы известных структур веществ.

1.Кореляция между точками спектограмм и определение структуры молекулы.

2.Генерирует продукционные правила и соответствующие ограничения

3.Проверяет правила в случае необходимости

Индуктивное обучение – пример DENDRAL, позволяет сформировать правила на основе анализа примера.

Основу данного подхода составляет умозаключение, называющееся – индуктив.

Обучение по примеру может использовать умозаключение по аналогии, это заключение, которое на основе принадлежащего признака известного объекта делает вывод о принадлежание этого признака другому, который сходен с известным объектом.

 

            Интеллектуальный анализ данных (ИАД, Data Mining) применяется для поиска функциональных и логических закономерностей в накопленной информации, построения моделей и правил, которые объясняют не только эти закономерности, но и найденные аномалии, а также прогнозируют развитие изучаемых процессов.

В общем случае ИАД должен состоять из трёх стадий (рисунок):

1) выявление закономерностей (свободный поиск);

2) использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование);

3) анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях.

 

49.             Интеллектуальный анализ данных.

            Интеллектуальный анализ данных (англ. Data Mining) — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [1] . Подразделяется на задачи классификации, моделирования и прогнозирования и другие. Методы Data Mining разделяются на статистические (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов) и кибернетические (искусственные нейронные сети, эволюционное программирование, генетические алгоритмы, ассоциативная память, нечеткая логика, деревья решений, системы обработки экспертных знаний).

            Визуальные инструменты Data Mining позволяют проводить анализ данных предметными специалистами (аналитиками), не владеющими соответствующими математическими знаниями.

 

Задачи, решаемые ИАД

 

·         Классификация — отнесение входного вектора (объекта, события, наблюдения) к одному из заранее известных классов.

·         Кластеризация — разделение множества входных векторов на группы (кластеры) по степени «похожести» друг на друга.

·         Сокращение описания — для визуализации данных, лаконизма моделей, упрощения счета и интерпретации, сжатия объемов собираемой и хранимой информации.

·         Ассоциация — поиск повторяющихся образцов. Например, поиск «устойчивых связей в корзине покупателя» (англ. market basket analysis) — вместе с пивом часто покупают орешки.

·         Прогнозирование

·         Анализ отклонений — Например, выявление нетипичной сетевой активности позволяет обнаружить вредоносные программы.

·         Визуализация

В литературе можно встретить еще ряд классов задач. Базовыми задачами являются первые три. Остальные задачи сводятся к ним тем или иным способом.

Также можно использовать сводные задачи под основу

 

Этапы обучения

Можно выделить типичный ряд этапов решения задач методами ИАД:

1.      Формирование гипотезы;

2.      Сбор данных;

3.      Подготовка данных (фильтрация);

4.      Выбор модели;

5.      Подбор параметров модели и алгоритма обучения;

6.      Обучение модели (автоматический поиск остальных параметров модели);

7.      Анализ качества обучения, если неудовлетворительный переход на п. 5 или п. 4;

8.      Анализ выявленных закономерностей, если неудовлетворительный переход на п. 1, 4 или 5.

 

50.             Инструментальные средства для разработки интеллектуальных систем.

            Трудозатраты на разработку ЭС в значительной степени зависят от используемых инструментальных средств (ИС). Ниже приведены типы современных ИС, упорядоченные в соответствии с убыванием трудозатрат при создании экспертных систем.

1. Традиционные (в том числе объектно-ориентированные) языки программирования типа С, С++ (как правило, эти ИС используются не для создания ЭС, а для создания ИС).

2. Символьные языки программирования (например, Lisp, Prolog и их разновидности). Эти ИС в последнее время, как правило, не используются в реальных приложениях в связи с тем, что они плохо приспособлены к объединению с программами, написанными на языках традиционного программирования.

3. Инструментарий, содержащий многие, но не все компоненты ЭС. Эти

средства предназначены для разработчика, от которого требуются знание программирования и умение интегрировать компоненты в программный комплекс.

Примерами являются такие средства, как OPS 5, ИЛИС и др.

4. Оболочки ЭС общего назначения, содержащие все программные компоненты, но не имеющие знаний о конкретных предметных средах. Средства этого и последующего типов не требуют от разработчика приложения знания программирования. Примерами являются ЭКО, Leonardo, Nexpert Object, Kappa и др.

В последнее время термин "оболочка" (shell) использует-

ся реже, его заменяют на более широкий термин "среда разработки" (development environment). Если хотят подчеркнуть, что средство используется не только на стадии разработки приложения, но и на стадиях использования и сопровождения, то употребляют термин "полная среда" (complete environment). Примерами таких средств для создания статических ЭС являются: Nexpert Object ,

ProKappa, ART*Enterprise, Level 5 Object и др.

5. Проблемно/предметно-ориентированные оболочки (среды):

• проблемно-ориентированные средства (problem-specific), ориентирован-

ные на некоторый класс решаемых задач и имеющие в своем составе соответствующие этому классу альтернативные функциональные модули (примерами таких классов задач являются задачи поиска, управления, планирования, прогнозирования и т.п.);

• предметно-ориентированные средства (domain-specific), включающие

знания о некоторых типах предметных областей, что сокращает время разработки БЗ.

51.             Интеллектуальные агенты.

            Интеллектуа́льный аге́нт — это программа, самостоятельно выполняющая задание, указанное пользователем компьютера, в течение длительных промежутков времени. Одним из примеров таких заданий может служить задача постоянного поиска и сбора необходимой информации в Интернете. Компьютерные вирусы также можно отнести к интеллектуальным агентам.

Обычно агент обладает набором из следующих свойств:

1.      адаптивность: агент обладает способностью обучаться

2.      автономномть: агент работает как самостоятельная программа, ставя себе цели и выполняя действия для достижения этих целей

3.      коллаборативность: агент может взаимодействовать с другими агентами несколькими способами, например, играя роль поставщика/потребителя информации или одновременно обе эти роли.

4.      способность к рассуждениям: агенты могут обладать частичными знаниями или механизмами вывода, например, знаниями, как приводить данные из различных источников к одному виду. Агенты могут специализироваться на конкретной предметной области.

5.      коммуникативность: агенты могут общаються с другими агентами

6.      мобильность: способность к передачи кода агента с одного сервера на другой.

 

Используются технологии uCoz