Отношения. Переменные отношения


Независимая переменная. Исследователь должен стремиться оперировать в эксперименте только независимой переменной. Эксперимент, где это условие соблюдается, называют чистым экспериментом. Но чаще всего в ходе эксперимента, варьируя одну переменную, экспериментатор изменяет вместе с тем ряд других. Это изменение может быть вызвано действием экспериментатора и обусловлено связью двух переменных. Например, в эксперименте по выработке простого двигательного навыка он наказывает испытуемого за неудачи электрическим током. Размер наказания может выступать в качестве независимой переменной, а скорость выработки навыка - зависимой переменной. Наказание не только закрепляет у испытуемого соответствующие реакции, но и порождает у него ситуативную тревогу, которая влияет на результаты - увеличивает число ошибок и уменьшает скорость выработки навыка.

Центральная проблема при проведении экспериментального исследования - выделение независимой переменной и ее изоляция от других переменных. В качестве независимых переменных в психологическом эксперименте могут выступать:

·характеристики заданий;

·особенности ситуации (внешние условия);

·управляемые особенности (состояния) испытуемого.

Последние часто называют «переменными организма». Иногда выделяют четвертый вид переменных - константные характеристики испытуемого (интеллект, пол, возраст и т. д.), но, на мой взгляд, они относятся к дополнительным переменным, поскольку на них нельзя воздействовать, а можно лишь учесть их уровень при формировании экспериментальных и контрольных групп.

Характеристика задания - то, чем может манипулировать экспериментатор более или менее свободно. По традиции, идущей от бихевиоризма, считается, что экспериментатор варьирует только характеристики стимулов (stimulus variables), но в его распоряжении гораздо больше возможностей. Экспериментатор может варьировать стимулы или материал задания, изменять тип ответа испытуемого (вербальный или невербальный ответ), менять шкалу оценивания и т.д. Он может варьировать инструкцию, меняя цели, которых должен достичь испытуемый в ходе выполнения задания. Экспериментатор может варьировать средства, которые имеет испытуемый для решения задачи, и ставить перед ним препятствия. Он может изменять систему поощрений и наказаний в ходе выполнения задания и т.д.



К особенностям ситуации следует отнести те переменные, которые непосредственно не входят в структуру экспериментального задания, выполняемого испытуемым. Это может быть температура в помещении, обстановка, наличие внешнего наблюдателя и т.д.

Эксперименты по выявлению эффекта социальной фасилитации (усиления) проводились по следующей схеме: испытуемому давалась какая-либо сенсомоторная или интеллектуальная задача. Он сначала выполнял ее в одиночку, а затем в присутствии другого человека или нескольких людей (последовательность, разумеется, менялась в разных группах). Оценивалось изменение продуктивности испытуемых. В этом случае задача испытуемого оставалась неизменной, изменялись лишь внешние условия эксперимента.

Что может варьировать экспериментатор?

Во-первых, это физические параметры ситуации: расположение аппаратуры, внешний вид помещения, освещенность, звуки и шумы, температура, размещение мебели, окраска стен, время проведения эксперимента (время суток, длительность и т.д.). То есть все физические параметры ситуации, не являющиеся стимулами.

Во-вторых, это социально психологические параметры: изоляция - работа в присутствии экспериментатора, работа в одиночку - работа с группой и т.д.

В-третьих, это особенности общения и взаимодействия испытуемого (испытуемых) и экспериментатора.

Судя по публикациям в научных журналах, за последние годы резко возросло количество экспериментальных исследований, в которых применяется варьирование внешних условий.

К «организменным переменным», или неуправляемым характеристикам испытуемых, относятся физические, биологические, психологические, социально-психологические и социальные признаки. Традиционно их относят к «переменным», хотя большинство из них является неизменным или относительно неизменным на протяжении жизни. Влияние дифференциально-психологических, демографических и прочих константных параметров на поведение индивида изучают в корреляционных исследованиях. Однако авторы большинства учебников по теории психологического метода, например М. Мэтлин, относят эти параметры к числу независимых переменных эксперимента.

Как правило, в современном экспериментальном исследовании дифференциально-психологические особенности индивидов, такие как интеллект, пол, возраст, социальное положение (статус) и т.д., учитываются в качестве дополнительных переменных, которые контролируются экспериментатором в общепсихологическом эксперименте. Но эти переменные могут превращаться во «вторую основную переменную» в дифференциально-психологическом исследовании, и тогда используется факторный план.

Зависимая переменная. Психологи имеют дело с поведением испытуемого, поэтому в качестве зависимой переменной выбираются параметры вербального и невербального поведения. К ним относятся: число ошибок, которое совершила крыса, пробегая лабиринт; время, которое затратил испытуемый при решении задачи, изменения мимики его лица при просмотре эротического фильма; время двигательной реакции на звуковой сигнал и т.д.

Выбор поведенческого параметра определяется исходной экспериментальной гипотезой. Исследователь должен ее максимально конкретизировать, т.е. добиться того, чтобы зависимая переменная была операционализирована - поддавалась регистрации в ходе эксперимента.

Параметры поведения условно можно разделить на формально-динамические и содержательные. Формально-динамические (или пространственно-временные) параметры достаточно легко поддаются аппаратурной регистрации. Приведем примеры этих параметров.

1. Точность. Наиболее часто регистрируемый параметр. Поскольку большинство заданий, предъявляемых испытуемому в психологических экспериментах, являются задачами на достижения, то точность или противоположный параметр - ошибочность действий - будет главным регистрируемым параметром поведения.

2. Латентность. Психические процессы протекают скрытно от внешнего наблюдателя. Время от момента предъявления сигнала до выбора ответа называется латентным временем. В некоторых случаях латентное время является важнейшей характеристикой процесса, например при решении мыслительных задач.

3. Длительность, или скорость, исполнения. Является характеристикой исполнительного действия. Время между выбором действия и окончанием его выполнения называют скоростью действия (в отличие от латентного времени).

4. Темп, или частота действий. Важнейшая характеристика, особенно при исследовании простейших форм поведения.

5. Продуктивность. Отношение числа ошибок или качества выполнения действий ко времени выполнения. Служит важнейшей характеристикой при исследовании научения, познавательных процессов, процессов принятия решения и т. д. Содержательные параметры поведения предполагают категоризацию формы поведения либо в терминах обыденного языка, либо в терминах той теории, предположения которой проверяются в данном эксперименте.

Распознавание различных форм поведения - дело специально обученных экспертов или наблюдателей. Требуется немалый опыт, чтобы характеризовать один поступок как проявление покорности, а другой - как проявление подобострастия.

Проблема фиксации качественных особенностей поведения решается посредством: а) обучения наблюдателей и разработки карт наблюдения; б) измерения формально-динамических характеристик поведения с помощью тестов.

Зависимая переменная должна быть валидной и надежной. Надежность переменной проявляется в устойчивости ее регистрируемости при изменении условий эксперимента в течение времени. Валидность зависимой переменной определена только в конкретных условиях эксперимента и применительно к определенной гипотезе.

Можно выделить три типа зависимых переменных: 1) одновременную; 2) многомерную; 3) фундаментальную. В первом случае регистрируется лишь один параметр, и именно он считается проявлением зависимой переменной (между ними существует функциональная линейная связь), как, например, при изучении времени простой сенсомоторной реакции. Во втором случае зависимая переменная многомерна. Например, уровень интеллектуальной продуктивности проявляется во времени решения задачи, его качестве, трудности решенной задачи. Эти параметры могут фиксироваться независимо. В третьем случае, когда известно отношение между отдельными параметрами многомерной зависимой переменной, параметры рассматриваются в качестве аргументов, а сама зависимая переменная - в качестве функции. Например, фундаментальное измерение уровня агрессии F(a) рассматривается как функция отдельных ее проявлений (а) мимики, пантомимики, брани, рукоприкладства и др.

F(a) =f(a 1 ,а 2 ,... ,а n).

Существует еще одно важное свойство зависимой переменной, а именно - сензитивность (чувствительность) зависимой переменной к изменениям независимой. Суть в том, что манипуляция независимой переменной влияет на изменение зависимой. Если же мы манипулируем независимой переменной, а зависимая не изменяется, то зависимая переменная несензитивна по отношению к независимой. Два варианта проявления несензитивности зависимой переменной получили названия «эффект потолка» и «эффект пола». Первый случай встречается тогда, когда предъявляемая задача так проста, что уровень ее выполнения много выше всех уровней независимой переменной. Второй эффект, напротив, возникает тогда, когда задание настолько сложно, что уровень его выполнения оказывается ниже всех уровней независимой переменной.

Итак, как и прочие компоненты психологического исследования, зависимая переменная должна быть валидна, надежна, обладать чувствительностью к изменению уровня независимой переменной.

Существуют два основных приема фиксации изменений зависимой переменной. Первый применяется наиболее часто в экспериментах с участием одного испытуемого. Изменение зависимой переменной регистрируется во время эксперимента вслед за изменением уровня независимой переменной. Примером является фиксация результатов в экспериментах по научению. Кривая научения представляет собой классический вариант тренда - изменения успешности выполнения заданий в зависимости от числа проб (времени проведения эксперимента). Для обработки таких данных применяется статистический аппарат анализа трендов. Второй прием фиксации изменения уровня независимой переменной называются отсроченным измерением. Между воздействием и эффектом проходит определенный промежуток времени, его длительность устанавливается по времени отдаленности следствия от причины. Например, прием дозы алкоголя увеличивает время сенсомоторной реакции не сразу, а по прошествии определенного времени. То же самое можно сказать о влиянии заучивания конкретного количества иностранных слов на успешность перевода текста на редкий язык: эффект проявляется не сразу (если проявляется).

Отношения между переменными. В основе построения современной экспериментальной психологии лежит формула К. Левина - поведение есть функция личности и ситуации:

Необихевиористы ставят в формулу вместо Р (личность) О (организм), что более точно, если считать испытуемыми не только людей, но и животных, а личность редуцировать к организму.

Как бы то ни было, большинство специалистов по теории психологического эксперимента, в частности МакГиган, считают, что в психологии существуют два типа законов: 1) «стимул-ответ»; 2) «организм-поведение».

Первый тип законов обнаруживается в ходе экспериментального исследования, когда стимул (задача, ситуация) - это независимая переменная, а зависимая переменная - ответ испытуемого.

Второй тип законов является продуктом метода систематического наблюдения и измерения, поскольку свойствами организма управлять с помощью психологических средств нельзя.

Существуют ли «пересечения»? Разумеется. Ведь в психологическом эксперименте зачастую учитывается влияние так называемых дополнительных переменных, большинство из которых является дифференциально-психологическими характеристиками. Следовательно, есть смысл добавить в список и «системные» законы, описывающие влияние ситуации на поведение личности, обладающей определенными свойствами. Но в психофизиологических и психофармакологических экспериментах можно воздействовать на состояние организма, а в ходе формирующего эксперимента - целенаправленно и необратимо изменять те или иные свойства личности.

В классическом психологическом поведенческом эксперименте устанавливается функциональная зависимость вида

где R - ответ, a S - ситуация (стимул, задача). Переменная S систематически варьируется, а детерминируемые ею изменения ответа испытуемого фиксируются. В ходе изучения проявляются условия, при которых испытуемый ведет себя тем или иным образом. Результат фиксируется в форме линейной или нелинейной зависимости.

Другой тип зависимостей символизируется как зависимость поведения от личностных свойств или состояний организма испытуемого:

R = f (О) или R = f(P).

Исследуется зависимость поведения испытуемого от того или иного состояния организма (болезни, усталости, уровня активации, фрустрации потребностей и т.д.) или от личностных свойств (тревожности, мотивации и т.д.). Исследования проводятся с участием групп людей, различающихся по данному признаку: свойству или актуальному состоянию.

Естественно, эти две строгие зависимости являются простейшими формами отношений между переменными. Возможны более сложные зависимости, устанавливаемые в конкретном эксперименте, в частности, факторные планы позволяют выявить зависимости вида R = f (S 1 , S 2), когда ответ испытуемого зависит от двух варьируемых параметров ситуации, а поведение является функцией состояния организма и среды.

Остановимся на формуле Левина. В общей форме она выражает идеал экспериментальной психологии возможность предсказать поведение конкретной личности в определенной ситуации. Переменная «личность», которая входит в состав этой формулы, вряд ли может рассматриваться лишь как «дополнительная». Традиция необихевиоризма предлагает использовать термин «промежуточная» переменная. В последнее время за такими «переменными» - свойствами и состояниями личности - закрепился термин «переменная-модератор», т.е. посредник.

Рассмотрим основные возможные варианты отношений между зависимыми переменными. Существует, как минимум, шесть видов связи переменных. Первый, он же простейший, - отсутствие зависимости. Графически он выражается в форме прямой, параллельной оси абсцисс на графике, где по оси абсцисс (X) отложены уровни независимой переменной. Зависимая переменная не чувствительна к изменению независимой (см. рис. 4.8).

Монотонно возрастающая зависимость наблюдается тогда, когда увеличению значений независимой переменной соответствует изменение зависимой переменной (см. рис. 4.9).

Монотонно убывающая зависимость наблюдается, если увеличению значений независимой переменной соответствует уменьшение уровня независимой переменной (см. рис. 4.10).

Нелинейная зависимость U -образного типа обнаруживается в большинстве экспериментов, в которых выявляются особенности психической регуляции поведения: (см. рис. 4.11).

Инвертированная U -образная зависимость получается в многочисленных экспериментальных и корреляционных исследованиях как в психологии личности, мотивации, так и в социальной психологии (см. рис. 4.12).

Последний вариант зависимости обнаруживается не так часто, как предыдущие, - сложная квазипериодическая зависимость уровня зависимой переменной от уровня независимой (см. рис. 4.13).

При выборе способа описания работает «принцип экономии». Любое простое описание лучше, чем комплексное, даже если они одинаково успешны. Поэтому аргументы, распространенные в отечественных научных дискуссиях типа «Все гораздо сложнее на самом деле, чем представляет автор» по меньшей мере бессмысленны. Тем более что никто не знает, как «на самом деле».

Так называемое «комплексное описание», «многомерное описание» есть зачастую просто попытка уйти от решения научной проблемы, способ маскировки личной некомпетентности, которую хотят скрыть за путаницей корреляционных связей и сложносоставными формулами, где все всему равняется.

В основе построения современной экспериментальной психо логии лежит формула К. Левина поведение есть функция личности и ситуации: В =f(P; S).

Исследуется зависимость поведения испытуемого от той или иной ситуации (стимула, задачи), состояния организма (болезни, усталости, уровня активации, фрустрации потребностей и т.д.) или от личностных свойств (тревожности, мотивации и т.д.). Исследования проводятся с участием групп людей, различающихся по данному признаку.

Формула Левина в общей форме выражает идеал экспериментальной психологии : возможность предсказать поведение конкретной личности в определенной ситуации . Переменная «личность», которая входит в состав этой формулы, по традиции необихевиоризма называется «промежуточная » переменная или более современно «переменная-модератор », т.е. посредник.

Рассмотрим основные возможные варианты отношений между переменными . Существует пять основных видов связи переменных.

1. Отсутствие зависимости. Графически он выражается в форме прямой, параллельной оси абсцисс на графике, где по оси абсцисс (X) отложены уровни независимой переменной, а по оси ординат (У) – зависимой переменной. Зависимая переменная не чувствительна к изменению независимой.

2. Монотонно возрастающая зависимость наблюдается тогда, когда увеличению значений независимой переменной соответствует изменение зависимой переменной.

Уровень ощущений


Интенсивность звука

3. Монотонно убывающая зависимость наблюдается, если увеличе­нию значений независимой переменной соответствует уменьшение уровня зависимой переменной.

Число воспроизведенных

Время, прошедшее от момента заучивания.

4. Нелинейная зависимость U-образного типа обнаруживается в большинстве экспериментов, в которых выявляются особенности психической регуляции поведения :


Уровень тревожности

5. Инвертированная U-образная зависимость получается в много­численных экспериментальных и корреляционных исследованиях, как в психологии личности, мотивации, так и в социальной психо­логии.

Эффективность

совместного

решения проблемы

р Размер группы

Конец работы -

Эта тема принадлежит разделу:

Наука и научная методология

На сайте сайт читайте: "наука и научная методология"

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Основные черты современной научной методологии
Каковы же основные черты современной научной методологии? Современная наука начинается с Галилея (1564-1642) и Ньютона (1642-1727), живших в эпоху первой научной революции. Для Ньютона научная деят

Что представляют собой теории
В связи с этим очень интересно и важно понять природу научных теорий. Сделать это непросто, поскольку, как указывают философы-науковеды, вопрос о природе научных теорий – самая неустойчивая часть ф

Проблема рациональности науки
Рациональность представляет собой нормативную концепцию. В этом отношении она подобна морали, и потому проблема рациональности науки очень важна. Быть моральным и рациональным – зн

Признаки и виды научного исследования
Исследование, в отличие от стихийных форм познания, основано на научном методе, который предполагает 1) фиксацию цели иссле­дования, 2) фиксацию средств исследования (методологию, мет

Особенности мышления, лежащие в основе научного исследования
Способ мышления, характерный для ученых в целом и исследователей-психологов в частности, имеет определенные особенности. Ученый исходит из того, что явления действительности, в том числе человеческ

Научное исследование и его инструменты
(продолжение) Теория как результат научного исследования Одной из целей психологии как науки является объяснение поведения. В связи с этим важно

Методология и психологическое знание
Начнем мы эту тему не непосредственно с описания методов эмпирического психологического исследования, а обратимся к методологии с тем, чтобы проследить связь методологических представлений о знании

Виды экспериментов
Какие существуют виды экспериментов (будем употреблять этот общий термин, поскольку из контекста обычно ясно, идет ли речь о строгом или о квазиэксперименте)? По формальным основан

Этапы экспериментально-психологического исследования
Экспериментальное исследование в психологии, как и в любых других науках, проводится в несколько этапов. Часть из них являет­ся обязательными, часть – в некоторых случаях может отсутство­вать, но п

Независимая переменная
Центральная проблема при проведении экспериментального исследования – выделение НП и ее изоляция от других переменных. В зависимости от того, как

Зависимая переменная
В качествеЗПвыбираютсяпараметры вербального и невербального поведения. Например, число ошибок, которое совершила крыса, пробегая лабиринт, время, кот

Контроль переменных
Следует различать контроль независимой переменной и контроль «прочих» или внешних (побочных и дополнительных переменных). Контроль независимой перемен

Валидность психологического эксперимента
К основным характеристикам психологического эксперимента относится его валидность. Начнем обсуждение понятия валидности применительно к психологическим измерениям. На чем осн

Экспериментальные планы
Предпосылки планирования эксперимента Планирование эксперимента имеет две основные формы: содержательную и формальную. Содержательное планирование включает решение

Экспериментальные планы
(продолжение) Проиллюстри­руем применение простого факторного плана примером из сравнительной психологии, в котором экспе­риментаторов интересовало, с какой скоростью крысы

Интерпретация результатов факторного эксперимента
Выше говорилось, что в факторных экспериментах оценивается отдельно влияние каждой НП на ЗП, а также зависимость влияния одной НП от уровня другой. Первый тип влияния называют главными (основным

Функциональные планы
Функциональные планы – это планы для малых n (1-2 испытуемых), где главное – указать связь между определяющими условиями и эффектом их воздействия на поведение, причем считается, что и условия, и р

Квазиэкспериментальные планы
Поскольку реализовать планы «истинных экспериментов», используя схемы контроля внешних переменных, удается не часто, в качестве попытки учета реалий жизни при проведении эмпирических исследований с

Планы ex-post-facto
Этот метод часто применяется в психологии. Другое название – экспери­мент, на который ссылаются. Стратегия его применения состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В к


Начнем изложение материала темы 7 словами Джеймса Гудвина, который, обращаясь к читателям своего учебника, говорит, что, «изучив эту главу, вы · поймете, что корреляционные

Корреляция и регрессия: основы
«На Гальтона произвела большое впечатления теория эволюции Дарвина, а в особенности мысль о том, что особи, принадлежащие к одному биологическому виду, отличаются друг от друга. Индивидуальные особ

График рассеяния
Силу корреляции можно обнаружить, рассмотрев график рассеяния. Он является графическим отображением взаимосвязи, на которую указывает корреляция. В случае полной положительной или полной отрицатель

Регрессионный анализ: построение предположений
Важнейшей особенностью корреляционных исследований является возможность при наличии сильной корреляциистроить предположения о будущем поведении. Корреляция между двумя переменными дает возмо

Интерпретация корреляций
Корреляционные исследования являются мощным инструментом, дающим возможность предсказывать будущие события. Однако необходимо очень внимательно подходить к интерпретации результатов таких исследова

Корреляция и причинно-следственная связь
Мы уже знаем, что в экспериментальном исследовании с управляемой НП с уверенностью можно делать выводы о наличии причинно-следственных связей: изучаемая переменная является управляемой, и если все

Направленность
Если между двумя переменными А и В существует корреляция, то может случиться так, что А вызывает В (А > В), а В вызывает А (В > А). Действие причинно-следственной связи в двух направлениях

Третья переменная
Так как в случае корреляционного исследования контроль за внешними переменными не осуществляется, причина найденной корреляции может заключаться именно в них. Это означает, что А не является причин

Необходимость корреляционных исследований
Учитывая трудности интерпретации корреляций, а также тот факт, что выводы о причинах и следствиях могут быть сделаны только на основании настоящих экспериментов с управляемыми НП, почему не огранич

Разновидности корреляционных исследований
Исследования, проводящиеся с помощью корреляционных процедур, можно обнаружить во всех областях психологии. Особенно часто они используются в исследованиях: а) посвященных разработке психологически

Психологическое тестирование
Для того чтобы измерение было значимым, оно должно быть надежным и валидным. Надежное и валидное измерение интеллекта дает одинаковые значения IQ при двух различных попытках измерения и действитель

Исследования по анормальной психологии и психологии личности
Для проведения такого исследования можно отобрать большую группу людей, протестировать их на различные свойства личности, а затем изучить корреляцию полученных оценок. Такое исследование может пока

Вопрос о природе и среде
Фрэнсиса Гальтона сильно впечатлил тот факт, что гении имеют тенденцию рождаться в одной и той же семье. Изучение сходства между членами семьи стало одной из ведущих стратегий исследования влияния

Как разновидности квазиэксперимента
(продолжение) Планирование корреляционного исследования При корреляционном исследовании все измеряемые переменные – зависимые. Корреляционное исследование разбива

Многомерный анализ
Двумерный анализ направлен на исследование взаимосвязей между любыми двумя переменными. С помощью многомерного анализа изучаются взаимосвязи более чем двух переменных (часто количество переменных з

Множественная регрессия
В случае простой регрессии рассматриваются две переменные: предикторная и критериальная. Если оценки SAT (Американский школьный тест проверки способностей – предикторная переменная) коррелируют со

Факторный анализ
Вторая многомерная процедура – это факторный анализ. В ходе факторного анализа определяются значения большого количества переменных, находится корреляция между ними, а затем выявляется группы перем

Результаты исследования, их интерпретация и обобщение
Содержание этой лекции начинается с того момента, когда данные исследования уже обработаны и представлены в той или иной форме, а применение статистических критериев уже позволило сделать вывод о п

Форма представления результатов исследования
Завершением любой исследовательской работы является представление результатов в той форме, которая принята научным сообществом. Следует различать две основные формы представления результатов: квали

Структура текст работы
Дипломная работа представляет собой письменный многостраничный текст-отчет, включающий постановку научной проблемы (теоретической или прикладной), обоснование основной идеи, гипоте

Титульный лист
Титульный лист - визитная карточка работы, которая выполняет задачу ее опознания и создания первого впечатления у Государственной аттестационной комиссии. Он должен содержать следующие сведе

Цель и задачи исследования
Цельисследования – ожидаемый результат вашей работы, который позволит разрешить обозначенную проблему. Возможными целями психологического исследования могут быть:

Программа эмпирического исследования
В программе эмпирического исследования уточняются его цель и задачи, производится «перевод» теоретических понятий, в которых обозначена проблема, в конкретные исследовательские переменные. Часто эт

Результаты и их обсуждение
Обсуждение полученных данных начинается с их описания. Описание должно быть предельно строгим, т.е. содержать в себе только факты с их качественными (есть – нет) или количественными характер

Что еще полезно знать?
Полезно напомнить о том, что дипломная работа оценивается Государственной аттестационной комиссией (ГАК) в ходе ее защиты. Обратимся к «Требованиям, предъявляемым к подготовке выпускных работ...» [

Теоретические основы организации БД. Реляционная модель данных.

(http://www.intuit.ru/department/database/rdbintro/)

Подходы к организации баз данных

Иерархические базы данных

В основе данной модели - иерархическая модель данных. В этой модели имеется один главный объект и остальные - подчиненные - объекты, находящиеся на разных уровнях иерархии. Взаимосвязи объектов образуют иерархическое дерево с одним корневым объектом.

Иерархическая БД состоит из упорядоченного набора нескольких экземпляров одного типа дерева. Автоматически поддерживается целостность ссылок между предками и потомками. Основное правило: никакой потомок не может существовать без своего родителя (см.Рис. 1).

Рис. 1 Схема иерархической модели данных

Типичным представителем (наиболее известным и распространенным) является Information Management System (IMS) фирмы IBM. Первая версия появилась в 1968 г. До сих пор поддерживается много баз данных этой системы

Сетевые базы данных

Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков.

В сетевой модели данных любой объект может быть одновременно и главным, и подчиненным, и может участвовать в образовании любого числа взаимосвязей с другими объектами. Сетевая БД состоит из набора записей и набора связей между этими записями, а если говорить более точно - из набора экземпляров каждого типа из заданного в схеме БД набора типов записи и набора экземпляров каждого типа из заданного набора типов связи (см. Рис. 2).

Рис. 2 Схема сетевой модели

Типичным представителем является Integrated Database Management System (IDMS) компании Cullinet Software, Inc., предназначенная для использования на машинах основного класса фирмы IBM под управлением большинства операционных систем. Архитектура системы основана на предложениях Data Base Task Group (DBTG) Комитета по языкам программирования Conference on Data Systems Languages (CODASYL) - организации, ответственной за определение языка программирования Кобол. Отчет DBTG был опубликован в 1971 г., а позже появилось несколько систем, среди которых IDMS.

Реляционные базы данных

Принято считать, что реляционный подход к организации баз данных был заложен в конце 1960-х гг. Эдгаром Коддом. В последние десятилетия этот подход является наиболее распространенным (с оговоркой, что в называемых в обиходе реляционными системах баз данных, основанных на языке SQL, в действительности нарушаются некоторые важные принципы классического реляционного подхода). Достоинствами реляционного подхода принято считать следующие свойства: реляционный подход основывается на небольшом числе интуитивно понятных абстракций, на основе которых возможно простое моделирование наиболее распространенных предметных областей; эти абстракции могут быть точно и формально определены; теоретическим базисом реляционного подхода к организации баз данных служит простой и мощный математический аппарат теории множеств и математической логики; реляционный подход обеспечивает возможность ненавигационного манипулирования данными без необходимости знания конкретной физической организации баз данных во внешней памяти. Компьютерный мир далеко не сразу признал реляционные системы. В 70-е года прошлого века, когда уже были получены почти все основные теоретические результаты и даже существовали первые прототипы реляционных СУБД, многие авторитетные специалисты отрицали возможность добиться эффективной реализации таких систем. Однако преимущества реляционного подхода и развитие методов и алгоритмов организации и управления реляционными базами данных привели к тому, что к концу 80-х годов реляционные системы заняли на мировом рынке СУБД доминирующее положение.

Реляционная модель данных основывается на математических принципах, вытекающих непосредственно из теории множеств и логики предикатов. Эти принципы впервые были применены в области моделирования данных в конце 1960-х гг. доктором Е.Ф. Коддом, в то время работавшим в IBM, а впервые опубликованы в технической статье "Реляционная модель данных для больших разделяемых банков данных". Эта статья является родоначальницей современной теории реляционных БД. Доктор Кодд определил 13 правил реляционной модели (которые называют 12 правилами Кодда).

12 правил Кодда:

1. Реляционная СУБД должна быть способна полностью управлять базой данных через ее реляционные возможности.

2. Информационное правило - вся информация в реляционной БД (включая имена таблиц и столбцов) должна определяться строго как значения в таблицах.

3. Гарантированный доступ - любое значение в реляционной БД должно быть гарантированно доступно для использования через комбинацию имени таблицы, значения первичного ключа и имени столбца

4. Поддержка пустых значений (null value) - СУБД должна уметь работать с пустыми значениями (неизвестными или неиспользованными значениями), в отличие от значений по умолчанию и независимо для любых доменов.

5. Онлайновый реляционный каталог - описание БД и ее содержания должны быть представлены на логическом уровне как таблицы, к которым можно применять запросы, используя язык базы данных.

6. Исчерпывающий язык управления данными - по крайней мере, один из поддерживаемых языков должен иметь четко определенный синтаксис и быть всеобъемлющим. Он должен поддерживать описание структуры данных и манипулирование ими, правила целостности, авторизацию и транзакции.

7. Правило обновления представлений (views) - все представления, теоретически обновляемые, могут быть обновлены через систему.

8. Вставка, обновление и удаление - СУБД поддерживает не только запрос на отбор данных, но и вставку, обновление и удаление

9. Физическая независимость данных - на программы-приложения и специальные программы логически не влияют изменения физических методов доступа к данным и структур хранилищ данных.

10. Логическая независимость данных - на программы-приложения и специальные программы логически не влияют, в пределах разумного, изменения структур таблиц.

11. Независимость целостности - язык БД должен быть способен определять правила целостности. Они должны сохраняться в онлайновом справочнике, и не должно существовать способа их обойти.

12. Независимость распределения - на программы-приложения и специальные программы логически не влияет, первый раз используются данные или повторно.

13. Неподрывность - невозможность обойти правила целостности, определенные через язык базы данных, использованием языков низкого уровня

Кодд предложил применение реляционной алгебры в СУРБД, для расчленения данных в связанные наборы. Он организовал свою систему БД вокруг концепции, основанной на наборах данных.

Введение в реляционную модель данных

Основные понятия реляционной модели данных

Выделим следующие основные понятия реляционных баз данных: тип данных, домен, атрибут, кортеж, отношение, первичный ключ .

Для начала покажем смысл этих понятий на примере отношения СЛУЖАЩИЕ, содержащего информацию о служащих некоторого предприятия (Рис. 3).

Рис. 3 Соотношение основных понятий реляционного подхода

Тип данных

Значения данных, хранимые в реляционной базе данных, являются типизированными, т. е. известен тип каждого хранимого значения. Понятие типа данных в реляционной модели данных полностью соответствует понятию типа данных в языках программирования. Напомним, что традиционное (нестрогое) определение типа данных состоит из трех основных компонентов: определение множества значений данного типа; определение набора операций, применимых к значениям типа; определение способа внешнего представления значений типа (литералов).

Обычно в современных реляционных базах данных допускается хранение символьных, числовых данных (точных и приблизительных), специализированных числовых данных (таких, как «деньги»), а также специальных «темпоральных» данных (дата, время, временной интервал). Активно развивается подход к внедрению в реляционные системы возможностей определения пользователями собственных типов данных.

В примере на Рис. 3 мы имеем дело с данными трех типов: строки символов, целые числа и «деньги».

Домен

Понятие домена более специфично для баз данных, хотя и имеются аналогии с подтипами в некоторых языках программирования. В общем виде домен определяется путем задания некоторого базового типа данных, к которому относятся элементы домена, и произвольного логического выражения, применяемого к элементу этого типа данных (ограничения домена).

Элемент данных является элементом домена в том и только в том случае, если вычисление этого логического выражения дает результат истина (для логических значений мы будем попеременно использовать обозначения истина и ложь или true и false). С каждым доменом связывается имя, уникальное среди имен всех доменов соответствующей базы данных.

Наиболее правильной интуитивной трактовкой понятия домена является его восприятие как допустимого потенциального, ограниченного подмножества значений данного типа. Например, домен ИМЕНА в нашем примере определен на базовом типе символьных строк, но в число его значений могут входить только те строки, которые могут представлять имена (в частности, для возможности представления русских имен такие строки не могут начинаться с мягкого или твердого знака и не могут быть длиннее, например, 20 символов). Если некоторый атрибут отношения определяется на некотором домене (как, например, на Рис. 3 атрибут СЛУ_ИМЯ определяется на домене ИМЕНА), то в дальнейшем ограничение домена играет роль ограничения целостности, накладываемого на значения этого атрибута.

Следует отметить также семантическую нагрузку понятия домена: данные считаются сравнимыми только в том случае, когда они относятся к одному домену. В нашем примере значения доменов НОМЕРА ПРОПУСКОВ и НОМЕРА ОТДЕЛОВ относятся к типу целых чисел, но не являются сравнимыми (допускать их сравнение было бы бессмысленно).

Заголовок отношения, кортеж, тело отношения, значение отношения, переменная отношения

Понятие отношения является наиболее фундаментальным в реляционном подходе к организации баз данных, поскольку n-арное отношение является единственной родовой структурой данных, хранящихся в реляционной базе данных. Это отражено и в общем названии подхода – термин реляционный (relational) происходит от relation (отношение) . Однако сам термин отношение является исключительно неточным, поскольку, говоря про любые сохраняемые данные, мы должны иметь в виду тип этих данных, значения этого типа и переменные, в которых сохраняются значения. Соответственно, для уточнения термина отношение выделяются понятия заголовка отношения, значения отношения и переменной отношения. Кроме того, нам потребуется вспомогательное понятие кортежа.

Итак, заголовком (или схемой) отношения r (Hr) называется конечное множество упорядоченных пар вида , где A называется именем атрибута, а T обозначает имя некоторого базового типа или ранее определенного домена. По определению требуется, чтобы все имена атрибутов в заголовке отношения были различны. В примере на Рис. 3 заголовком отношения СЛУЖАЩИЕ является множество пар {<слу_номер, номера_пропусков>, <слу_имя, имена>, <слу_зарп, размеры_выплат>, <слу_отд_номер, номера_отделов>}.

Если все атрибуты заголовка отношения определены на разных доменах, то, чтобы не плодить лишних имен, разумно использовать для именования атрибутов имена соответствующих доменов (не забывая, конечно, о том, что это всего лишь удобный способ именования, который не устраняет различия между понятиями домена и атрибута).

Кортежем tr, соответствующим заголовку Hr, называется множество упорядоченных триплетов вида , по одному такому триплету для каждого атрибута в Hr. Третий элемент – v – триплета должен являться допустимым значением типа данных или домена T. Заголовку отношения СЛУЖАЩИЕ соответствуют, например, следующие кортежи: {<слу_номер, номера_пропусков, 2934>, <слу_имя, имена, Иванов>, <слу_зарп, размеры_выплат, 22.000>, <слу_отд_номер, номера_отделов, 310>}, {<слу_номер, номера_пропусков, 2940>, <слу_имя, имена, Кузнецов>, <слу_зарп, размеры_выплат, 35.000>, <слу_отд_номер, номера_отделов, 320>}.Телом Br отношения r называется произвольное множество кортежей tr. Одно из возможных тел отношения СЛУЖАЩИЕ показано на Рис. 3. Заметим, что в общем случае, как это демонстрируют, в частности, Рис. 3 и пример предыдущего абзаца, могут существовать такие кортежи tr, которые соответствуют Hr, но не входят в Br.

Значением Vr отношения r называется пара множеств Hr и Br. Одно из допустимых значений отношения СЛУЖАЩИЕ показано на рис. 2.1.

114 Часть I. Основные понятия

3.5. ОПТИМИЗАЦИЯ

Как было описано в разделе 3.2, все реляционные операции, такие как сокращение, проекция и соединение, выполняются на уровне множеств. Поэтому реляционные языки часто называютнепроцедурными, так как пользователь указывает,что делать, а некак делать. Фактически пользователь сообщает лишь, что ему нужно, без указания процедуры получения результата. Процесснавигации (перемещения) по хранимой базе данных в целях удовлетворения запроса пользователя выполняется системой автоматически, а не пользователем вручную. Поэтому реляционные системы иногда называют системамиавтоматической навигации. В нереляционных системах за навигацию по базе данных в основном несет ответственность сам пользователь. На рис. 3.5 приведена яркая иллюстрация преимуществ автоматической навигации - оператору языка SQL INSERT противопоставлен код навигации, подготовленный "вручную". Для получения того же результата подобный код, вероятно, должен быть подготовлен пользователем любой нереляционной системы (в данном случае - сетевой системы CODASYL; пример взят из главы по сетевым базам данных в ). Следует отметить, что здесь в качестве примера снова используется база данных деталей и поставщиков. За подробностями обратитесь к разделу3.9.

Несмотря на предыдущие замечания, следует отметить, что непроцедурный - это хотя и общепринятый, но не совсем точный термин, потому чтопроцедурный инепроцедурный - понятия относительные. Обычно можно с уверенностью определить лишь то, является ли язык А более (или менее) процедурным, чем язык Б. Поэтому точнее будет сказать, что реляционные языки, такие как SQL, характеризуютсяболее высоким уровнем абстракции, чем типичные языки программирования, подобные C++ или COBOL (либо подъязыки данных, обычно принадлежащие нереляционным СУБД; см. рис. 3.5). В принципе, именно более высокий уровень абстракции способствует повышению продуктивности труда программистов, свойственному для реляционных систем.

Ответственность за организацию выполнения автоматической навигации возложена на очень важный компонент СУБД - оптимизатор (мы уже упоминали о нем в главе 2). Другими словами, работа оптимизатора заключается в том, чтобы выбрать самый эффективный способ выполнения для каждого запроса пользователя. Предположим, например, что пользователь сделал следующий запрос (снова воспользуемся языком Tutorial D).

(EMP WHERE ЕМР# = ЕМР# ("Е4")) { SALARY }

Пояснение. Выражение в первых скобках (EMP WHERE ...) означает, что применяется операция сокращения текущего значения переменной отношения ЕМР, касающаяся той строки, в которой значение столбца ЕМР# равно Е4. Применяемая здесь языковая конструкция, представляющая собой имя столбцаSALARY , заключенное в фигурные скобки, означаетпроекцию результата операциисокращения по столбцуSALARY . Результатом этой операции проекции становится отношение, состоящее из одного столбца и одной строки, которое содержит данные о заработке служащего Е4. (Обратите внимание, что в данном случае в неявном виде используется реляционное свойствозамкнутости: мы написали вложенное выражение, в котором результат операции сокращения применяется в качестве входных данных для операции проекции.)

Рис. 3.5. Примерыавтоматическойнавигацииинавигациивручную

Дажевэтомпростомпримеремогутприменятьсяпокрайнеймередваспособадоступа к необходимым данным.

1. Последовательный физический просмотр (хранимой версии) переменной отношения ЕМР, пока требуемая запись не будет найдена.

2. Если есть индекс для столбца ЕМР # (в хранимой версии) переменной отношения (который, вероятно, действительно существует, поскольку этот столбец является уникальным, а большинство систем фактическитребует создания индекса для обеспечения уникальности), то переход с помощью этого индекса непосредствен но к данным служащего с номером Е4.

Оптимизатор определит, какую из двух возможных стратегий следует применить. В общем случае для реализации любого конкретного реляционного запроса оптимизатор будет осуществлять выбор стратегии, исходя из соображений, подобных следующим:

116 Часть I. Основные понятия

на какие переменные отношения есть ссылки в запросе;

насколько велики эти переменные отношения в настоящее время;

какие существуют индексы;

насколько избирательны эти индексы;

как физически группируются данные на диске;

какие реляционные операции используются; и т.д.

Поэтому повторяем: пользователь указывает в запросе, какие данные ему требуются, а некак их получить, тогда как стратегия доступа к данным выбирается оптимизатором (автоматическая навигация). В результате пользователи и пользовательские программы становятся независимыми от применяемых стратегий доступа, что, конечно же, совершенно необходимо, если мы хотим достичь реальной независимости от физического представления данных.

Более подробные сведения об оптимизаторе приводятся в главе 18.

3.6. КАТАЛОГ

Как отмечалось в главе 2, каждая СУБД должна поддерживать функции каталога, илисловаря. Каталог обычно размещается там, где хранятся различные схемы (внешние, концептуальные, внутренние) и все, что относится к отображениям ("внешнийконцептуальный", "концептуальный-внутренний", "внешний-внешний"). Иначе говоря, в каталоге содержится подробная информация (иногда называемаяописательной информацией илиметаданными), касающаяся различных объектов, которые имеют значение для самой системы. Примерами таких объектов могут служить переменные отношения, индексы, ограничения поддержки целостности, ограничения защиты и т.д. Описательная информация необходима для обеспечения правильной работы системы. Например, оптимизатор использует информацию каталога об индексах и других физических структурах хранения данных, а также прочую информацию, необходимую ему для принятия решения о том, как выполнить тот или иной запрос пользователя (см. главу 18). Аналогично, подсистема защиты использует информацию каталога о пользователях и установленных ограничениях защиты (глава 17), чтобы разрешить или запретить выполнение поступившего запроса.

Замечательным свойством реляционных систем является то, что их каталог также состоит из переменных отношения (точнее, изсистемных переменных отношения, на-

званных так для того, чтобы отличать их от обычных пользовательских). В результате пользователь может обращаться к каталогу так же, как к своим данным. Например, в каталоге любой системы SQL обычно содержатся системные переменные отношения TABLES и COLUMNS, назначение которых - описание известных системе таблиц (т.е. переменных отношения) и столбцов этих таблиц. Для базы данных отделов и служащих переменные отношения4 TABLES иCOLUMNS могут быть схематически представлены в виде иерархической структуры так, как показано на рис. 3.6.

4 Отметим, что исходя из наличия на этом рисунке столбца ROWCOUNT, можно сделать следующее за ключение: выполнение в базе данных операций INSERT и DELETE в качестве побочного эффекта потре бует обновления данных каталога. На практике столбец ROWCOUNT обычно обновляется только по спе циальному запросу (например, при запуске некоторой утилиты), поэтому значения этого столбца не всегда будут актуальными.

Рис. 3.6. Каталог базы данных отделов и служащих (изображен схематически)

Примечание. Как упоминалось в главе 2, каталог должен также описывать сам себя, т.е. включать записи, описывающие переменные отношения самого каталога (см. упр. 3.3).

Теперь предположим, что пользователю базы данных отделов и служащих понадобилось узнать, какие именно столбцы содержит переменная отношения DEPT (конечно, предполагается, что по каким-то причинам пользователь не имеет этой информации). Тогда необходимое выражение будет выглядеть следующим образом.

(COLUMNS WHERE TABNAME = "DEPT") { COLNAME }

Вот еще один пример. Пусть необходимо узнать, в каких переменных отношения есть столбецЕМР#.

(COLUMNS WHERE COLNAME = "ЕМР#") { TABNAME }

Упражнениедлясамопроверки. Каким будетрезультатвыполнения следующего выражения?

((TABLES JOIN COLUMNS)

WHERE COLCOUNT < 5) { TABNAME, COLNAME }

3.7. БАЗОВЫЕ ПЕРЕМЕННЫЕ ОТНОШЕНИЯ И ПРЕДСТАВЛЕНИЯ

Мы уже видели, что на основе реляционных значений, присвоенных некоторому множеству переменных отношения, подобных DEPT и ЕМР , реляционные выражения позволяют получить множество других значений отношений, например, в результате соединения двух переменных отношения. Теперь необходимо ввести еще несколько новых терминов. Исходные (заданные) переменные отношения называютсябазовыми переменными отношения, а присвоенные им значения называютсябазовыми отношениями. Отношение, которое получено или может быть получено из базового отношения в результате выполнения каких-либо реляционных выражений, называетсяпроизводным отношением.

118 Часть I. Основные понятия

Примечание. В базовые переменные отношения называютсяреальными переменными отношения.

Реляционные системы, очевидно, должны предоставлять средства для создания, в первую очередь, базовых переменных отношения. В языке SQL, например, эта функция обеспечивается оператором CREATE TABLE (здесь слово TABLE используется в узком смысле, какбазовая переменная отношения). Базовые переменные отношения, конечно же, должны бытьименованными, как, например, показано ниже.

CREATE TABLE EMP ... ;

Однако реляционные системы обычно поддерживают еще один вид именованных переменных отношения, называемых представлениями. В любой конкретный момент их значение являетсяпроизводным отношением (и поэтому упрощенно можно считать, что представление - этопроизводная переменная отношения). Значение данного представления в данное время является результатом вычисления определенного реляционного выражения в данный момент, а упомянутое реляционное выражение определяется в момент создания этого представления. Например, для определения представления ТОРЕМР можно использовать следующий оператор.

CREATE VIEW ТОРЕМР AS

(EMP WHERE SALARY > 3 3K

) { EMP#, ENAME, SALARY } ;

Примечание. Поскольку в данный момент это несущественно, в примере для удобства используется смешанная нотация языков SQL и Tutorial D.

При выполнении этого оператора выражение, следующее за ключевым словом AS и фактически определяющее представление, не вычисляется, а простозапоминается системой (обычно посредством сохранения в каталоге под указанным именем ТОРЕМР). Однако с точки зрения пользователя все выглядит так, как будто в базе данных появилась вполне реальная переменная отношения с именемТОРЕМР , имеющая текущее значение, которое показано на рис. 3.7 только в незатененных участках. И пользователь должен иметь возможность оперировать этим представлением точно так, как если бы оно являлось обычной базовой переменной отношения.

Рис. 3.7. Виртуальная переменная отношения ТОРЕМР (незатененные участки) как представление базовой переменной отношения ЕМР

Примечание. Выше уже было сказано, что если такие переменные отношения, какDEPT и ЕМР, можно считатьреальными, то переменную отношения ТОРЕМР следует рассматривать каквиртуальную переменную отношения, иначе говоря, как переменную отношения, которая внешне существует как таковая, но на самом деле ее нет (значение этой переменной отношения в любой данный момент зависит от значений некоторых

других переменных отношения). И действительно, в представления называются

виртуальными переменными отношения.

Однако будьте внимательны: отмечая, что значение переменной отношения ТОРЕМР является отношением, которое было бы результатом, если бы определяющее данное представление выражение было на самом деле вычислено, мы вовсе не хотим сказать, что существует отдельная копия этих данных. Иначе говоря, мы вовсе не имеем в виду, что выражение, определяющее представление, действительно вычисляется. Наоборот, представление - это по сути простоокно, через которое можно видеть часть значения базовой переменной отношения ЕМР. Отсюда следует, что любые изменения в базовой переменной отношения будут автоматически и немедленно поступать в подобное окно (конечно, если эти изменения относятся к незатененной части реальной переменной отношения). Аналогично, изменения, внесенные в переменную отношения ТОРЕМР, будут автоматически и немедленно применены к реальной переменной отношения ЕМР и, следовательно, станут видны через это окно (примеры будут приведены позднее).

Ниже показан пример запроса, использующего представление TОРЕМР.

(ТОРЕМР WHERE SALARY < 42К) { ЕМР#, SALARY }

Если в качестве исходных используются данные на рис. 3.7, то результат будет иметь вид, показанный на рис. 3.8.

Рис. 3.8. Результат использования представления ТОРЕМР

С концептуальной точки зрения операции с представлениями, подобные рассмотренной выше, аналогичны операциям поиска, которые фактически реализуются посредством замены ссылки на имя представления выражением, которое определяет представление (т.е. выражением, сохраненным в каталоге). Поэтому в рассмотренном примере исходное выражение

(ТОРЕМР WHERE SALARY < 42К) { ЕМР#, SALARY }

модифицируется системой следующим образом.

(((ЕМР WHERE SALARY > ЗЗК) { ЕМР#, ENAME, SALARY })WHERE SALARY < 42К) { ЕМР#, SALARY }

Здесь курсивом выделено имя представления в исходном выражении и заменяющий текст в модифицированной версии. После определенного количества перегруппировок это выражение может быть упрощено (глава 18) и представлено в следующем виде.

(ЕМР WHERE SALARY > ЗЗК AND SALARY < 42К) { ЕМР#, SALARY }

Вычисление данного выражения приводит к результату, показанному выше. Иными словами, первоначальная операция над представлением просто преобразуется в эквивалентную операцию над соответствующей базовой переменной отношения, после чего

120 Часть I. Основные понятия

полученная эквивалентная операция выполняется обычным образом (точнее, оптимизируется и выполняется обычным образом).

В качестве другого примера рассмотрим операцию удаления DELETE .

DELETE TOPEMP WHERE SALARY < 42K ;

На самом деле будет выполнена следующая операция.

DELETE EMP WHERE SALARY > ЗЗК AND SALARY < 42К;

Рассматриваемое здесь представление ТОРЕМР является очень простым, состоящим (выражаясь неформально) из подмножества строк и столбцов единственной базовой переменной отношения. Однако, в принципе, определение представления может иметь произвольную сложность (оно может даже ссылаться на другие представления). Например, далее приведено представление, определение которого включает соединение двух базовых переменных отношения.

CREATE VIEW JOINEX AS

((EMP JOIN DEPT) WHERE BUDGET > 7M) { EMP#, DEPT# } ;

К вопросу определения и обработки представлений мы еще вернемся в главе 10. Между прочим, сейчас уже можно объяснить смысл приведенного в конце раздела 2.2 замечания, касающегося того, что термин представление (view) в реляционном контексте имеет довольно специфическое значение, не совпадающее со значением, приписанным ему в архитектуре ANSI/SPARC. На внешнем уровне этой архитектуры база данных воспринимается каквнешнее представление, определяемое внешней схемой (и разные пользователи могут иметь разные внешние представления). В реляционных системах, наоборот, представление, как пояснялось выше, является специальноименованной производной виртуальной переменной отношения. Поэтому реляционным аналогомвнешнего представ-

ления ANSI/SPARC обычно служит множество из нескольких переменных отношения, каждая из которых является представлением в реляционном смысле.Внешняя схема состоит из определений таких представлений. (Из этого следует, что в реляционной модели представления являются одним из способов обеспечениялогической независимости от данных, хотя еще раз следует отметить, что современные коммерческие продукты имеют серьезные недостатки в этой части. Подробности приведены в главе 10.)

Архитектура ANSI/SPARC является достаточно общей и допускает произвольные преобразования между внешним и концептуальным уровнями. В принципе, даже типы структур данных, поддерживаемые на этих двух уровнях, могут быть различными: например, концептуальный уровень может быть реляционным, тогда как конкретному пользователю может быть передано внешнее представление иерархического типа5 . Однако на практике в большинстве систем в качестве базовых на обоих уровнях используются одинаковые типы структур. Реляционные продукты не являются исключением из этого общего правила - представление по-прежнему остается переменной отношения, как и базовые переменные отношения. А поскольку на обоих уровнях поддерживаются одинаковые типы объектов, на этих уровнях применяется один и тот же подъязык данных (обычно это язык SQL). Действительно, тот факт, что представление - это переменная

5 Пример осуществления такой возможности приведен в главе 27.

отношения, так же важен для реляционных систем, как для математики важно то, что подмножество является множеством.

Примечание. Однако, по-видимому, в документации к реальным продуктам SQL и в самом стандарте языка SQL этот нюанс часто игнорируется (глава 4), поскольку нередко можно встретить упоминания о "таблицах и представлениях" (т.е. при этом подразумева ется, что представление не является таблицей). Советуемне делать этой распространен ной ошибки и использовать терминтаблицы (илипеременные отношения) лишь для обо значениябазовых таблиц(илибазовыхпеременныхотношения).

Есть еще один заслуживающий внимания вопрос, касающийся базовых переменных отношения и представлений. Различие между базовой переменной отношения и представлением часто характеризуют следующим образом.

Базовые переменные отношения "реально существуют" в том смысле, что они во площают в себе данные, которые действительно хранятся в базе данных.

Представления, наоборот, "реально не существуют", а просто предоставляют раз личные способы просмотра "реальных" данных.

Однако такая характеристика, хотя и полезна в неформальном смысле, неточно отражает истинное положение дел. Действительно, пользователи могут рассматривать базовые переменные отношения как физически хранимые, поскольку фактически главная цель создания реляционных систем состоит в том, чтобы дать возможность пользователю работать с базовыми переменными отношения как с физически существующими, не заботясь о том, как эти переменные отношения физически представлены в памяти. Но (и это весьма существенное "но"!) подобные взгляды пользователей на то, как происходит обработка данных,нельзя толковать так, будто базовая переменная отношения - это непосредственно физически хранимая переменная отношения (например, как единственный хранимый файл). Как пояснялось в разделе 3.2, базовые переменные отношения лучше всего представлять какабстракцию для некоторого набора хранимых данных - абстракцию, скрывающую все детали уровня хранения данных. В принципе, базовая переменная отношения иеехранимыйэквивалент6 могутразличаться впроизвольнойстепени.

Этот вопрос поможет прояснить простой пример. Снова рассмотрим базу данных отделов и служащих. В большинстве современных реляционных систем она, вероятно, была бы реализована в виде двух хранимых файлов, по одному для каждой переменной отношения базы данных. Но нет абсолютно никаких доводов против создания одного хранимого файла иерархически хранимых записей, каждая из которых состоит, во-первых, из номера отдела, названия и бюджета для некоторого отдела, и, во-вторых, вместе с ними заданы табельный номер служащего, фамилия и зарплата каждого служащего, работающего в этом отделе. Иначе говоря, для физического хранения данных может быть использован любой подходящий способ (дополнительные сведения приведены в приложении А), но на логическом уровне данные всегда должны выглядеть одинаково.

6 Следующая цитата из одной недавно вышедшей книги демонстрирует некоторые недоразумения, обсуждаемые здесь, а также недоразумения, которые обсуждались в разделе 3.3: "Важно различать хранимые отношения, которые являютсятаблицами, и виртуальные отношения, которые являютсяпредставлениями... [Мы] будем использовать терминотношение только в тех случаях, когда вместо него можно использовать термин «таблица» или «представление». Если необходимо будет подчеркнуть, что данное отношение является хранимым отношением, а не представлением, то в этом случае мы будем использовать терминбазовое отношение илибазовая таблица." Подобные цитаты, к сожалению, - не редкость.

Отношения. Переменные отношения. Значение переменных отношения. Базовые переменные отношения и их представления. Предикаты и высказывания

Информатика, кибернетика и программирование

Отношения. Переменные отношения. Значение переменных отношения. Базовые переменные отношения и их представления.

Отношения. Переменные отношения. Значение переменных отношения. Базовые переменные отношения и их представления. Предикаты и высказывания.

Определения

n -арным отношением R , или R отношением степени n , называют подмножество декартовa произведения множеств D 1, D 2, D 3... Dn (n >=1), не обязательно различных. Исходные множества D 1, D 2, D 3…называют в модели доменами (в СУБД используется понятие тип данных).

Отношение имеет простую графическую интерпретацию, оно может быть представлено в виде таблицы, столбцы (поля, атрибуты) которой соответствуют вхождениям доменов в отношение, а строки (записи) — наборам из значений, взятых из исходных доменов. Число строк (кортежей) называют кардинальным числом отношения (кардинальностью), или мощностью отношения.

Такая таблица обладает рядом свойств:

  1. В таблице нет двух одинаковых строк.
  2. Таблица имеет столбцы, соответствующие атрибутам отношения.
  3. Каждый атрибут в отношении имеет уникальное имя.
  4. Порядок строк в таблице произвольный.

Под атрибутом здесь понимается вхождение домена в отношение. Строки отношения называются кортежами.

Заголовок Hr (или схема) отношения r — конечное множество упорядоченных пар вида , где A называется именем атрибута, а T обозначает имя некоторого базового типа или ранее определенного домена, то есть множества допустимых значений. По определению требуется, чтобы все имена атрибутов в заголовке отношения были различны.

Кортеж tr, соответствующий заголовку Hr — множество упорядоченных триплетов вида , по одному такому триплету для каждого атрибута в Hr. Третий элемент – v – триплета должен являться допустимым значением типа данных или домена T. Замечание: так как имена атрибутов уникальны, то указание домена в кортеже излишне.

Тело Br отношения — неупорядоченное множество различных кортежей tr.

Значением Vr отношения r называется пара множеств Hr и Br.

Полезно также понятие первичного ключа — это такой набор атрибутов, который однозначно определяет кортеж и минимален среди всех своих подмножеств (то есть нельзя убрать ни один из атрибутов). При добавлении новых записей первичный ключ обязан оставаться первичным ключом (например, неверным будет использование в качестве первичного ключа набора Имя + Отчество + Фамилия сотрудника, даже если на момент создания таблицы полных тёзок среди заносимых в неё людей не было).

Осн. понятия:

Объект – элемент предметной области, который можно четко идентифицировать.

Свойства объекта отображаются с помощью переменных величин, которые являются элементарными единицами информации в рамках БД, и наз-ся атрибутами.

Атрибут/поле/столбец – логически неделимый элемент, относящийся к свойствам некоторого объекта или процесса.

Атрибуты разделяются на атрибуты-признаки и атрибуты-основания.

  1. Атрибуты – признаки – являются качественной характеристикой объекта.
  2. Атрибуты – основания – характеризуют количественную сторону объекта.

Атрибуты имеют множество допустимых значений.

Множество всех возможных значений атрибута наз-ся доменом .

Совокупность атрибутов, характеризующих один объект, наз-ся записью/кортежем/строкой .

Тип записи определяется свойствами объекта.

Ключ – атрибут или совокупность атрибутов, однозначно определяющие объект.

Потенциальный ключ – ключ, который может идентифицировать объект.

Из множества потенциальных ключей выбирается один первичный ключ. Все остальные ключи – альтернативные.

Суррогатный ключ – атрибут, который создан для того, чтобы однозначно определять объект.

Вторичный ключ – атрибут, который относит объект к некоторой группе.

Индексирование таблицы – процесс созд-я индексного файла, в кот-м описано, как отсортировать таблицу по выбранному полю или выражению.

В современных СУБД в одном индексном файле может хранится неск-ко индексов.

На таблицу может быть наложен фильтр.

Фильтр – логич. усл-е, позволяющее отображать только те записи, кот-е удовл. этому условию.

В БД сущ. понятие представление – вирт. таблица , кот-я может отображать данные из одной или нескольких таблиц.


А также другие работы, которые могут Вас заинтересовать

44214. Выявление взаимосвязи между терминальными ценностями и когнитивно-поведенческими установками 2.63 MB
Взаимосвязь терминальных ценностей с когнитивно-поведенческими установками старших школьников Научный руководитель: Асеева Инна Николаевна Цель: выявление взаимосвязи между терминальными ценностями и когнитивно-поведенческими установками Объект: терминальные ценности личности Предмет: взаимосвязь терминальных ценностей с когнитивно-поведенческими установками старших школьников Гипотеза: существуют особенности в структуре взаимосвязи терминальных ценностей с когнитивно-поведенческими установками старших...
44215. Программное обеспечение вычислительной техники и автоматизированных систем 176.5 KB
Особым образом описывается порядок подготовки дипломной работы к защите, комплектование работы, получение необходимых подписей, подготовка к рецензии. Предлагается примерный план-тезис устной защиты дипломной работы перед Государственной аттестационной комиссией
44216. Разработка мероприятий по повышению эффективности использования информационных технологий управления предприятием ЧТПУП «Балтийский Легион» 571.5 KB
Краткая характеристика деятельности предприятия Анализ финансово-экономических показателей предприятия Следовательно повышение эффективности управленческой деятельности становится одним из направлений совершенствования деятельности предприятия в целом. Сравнительная легкость внедрения новых решений благодаря наличию специализированных подразделений предприятия вычислительных центров.
44217. АНАЛІЗ ЕФЕКТИВНОСТІ ІНФОРМАЦІЙНОЇ СИСТЕМИ У ГОТЕЛЬНОМУ КОМПЛЕКСІ «ЦЕНТРАЛЬ» 665 KB
Інформація потрібна всім: керуючим структурам, коллективам підприємств, громадським організаціям, всім працюючим. Неможливо спиратися тільки на інтуїцію, на свій життєвий і практичний досвід, необхідно одержувати і освоювати всі розширюється інформацію, що допомагає вирішувати виникаючі питання.
44218. МОДИФИКАЦИЯ МЕТОДА ОПРЕДЕЛЕНИЯ МИЕЛОПЕРОКСИДАЗЫ ПОЛИМОРФНОЯДЕРНЫХ ГРАНУЛОЦИТОВ ПЕРИФЕРИЧЕСКОЙ КРОВИ ДЛЯ СПЕКТОРОФОТОМЕТРИЧЕСКОЙ ОЦЕНКИ РЕЗУЛЬТАТОВ 2.65 MB
Цель работы модификация лабораторного метода для спектрофотометрического определения спонтанной активности миелопероксидазы полиморфноядерных гранулоцитов периферической крови человека и его сравнительная оценка с различными лабораторными методами определения активности миелопероксидазы нейтрофилов с точки зрения основных требований предъявляемых к лабораторным методам определения активности ферментов в клинических условиях. Определение активности миелопероксидазы с помощью модифицированного лабораторного метода позволяет оценить спонтанную...
44219. СЕМЕЙНОЕ ЧТЕНИЕ: ПРОБЛЕМЫ ПОДДЕРЖКИ И СТИМУЛИРОВАНИЯ В СОВРЕМЕННЫХ УСЛОВИЯХ 665.5 KB
Особенно тревожная ситуация сложилась с детским и подростковым чтением проблемы чтения ныне встали в один ряд с важнейшими государственными задачами защиты и обеспечения безопасности российской национальной культуры. Проблемами детского чтения считаются недостаточность специальных знаний у родителей о чтении детей о воспитании и педагогике детей экономические и финансовые причины; и др. В современных условиях очень важно позиционировать значение семейного чтения для каждого человека живущего как в нашей стране так и за рубежом....
44220. Сюжетно-дидактические игры математического содержания в самостоятельной деятельности детей 6-го года жизни 10.48 MB
Теоретические аспекты использования игровой деятельности детей дошкольного возраста для развития математических представлений Содержание математических представлений детей 6 го года жизни Характеристика самостоятельной деятельности детей шестого года жизни и условия применения в ней сюжетно-дидактических игр математического содержания.
44221. Сюжетно-дидактические игры математического содержания в самостоятельной деятельности детей 6 го года жизни 10.3 MB
Теоретические аспекты использования игровой деятельности детей дошкольного возраста для развития математических представлений Содержание математических представлений детей 6 го года жизни. Характеристика самостоятельной деятельности детей шестого года жизни и условия применения в ней сюжетно-дидактических игр математического содержания.
44222. Лига Арабских государств и ее роль в Интеграционном процессе арабского мира 358.5 KB
Следует сказать, что в последние годы объем исследований и научных работ по интеграции арабского мира возрос, однако, до сих пор нет четкого анализа происходящих в этом регионе процессов. Они изучаются, главным образом, с точки зрения роли субъективного фактора, сознательных намерений тех или иных социальных групп, но в них не выделяются закономерности, тенденции, объективные факторы, обстоятельства.






2024 © gtavrl.ru.