Применение пакета статистических программ в психологических исследованиях - Учебное пособие (Беребин М.А.)

1.5. работа с базами данных

 

1.5.1. Ввод и редактирование данных

 

Обработка любых данных начинается с их ввода, который обеспечивается процедурами, содержащимися в разделе A. Управление данными (в англоязычной версии А. Data management). Для выбора необходимой процедуры установить курсор на соответствующий раздел и нажать клавишу [Enter], на экране – подменю раздела A. Управление данными из четырех процедур (рис. 1.4.).

 

 

Рис. 1.4

Поясним назначение каждой из имеющихся четырех процедур.

Вывести каталог данных (Display Data Directory) – обеспечивает вывод на дисплей каталога данных (файлов и переменных).

Файловые операции (File Operations) – обеспечивает операции с файлами данных.

Импорт файлов (Import Data Files) – обеспечивает считывание данных из файлов, созданных в других системах в форматах ASCII, Lotus, DIF, Dbase, Comma Delimited, Blank Delimited и Atlas.

Экспорт файлов (Export Data Files) – обеспечивает перевод данных формата STATGRAPHICS в файлы форматов вышеперечисленных систем.

Для ввода и редактирования данных выбрать процедуру 2. Файл.Операции (File Operations): подвести курсор к этому пункту и нажать клавишу [Enter], на экране появляется многопунктовая заставка (рис. 1.5).

 

Подпись:

Рис.1.5

В верхней части экрана – панель, необходимая для создания файлов базы данных, начала ввода данных и для обеспечения взаимодействия с системой.

В нижней строке (Files on Data Drive) – перечень файлов, имеющихся в текущем каталоге данных. Все файлы данных имеют расширение [*.asf].

Титульная строка указывает название процедуры, с которой работаем (File Operations). Далее под чертой – сообщение STATGRAPHICS file name:___________, которое завершается цветным полем (лиловым – при активном, ожидающем ввода состоянии и зеленым – при неактивном состоянии). Это – поле для ввода имени файла, с которым предстоит работа. Рассмотрим возможности этой процедуры на конкретном примере (см. пример 1).

Пример к разделу 1.1. При психологическом исследовании влияния личностной тревожности на эффективность деятельности изучались результаты испытуемых в выполнении корректурной пробы, и проводилось тестирование по методике РЛТ (тест тревожности Спилбергера-Ханина). Имеются результаты исследования 20 испытуемых, где представлены количество ошибок при выполнении корректурной пробы (Корр) и уровень личностной тревожности по субтесту ЛТ методики РЛТ (Лтр, в баллах). Ряды полученных статистических переменных (вариант) представлены в табл.  1.6.

Таблица 1.6

Испыт./

Перем.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Корр.

12

14

16

9

6

11

12

9

13

10

14

15

13

9

7

13

17

17

14

9

Лтр

45

48

51

41

39

55

57

47

53

49

56

54

49

41

39

47

51

55

52

39

 

В связи с тем, что в STATGRAPHICSе v.3.1 for DOS возможно введение только с помощью английской раскладки клавиатуры, обозначим показатели по строке Корр как переменную Korrect, а показатели по строке Лтр – как переменную Trewoga. Весь файл, в который предполагается ввести исходные данные, определим как file TREWOGA.

В первой строке экрана содержится сообщение Complete input fields and press F6 (заполните поля ввода и нажмите клавишу F6). В поле для имени файла STATGRAPHICS file name требуется набрать имя TREWOGA (необходимо учитывать, что в поле для ввода имени файла можно ввести только до 8-ми букв латинского алфавита). Так будет назван файл данных, с которым предстоит последующая работа. После ввода имени файла переход в следующее окно Desired operation (выбор необходимой операции) происходит после нажатия клавиши [Enter] или [Tab]. Курсор перемещается в следующее поле ввода, в котором необходимо набрать букву, соответствующую требуемой операции из перечня, содержащегося на экране:

Operations:

A. Copy

D. Erase

G. Recode

J. Update

B. Create

E. Join

H. Rename

 

C. Edit

F. Print

I. Split

 

 

Обозначение операций A. Copy – копирование файла; В. Create – создание файла; С. Edit – редактирование данных; D. Erase – удаление файла; E. Join – объединение файлов; F. Print – распечатка данных файла; G. Recode – перекодировка данных; H. Rename – переименование файла; I. Split – расчленение файла; J. Update – исправление данных.

 

1.5.2. Создание файла и редактирование данных

 

Для создания нового файла TREWOGA требуется выполнить операцию В. Create. Для этого следует в активном поле строки Desired operation набрать с клавиатуры латинскую букву «В» и нажать исполнительную клавишу [F6]. В результате на жестком диске компьютера будет создан файл с именем TREWOGA, содержимое же экрана не изменится. Для продолжения работы (ввода исходных данных в электронную базу данных) требуется набрать букву С (Edit) в поле ввода кода операции и вновь нажать клавишу [F6]. На экране – окно, в нижнем правом углу которого находится таблица для формирования параметров матрицы наблюдений (рис. 1.7).

 

 

 

 

Рис.1.7

В первой строке нижней таблицы основная строка носит название Add additonal column (добавление колонки). Вторая строка (являющаяся по умолчанию активной) носит название Name (имени переменной) – для ввода названия колонки с именем переменной. В этом поле также может быть размещено не более 8-ми латинских букв или цифр. В последнем случае имя переменной не должно начинаться с цифры. В конце имени переменной цифра вводится без пробела либо с нижней чертой, например, Korrekt1 либо Korrek_1. В нашем примере следует набрать название первой переменной Korrekt и клавишей [Enter] переместить курсор в следующую строку – Type. В этой строке назначается тип вводимых данных. По умолчанию в поле устанавливается N – представление числовых переменных с плавающей запятой. Кроме того, по клавише [Пробел] возможен выбор числовых целочисленных переменных (I), числовых переменных с фиксированным числом десятичных знаков после запятой (F, где F может принимать значения от 1 до 9), числовые переменные, обозначающие даты в формате «мм/дд/гг[8]» (D), символьные переменные (С). Четвертая строка Width – определяет количество знакомест в колонке и по умолчанию устанавливается 13. В базовой раскладке этой опции установлено минимальное число знакомест в столбце, равное 7. Поэтому при проведении нестрогих вычислений следует с клавиатуры заменить 13 на 07. После заполнения полей для первой колонки необходимо нажать [F6]. В левом углу окна появится название переменной Korrekt, ниже – цветовое зеленое поле для ввода данных. В правом нижнем углу сохраняется таблица для задания параметров следующей колонки. В нашем иллюстрируемом примере следующая переменная названа Trewoga. Клавишей [DEL] следует удалить название предыдущей колонки, а затем набрать с клавиатуры Trewoga и вновь нажать клавишу [F6]. После задания параметров последней колонки выходим в режим ввода данных нажатием клавиши [Esc] или [F10]. На экран будет выведена панель для ввода исходных данных в два столбца, каждый из которых должен содержать значения соответствующей варианты по каждому испытуемому.

В левом верхнем углу находится указатель координат курсора, показывающий, в какой строке и в какой колонке он находится в данный момент: Cursor at Row: (строка, в которой находится курсор): 1; Column: (колонка, в которой находится курсор): 2.

В середине первой строки приводится название выполняемой процедуры Data Editor (редактирование данных), под ним – название файла, в который будут записаны данные (в нашем случае TREWOGA). В верхнем правом углу экрана расположены два сообщения: 1.Maximum Rows:___ (максимальный номер строки, содержащей данные) и 2. Number of Cols___ (число созданных колонок).

Ввод значений производится с клавиатуры вручную. Курсор перемещается с помощью клавиш управления в 1-ю строку 1-й колонки. Введенное в это поле число запоминается нажатием клавиши [Enter], после чего курсор перемещается в следующую строку этой же колонки. Заполнение полей таблицы может производиться «по вертикали» (т.е. сначала вводятся значения первой переменной по каждому испытуемому) либо «по горизонтали» (т.е. вводятся все данные по всем переменным, полученные при обследовании одного испытуемого). В последнем случае переход из столбца в столбец слева направо осуществляется по стрелке «вправо» (более медленный способ) либо по клавише [Tab] или [Backtab]. Следует иметь в виду, что для решения конкретных задач система требует представления исходных данных либо в виде матрицы наблюдений, либо в виде отдельных переменных (вектор-столбцов). Так, для получения числовых характеристик случайной величины исходные данные должны быть представлены в виде переменных. Для факторного анализа результаты наблюдений формируются в виде матрицы.

После ввода последнего значения последней переменной из числа представленных в табл. 1.6 на экране возникает электронная таблица с матрицей наблюдений, которая должна быть записана в файл с именем TREWOGA.

После ввода последнего значения исходных данных (если переменные введены без ошибок) необходимо записать их на диск в созданный ранее файл. Для этого нажимается клавиша [F6], инициирующая появление на экране «всплывающего» окна с опциями: Save without exit (записать данные на диск и остаться в режиме редактирования) и Save and exit (записать данные на диск и выйти из режима редактирования).

При выборе с помощью курсора первой опции и нажатии клавиши [Enter] введенные данные записываются на диск, система возвращается в рабочее состояние, позволяющее продолжить ввод или редактирование исходных данных. При выборе второй опции этого окна данные запишутся на диск, система по умолчанию переходит к следующей операции – выборочному просмотру и редактированию переменных (рис. 1.8).

 

 

 

Рис.1.8

Чтобы вывести на экран данные одной из указанных на экране переменных, необходимо подвести курсор к строке с ее именем и нажать клавишу [D]. На экране – название имени файла и имени переменной, разделенные точкой, количество данных в переменной, порядковый номер и значения всех данных переменной. При необходимости можно вывести эти данные на печать посредством клавиши [F4], на экране – опции: Print to printer (вывод данных на принтер) и Print to file (вывод данных в файл). Нажатие клавиши [А] при экране, представленном на рис. 1.8 возвращает пользователя на этап ввода и редактирования исходных данных.

Более широкие возможности для редактирования исходных данных реализуются клавишей [F5]. В режиме ввода данных в окне состояния (нижнем поле контекстной подсказки) выведена запись Press the F6 key to save updated data or the F5 key for other options («нажмите F6 для записи введенных данных или F5 для других опций»). После нажатия [F5] на экране возникает меню с опциями (рис. 1.9).

 

 

Рис. 1.9

Меню включает в себя следующие опции: Modify Кorrect (изменить параметры переменной Korrekt); Add additional column (добавить новую колонку); Remove Korrekt (удалить колонку Korrekt); Add rows (вставить строки); Delete rows (удалить строки); Add cells (вставить клетки в текущем столбце); Delete cells (удалить клетки в текущем столбце); Print to printer (печать на принтер); Print to file (печать в файл); Save without exit ( запись данных без выхода); Sort in ascending order (сортировка по возрастающему порядку); Sort in descending order (сортировка по убывающему порядку). Последние два пункта доступны при редактировании вновь созданного файла. Распечатку данных можно осуществить с помощью операции File Орerations, заменив код С (Edit) на F (Print) и нажав клавишу [F6].

При выборе опции Modify Korrekt (изменить параметры переменной Korrekt) на экране появляется меню, аналогичное представленному в таблице 1.7, но отличающееся лишь названием (Modify current column). Перемещение курсора по клавишам [Tab], [Enter] и [Стрелка вниз] позволяет активировать поля [Name], [Type] и [Width] с целью внесения в них изменений имени и типа файла, количества ячеек столбца матрицы.

При выборе опции Add additional column (добавить новую колонку) на экране появляется меню, полностью идентичное представленному в табл. 1.7, и позволяющее создать в данном файле новую переменную по вышеописанному алгоритму. Программа по умолчанию создает колонку для новой переменной, располагая ее вслед за активной колонкой (т.е. колонкой, в которой находится курсор в момент вызова опции по клавише [F5]).

При выборе опции Remove Korrekt (удалить колонку Korrekt) происходит удаление колонки Korrekt, которое необходимо записать на диск с помощью опций, возникающих на экране после нажатия клавиши [F6]. Однако в случае работы с ранее созданным файлом удаление колонки с помощью опции Remove Korrekt невозможно. Необходимо отметить, что изменение структуры уже созданного файла данных необходимо проводить только с помощью опции J. Update (исправление данных) из меню 2. Файловые Операции.

При выборе опции Add rows (вставить строки) на экране появляется табло со строкой How many rows to add? (1) и активным полем курсора. В это поле необходимо ввести цифру от 1 до 9, обозначающую число строк, которое Вы хотите дополнительно ввести в матрицу. Программа по умолчанию создает новые строки во всех переменных, располагая их перед активной строкой (т.е. строкой, в которой находится курсор в момент вызова опции по клавише [F5]).

При выборе опции Delete rows (удалить строки) на экране появляется табло со строкой How many rows to delete (1) и активным полем курсора. В это поле необходимо ввести цифру от 1 до 9, обозначающую число строк, которое Вы хотите удалить из матрицы. Программа по умолчанию удаляет указанное Вами число строк во всех переменных, включая и активную строку. Внесенные изменения необходимо записать на диск с помощью опций, возникающих на экране после нажатия клавиши [F6].

При выборе опции Add cells (вставить клетки в текущем столбце) на экране появляется табло со строкой How many cells to add?(1) и активным полем курсора. В это поле необходимо ввести цифру от 1 до 9, обозначающую число строк, которое Вы хотите дополнительно ввести в текущий столбец. Программа создает новые строки только в колонке текущей переменной, располагая их перед активной строкой (т.е. строкой, в которой находится курсор в момент вызова опции по клавише [F5]).

При выборе опции Delete cells (удалить клетки в текущем столбце) на экране появляется табло со строкой How many cells to delete (1) и активным полем курсора. В это поле необходимо ввести цифру от 1 до 9, обозначающую число строк, которое Вы хотите удалить из текущего столбца. Программа по умолчанию удаляет указанное Вами число строк в текущем столбце, расположенных ниже активной строки (включая и саму активную строку). Внесенные изменения необходимо записать на диск с помощью опций, возникающих на экране после нажатия клавиши [F6].

При выборе опции Print to printer (печать на принтер) происходит распечатка файла на принтере. При выборе опции Print to file (печать в файл) на экране появляется табло со строкой Enter file name for printing (STATGSCR.PRN) и активным полем курсора. В это поле необходимо ввести имя файла, под которым необходимо сохранить созданную базу данных для дальнейшей работы с ней в текстовых редакторах. После ввода имени файла после непродолжительной работы созданная база данных сохраняется на жестком диске по умолчанию в основной директории STATGRAPHICS.

При выборе опции Save without exit (запись данных без выхода) происходит запись введенных в текущий файл данных. Этой опцией рекомендуется пользоваться при введении данных в многоразмерные матрицы (во избежание утраты файла при возможных форс-мажорных обстоятельствах).

При выборе опций Sort in ascending order (сортировка по возрастающей) или Sort in descending order (сортировка по убывающей) происходит сортировка всей матрицы по возрастанию (убыванию) значений текущей (активной) переменной. В STATGRAPHICS реализуется алгоритм, при котором сортировка по возрастающей (убывающей) текущей переменной сопровождается одновременным и симметричным перемещением всех значений по данному случаю наблюдений (испытуемому, результатам измерений и т.п.).

 

1.5.3. Копирование, удаление и переименование созданных файлов

 

Для копирования созданного файла (например, файла TREWOGA) требуется ввести в поле для имени файла STATGRAPHICS file name. Ввод осуществляется путем одновременного нажатия клавиш [Ctrl]+[F7] и выбора файла TREWOGA из всплывающего меню файлов всей базы с помощью клавиш [Стрелка вниз] и [Enter]. Затем (после нажатия клавиши [Enter] или [Tab]) в активном поле строки Desired operation следует набрать с клавиатуры латинскую букву «А» и подтвердить выбор с помощью клавиши [F6]. В результате на экране появляется табло со строкой Enter new filename (up to 8 letters) и активным полем курсора. В это поле следует ввести до 8-ми букв латинского алфавита, обозначающих имя копии созданного основного файла. Набор имени файла-копии подтверждается нажатием клавиши [Enter][9]. В результате этой процедуры на диске будет создан новый файл, содержимое же экрана почти не изменится, а имя созданного файла-копии с расширением *.asf появится в поле Files on Data Drives.

Для удаления любого имеющегося на диске файла с расширением *.asf требуется ввести его имя в поле STATGRAPHICS file name с помощью опции [Ctrl]+[F7], также выбрав его из всплывающего меню файлов всей базы с помощью клавиш [Стрелка вниз] и [Enter]. Затем (после нажатия клавиши [Enter] или [Tab]) в активном поле строки Desired operation следует набрать с клавиатуры латинскую букву «D» и подтвердить выбор с помощью клавиши [F6]. На экране появляется табло со строкой OK to erase < имя удаляемого файла> (N/Y) и активным полем курсора. Для подтверждения удаления файла с жесткого диска компьютера в это поле следует ввести латинскую букву «Y». После этого файл будет удален, его имя исчезнет из поля Files on Data Drives, а содержимое экрана почти не изменится.

Процедура переименования любого файла осуществляется аналогично процедуре копирования. В поле STATGRAPHICS file name вводится имя файла, нуждающегося в переименовании, затем в поле строки Desired operation вносится латинская буква «Н» и после нажатия клавиши [F6] появляется табло со строкой Enter new filename (up to 8 letters) и активным полем курсора. В этом поле записывается новое имя существующего на диске компьютера файла. После подтверждения клавишей [Enter] этот файл с новым именем и расширением *.asf появится в поле Files on Data Drives.

 

1.5.4. Объединение и расчленение файлов

 

Для выполнения операций объединения файлов используется опция «Е» Join – объединение файлов. Для этого требуется ввести имя файла, в который предполагается присоединить имеющуюся базу данных (например, в файл TREWOGA), в поле для имени файла STATGRAPHICS file name. Ввод осуществляется путем одновременного нажатия клавиш [Ctrl]+[F7] и выбора файла TREWOGA из всплывающего меню файлов всей базы с помощью клавиш [Стрелка вниз] и [Enter].

Затем (после нажатия клавиш [Enter] или [Tab]) в поле строки Desired operation следует набрать с клавиатуры латинскую букву «Е» и подтвердить выбор с помощью клавиши [F6]. Далее на экране появляется всплывающее меню с расположенными вертикально надписями «Join vertically» и «Join horisontally». Первая опция применяется для присоединения к исходному файлу другого файла с аналогичной вертикальной структурой, то есть файла с таким же числом переменных, имеющих по транскрипции такие же наименования, как и в базовом файле. При выборе первой опции на экране появляется всплывающее меню имени файлов, содержащихся в базе данных. Следует выбрать по команде [Стрелка вниз] имя файла, которое предполагается соединить с базовым файлом. На экране появляется новое всплывающее табло со строкой Enter new filename (up to 8 letters) и активным полем курсора. В это поле следует ввести до 8-ми букв латинского алфавита, обозначающих имя создаваемого нового файла, объединяющего данные двух исходных файлов. Ввод имени нового файла-увеличенной базы подтверждается нажатием клавиши [Enter][10]. В результате этой процедуры на диске будет создан новый файл, содержимое же экрана почти не изменится, а имя созданного файла-увеличенной базы с расширением *.asf появится в поле Files on Data Drives.

В случае несовпадения состава переменных и/или их транскрипции программа создаст новый файл, в котором в столбцах по вертикали будут приведены наименования/транскрипции всех переменных первого файла, а затем – наименования/транскрипции переменных второго файла. При этом в первых n строках файла будут приведены значения k в случае наблюдений по m переменным, содержавшихся в первом файле. Далее в последующих n+x строках файла будут приведены значения k+y случаев наблюдений по z переменным, содержавшихся во втором файле. Сформированную таким ошибочным образом матрицу можно представить в виде некоторой тетрапольной таблицы с избирательно заполненными I и IV квадрантами.

Вторая опция применяется для присоединения к исходному файлу другого файла, имеющего горизонтальную структуру, аналогичную базовому, т.е. число случаев наблюдения во втором файле идентично числу случаев наблюдения в первом файле. При этом наименования/транскрипции переменных второго файла отличаются от наименования/транскрипции переменных первого файла.

При выборе второй опции на экране появляется всплывающее меню имени файлов, содержащихся в базе данных. Следует выбрать по команде [Стрелка вниз] имя файла, которое предполагается соединить с базовым файлом. На экране появляется новое всплывающее табло со строкой Enter new filename (up to 8 letters) и активным полем курсора. В это поле следует ввести до 8-ми букв латинского алфавита, обозначающих имя создаваемого нового файла, объединяющего данные двух исходных файлов. Ввод имени нового файла-расширенной базы подтверждается нажатием клавиши [Enter][11]. В результате этой процедуры на диске будет создан новый файл, содержимое же экрана почти не изменится, а имя созданного файла-расширенной базы с расширением *.asf появится в поле Files on Data Drives.

В случае несовпадения числа случаев наблюдения в первом и втором файле переменных и/или их транскрипции программа выдает табло-предупреждение «ERROR. No matching variables found in the two files». Табло означает, что дальнейшие действия с файлами, обнаруживающими несовпадения по горизонтали, не представляются возможными.

Для выполнения операций расчленения файлов используется опция «I» Split – расчленение файлов. Однако опыт использования пакета STATGRAPHICS убеждает в том, что наиболее удобным достижение целей расчленения файла на несколько составляющих является процедура «J» Update – исправление данных. Наиболее удобным является использование этой процедуры в следующем режиме – опция «А» Copy – копирование файла, с созданием копии файла, в котором предполагается внесение изменений, касающихся структуры самого файла и (или) наименования переменных. Затем для вновь созданного файла, имя которого введено в поле для имени файла STATGRAPHICS file name посредством процедуры одновременного нажатия клавиш [Ctrl]+[F7] и выбора его имени из всплывающего меню файлов всей базы с помощью клавиш [Стрелка вниз] и [Enter]. Затем (после нажатия клавиши [Enter] или [Tab]) в активном поле строки Desired operation следует набрать с клавиатуры латинскую букву «J» Update – исправление данных и подтвердить выбор с помощью клавиши [F6]. На экране меню с расположенными в столбцах данными с именами переменных, характеристиками ширины поля ввода в редакторе, типа переменных, количества случаев наблюдений по каждой переменной, датой и временем создания файла с базой данных. Затем следует поставить курсор на имя переменной, которую следует удалить из файла базы данных, а потом из контекстного меню панели статуса, имеющего вид «Highlight variable: A=Assign C=Comment D=Display E=Erase N=New R=Rename Y=Copy» следует выбрать процедуру «Е» Erase. Во всплывающем меню возникает контрольное табло, содержащее текст «ОК to variable <имя переменной> (Y/N)» и курсор в активным поле. Для подтверждения удаления переменной из базы данных файла в это поле следует ввести латинскую букву «Y». После этого переменная будет удалена, ее имя исчезнет из текущего поля. Опция позволяет проводить и другие операции с переменными, предусмотренные в меню панели статуса.

Для удаления во вновь созданной копии файла случаев наблюдений (строк в матрице) следует использовать опцию [C] – редактирование данных, далее опция «А» – All, [F5] и строки «delete rows» из всплывающего меню.

Так представляются основные процедуры работы с файлами базы данных. Эти процедуры позволяют производить ввод и преобразование данных, что представляется весьма важным в практических задачах. В целом стандартный набор опций, предназначенных для выполнения задаваемых пользователем преобразований типа разрезания и склеивания переменных, сортировки и ранжирования, генерации данных и т.п.