Способ синхронизации доступа к разделяемым ресурсам вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов
Изобретение относится к способу обнаружения и устранения повисших блокировок с использованием блокировочных файлов. Технический результат заключается в повышении надежности обнаружения и устранения повисших блокировок. Ассоциируют разделяемый ресурс с блокировочным файлом. Вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе. Помещают во временный файл информацию о текущем процессе, который пытается обратиться к разделяемому ресурсу. Осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл. Если системный вызов создания жесткой ссылки выполнен успешно, то удаляют жесткую ссылку на временный файл и обеспечивают выполнение текущим процессом операций с разделяемым ресурсом. Если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия: удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса; заносят в существующий блокировочный файл данные текущего процесса. Снимают файловую блокировку записи с существующего блокировочного файла. Обеспечивают выполнение текущим процессом операций с разделяемым ресурсом. Удаляют существующий блокировочный файл.
Реферат
Область техники, к которой относится изобретение
Предлагаемое изобретение относится к вычислительной технике и, в частности, к обеспечению синхронизации доступа к разделяемым ресурсам вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов.
Уровень техники
В настоящее время известны способы синхронизации доступа параллельно выполняемых процессов (приложений) к разделяемым ресурсам вычислительной системы (в том числе файлам, участкам оперативной памяти и др.). При обеспечении синхронизации исключительный доступ предоставляется только одному процессу, а сам ресурс блокируется для записи и/или чтения для других процессов. Блокировка может осуществляться разными методами, однако возможны ситуации, когда ресурс оказывается заблокирован одновременно несколькими процессами и ни один из них не может ни снять блокировку, ни выполнить необходимые операции с разделяемым ресурсом.
Такое состояние обычно называют повисшей блокировкой (deadlock), а определяют его наличие и затем устраняют с использованием разных механизмов.
Так, известен способ предотвращения повисших блокировок [1] при выполнении обновлений хранилища данных в многопроцессорном устройстве, имеющем локальную кэш-память для каждого процессора, причем каждый процессор имеет возможность работы в быстром, медленном или расширенном медленном режиме, способ, заключающийся в том, что
- получают инструкцию, которая включает обращение к хранилищу данных;
- устанавливают процессор в быстрый режим, при котором множество инструкций выполняются параллельно, а целевая запись кэш-памяти, связанная с хранилищем данных, берется из локальной кэш-памяти с состоянием исключительного владения перед выполнением инструкции;
- инициализируют выполнение инструкции в быстром режиме;
- в ответ на обнаружение возможной повисшей блокировки во время выполнения инструкции в быстром режиме:
- прерывают выполнения инструкции в быстром режиме;
- устанавливают процессор в медленный режим, при котором выполняется единственная инструкция в текущий момент времени, а целевая запись кэш-памяти берется из локальной кэш-памяти с состоянием исключительного владения перед выполнением инструкции;
- инициализируют выполнение инструкции в медленном режиме;
- в ответ на обнаружение возможной повисшей блокировки во время выполнения инструкции в медленном режиме:
- прерывают выполнение инструкции в медленном режиме;
- устанавливают процессор в расширенный медленный режим, при котором выполняется единственная инструкция в текущий момент времени, а целевая запись кэш-памяти берется из локальной кэш-памяти с состоянием только чтения перед выполнением инструкции и с состоянием исключительного владения после завершения выполнения инструкции; и
- инициализируют выполнение инструкции в расширенном медленном режиме.
После того как выполнение инструкции завершено в расширенном медленном режиме, процессор может быть переведен обратно в быстрый режим.
Возможная повисшая блокировка считается обнаруженной, когда превышается предварительно задаваемое пороговое число исключительных отклонений без признаков окончания выполнения инструкции.
Этот способ имеет недостатки, среди которых можно отметить, в частности, необходимость перевода процессора в медленный и в расширенный медленный режим работы, что снижает производительность вычислительной системы. Кроме того, обнаружение повисшей блокировки носит вероятностный характер и зависит от предварительно задаваемого порогового числа исключительных отклонений.
Известен также способ синхронизации доступа к разделяемым ресурсам между параллельно выполняемыми процессами [2] с использованием механизма блокировочных файлов, заключающийся в том, что
- ассоциируют разделяемый ресурс с блокировочным файлом;
- создают в ходе попытки доступа процесса (приложения) к разделяемому ресурсу блокировочный файл;
- если такой блокировочный файл уже существует, эта операция будет завершена с ошибкой;
- если такой блокировочный файл не существует, то создается блокировочный файл;
- записывают в только что созданный и открытый блокировочный файл данные процесса, который его создал (идентификатор процесса (process ID, РID) и др.);
- обеспечивают выполнение процессом операций с разделяемым ресурсом;
- снимают блокировку с разделяемого ресурса (файла) путем удаления блокировочного файла.
Описанный способ принят за прототип.
Однако этот известный способ также имеет недостаток. Так, если процесс, владеющий блокировкой, завершился некорректно и не удалил блокировочный файл, то больше ни один процесс не сможет получить доступ к разделяемому ресурсу и возникает повисшая блокировка. Соответственно, надежность известного способа является невысокой.
Раскрытие изобретения
С целью исключения возможности появления повисших блокировок следует проверять наличие в системе процесса, данные которого указаны в существующем блокировочном файле.
Для этого предлагается способ, заключающийся в том, что
- ассоциируют разделяемый ресурс с блокировочным файлом;
- вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе, в которой предполагается создание блокировочного файла, со стороны текущего процесса, пытающегося получить доступ к разделяемому ресурсу;
- помещают во временный файл информацию о текущем процессе (PID и/или др. сведения, по которым можно определить наличие данного процесса в системе), который пытается обратиться к разделяемому ресурсу;
- осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл;
- если системный вызов создания жесткой ссылки выполнен успешно, то:
- удаляют жесткую ссылку на временный файл;
- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
- удаляют блокировочный файл;
- если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка не связана с тем, что файл с именем блокировочного файла уже существует, то удаляют временный файл;
- если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка связана с тем, что файл с именем блокировочного файла уже существует, то
- удаляют временный файл;
- осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:
- устанавливают файловую блокировку записи на существующий блокировочный файл;
- проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле;
- если текущий процесс в системе существует, то снимают файловую блокировку записи на существующий блокировочный файл;
- если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия:
- удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса;
- заносят в существующий блокировочный файл данные текущего процесса;
- снимают файловую блокировку записи с существующего блокировочного файла;
- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
- удаляют существующий блокировочный файл.
Таким образом, если после проверки выясняется, что процесс, данные которого указаны в блокировочном файле, в данный момент в вычислительной системе не существует (например, произошел внутренний программный сбой и приложение операционной системой (ОС) было принудительно выгружено из оперативной памяти), то это не помешает обеспечить доступ к разделяемому ресурсу другим процессам и гарантировать отсутствие повисшей блокировки.
Техническим результатом является повышение надежности обнаружения и устранения повисших блокировок.
Осуществление изобретения
Реализация предложенного способа может быть осуществлена в вычислительной системе, работающей под управлением POSIX-совместимой ОС, в частности ОС GNU/Linux, где механизм блокировочных файлов для синхронизации доступа к разделяемому ресурсу получил широкое распространение.
Необходимым условием реализации предложенного способа является наличие в составе ОС вычислительной системы следующих средств, описанных в стандарте ISO/IEC/IEEE 9945-1:2008 [3]:
- системных вызовов для работы с файлами;
- операций атомарного эксклюзивного создания и открытия временного файла с уникальным именем (например, выполняемых с помощью системного вызова mkstemp);
- поддержка жестких ссылок ОС и файловой системой, в которой предполагается создание блокировочного файла;
- поддержка файловых блокировок и наличие системных вызовов для работы с ними.
Все указанные средства присутствуют в ОС GNU/Linux, в частности в доступном для любого пользователя дистрибутиве ОС Debian 6.
Жесткие ссылки поддерживаются большинством файловых систем, такой, в частности, как Ext3 (Extended File System версии 3), поддерживаемая в ОС Debian.
Для реализации способа в создаваемой или модернизируемой программе или программном модуле, предназначенном для работы с разделяемыми ресурсами, предусматривают осуществление следующих действий.
Ассоциируют разделяемый ресурс (например, последовательный порт) с блокировочным файлом. Это можно сделать, к примеру, сформировав константу, содержащую путь к блокировочному файлу.
В каждом процессе перед обращением к разделяемому ресурсу вызывают системный вызов mkstemp путем вызова одноименной системной функции, указав в качестве шаблона пути для создания временного файла путь в той же файловой системе, в которой предполагается создание блокировочного файла.
С помощью системного вызова write, помещают во временный файл информацию о текущем процессе, по которой можно определить наличие данного процесса в системе (в самом простом случае это может быть PID процесса), который пытается обратиться к разделяемому ресурсу.
Вызывают системный вызов link с помощью одноименной функции, передавая в качестве первого параметра путь к временному файлу, а в качестве второго параметра - путь к блокировочному файлу, с которым ассоциирован разделяемый ресурс.
Если функция link возвращает 0, то
- удаляют жесткую ссылку на временный файл, вызывая системный вызов unlink;
- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
- удаляют блокировочный файл, используя системный вызов unlink. Если функция link возвращает - 1 и в errno (error return value) содержится код ошибки, отличный от EEXISTS, то удаляют временный файл.
Если функция link возвращает - 1 и в errno содержится код ошибки EEXISTS, то
- удаляют временный файл, для чего вызывают системный вызов unlink, передавая в качестве параметра путь к временному файлу;
- осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:
- открывают существующий блокировочный файл для записи, для чего выполняют системный вызов open, передавая в качестве первого параметра путь к блокировочному файлу, с которым ассоциирован разделяемый ресурс, а в качестве второго параметра - режим чтения/записи, и запоминают возвращаемый номер файлового дескриптора открытого блокировочного файла;
- устанавливают файловую блокировку записи, для чего вызывают системный вызов fcntl, передавая в качестве первого параметра номер файлового дескриптора открытого блокировочного файла, в качестве второго значения - F_SETLKW, в качестве третьего значения - заполненную структуру flock, для установки блокировки всего содержимого файла;
- читают содержимое файла с помощью системного вызова файла read;
- проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле (для случая, когда в качестве данных о процессе выбран PID процесса, проверка может быть осуществлена путем выполнения системного вызова kill, передав в качестве первого параметра PID прочитанный из существующего блокировочного файла, а в качестве второго параметра - 0);
- если текущий процесс в системе существует (для случая, когда в качестве данных о процессе выбран PID процесса, системный вызов kill вернул 0), то снимают файловую блокировку записи на существующий блокировочный файл;
- если текущий процесс в системе не существует (для случая, когда в качестве данных о процессе выбран PID процесса,, системный вызов kill вернул -1 и errno содержит код ошибки ENOEXIST), то выполняют устранение повисшей блокировки, осуществляя следующие действия:
- удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса, выполняя системный вызов trunc, передав в качестве параметра значения номер файлового дескриптора открытого блокировочного файла;
- определяют информацию о текущем процессе (для случая, когда используется PID - выполняют системный вызов getpid и сохраняют возвращаемое значение);
- заносят в существующий блокировочный файл данные текущего процесса, выполняя системный вызов write;
- снимают файловую блокировку записи с существующего блокировочного файла, для чего вызывают системный вызов fcntl, передавая в качестве первого параметра номер файлового дескриптора открытого блокировочного файла, в качестве второго значения - F_SETLKW, в качестве третьего значения - заполненную структуру flock, для снятия блокировки всего содержимого файла;
- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
- удаляют существующий блокировочный файл, для чего вызывают системный вызов unlink, передавая в качестве параметра путь к блокировочному файлу.
Реализовать действия предложенного способа в составе программы или функции может специалист в области программирования (программист).
Источники информации
1. Патент США №7953932, приоритет от 13.02.2008 г.
2. Джонсон М.К., Троан Э.В. Разработка приложений в среде Linux, 2-е изд., Москва, 2007, стр.231-232.
3. Стандарт ISO/IEC/IEEE 9945-1:2008 Information technology - Portable Operating System Interface (POSIX®) Base Specifications.
Способ синхронизации доступа к разделяемому ресурсу вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов, заключающийся в том, чтоассоциируют разделяемый ресурс с блокировочным файлом;вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе, в которой предполагается создание блокировочного файла, со стороны текущего процесса, пытающегося получить доступ к разделяемому ресурсу;помещают во временный файл информацию о текущем процессе, который пытается обратиться к разделяемому ресурсу;осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл;если системный вызов создания жесткой ссылки выполнен успешно, то:удаляют жесткую ссылку на временный файл;обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;удаляют блокировочный файл;если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка не связана с тем, что файл с именем блокировочного файла уже существует, то удаляют временный файл;если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка связана с тем, что файл с именем блокировочного файла уже существует, то:удаляют временный файл;осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:устанавливают файловую блокировку записи на существующий блокировочный файл;проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле;если текущий процесс в системе существует, то снимают файловую блокировку записи на существующий блокировочный файл;если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия:удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса;заносят в существующий блокировочный файл данные текущего процесса;снимают файловую блокировку записи с существующего блокировочного файла;обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;удаляют существующий блокировочный файл.