Изучение создания процесса UNIX. Особая семантика execlp() и execvp(). Потомок умирает раньше родителя

The exec system call is used to execute a file which is residing in an active process. When exec is called the previous executable file is replaced and new file is executed.

More precisely, we can say that using exec system call will replace the old file or program from the process with a new file or program. The entire content of the process is replaced with a new program.

The user data segment which executes the exec() system call is replaced with the data file whose name is provided in the argument while calling exec().

The new program is loaded into the same process space. The current process is just turned into a new process and hence the process id PID is not changed, this is because we are not creating a new process we are just replacing a process with another process in exec.

If the currently running process contains more than one thread then all the threads will be terminated and the new process image will be loaded and then executed. There are no destructor functions that terminate threads of current process.

PID of the process is not changed but the data, code, stack, heap, etc. of the process are changed and are replaced with those of newly loaded process. The new process is executed from the entry point.

Exec system call is a collection of functions and in C programming language, the standard names for these functions are as follows:

  1. execl
  2. execle
  3. execlp
  4. execv
  5. execve
  6. execvp

It should be noted here that these functions have the same base exec followed by one or more letters. These are explained below:

e: It is an array of pointers that points to environment variables and is passed explicitly to the newly loaded process.

l: l is for the command line arguments passed a list to the function

p: p is the path environment variable which helps to find the file passed as an argument to be loaded into process.

v: v is for the command line arguments. These are passed as an array of pointers to the function.

Why exec is used?

exec is used when the user wants to launch a new file or program in the same process.

Inner Working of exec

Consider the following points to understand the working of exec:

  1. Current process image is overwritten with a new process image.
  2. New process image is the one you passed as exec argument
  3. The currently running process is ended
  4. New process image has same process ID, same environment, and same file descriptor (because process is not replaced process image is replaced)
  5. The CPU stat and virtual memory is affected. Virtual memory mapping of the current process image is replaced by virtual memory of new process image.

Syntaxes of exec family functions:

The following are the syntaxes for each function of exec:

int execl(const char* path, const char* arg, …)
int execlp(const char* file, const char* arg, …)
int execle(const char* path, const char* arg, …, char* const envp)
int execv(const char* path, const char* argv)
int execvp(const char* file, const char* argv)
int execvpe(const char* file, const char* argv, char *const envp)

Description:

The return type of these functions is Int. When the process image is successfully replaced nothing is returned to calling function because the process that called it is no longer running. But if there is any error -1 will be returned. If any error is occurred an errno is set.

  1. path is used to specify the full path name of the file which is to be executes.
  1. arg is the argument passed. It is actually the name of the file which will be executed in the process. Most of the times the value of arg and path is same.
  1. const char* arg in functions execl(), execlp() and execle() is considered as arg0, arg1, arg2, …, argn. It is basically a list of pointers to null terminated strings. Here the first argument points to the filename which will be executed as described in point 2.
  1. envp is an array which contains pointers that point to the environment variables.
  1. file is used to specify the path name which will identify the path of new process image file.
  1. The functions of exec call that end with e are used to change the environment for the new process image. These functions pass list of environment setting by using the argument envp . This argument is an array of characters which points to null terminated String and defines environment variable.

To use the exec family functions, you need to include the following header file in your C program:

#include

Example 1: Using exec system call in C program

Consider the following example in which we have used exec system call in C programming in Linux, Ubuntu: We have two c files here example.c and hello.c:

example.c

#include
#include
#include

{
printf ("PID of example.c = %d\n " , getpid() ) ;
char * args = { "Hello" , "C" , "Programming" , NULL} ;
execv("./hello" , args) ;
printf ("Back to example.c" ) ;
return 0 ;
}

hello.c

PID of example.c = 4733
We are in Hello.c
PID of hello.c = 4733

In the above example we have an example.c file and hello.c file. In the example .c file first of all we have printed the ID of the current process (file example.c is running in current process). Then in the next line we have created an array of character pointers. The last element of this array should be NULL as the terminating point.

Then we have used the function execv() which takes the file name and the character pointer array as its argument. It should be noted here that we have used ./ with the name of file, it specifies the path of the file. As the file is in the folder where example.c resides so there is no need to specify the full path.

When execv() function is called, our process image will be replaced now the file example.c is not in the process but the file hello.c is in the process. It can be seen that the process ID is same whether hello.c is process image or example.c is process image because process is same and process image is only replaced.

Then we have another thing to note here which is the printf() statement after execv() is not executed. This is because control is never returned back to old process image once new process image replaces it. The control only comes back to calling function when replacing process image is unsuccessful. (The return value is -1 in this case).

Difference between fork() and exec() system calls:

The fork() system call is used to create an exact copy of a running process and the created copy is the child process and the running process is the parent process. Whereas, exec() system call is used to replace a process image with a new process image. Hence there is no concept of parent and child processes in exec() system call.

In fork() system call the parent and child processes are executed at the same time. But in exec() system call, if the replacement of process image is successful, the control does not return to where the exec function was called rather it will execute the new process. The control will only be transferred back if there is any error.

Example 2: Combining fork() and exec() system calls

Consider the following example in which we have used both fork() and exec() system calls in the same program:

example.c

#include
#include
#include
int main(int argc, char * argv )
{
printf ("PID of example.c = %d\n " , getpid() ) ;
pid_t p;
p = fork() ;
if (p==- 1 )
{
{
printf ("We are in the parent process" ) ;
}
return 0 ;
}

hello.c:

PID of example.c = 4790
We are in Parent Process
We are in Child Process
Calling hello.c from child process
We are in hello.c
PID of hello.c = 4791

In this example we have used fork() system call. When the child process is created 0 will be assigned to p and then we will move to the child process. Now the block of statements with if(p==0) will be executed. A message is displayed and we have used execv() system call and the current child process image which is example.c will be replaces with hello.c. Before execv() call child and parent processes were same.

It can be seen that the PID of example.c and hello.c is different now. This is because example.c is the parent process image and hello.c is the child process image.

Функция Функции, загружающие и запускающие другие программы. Синтаксис int execl(char * pathname, char * arg0, arg1, ..., argn, NULL); int execle(char * pathname, char * arg0, arg1, ..., argn, NULL, char ** envp); int execlp(char * pathname, char * arg0, arg1, ..., argn, NULL); int execlpe(char * pathname, char * arg0, arg1, ..., argn, NULL, char ** envp); int execv(char * pathname, char * argv); int execve(char * pathname, char * argv, char ** envp); int execvp(char * pathname, char * argv); int execvpe(char * pathname, char * argv, char ** envp); Файл, содержащий process.h прототип Описание Семейство функций exec... загружает и запускает другие программы, известные как "дочерние" процессы. Если вызов функции exec... завершается успешно, "дочерний" процесс накладывается на "родительский" процесс; причем должно быть достаточно памяти для загрузки и выполнения "дочернего" процесса. pathname - это имя файла вызываемого "дочернего" процесса. Функции exec... производят поиск pathname, пользуясь стандартным алгоритмом системы DOS: - Нет расширения имени файла и нет точки; в таком случае производится поиск точного имени файла, если такое имя не найдено, добавляется расширение.com и поиск продолжается. Если и такого файла не найдено, то добавляется расширение.exe и поиск выполняется последний раз. - Расширение имени присутствует - производится поиск по точному имени файла; Суффиксы l, v, p и e, добавляемые к имени семейства exec... обозначают, что данная функция будет работать с некоторыми особенностями: p - определяет, что функция будет искать "дочернюю" программу в директориях, определяемых переменной среды DOS PATH. Без суффикса p поиск будет производиться только в рабочем каталоге. Если параметр path не содержит маршрута, то поиск производится в текущей директории, а затем по маршрутaм, определяемым переменной окружения PATH. l - показывает, что адресные указатели (arg0, arg1, ..., argn) передаются, как отдельные аргументы. Обычно суффикс l употребляется, когда число пере- даваемых аргументов заранее вам известно. v - показывает, что адресные указатели (arg, arg,...arg[n]) передаются, как массив указателей. Обычно, суффикс v используется, когда передаeтся переменное число аргументов. e - показывает, что "дочернему" процессу может быть передан аргумент envp, который позволяет выбирать среду "дочернего" процесса. Без суффикса e "дочерний" процесс унаследует среду "родительского" процесса. Каждая функция семейства exec... должна иметь один из двух суффиксов, определяющих аргументы (либо l, либо v). Суффиксы определения маршрута доступа (PATH) и унаследования операционной среды (p и e) являются необязательными. Например: - execl - представляет собой функцию семейства exec..., которая передает раздельные аргументы, ищет "дочерний" процесс только в рабочем каталоге и передает "родительскую" среду "дочернему" процессу. - execvpe представляет собой функцию семейства exec..., которая передает массив указателей аргументов, подсоединяет маршрут доступа PATH для поиска "дочернего" процесса и применяет аргумент envp для выбора среды "дочернего" процесса. Функция семейства exec... должна передавать "дочернему" процессу хотя бы один аргумент (arg0 или argv). Данный аргумент, по соглашению, представляет собой копию pathname. (Использование других значений для нулевого аргумента не будет ошибкой). В системах DOS версий 3.X "дочерний" процесс может получить аргумент pathname; в более ранних версиях "дочерний" процесс не может использовать значение нулевого аргумента (arg0 или argn). При использовании суффикса l, арг0 обычно указывает на pathname, а arg1, ..., argn указывают на строки символов, которые формируют новый список аргументов. Завершающий NULL, следующий за argn, обозначает конец списка. При использовании суффикса e список назначенной среды передается с помощью аргумента envp. Данный аргумент является массивом из элементов типа char*. Каждый элемент указывает на символьную строку с нулевым окончанием формы: envvar = value , где envvar - имя переменной среды, а value- значение символьной строки, которая присваивается каждой переменной envvar. Последним элементом в массиве envp является адресный нуль NULL. Когда значением envp является NULL, "дочерний" процесс наследует назначения среды "родительского" процесса. Общая длина arg0+ arg1+...+argn (или arg+ arg+...+arg[n]), включая пробелы, разделяющие аргументы, должна быть меньше 128 байтов. Нулевые окончания не считаются. При вызове функции exec... любые открытые файлы остаются открытыми и в "дочернем" процессе. Возвращаемое При успешном завершении функции exec... не возвра- значение щают никакого значения. При возникновении ошибки функции exec... возвращают значение -1, а глобальная переменная errno получает одно из следующих значений: E2BIG - Слишком длинный список аргументов. EACCES - Отказ доступа. EMFILE - Слишком много открытых файлов. ENOENT - Маршрут доступа (PATH) или имя файла не найдены. ENOEXEC - Ошибка формата EXEC. ENOMEM - Не хватает памяти. Переносимость exec... уникальна для DOS. Смотрите также: abort, atexit,_exit, exit, _fpreset, searchpath, spawn..., system. Пример: #include #include main(int argc, char * argv) { int i; printf("Запущен дочерний процесс...\n"); printf("%s\n",getenv("PATH")); for (i=0; i #include #include int main(int argc,char *argv) { int loop; printf("%s работает...\n\n",argv); if(argc == 1) /* есть ли еще аргументы */ { printf("%s запускает сама себя опять...\n",argv); execl(argv,argv,"ONE","TWO","THREE",NULL); perror("EXEC:"); exit(1); } printf("%s вызвана с аргументами:\n",argv); for(loop = 1;loop<=argc;loop++) puts(argv); return 0; } #include #include #include #include #include int main(int argc,char *argv) { int loop; char *new_env = {"TELYING",NULL}; printf("%s работает...\n\n",argv); if(argc == 1) /* есть ли еще аргументы */ { printf("%s запускает сама себя опять...\n",argv); execle(argv,argv,"ONE","TWO","THREE",NULL,new_env); perror("EXEC:"); exit(1); } printf("%s вызвана с аргументами:\n",argv); for(loop = 1;loop<=argc;loop++) puts(argv); /* напечатать первый параметр среды */ printf("env = %s\n",env); return 0; } #include #include #include #include int main(int argc,char *argv) { int loop; printf("%s работает...\n\n",argv); if(argc == 1) /* есть ли еще аргументы */ { printf("%s запускает сама себя опять...\n",argv); execlp(argv,argv,"ONE","TWO","THREE",NULL); perror("EXEC:"); exit(1); } printf("%s вызвана с аргументами:\n",argv); for(loop = 1;loop<=argc;loop++) puts(argv); return 0; } #include #include #include #include #include #include void main(int argc,char *argv,char **envp) { printf("Запуск CHILD с arg1, arg2 ...\n"); execlpe("CHILD.EXE","CHILD.EXE","arg1","arg2",NULL,envp); perror("Ошибка EXEC"); exit(1); } #include #include #include #include #include #include void main(int argc,char **argv) { printf("Запуск CHILD с arg1, arg2 ...\n"); execv("CHILD.EXE",argv); perror("Ошибка EXEC"); exit(1); } #include #include #include #include #include #include void main(int argc,char **argv,char **envp) { printf("Запуск CHILD с arg1, arg2 ...\n"); execve("CHILD.EXE",argv,envp); perror("Ошибка EXEC"); exit(1); } #include #include #include #include #include #include void main(int argc,char **argv) { printf("Запуск CHILD с arg1, arg2 ...\n"); execvp("CHILD.EXE",argv); perror("Ошибка EXEC"); exit(1); } #include #include #include #include #include #include int main(int argc,char **argv,char **envp) { printf("Запуск CHILD с arg1, arg2 ...\n"); execvpe("CHILD.EXE",argv,envp); perror("Ошибка EXEC"); exit(1); }

Семейство функций exec()

Функции семейства exec() заменяют программу, выполняющуюся в текущем процессе, другой программой. Когда программа вызывает функцию exec() , ее выполнение немедленно прекращается и начинает работу новая программа.

Функции, входящие в семейство exec() , немного отличаются друг от друга по своим возможностям и способу вызова.

Функции, в названии которых присутствует суффикс "p"(execvp() и execlp()), принимают в качестве аргумента имя программы и ищут эту программу в каталогах, определяемых переменном среды PATH . Всем остальным функциям нужно передавать полное путевое имя программы.

Функции, в названии которых присутствует суффикс "v"(execv() , execvp() и execve()), принимают список аргументов программы в виде массива строковых указателей, оканчивающегося NULL -указателем. Функции с суффиксом "l"(execl() , execlp() и execle()) принимают список аргументов переменного размера.

Функции, в названии которых присутствует суффикс "e"(execve() и execle()), в качестве дополнительного аргумента принимают массив переменных среды. Этот массив содержит строковые указатели и оканчивается пустым указателем. Каждая строка должна иметь вид "ПЕРЕМЕННАЯ =значение " .

Поскольку функция exec() заменяет одну программу другой, она никогда не возвращает значение - только если вызов программы оказался невозможен в случае ошибки.

Список аргументов, передаваемых программе, аналогичен аргументам командной строки, указываемым при запуске программы в интерактивном режиме. Их тоже можно получить с помощью параметров argc и argv функции main() . Не забывайте, когда программу запускает интерпретатор команд, первый элемент массива argv будет содержать имя программы, а далее будут находиться переданные программе аргументы. Аналогичным образом следует поступить, формируя список аргументов для функции exec() .

Execlp(3) запуск файла на исполнение

Other Alias

execl, execle, execv, execvp, execvpe

ОБЗОР

#include

extern char **environ;

int execl(const char * path , const char * arg , ...
/* (char *) NULL */);
int execlp(const char * file , const char * arg , ...
/* (char *) NULL */);
int execle(const char * path , const char * arg , ...
/*, (char *) NULL, char * const envp */);
int execv(const char * path , char *const argv );
int execvp(const char * file , char *const argv );
int execvpe(const char * file , char *const argv ,
char *const envp );

Требования макроса тестирования свойств для glibc (см. feature_test_macros (7)):

execvpe (): _GNU_SOURCE

ОПИСАНИЕ

Семейство функций exec () заменяет текущий образ процесса новым. Описанные в данной справочной странице функции являются оберткой для execve (2) (подробней о см. замене текущего смотрите в справочной странице execve (2)).

Первый аргумент этих функций - имя исполняемого файла.

Параметр const char *arg и последующие параметры в функциях execl (), execlp () и execle () можно воспринимать как параметры arg0 , arg1 , ..., argn . Все вместе они описывают список из одного или нескольких указателей на строки (заканчивающиеся null), который представляет собой список параметров, доступных исполняемой программе. Первый параметр, по соглашению, должен указывать на имя, ассоциированное с файлом, который надо запустить. Список параметров должен заканчиваться указателем null и, так как это функция с переменным числом аргументов, этот указатель должен приводиться к (char *) NULL .

Функции execv (), execvp () и execvpe () предоставляют новой программе список аргументов в виде массива указателей на строки, заканчивающиеся null. Первый аргумент, по соглашению, должен указать на имя, ассоциированное с файлом, который необходимо запустить. Массив указателей должен заканчиваться указателем null.

Функции execle () и execvpe () позволяют вызывающему назначить окружение исполняемой программе через параметр envp . Аргумент envp является массивом указателей на строки (завершающиеся null), он должен заканчиваться указателем null. Остальные функции извлекают окружение для нового образа процесса из внешней переменной environ вызвавшего процесса.

Особая семантика execlp() и execvp()

Функции execlp (), execvp () и execvpe () дублируют действия оболочки, относящиеся к поиску исполняемого файла, если указанное имя файла не содержит символ черты (/). Путь поиска задаётся в переменной окружения PATH (список каталогов, перечисленных через двоеточие). Если эта переменная не определена, то по умолчанию к текущему каталогу добавляется список каталогов, возвращаемый confstr(_CS_PATH) (вызов confstr (3) обычно возвращает значение «/bin:/usr/bin»).

Если указанное имя файла содержит в себе символ косой черты, переменная PATH будет проигнорирована, и будет запущен файл по указанному пути.

Кроме этого, есть отличия в обработке некоторых ошибок.

Если доступ к файлу запрещён (при попытке исполнения execve (2) возвращается ошибка EACCES ), то эти функции будут продолжать поиск в оставшихся путях. Однако, если больше никаких файлов не найдено, то они присваивают значение глобальной переменной errno равным EACCES .

Если заголовок файла не распознаётся (при попытке выполнения execve (2) возвращает ENOEXEC ), то эти функции запускают оболочку (/bin/sh ) с полным именем файла в качестве первого параметра (если это тоже приводит к ошибке, то поиск останавливается).

ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ

Функции exec () возвращают значение только при возникновении ошибки. При этом возвращается -1, а errno присваивается код ошибки.

ВЕРСИИ

Функция execvpe () впервые появилась в glibc 2.11.

АТРИБУТЫ

Описание терминов данного раздела смотрите в attributes (7).
Интерфейс Атрибут Значение
execl (), execle (), execv () безвредность в нитях безвредно (MT-Safe)
execlp (), execvp (), execvpe () безвредность в нитях безвредно (MT-Safe env)

СООТВЕТСТВИЕ СТАНДАРТАМ

POSIX.1-2001, POSIX.1-2008.

Функция execvpe () является расширением GNU.

ЗАМЕЧАНИЯ

В некоторых системах путь поиска по умолчанию (используемый, когда в окружении нет переменной PATH ) начинается c каталогов /bin и /usr/bin , а затем поиск проводится в текущем каталоге (чтобы не запустить подложенную программу «троянского коня»). В Linux используется традиционный метод: поиск начинается с текущего каталога.

Поведение функций execlp () и execvp () при ошибках во время попыток исполнения файла сложилось исторически, но при этом оно не описано и не определено в стандарте POSIX. В BSD (и, возможно, других системах) выполняется автоматическое ожидание и повтор, если возникает ошибка ETXTBSY . В Linux это воспринимается как невосстановимая ошибка, и она сразу возвращается.

Традиционно, функции execlp () и execvp () игнорировали все ошибки за исключением описанных выше, а также ENOMEM и E2BIG , которые они возвращают. В Linux эти функции возвращают любую ошибку, помимо перечисленных ранее.




Top