]> mj.ucw.cz Git - eval.git/blobdiff - src/box.c
Implemented general mechanism for overriding variables for specific
[eval.git] / src / box.c
index f18acff5d10143b72f90ac9ac9e3c10f7331b57b..dc41f6cb032962c272fb2ff73b71373b0d4836ed 100644 (file)
--- a/src/box.c
+++ b/src/box.c
@@ -27,6 +27,7 @@
 
 #define NONRET __attribute__((noreturn))
 #define UNUSED __attribute__((unused))
+#define ARRAY_SIZE(a) (int)(sizeof(a)/sizeof(a[0]))
 
 static int filter_syscalls;            /* 0=off, 1=liberal, 2=totalitarian */
 static int timeout;                    /* milliseconds */
@@ -90,127 +91,138 @@ msg(char *msg, ...)
   va_end(args);
 }
 
-static const char * const syscall_tab[] = {
+static void *
+xmalloc(size_t size)
+{
+  void *p = malloc(size);
+  if (!p)
+    die("Out of memory");
+  return p;
+}
+
+/*** Syscall rules ***/
+
+static const char * const syscall_names[] = {
 #include "syscall-table.h"
 };
-#define NUM_SYSCALLS (sizeof(syscall_tab)/sizeof(syscall_tab[0]))
+#define NUM_SYSCALLS ARRAY_SIZE(syscall_names)
 #define NUM_ACTIONS (NUM_SYSCALLS+64)
 
-enum syscall_action {
-  SC_DEFAULT,          // Use the default action
-  SC_NO,               // Always forbid
-  SC_YES,              // Always permit
-  SC_FILENAME,         // Permit if arg1 is a known filename
-  SC_LIBERAL = 128,    // Valid only in liberal mode
+enum action {
+  A_DEFAULT,           // Use the default action
+  A_NO,                        // Always forbid
+  A_YES,               // Always permit
+  A_FILENAME,          // Permit if arg1 is a known filename
+  A_LIBERAL = 128,     // Valid only in liberal mode
 };
 
 static unsigned char syscall_action[NUM_ACTIONS] = {
 #define S(x) [__NR_##x]
 
     // Syscalls permitted for specific file names
-    S(open) = SC_FILENAME,
-    S(creat) = SC_FILENAME,
-    S(unlink) = SC_FILENAME,
-    S(oldstat) = SC_FILENAME,
-    S(access) = SC_FILENAME,                   
-    S(oldlstat) = SC_FILENAME,                 
-    S(truncate) = SC_FILENAME,
-    S(stat) = SC_FILENAME,
-    S(lstat) = SC_FILENAME,
-    S(truncate64) = SC_FILENAME,
-    S(stat64) = SC_FILENAME,
-    S(lstat64) = SC_FILENAME,
-    S(readlink) = SC_FILENAME,
+    S(open) = A_FILENAME,
+    S(creat) = A_FILENAME,
+    S(unlink) = A_FILENAME,
+    S(oldstat) = A_FILENAME,
+    S(access) = A_FILENAME,                    
+    S(oldlstat) = A_FILENAME,                  
+    S(truncate) = A_FILENAME,
+    S(stat) = A_FILENAME,
+    S(lstat) = A_FILENAME,
+    S(truncate64) = A_FILENAME,
+    S(stat64) = A_FILENAME,
+    S(lstat64) = A_FILENAME,
+    S(readlink) = A_FILENAME,
 
     // Syscalls permitted always
-    S(exit) = SC_YES,
-    S(read) = SC_YES,
-    S(write) = SC_YES,
-    S(close) = SC_YES,
-    S(lseek) = SC_YES,
-    S(getpid) = SC_YES,
-    S(getuid) = SC_YES,
-    S(oldfstat) = SC_YES,
-    S(dup) = SC_YES,
-    S(brk) = SC_YES,
-    S(getgid) = SC_YES,
-    S(geteuid) = SC_YES,
-    S(getegid) = SC_YES,
-    S(dup2) = SC_YES,
-    S(ftruncate) = SC_YES,
-    S(fstat) = SC_YES,
-    S(personality) = SC_YES,
-    S(_llseek) = SC_YES,
-    S(readv) = SC_YES,
-    S(writev) = SC_YES,
-    S(getresuid) = SC_YES,
+    S(exit) = A_YES,
+    S(read) = A_YES,
+    S(write) = A_YES,
+    S(close) = A_YES,
+    S(lseek) = A_YES,
+    S(getpid) = A_YES,
+    S(getuid) = A_YES,
+    S(oldfstat) = A_YES,
+    S(dup) = A_YES,
+    S(brk) = A_YES,
+    S(getgid) = A_YES,
+    S(geteuid) = A_YES,
+    S(getegid) = A_YES,
+    S(dup2) = A_YES,
+    S(ftruncate) = A_YES,
+    S(fstat) = A_YES,
+    S(personality) = A_YES,
+    S(_llseek) = A_YES,
+    S(readv) = A_YES,
+    S(writev) = A_YES,
+    S(getresuid) = A_YES,
 #ifdef __NR_pread64
-    S(pread64) = SC_YES,
-    S(pwrite64) = SC_YES,
+    S(pread64) = A_YES,
+    S(pwrite64) = A_YES,
 #else
-    S(pread) = SC_YES,
-    S(pwrite) = SC_YES,
+    S(pread) = A_YES,
+    S(pwrite) = A_YES,
 #endif
-    S(ftruncate64) = SC_YES,
-    S(fstat64) = SC_YES,
-    S(fcntl) = SC_YES,
-    S(fcntl64) = SC_YES,
-    S(mmap) = SC_YES,
-    S(munmap) = SC_YES,
-    S(ioctl) = SC_YES,
-    S(uname) = SC_YES,
-    S(gettid) = SC_YES,
-    S(set_thread_area) = SC_YES,
-    S(get_thread_area) = SC_YES,
-    S(exit_group) = SC_YES,
+    S(ftruncate64) = A_YES,
+    S(fstat64) = A_YES,
+    S(fcntl) = A_YES,
+    S(fcntl64) = A_YES,
+    S(mmap) = A_YES,
+    S(munmap) = A_YES,
+    S(ioctl) = A_YES,
+    S(uname) = A_YES,
+    S(gettid) = A_YES,
+    S(set_thread_area) = A_YES,
+    S(get_thread_area) = A_YES,
+    S(exit_group) = A_YES,
 
     // Syscalls permitted only in liberal mode
-    S(time) = SC_YES | SC_LIBERAL,
-    S(alarm) = SC_YES | SC_LIBERAL,
-    S(pause) = SC_YES | SC_LIBERAL,
-    S(signal) = SC_YES | SC_LIBERAL,
-    S(fchmod) = SC_YES | SC_LIBERAL,
-    S(sigaction) = SC_YES | SC_LIBERAL,
-    S(sgetmask) = SC_YES | SC_LIBERAL,
-    S(ssetmask) = SC_YES | SC_LIBERAL,
-    S(sigsuspend) = SC_YES | SC_LIBERAL,
-    S(sigpending) = SC_YES | SC_LIBERAL,
-    S(getrlimit) = SC_YES | SC_LIBERAL,
-    S(getrusage) = SC_YES | SC_LIBERAL,
-    S(ugetrlimit) = SC_YES | SC_LIBERAL,
-    S(gettimeofday) = SC_YES | SC_LIBERAL,
-    S(select) = SC_YES | SC_LIBERAL,
-    S(readdir) = SC_YES | SC_LIBERAL,
-    S(setitimer) = SC_YES | SC_LIBERAL,
-    S(getitimer) = SC_YES | SC_LIBERAL,
-    S(sigreturn) = SC_YES | SC_LIBERAL,
-    S(mprotect) = SC_YES | SC_LIBERAL,
-    S(sigprocmask) = SC_YES | SC_LIBERAL,
-    S(getdents) = SC_YES | SC_LIBERAL,
-    S(getdents64) = SC_YES | SC_LIBERAL,
-    S(_newselect) = SC_YES | SC_LIBERAL,
-    S(fdatasync) = SC_YES | SC_LIBERAL,
-    S(mremap) = SC_YES | SC_LIBERAL,
-    S(poll) = SC_YES | SC_LIBERAL,
-    S(getcwd) = SC_YES | SC_LIBERAL,
-    S(nanosleep) = SC_YES | SC_LIBERAL,
-    S(rt_sigreturn) = SC_YES | SC_LIBERAL,
-    S(rt_sigaction) = SC_YES | SC_LIBERAL,
-    S(rt_sigprocmask) = SC_YES | SC_LIBERAL,
-    S(rt_sigpending) = SC_YES | SC_LIBERAL,
-    S(rt_sigtimedwait) = SC_YES | SC_LIBERAL,
-    S(rt_sigqueueinfo) = SC_YES | SC_LIBERAL,
-    S(rt_sigsuspend) = SC_YES | SC_LIBERAL,
-    S(mmap2) = SC_YES | SC_LIBERAL,
-    S(_sysctl) = SC_YES | SC_LIBERAL,
+    S(time) = A_YES | A_LIBERAL,
+    S(alarm) = A_YES | A_LIBERAL,
+    S(pause) = A_YES | A_LIBERAL,
+    S(signal) = A_YES | A_LIBERAL,
+    S(fchmod) = A_YES | A_LIBERAL,
+    S(sigaction) = A_YES | A_LIBERAL,
+    S(sgetmask) = A_YES | A_LIBERAL,
+    S(ssetmask) = A_YES | A_LIBERAL,
+    S(sigsuspend) = A_YES | A_LIBERAL,
+    S(sigpending) = A_YES | A_LIBERAL,
+    S(getrlimit) = A_YES | A_LIBERAL,
+    S(getrusage) = A_YES | A_LIBERAL,
+    S(ugetrlimit) = A_YES | A_LIBERAL,
+    S(gettimeofday) = A_YES | A_LIBERAL,
+    S(select) = A_YES | A_LIBERAL,
+    S(readdir) = A_YES | A_LIBERAL,
+    S(setitimer) = A_YES | A_LIBERAL,
+    S(getitimer) = A_YES | A_LIBERAL,
+    S(sigreturn) = A_YES | A_LIBERAL,
+    S(mprotect) = A_YES | A_LIBERAL,
+    S(sigprocmask) = A_YES | A_LIBERAL,
+    S(getdents) = A_YES | A_LIBERAL,
+    S(getdents64) = A_YES | A_LIBERAL,
+    S(_newselect) = A_YES | A_LIBERAL,
+    S(fdatasync) = A_YES | A_LIBERAL,
+    S(mremap) = A_YES | A_LIBERAL,
+    S(poll) = A_YES | A_LIBERAL,
+    S(getcwd) = A_YES | A_LIBERAL,
+    S(nanosleep) = A_YES | A_LIBERAL,
+    S(rt_sigreturn) = A_YES | A_LIBERAL,
+    S(rt_sigaction) = A_YES | A_LIBERAL,
+    S(rt_sigprocmask) = A_YES | A_LIBERAL,
+    S(rt_sigpending) = A_YES | A_LIBERAL,
+    S(rt_sigtimedwait) = A_YES | A_LIBERAL,
+    S(rt_sigqueueinfo) = A_YES | A_LIBERAL,
+    S(rt_sigsuspend) = A_YES | A_LIBERAL,
+    S(mmap2) = A_YES | A_LIBERAL,
+    S(_sysctl) = A_YES | A_LIBERAL,
 #undef S
 };
 
 static const char *
 syscall_name(unsigned int id, char *buf)
 {
-  if (id < NUM_SYSCALLS && syscall_tab[id])
-    return syscall_tab[id];
+  if (id < NUM_SYSCALLS && syscall_names[id])
+    return syscall_names[id];
   else
     {
       sprintf(buf, "#%d", id);
@@ -221,8 +233,8 @@ syscall_name(unsigned int id, char *buf)
 static int
 syscall_by_name(char *name)
 {
-  for (unsigned int i=0; i<sizeof(syscall_tab)/sizeof(syscall_tab[0]); i++)
-    if (syscall_tab[i] && !strcmp(syscall_tab[i], name))
+  for (unsigned int i=0; i<NUM_SYSCALLS; i++)
+    if (syscall_names[i] && !strcmp(syscall_names[i], name))
       return i;
   if (name[0] == '#')
     name++;
@@ -238,19 +250,19 @@ syscall_by_name(char *name)
 }
 
 static int
-set_action(char *a)
+set_syscall_action(char *a)
 {
   char *sep = strchr(a, '=');
-  enum syscall_action act = SC_YES;
+  enum action act = A_YES;
   if (sep)
     {
       *sep++ = 0;
       if (!strcmp(sep, "yes"))
-       act = SC_YES;
+       act = A_YES;
       else if (!strcmp(sep, "no"))
-       act = SC_NO;
+       act = A_NO;
       else if (!strcmp(sep, "file"))
-       act = SC_FILENAME;
+       act = A_FILENAME;
       else
        return 0;
     }
@@ -258,12 +270,216 @@ set_action(char *a)
   int sys = syscall_by_name(a);
   if (sys < 0)
     die("Unknown syscall `%s'", a);
-  if (sys >= (int)NUM_ACTIONS)
+  if (sys >= NUM_ACTIONS)
     die("Syscall `%s' out of range", a);
   syscall_action[sys] = act;
   return 1;
 }
 
+/*** Path rules ***/
+
+struct path_rule {
+  char *path;
+  enum action action;
+  struct path_rule *next;
+};
+
+static struct path_rule default_path_rules[] = {
+  { "/etc/", A_YES },
+  { "/lib/", A_YES },
+  { "/usr/lib/", A_YES },
+  { "/opt/lib/", A_YES },
+  { "/usr/share/zoneinfo/", A_YES },
+  { "/usr/share/locale/", A_YES },
+  { "/dev/null", A_YES },
+  { "/dev/zero", A_YES },
+  { "/proc/meminfo", A_YES },
+  { "/proc/self/stat", A_YES },
+  { "/proc/self/exe", A_YES },                 // Needed by FPC 2.0.x runtime
+};
+
+static struct path_rule *user_path_rules;
+static struct path_rule **last_path_rule = &user_path_rules;
+
+static int
+set_path_action(char *a)
+{
+  char *sep = strchr(a, '=');
+  enum action act = A_YES;
+  if (sep)
+    {
+      *sep++ = 0;
+      if (!strcmp(sep, "yes"))
+       act = A_YES;
+      else if (!strcmp(sep, "no"))
+       act = A_NO;
+      else
+       return 0;
+    }
+
+  struct path_rule *r = xmalloc(sizeof(*r) + strlen(a) + 1);
+  r->path = (char *)(r+1);
+  strcpy(r->path, a);
+  r->action = act;
+  r->next = NULL;
+  *last_path_rule = r;
+  last_path_rule = &r->next;
+  return 1;
+}
+
+static enum action
+match_path_rule(struct path_rule *r, char *path)
+{
+  char *rr = r->path;
+  while (*rr)
+    if (*rr++ != *path++)
+      {
+       if (rr[-1] == '/' && !path[-1])
+         break;
+       return A_DEFAULT;
+      }
+  if (rr > r->path && rr[-1] != '/' && *path)
+    return A_DEFAULT;
+  return r->action;
+}
+
+/*** Environment rules ***/
+
+struct env_rule {
+  char *var;                   // Variable to match
+  char *val;                   // ""=clear, NULL=inherit
+  int var_len;
+  struct env_rule *next;
+};
+
+static struct env_rule *first_env_rule;
+static struct env_rule **last_env_rule = &first_env_rule;
+
+static struct env_rule default_env_rules[] = {
+  { "LIBC_FATAL_STDERR_", "1" }
+};
+
+static int
+set_env_action(char *a0)
+{
+  struct env_rule *r = xmalloc(sizeof(*r) + strlen(a0) + 1);
+  char *a = (char *)(r+1);
+  strcpy(a, a0);
+
+  char *sep = strchr(a, '=');
+  if (sep == a)
+    return 0;
+  r->var = a;
+  if (sep)
+    {
+      *sep++ = 0;
+      r->val = sep;
+    }
+  else
+    r->val = NULL;
+  *last_env_rule = r;
+  last_env_rule = &r->next;
+  r->next = NULL;
+  return 1;
+}
+
+static int
+match_env_var(char *env_entry, struct env_rule *r)
+{
+  if (strncmp(env_entry, r->var, r->var_len))
+    return 0;
+  return (env_entry[r->var_len] == '=');
+}
+
+static void
+apply_env_rule(char **env, int *env_sizep, struct env_rule *r)
+{
+  // First remove the variable if already set
+  int pos = 0;
+  while (pos < *env_sizep && !match_env_var(env[pos], r))
+    pos++;
+  if (pos < *env_sizep)
+    {
+      (*env_sizep)--;
+      env[pos] = env[*env_sizep];
+      env[*env_sizep] = NULL;
+    }
+
+  // What is the new value?
+  char *new;
+  if (r->val)
+    {
+      if (!r->val[0])
+       return;
+      new = xmalloc(r->var_len + 1 + strlen(r->val) + 1);
+      sprintf(new, "%s=%s", r->var, r->val);
+    }
+  else
+    {
+      pos = 0;
+      while (environ[pos] && !match_env_var(environ[pos], r))
+       pos++;
+      if (!(new = environ[pos]))
+       return;
+    }
+
+  // Add it at the end of the array
+  env[(*env_sizep)++] = new;
+  env[*env_sizep] = NULL;
+}
+
+static char **
+setup_environment(void)
+{
+  // Link built-in rules with user rules
+  for (int i=ARRAY_SIZE(default_env_rules)-1; i >= 0; i--)
+    {
+      default_env_rules[i].next = first_env_rule;
+      first_env_rule = &default_env_rules[i];
+    }
+
+  // Scan the original environment
+  char **orig_env = environ;
+  int orig_size = 0;
+  while (orig_env[orig_size])
+    orig_size++;
+
+  // For each rule, reserve one more slot and calculate length
+  int num_rules = 0;
+  for (struct env_rule *r = first_env_rule; r; r=r->next)
+    {
+      num_rules++;
+      r->var_len = strlen(r->var);
+    }
+
+  // Create a new environment
+  char **env = xmalloc((orig_size + num_rules + 1) * sizeof(char *));
+  int size;
+  if (pass_environ)
+    {
+      memcpy(env, environ, orig_size * sizeof(char *));
+      size = orig_size;
+    }
+  else
+    size = 0;
+  env[size] = NULL;
+
+  // Apply the rules one by one
+  for (struct env_rule *r = first_env_rule; r; r=r->next)
+    apply_env_rule(env, &size, r);
+
+  // Return the new env and pass some gossip
+  if (verbose > 1)
+    {
+      fprintf(stderr, "Passing environment:\n");
+      for (int i=0; env[i]; i++)
+       fprintf(stderr, "\t%s\n", env[i]);
+    }
+  return env;
+}
+
+/*** Syscall checks ***/
+
 static void
 valid_filename(unsigned long addr)
 {
@@ -309,47 +525,49 @@ valid_filename(unsigned long addr)
   msg("[%s] ", namebuf);
   if (file_access >= 3)
     return;
+
+  // Everything in current directory is permitted
   if (!strchr(namebuf, '/') && strcmp(namebuf, ".."))
     return;
+
+  // ".." anywhere in the path is forbidden
+  enum action act = A_DEFAULT;
+  if (strstr(namebuf, ".."))
+    act = A_NO;
+
+  // Scan user rules
+  for (struct path_rule *r = user_path_rules; r && !act; r=r->next)
+    act = match_path_rule(r, namebuf);
+
+  // Scan built-in rules
   if (file_access >= 2)
-    {
-      if ((!strncmp(namebuf, "/etc/", 5) ||
-          !strncmp(namebuf, "/lib/", 5) ||
-          !strncmp(namebuf, "/usr/lib/", 9) ||
-          !strncmp(namebuf, "/opt/lib/", 9))
-         && !strstr(namebuf, ".."))
-       return;
-      if (!strcmp(namebuf, "/dev/null") ||
-         !strcmp(namebuf, "/dev/zero") ||
-         !strcmp(namebuf, "/proc/meminfo") ||
-         !strcmp(namebuf, "/proc/self/stat") ||
-         !strcmp(namebuf, "/proc/self/exe") ||                 /* Needed by FPC 2.0.x runtime */
-         !strncmp(namebuf, "/usr/share/zoneinfo/", 20))
-       return;
-    }
-  die("Forbidden access to file `%s'", namebuf);
+    for (int i=0; i<ARRAY_SIZE(default_path_rules) && !act; i++)
+      act = match_path_rule(&default_path_rules[i], namebuf);
+
+  if (act != A_YES)
+    die("Forbidden access to file `%s'", namebuf);
 }
 
 static int
 valid_syscall(struct user *u)
 {
   unsigned int sys = u->regs.orig_eax;
-  enum syscall_action act = (sys < NUM_ACTIONS) ? syscall_action[sys] : SC_DEFAULT;
+  enum action act = (sys < NUM_ACTIONS) ? syscall_action[sys] : A_DEFAULT;
 
-  if (act & SC_LIBERAL)
+  if (act & A_LIBERAL)
     {
       if (filter_syscalls == 1)
-        act &= ~SC_LIBERAL;
+        act &= ~A_LIBERAL;
       else
-        act = SC_DEFAULT;
+        act = A_DEFAULT;
     }
   switch (act)
     {
-    case SC_YES:
+    case A_YES:
       return 1;
-    case SC_NO:
+    case A_NO:
       return 0;
-    case SC_FILENAME:
+    case A_FILENAME:
       valid_filename(u->regs.ebx);
       return 1;
     default: ;
@@ -565,7 +783,6 @@ box_inside(int argc, char **argv)
 {
   struct rlimit rl;
   char *args[argc+1];
-  char *env[] = { "LIBC_FATAL_STDERR_=1", NULL };
 
   memcpy(args, argv, argc * sizeof(char *));
   args[argc] = NULL;
@@ -602,7 +819,7 @@ box_inside(int argc, char **argv)
       signal(SIGCHLD, SIG_IGN);
       raise(SIGCHLD);
     }
-  execve(args[0], args, (pass_environ ? environ : env));
+  execve(args[0], args, setup_environment());
   die("execve(\"%s\"): %m", args[0]);
 }
 
@@ -616,16 +833,20 @@ Usage: box [<options>] -- <command> <arguments>\n\
 Options:\n\
 -a <level>\tSet file access level (0=none, 1=cwd, 2=/etc,/lib,..., 3=whole fs, 9=no checks; needs -f)\n\
 -c <dir>\tChange directory to <dir> first\n\
--e\t\tPass full environment of parent process\n\
+-e\t\tInherit full environment of the parent process\n\
+-E <var>\tInherit the environment variable <var> from the parent process\n\
+-E <var>=<val>\tSet the environment variable <var> to <val>; unset it if <var> is empty\n\
 -f\t\tFilter system calls (-ff=very restricted)\n\
 -i <file>\tRedirect stdin from <file>\n\
 -m <size>\tLimit address space to <size> KB\n\
 -o <file>\tRedirect stdout to <file>\n\
+-p <path>\tPermit access to the specified path (or subtree if it ends with a `/')\n\
+-p <path>=<act>\tDefine action for the specified path (<act>=yes/no)\n\
 -s <sys>\tPermit the specified syscall (be careful)\n\
 -s <sys>=<act>\tDefine action for the specified syscall (<act>=yes/no/file)\n\
 -t <time>\tSet run time limit (seconds, fractions allowed)\n\
 -T\t\tAllow syscalls for measuring run time\n\
--v\t\tBe verbose\n\
+-v\t\tBe verbose (use multiple times for even more verbosity)\n\
 -w <time>\tSet wall clock time limit (seconds, fractions allowed)\n\
 ");
   exit(1);
@@ -637,7 +858,7 @@ main(int argc, char **argv)
   int c;
   uid_t uid;
 
-  while ((c = getopt(argc, argv, "a:c:efi:m:o:s:t:Tvw:")) >= 0)
+  while ((c = getopt(argc, argv, "a:c:eE:fi:m:o:p:s:t:Tvw:")) >= 0)
     switch (c)
       {
       case 'a':
@@ -649,6 +870,10 @@ main(int argc, char **argv)
       case 'e':
        pass_environ = 1;
        break;
+      case 'E':
+       if (!set_env_action(optarg))
+         usage();
+       break;
       case 'f':
        filter_syscalls++;
        break;
@@ -661,15 +886,19 @@ main(int argc, char **argv)
       case 'o':
        redir_stdout = optarg;
        break;
+      case 'p':
+       if (!set_path_action(optarg))
+         usage();
+       break;
       case 's':
-       if (!set_action(optarg))
+       if (!set_syscall_action(optarg))
          usage();
        break;
       case 't':
        timeout = 1000*atof(optarg);
        break;
       case 'T':
-       syscall_action[__NR_times] = SC_YES;
+       syscall_action[__NR_times] = A_YES;
        break;
       case 'v':
        verbose++;