syz-verifier: add the starting point of syz-verifier

author: Mara Mihali <maramihali@google.com> 2021-06-25 08:20:28 +0000
committer: Dmitry Vyukov <dvyukov@google.com> 2021-06-30 09:35:14 +0200
commit: db933a8151125a7da3c90276d3757713a25e6036 (patch)
tree: e073d671373849eb5619bb8cca6c0256aff23ee2 /syz-verifier
parent: 5f9ef4d06157d279b6522f7a8f34815fcb6d5b57 (diff)
2 files changed, 486 insertions, 0 deletions
diff --git a/syz-verifier/main.go b/syz-verifier/main.go
new file mode 100755
index 000000000..bf24d241e
--- /dev/null
+++ b/syz-verifier/main.go
@@ -0,0 +1,331 @@
+// Copyright 2021 syzkaller project authors. All rights reserved.
+// Use of this source code is governed by Apache 2 LICENSE that can be found in the LICENSE file.
+package main
+
+import (
+	"flag"
+	"log"
+	"math/rand"
+	"net"
+	"path/filepath"
+	"strconv"
+	"sync"
+	"time"
+
+	"github.com/google/syzkaller/pkg/instance"
+	"github.com/google/syzkaller/pkg/mgrconfig"
+	"github.com/google/syzkaller/pkg/osutil"
+	"github.com/google/syzkaller/pkg/report"
+	"github.com/google/syzkaller/pkg/rpctype"
+	"github.com/google/syzkaller/pkg/tool"
+	"github.com/google/syzkaller/prog"
+	"github.com/google/syzkaller/syz-verifier/verf"
+	"github.com/google/syzkaller/vm"
+)
+
+// Verifier TODO.
+type Verifier struct {
+	pools  map[int]*poolInfo
+	vmStop chan bool
+	// Location of a working directory for all VMs for the syz-verifier process.
+	// Outputs here include:
+	// - <workdir>/crashes/<OS-Arch>/*: crash output files grouped by OS/Arch
+	// - <workdir>/corpus.db: corpus with interesting programs
+	// - <workdir>/<OS-Arch>/instance-x: per VM instance temporary files
+	// grouped by OS/Arch
+	workdir     string
+	crashdir    string
+	target      *prog.Target
+	runnerBin   string
+	executorBin string
+	choiceTable *prog.ChoiceTable
+	rnd         *rand.Rand
+	progIdx     int
+	addr        string
+}
+
+// RPCServer is a wrapper around the rpc.Server. It communicates with  Runners,
+// generates programs and sends complete Results for verification.
+type RPCServer struct {
+	vrf   *Verifier
+	port  int
+	mu    sync.Mutex
+	pools map[int]*poolInfo
+	progs map[int]*progInfo
+}
+
+// poolInfo contains kernel-specific information for spawning virtual machines
+// and reporting crashes. It also keeps track of the Runners executing on
+// spawned VMs, what programs have been sent to each Runner and what programs
+// have yet to be sent on any of the Runners.
+type poolInfo struct {
+	cfg      *mgrconfig.Config
+	pool     *vm.Pool
+	Reporter report.Reporter
+	//  vmRunners keep track of what programs have been sent to each Runner.
+	//  There is one Runner executing per VM instance.
+	vmRunners map[int][]*progInfo
+	// progs stores the programs that haven't been sent to this kernel yet but
+	// have been sent to at least one kernel.
+	progs []*progInfo
+}
+
+type progInfo struct {
+	prog       *prog.Prog
+	idx        int
+	serialized []byte
+	res        []*verf.Result
+	// left contains the indices of kernels that haven't sent results for this
+	// program yet.
+	left map[int]bool
+}
+
+func main() {
+	var cfgs tool.CfgsFlag
+	flag.Var(&cfgs, "configs", "list of kernel-specific comma-sepatated configuration files ")
+	flagDebug := flag.Bool("debug", false, "dump all VM output to console")
+	flag.Parse()
+	pools := make(map[int]*poolInfo)
+	for idx, cfg := range cfgs {
+		var err error
+		pi := &poolInfo{}
+		pi.cfg, err = mgrconfig.LoadFile(cfg)
+		if err != nil {
+			log.Fatalf("%v", err)
+		}
+		pi.pool, err = vm.Create(pi.cfg, *flagDebug)
+		if err != nil {
+			log.Fatalf("%v", err)
+		}
+		pools[idx] = pi
+	}
+
+	cfg := pools[0].cfg
+	workdir, target, sysTarget, addr := cfg.Workdir, cfg.Target, cfg.SysTarget, cfg.RPC
+	for idx := 1; idx < len(pools); idx++ {
+		cfg := pools[idx].cfg
+
+		// TODO: pass the configurations that should be the same for all
+		// kernels in a default config file in order to avoid this checks and
+		// add testing
+		if workdir != cfg.Workdir {
+			log.Fatalf("working directory mismatch")
+		}
+		if target != cfg.Target {
+			log.Fatalf("target mismatch")
+		}
+		if sysTarget != cfg.SysTarget {
+			log.Fatalf("system target mismatch")
+		}
+		if addr != pools[idx].cfg.RPC {
+			log.Fatalf("tcp address mismatch")
+		}
+	}
+
+	exe := sysTarget.ExeExtension
+	runnerBin := filepath.Join(cfg.Syzkaller, "bin", target.OS+"_"+target.Arch, "syz-runner"+exe)
+	if !osutil.IsExist(runnerBin) {
+		log.Fatalf("bad syzkaller config: can't find %v", runnerBin)
+	}
+	execBin := cfg.ExecutorBin
+	if !osutil.IsExist(execBin) {
+		log.Fatalf("bad syzkaller config: can't find %v", execBin)
+	}
+
+	crashdir := filepath.Join(workdir, "crashes")
+	osutil.MkdirAll(crashdir)
+	for idx := range pools {
+		OS, Arch := target.OS, target.Arch
+		targetPath := OS + "-" + Arch + "-" + strconv.Itoa(idx)
+		osutil.MkdirAll(filepath.Join(workdir, targetPath))
+		osutil.MkdirAll(filepath.Join(crashdir, targetPath))
+	}
+
+	for idx, pi := range pools {
+		var err error
+		pi.Reporter, err = report.NewReporter(pi.cfg)
+		if err != nil {
+			log.Fatalf("failed to create reporter for instance-%d: %v", idx, err)
+		}
+		pi.vmRunners = make(map[int][]*progInfo)
+		pi.progs = make([]*progInfo, 0)
+	}
+
+	calls := make(map[*prog.Syscall]bool)
+	for _, id := range cfg.Syscalls {
+		calls[target.Syscalls[id]] = true
+	}
+
+	vrf := &Verifier{
+		workdir:     workdir,
+		crashdir:    crashdir,
+		pools:       pools,
+		target:      target,
+		choiceTable: target.BuildChoiceTable(nil, calls),
+		rnd:         rand.New(rand.NewSource(time.Now().UnixNano() + 1e12)),
+		runnerBin:   runnerBin,
+		executorBin: execBin,
+		addr:        addr,
+	}
+
+	srv, err := startRPCServer(vrf)
+	if err != nil {
+		log.Fatalf("failed to initialise RPC server: %v", err)
+	}
+
+	for idx, pi := range pools {
+		go func(pi *poolInfo, idx int) {
+			for { // TODO: implement support for multiple VMs per Pool.
+				inst, err := pi.pool.Create(0)
+				if err != nil {
+					log.Fatalf("failed to create instance: %v", err)
+				}
+
+				fwdAddr, err := inst.Forward(srv.port)
+				if err != nil {
+					log.Fatalf("failed to set up port forwarding: %v", err)
+				}
+
+				runnerBin, err := inst.Copy(vrf.runnerBin)
+				if err != nil {
+					log.Fatalf(" failed to copy runner binary: %v", err)
+				}
+				_, err = inst.Copy(vrf.executorBin)
+				if err != nil {
+					log.Fatalf("failed to copy executor binary: %v", err)
+				}
+
+				cmd := instance.RunnerCmd(runnerBin, fwdAddr, vrf.target.OS, vrf.target.Arch, idx, 0)
+				outc, errc, err := inst.Run(pi.cfg.Timeouts.VMRunningTime, vrf.vmStop, cmd)
+				if err != nil {
+					log.Fatalf("failed to start runner: %v", err)
+				}
+
+				inst.MonitorExecution(outc, errc, pi.Reporter, vm.ExitTimeout)
+				srv.cleanup(idx, 0)
+			}
+		}(pi, idx)
+	}
+
+	select {}
+}
+
+func startRPCServer(vrf *Verifier) (*RPCServer, error) {
+	srv := &RPCServer{
+		vrf:   vrf,
+		pools: vrf.pools,
+		progs: make(map[int]*progInfo),
+	}
+
+	s, err := rpctype.NewRPCServer(vrf.addr, "Verifier", srv)
+	if err != nil {
+		return nil, err
+	}
+
+	log.Printf("serving rpc on tcp://%v", s.Addr())
+	srv.port = s.Addr().(*net.TCPAddr).Port
+
+	go s.Serve()
+	return srv, nil
+}
+
+// Connect notifies the RPCServer that a new Runner was started.
+func (srv *RPCServer) Connect(a *rpctype.RunnerConnectArgs, r *int) error {
+	srv.mu.Lock()
+	defer srv.mu.Unlock()
+	pool, vm := a.Pool, a.VM
+	srv.pools[pool].vmRunners[vm] = nil
+	return nil
+}
+
+// NextExchange is called when a Runner requests a new program to execute and,
+// potentially, wants to send a new Result to the RPCServer.
+func (srv *RPCServer) NextExchange(a *rpctype.NextExchangeArgs, r *rpctype.NextExchangeRes) error {
+	srv.mu.Lock()
+	defer srv.mu.Unlock()
+
+	if a.Info.Calls != nil {
+		res := &verf.Result{
+			Pool:   a.Pool,
+			Hanged: a.Hanged,
+			Info:   a.Info,
+		}
+		if srv.newResult(res, a.ProgIdx) {
+			for idx, prog := range srv.progs {
+				if a.ProgIdx == prog.idx {
+					if !verf.Verify(prog.res, prog.prog) {
+						log.Printf("mismatch found for %+v", prog.prog)
+					}
+					delete(srv.progs, idx)
+				}
+			}
+		}
+	}
+
+	prog, pi := srv.newProgram(a.Pool, a.VM)
+	r.RPCProg = rpctype.RPCProg{Prog: prog, ProgIdx: pi}
+	return nil
+}
+
+// newProgram returns a new program for the Runner identified by poolIdx and
+// vmIdx and the program's index.
+func (srv *RPCServer) newProgram(poolIdx, vmIdx int) ([]byte, int) {
+	pool := srv.pools[poolIdx]
+	if len(pool.progs) == 0 {
+		prog, progIdx := srv.vrf.generate()
+		pi := &progInfo{
+			prog:       prog,
+			idx:        progIdx,
+			serialized: prog.Serialize(),
+			res:        make([]*verf.Result, 0),
+			left:       make(map[int]bool),
+		}
+		for idx, pool := range srv.pools {
+			pool.progs = append(pool.progs, pi)
+			pi.left[idx] = true
+		}
+		srv.progs[progIdx] = pi
+	}
+	p := pool.progs[0]
+	pool.vmRunners[vmIdx] = append(pool.vmRunners[vmIdx], p)
+	pool.progs = pool.progs[1:]
+	return p.serialized, p.idx
+}
+
+// generate will return a newly generated program and its index.
+func (vrf *Verifier) generate() (*prog.Prog, int) {
+	vrf.progIdx++
+	return vrf.target.Generate(vrf.rnd, prog.RecommendedCalls, vrf.choiceTable), vrf.progIdx
+}
+
+// newResult is called when a Runner sends a new Result. It returns true if all
+// Results from the corresponding programs have been received and they can be
+// sent for verification. Otherwise, it returns false.
+func (srv *RPCServer) newResult(res *verf.Result, idx int) bool {
+	for _, prog := range srv.progs {
+		if prog.idx == idx {
+			prog.res = append(prog.res, res)
+			delete(prog.left, res.Pool)
+			return len(prog.left) == 0
+		}
+	}
+	return false
+}
+
+// cleanup is called when a vm.Instance crashes.
+func (srv *RPCServer) cleanup(poolIdx, vmIdx int) {
+	srv.mu.Lock()
+	defer srv.mu.Unlock()
+	progs := srv.pools[poolIdx].vmRunners[vmIdx]
+	delete(srv.pools[poolIdx].vmRunners, vmIdx)
+	for idx, prog := range progs {
+		delete(prog.left, poolIdx)
+		if len(prog.left) == 0 {
+			if !verf.Verify(prog.res, prog.prog) {
+				log.Printf("mismatch found for %+v", prog.prog)
+			}
+			delete(srv.progs, idx)
+			continue
+		}
+	}
+}
diff --git a/syz-verifier/main_test.go b/syz-verifier/main_test.go
new file mode 100644
index 000000000..51437b148
--- /dev/null
+++ b/syz-verifier/main_test.go
@@ -0,0 +1,155 @@
+// Copyright 2021 syzkaller project authors. All rights reserved.
+// Use of this source code is governed by Apache 2 LICENSE that can be found in the LICENSE file.
+package main
+
+import (
+	"math/rand"
+	"testing"
+	"time"
+
+	"github.com/google/go-cmp/cmp"
+	"github.com/google/syzkaller/pkg/rpctype"
+	"github.com/google/syzkaller/prog"
+	"github.com/google/syzkaller/syz-verifier/verf"
+)
+
+var (
+	srv *RPCServer
+)
+
+func setup(t *testing.T) {
+	target, err := prog.GetTarget("test", "64")
+	if err != nil {
+		t.Fatalf("failed to initialise test target: %v", err)
+	}
+	vrf := Verifier{
+		target:      target,
+		choiceTable: target.DefaultChoiceTable(),
+		rnd:         rand.New(rand.NewSource(time.Now().UnixNano())),
+		progIdx:     3,
+	}
+	srv, err = startRPCServer(&vrf)
+	if err != nil {
+		t.Fatalf("failed to initialise RPC server: %v", err)
+	}
+	srv.pools = map[int]*poolInfo{
+		1: {
+			vmRunners: map[int][]*progInfo{
+				0: {&progInfo{idx: 1, left: map[int]bool{1: true, 2: true}}},
+			},
+			progs: []*progInfo{{idx: 3, left: map[int]bool{1: true}}},
+		},
+		2: {vmRunners: map[int][]*progInfo{
+			2: {&progInfo{idx: 1, left: map[int]bool{1: true, 2: true}}},
+		},
+			progs: []*progInfo{},
+		},
+	}
+	srv.progs = map[int]*progInfo{
+		1: {idx: 1, left: map[int]bool{1: true, 2: true}},
+		3: {idx: 3, left: map[int]bool{1: true}},
+	}
+}
+
+func TestNewProgram(t *testing.T) {
+	tests := []struct {
+		name                             string
+		pool, vm, retProgIdx, vrfProgIdx int
+		progs                            map[int]*progInfo
+	}{
+		{
+			name:       "NewProgram doesn't generate new program",
+			pool:       1,
+			vm:         1,
+			retProgIdx: 3,
+			vrfProgIdx: 3,
+			progs: map[int]*progInfo{
+				1: {idx: 1, left: map[int]bool{1: true, 2: true}},
+				3: {idx: 3, left: map[int]bool{2: true}},
+			},
+		},
+		{
+			name:       "NewProgram generates new program",
+			pool:       2,
+			vm:         2,
+			retProgIdx: 4,
+			vrfProgIdx: 4,
+			progs: map[int]*progInfo{
+				1: {idx: 1, left: map[int]bool{1: true, 2: true}},
+				3: {idx: 3, left: map[int]bool{2: true}},
+				4: {idx: 4, left: map[int]bool{1: true, 2: true}},
+			},
+		},
+	}
+	for _, test := range tests {
+		t.Run(test.name, func(t *testing.T) {
+			setup(t)
+			_, gotProgIdx := srv.newProgram(test.pool, test.vm)
+			if gotProgIdx != test.retProgIdx {
+				t.Errorf("srv.newProgram returned idx: got %d, want %d", gotProgIdx, test.retProgIdx)
+			}
+			if srv.vrf.progIdx != test.vrfProgIdx {
+				t.Errorf("srv.progIdx: got %d, want %d", srv.vrf.progIdx, test.vrfProgIdx)
+			}
+		})
+	}
+}
+
+func TestNewResult(t *testing.T) {
+	tests := []struct {
+		name      string
+		idx       int
+		res       verf.Result
+		left      map[int]bool
+		wantReady bool
+	}{
+		{
+			name:      "Results ready for verification",
+			idx:       3,
+			res:       verf.Result{Pool: 1},
+			wantReady: true,
+			left:      map[int]bool{},
+		},
+		{
+			name:      "No results ready for verification",
+			idx:       1,
+			res:       verf.Result{Pool: 1},
+			wantReady: false,
+			left: map[int]bool{
+				2: true,
+			},
+		},
+	}
+	for _, test := range tests {
+		t.Run(test.name, func(t *testing.T) {
+			setup(t)
+			gotReady := srv.newResult(&test.res, test.idx)
+			if test.wantReady != gotReady {
+				t.Errorf("srv.newResult: got %v want %v", gotReady, test.wantReady)
+			}
+			if diff := cmp.Diff(test.left, srv.progs[test.idx].left); diff != "" {
+				t.Errorf("srv.left mismatch (-want +got):\n%s", diff)
+			}
+		})
+	}
+}
+
+func TestConnect(t *testing.T) {
+	setup(t)
+	a := &rpctype.RunnerConnectArgs{
+		Pool: 1,
+		VM:   1,
+	}
+	if err := srv.Connect(a, nil); err != nil {
+		t.Fatalf("srv.Connect failed: %v", err)
+	}
+	want, got := map[int][]*progInfo{
+		0: {&progInfo{idx: 1, left: map[int]bool{1: true, 2: true}}},
+		1: nil,
+	}, srv.pools[a.Pool].vmRunners
+	if diff := cmp.Diff(want, got, cmp.AllowUnexported(progInfo{})); diff != "" {
+		t.Errorf("srv.progs[a.Name] mismatch (-want +got):\n%s", diff)
+	}
+}
+
+// TODO: add integration tests for NewExchange and cleanup.
author	Mara Mihali <maramihali@google.com>	2021-06-25 08:20:28 +0000
committer	Dmitry Vyukov <dvyukov@google.com>	2021-06-30 09:35:14 +0200
commit	db933a8151125a7da3c90276d3757713a25e6036 (patch)
tree	e073d671373849eb5619bb8cca6c0256aff23ee2 /syz-verifier
parent	5f9ef4d06157d279b6522f7a8f34815fcb6d5b57 (diff)