BPF 学习系列之 - 用户空间探针 - uprobes 与 uretprobes

type

Post

status

Published

date

Jan 6, 2023

slug

2023/01/06/bpf-example-program-uprobes

summary

1 uprobes

般来说，uprobes 是内核在程序特定指令执行之前插入该指令集的钩子。附加 uprobes 到程序的不同版本时要注意，因为在不同版本之间函数签名可能会有所变化。如果你想在程序不同版本上运行 BPF 程序，唯一的方法是确保程序不同版本中函数签名是相同的。在 Linux 中你可以使用 nm 命令列出 ELF 对象文件中包括的所有符号，并检查跟踪指令在程序中是否仍然存在

下面是示例程序:

1.1 main.go


package main

import "fmt"

func main()  {
    fmt.Println("Hello, BPF")
}

我们可以使用go build -o hello-bpf main.go 编译这个Go程序。你能使用命令 nm 获取二进制文件中包括所有的指令点信息。nm 程序是 GNU开发工具包中的程序，可以用来列出目标文件中包括的符号。如果使用 main关键字对符号进行过滤，将得到与下面类似的列表:

有了符号列表后，你可以在指令执行时进行跟踪，即使多个进程同时执行一个二进制程序，我们也能够使用该方法对程序指令进行跟踪。

为了跟踪上面 Go 程序中的 main 函数什么时候执行，我们可以编写 BPF 程序并将其附加到 uprobe 上，在任何进程调用该指令之前 uprobe 将产生中断:

1.2 example.py


from bcc import BPF

bpf_source = """
int trace_go_main(struct pt_regs *ctx) {
  u64 pid = bpf_get_current_pid_tgid();
  bpf_trace_printk("New hello-bpf process running with PID: %d\\n", pid);
  return 0;
}
"""

bpf = BPF(text = bpf_source)
bpf.attach_uprobe(name = "./hello-bpf", sym = "main.main", fn_name = "trace_go_main")
bpf.trace_print()

使用函数 bpf_get_current_pid_tgid 获取 hello-bpf 程序的进程标识符 (PID)。

将该程序附加到 uprobe。这个调用需要知道要跟踪的对象 hello-bpf 此为目标文件的绝对路径。程序还需要设置正在跟踪对象的符号 main.main，及要运行的BPF 程序。这样，每次系统中运行 hello-bpf 时我们将在跟踪中获得一条新日志。

1.3 运行结果展示

2 uretprobes

uretprobes 是 kretprobes 并行探针，适用于用户空间程序使用。它将 BPF 程序附加到指令返回值之上，允许通过 BPF 代码从寄存器中访问返回值。

uprobes 和 uretprobes 的结合使用可以编写更复杂的 BPF 程序。两者的结合可以为我们提供应用程序运行时的全面了解。你可以在函数运行前及结束后注入跟踪代码，则能够收集更多数据来衡量应用程序行为。一个常见的用例是在无须修改应用程序的前提下，衡量一个函数执行所需的时间。

我们将再次使用介绍 “uprobes” 时的 Go程序示例，测量主函数的执行时间。这个 BPF 程序比前面的示例要长，因此，我们将它分为不同的代码块:

2.1 example.py


from bcc import BPF

bpf_source = """
BPF_HASH(cache, u64, u64);

int trace_start_time(struct pt_regs *ctx) {
  u64 pid = bpf_get_current_pid_tgid();
  u64 start_time_ns = bpf_ktime_get_ns();
  cache.update(&pid, &start_time_ns);
  return 0;
}
"""

bpf_source += """
int print_duration(struct pt_regs *ctx) {
  u64 pid = bpf_get_current_pid_tgid();
  u64 *start_time_ns = cache.lookup(&pid);
  if (start_time_ns == 0) {
    return 0;
  }
  u64 duration_ns = bpf_ktime_get_ns() - *start_time_ns;
  bpf_trace_printk("Function call duration: %d\\n", duration_ns);
  return 0;
}
"""

bpf = BPF(text = bpf_source)
bpf.attach_uprobe(name = "./hello-bpf", sym = "main.main", fn_name = "trace_start_time")
bpf.attach_uretprobe(name = "./hello-bpf", sym = "main.main", fn_name = "print_duration")
bpf.trace_print()