首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
何人听我楚狂声
字节跳动_抖音_后端开发工程师
发布于浙江
关注
已关注
取消关注
到现在想起来还很气!!
@何人听我楚狂声:
一次失败的项目实践——春节七天乐(不起来)
缘起最初是在过年回家的高铁上,在知乎上看到了这篇文章:将Go程序跑在裸机上,大致想法是通过实现一遍系统接口,来接管 golang 程序的各种系统调用和中断之类的。感觉这个想法十分有趣。作者还用 golang 写了一个 x86 os:eggos,完成度相当之高。由于是从底层魔改了 golang 的运行时,用户程序完全无感知,所以各种 golang 的第三方库都可以直接使用。作者甚至实现了一个支持 TCP/IP 的协议栈,使得一些网络库可以直接使用。看的我心潮澎湃。搜了搜一些前人的工作,发现这个想法很早就被人提出来过。2018 年 OSDI 会议上就有一篇论文,讲述了使用高级语言实现操作系统的好处和代价,幻灯片在这儿。另外,相关的实现这几年也是有的,比如 gopher-os,一个验证性质的内核,只是为了证明使用 golang 实现操作系统是可行的。另外还有 MIT 的一个博士论文项目 Buscuit,思路是 hack 编译器使得能够编译到裸机,这个项目完成度更高,实现了部分 POSIX 接口,甚至可以在上面跑 redis 和 nginx。在研究资料过程中,发现了一个共同点:都是基于 x86 架构实现的。我之前用 c 写过一个小内核,是基于 RISC-V 架构,RISC-V 的汇编和各种机制都十分简单,写起来也很舒服。于是就有了这么个想法:用 go 实现一个 RISC-V 的操作系统。说干就干!到家第二天就开始搞起来了。就是干!做一个项目,很重要的一点,就是起名字(bushi但我确实首先想到了一个绝妙的名字:goose太妙了兄弟们!首先 go 是原生支持交叉编译到 RISC-V 64 位的可执行文件的,这是好事。只需要在 go build 命令之前加上 GOOS=linux GOARCH=riscv64 即可,非常方便。虚拟机照例使用的是 qemu,平台还是 virt。virt 平台的内存布局:0x80000000 以上是物理内存区域,0x80000000 以下是 mmio 区域(大概就是把设备的内存映射到了这片区域,操作这块内存等同于操作这个设备)。virt 启动时会把 pc 设置为 0x80000000然而正常编译的 go 可执行文件,由于运行在用户态虚拟地址上,entry 的地址都是低地址,大概 0x10000 左右。好在 go 提供了一个链接标志 -T 来指定 TEXT 段的起始地址,可以用这个标志把整个代码段放在高地址内存处,同时还可以通过 -E 来指定入口的标志,这样就可以写一个函数来接管 go 的启动过程(go 程序的入口不是 main 函数,而是 _entry 函数,这个函数用来做一些初始化工作)然而还有一个严重的问题:我们指定了入口函数,但是没有办法指定这个函数的起始地址,就没法把这个函数放到 0x80000000 处,virt 在启动的时候,0x80000000 就可能是一堆啥也不知道的代码。通常,如果是 c,我们可以通过编写链接脚本来解决这个问题,而且非常简单:直接指定好入口标记的地址,一行就完事。可是这是 go。在查了一些资料后,在 stackoverflow 上看到了这个提问,使用外部链接器而非 go 自己内置的链接器,这样就可以指定链接脚本了。但是尝试了下之后,不太可行。go 的可执行文件中除了一些已知的 text 段、bss 段、rodata 段和 data 段,还有一些自己的乱七八糟的段,这些都必须在链接脚本里显式指定,几乎不太可能。于是更换思路,入口可以写一段 c 代码,这段 c 代码动态获取 go 代码的入口然后跳转过去。由于 go 代码的入口只存在于 elf 文件中,在加载后的内存映像中是没有这个信息的。所以可以把这个 elf 文件直接以二进制的形式链接到 c 程序的 data 段,可以为这段保存二进制的内存开始和结尾指定一个名字,我是用的是 _binary_kernel_elf_start 和 _binary_kernel_elf_end。这样在 c 代码中就可以快速找到了。而 c 代码的作用,就是解析这段内存中保存的 elf 文件,把需要载入内存的段复制到内存对应的地址处,再跳转到 elf 指定的 entry 处即可。这里贴一下入口的汇编代码,大概就是设置好栈就跳转进 c 函数中,同时指定了 data 段中的两个符号间的一段内存是编译好的 go 可执行文件: .section .text.entry .globl _start # 仅仅是设置了 sp 就跳转到 main_start: la sp, bootstacktop call bootmain # 启动线程的内核栈 bootstack 放置在 bss 段的 stack 标记处 .section .bss.stack .align 12 .global bootstackbootstack: # 以下 16K 字节的空间作为 OS 的启动栈 .space 0x4000 .global bootstacktopbootstacktop: .section .data .globl _binary_kernel_elf_start .globl _binary_kernel_elf_end_binary_kernel_elf_start: .incbin "kernel.elf"_binary_kernel_elf_end:C 函数 bootmain 也十分简单,解析 elf 文件,读取程序头表,把各个段都加载到需要的物理内存处:voidbootmain(){ struct elfhdr *elf; struct proghdr *ph, *eph; void (*entry)(void); uchar *pa; elf = (struct elfhdr *)(_binary_kernel_elf_start); if (elf->magic != ELF_MAGIC) return; ph = (struct proghdr *)((uchar *)elf + elf->phoff); eph = ph + elf->phnum; for (; ph < eph; ph++) { pa = (uchar *)ph->paddr; readseg(pa, ph->filesz, ph->off); if (ph->memsz > ph->filesz) clearMem(pa + ph->filesz, ph->memsz - ph->filesz); } entry = (void (*)(void))(elf->entry); entry();}最后 entry 的位置就是从 elf 头中读出来的 go 入口函数地址,跳转过去即可。go 入口函数是 rt0 函数,是一个汇编函数。go 使用的汇编格式是 PLAN9 汇编,起源于一个上古操作系统 plan9。这个格式的汇编支持多个指令集架构,但是很神奇的是找不到任何官方的文档描述不同的指令集架构中这个格式的汇编支持哪些指令。x86 的还能找到点资料,因为 PLAN9 汇编的例子基本是 x86 的,RV64 则是一点痕迹都没有,完全靠猜(通过各种摸索,最后终于写出了入口:#include "textflag.h"TEXT ·rt0(SB),NOSPLIT|NOFRAME,$0 CALL ·kernelStackTop(SB) MOV 0(SP), A1 MOV A1, SP CALL ·kmain(SB) UNDEF RET这个格式也蛮阴间的……做的事情基本一致,调用 kernelStackTop 获得预先分配好的栈顶地址,并把 SP 指针指向那个地址,随后就调用 go 语言的入口了:kmain。唯一的 go 文件写得也很简单:type stack [16 * 4096]bytetype virtualAddress uintptrvar ( kstack stack)//go:nosplitfunc (s *stack) top() virtualAddress { stackTop := uintptr(unsafe.Pointer(&s[0])) + unsafe.Sizeof(*s) // Align to 16 bytes. stackTop = stackTop &^ 0xf return virtualAddress(stackTop)}//go:nosplitfunc kernelStackTop() uint64 { return uint64(kstack.top())}//go:nosplitfunc rt0()//go:nosplitfunc kmain() { for { }}预先分配了 stack 数组作为内核栈,kmain 啥也没干,就是无限循环。注意每个函数都有一个编译标识://go:nosplit,表示让编译器不要插入检查这个函数的是否会栈溢出的代码,同时还有一个隐式的用途:阻止编译器在函数中插入 gc 检查点。如果触发了 gc,以现在这个啥也没有的裸机,gc 是完全不支持的(当然 gc 也不应该在内核中跑,更多的处理用户空间的堆)这样 Makefile 就可以这样写了:Image: kernel.elf $(CC) $(CFLAGS) -fno-pic -O -nostdinc -I. -c boot/boot.c $(CC) $(CFLAGS) -fno-pic -nostdinc -I. -c boot/boot_header.S $(LD) $(LDFLAGS) -T image.ld -o Image boot.o boot_header.okernel.elf: GOOS=linux GOARCH=riscv64 go build -o kernel.elf -ldflags '-E goose/kernel.rt0 -T 0x80200000' -gcflags "-N -l" ./kmainkernel.elf 编译 go 的 elf 文件,指定入口函数为 goose/kernel.rt0,TEXT 段的起始地址为 0x80200000。而 Image 则是编译了上面说的加载内核的入口代码,image.ld 中指定了将入口函数放在 TEXT 段的入口,并把 TEXT 段放在 0x80000000 位置。/* 执行入口 */ENTRY(_start)/* 数据存放起始地址 */BASE_ADDRESS = 0x80000000;SECTIONS{ /* . 表示当前地址(location counter) */ . = BASE_ADDRESS; /* start 符号表示全部的开始位置 */ kernel_start = .; text_start = .; /* .text 字段 */ .text : { /* 把 entry 函数放在最前面 */ *(.text.entry) /* 要链接的文件的 .text 字段集中放在这里 */ *(.text .text.*) } ...}妥!因为兴趣很大,整个春节我亲戚都没有走好,整天就是憋在屋里收集资料,在外面也是发呆想思路,魔怔了一样。大失败噔噔咚!在把内核加载到 qemu 开始运行后,debug 看到卡死在把程序段加载到内存中。于是用 readelf 检查了一下 go build 出来的 elf 文件,发现了这个诡异的东西Type Offset VirtAddr PhysAddr FileSiz MemSiz Flags Align PHDR 0x0000000000000040 0x00000000801ff040 0x00000000801ff040 0x0000000000000188 0x0000000000000188 R 0x10000 NOTE 0x0000000000000f9c 0x00000000801fff9c 0x00000000801fff9c 0x0000000000000064 0x0000000000000064 R 0x4 LOAD 0xffffffffffff1000 0x00000000801f0000 0x00000000801f0000 0x0000000000063300 0x0000000000063300 R E 0x10000 LOAD 0x0000000000060000 0x0000000080260000 0x0000000080260000 0x000000000006adb8 0x000000000006adb8 R 0x10000 ...注意第三段的 Offset 是 0xffffffffffff1000 这个大的吓人的数。Offset 是这个段的内容在文件中存放的位置相对于文件开头的偏移。这个 elf 文件才几十 KB,哪来这么大的偏移?即使加载到内存中,virt 计算机的默认物理内存大小也只有 128 MB,直接炸裂百思不得其解,于是开始试验起来,最后发现,只要加上 -T 这个链接参数,就会出现这种情况。但是不加又不行,这些内存段不能被加载到低地址上,因为那是 mmio 的位置。于是我去 go 的 github 仓库里发了个 issue:cmd/link: wrong program header offset when cross-compile to riscv64 when setting -T text alignment。描述了一下后,得到的回答是:看来是 RV64 对 -T 的支持不太完善……于是这个项目就被搁置到了现在,可惜了我想的好名字/(ㄒoㄒ)/~~ 只能期待后续 go 官方能修复这个问题,但是感觉 go 对 RV64 不是很上心,原生支持交叉编译到 RV64 也是近几年才合进主线的……很气,转投 Rust 去了!
点赞 20
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
不愿透露姓名的神秘牛友
09-01 23:18
美团后端一面面经
开头自我介绍,问下base地要求,问下在哪里学习的知识1.项目中有什么自己比较了解的点?讲了下分布式锁,threadlocal,之后项目没怎么问,开始主攻八股2.java的集合都有什么,其中有什么线程安全的,通过什么实现线程安全的3.讲一下线程池参数,拒绝策略都有什么4.java的锁都有什么,底层分别是什么5.springboot启动流程(不会)6.mysql用过什么索引,怎么知道用没用索引,讲一下索引底层原理,b+树优势,数据库部署都有哪些方式7.怎么进行数据库和缓存的同步的,怎么保证一致性,讲一下分库分表8.redis缓存三兄弟,常用数据类型,hll是干什么的9.jvm用过什么启动参数,j...
查看14道真题和解析
点赞
评论
收藏
分享
09-04 11:55
门头沟学院 测试工程师
准备秋招反而躺平上了
准备面试实习的时候天天紧张够呛,好不容易找到实习之后发现越实习越菜,呆了两个月打算跑路准备秋招,现在属于是八股也没捡起来,还不如找暑期水平,实习偷的内容看的也半斤八两。还能有班上吗真服了
我的秋招日记
点赞
评论
收藏
分享
07-10 14:08
已编辑
江西农业大学 Java
笔试做项目
咋感觉是白嫖呢
拒绝无效加班的小学生...:
期望3k吗?java这辈子有了
点赞
评论
收藏
分享
08-21 10:02
已编辑
门头沟学院 Java
这是PUA吗,我第一反应不舒服
java25应届深圳ERP系统大概率驻场开发出差7k,转之前需自带电脑,各位牛友锐评一下,后来打电话来说是开玩笑。。。
那一天的Java_J...:
他在试探你呢,这种公司的官场味都溢出来了
点赞
评论
收藏
分享
09-03 22:01
南京信息工程大学 Web前端
大三了,突然感觉好空虚
本人双一流软工,想要直接就业(有没有人来骂醒我)。大三后,学校的课比较少了,在考虑要不要翘课去实习。有没有大佬可以给我点建议,帮我规划一下路线。之前想的是跟导师做项目,这样个人时间也好分配一些。最近想要去实习的愿望愈加浓烈。
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
面试问题--介绍一下你的项目吧--邪修框架
1.8W
2
...
美团秋招java后端面经,已意向
4202
3
...
总结一下踩坑过的面试忌讳
4049
4
...
延毕三月,25变26,再走来时路
3621
5
...
滴滴卡笔试吗
3621
6
...
大厂实习之后,发现自己好像不喜欢这种生活
3223
7
...
美团笔试
3057
8
...
美团一面凉经-冷门八股狂轰滥炸 1h
2261
9
...
小米20250906后端笔试
2101
10
...
虾皮shopee意向
1953
创作者周榜
更多
正在热议
更多
#
一起聊字节
#
30033次浏览
210人参与
#
周六调休日,你打算几点下班?
#
15018次浏览
74人参与
#
开立医疗秋招
#
38441次浏览
193人参与
#
发面经攒人品
#
165420次浏览
3206人参与
#
邪修秋招思路
#
23768次浏览
696人参与
#
工作后,谈恋爱还和学生时代一样吗?
#
19692次浏览
216人参与
#
考研可以缓解求职焦虑吗
#
57331次浏览
487人参与
#
我的秋招日记
#
396725次浏览
5894人参与
#
秋招有哪些公司要求提前实习
#
13534次浏览
76人参与
#
运营面经
#
128390次浏览
1297人参与
#
正在实习的你,几点下班
#
213020次浏览
1485人参与
#
你后悔自己读研吗?
#
42490次浏览
317人参与
#
深信服求职进展汇总
#
215787次浏览
1735人参与
#
产品每日一题
#
55814次浏览
597人参与
#
那些我实习了才知道的事
#
228051次浏览
1765人参与
#
速腾聚创求职进展汇总
#
37610次浏览
244人参与
#
工作一周年分享
#
37519次浏览
206人参与
#
牛友们的论文几号送审
#
53452次浏览
805人参与
#
你遇到过哪些神仙同事
#
111142次浏览
743人参与
#
面试被问“你的缺点是什么?”怎么答
#
126587次浏览
1475人参与
#
被AI治愈的瞬间
#
67480次浏览
641人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务