//内核启动第一阶段（ASM部分）

//////////////////////////////////////////////////////////////////////////////////////////////////////////////// //内核启动第一阶段（ASM部分） //////////////////////////////////////////////////////////////////////////////////////////////////////////////// head.S

A. ARMv4上的：

    1. kernel运行的史前时期和内存布局
    在arm平台下，zImage.bin压缩镜像是由bootloader加载到物理内存，然后跳到zImage.bin里一段程序，它专门于将被压缩的kernel解压缩到KERNEL_RAM_PADDR开始的一段内存中，
    接着跳进真正的kernel去执行。
    该kernel的执行起点是stext函数，定义于arch/arm/kernel/head.S。
    
    先看此时内存的布局: 
    以下全属于ARM CPU地址空间，其中 0x30000000~0x32000000 是SDRAM空间。
     ___________
    |           |
    |           |
    |           |
    |           |
    |           |
    |___________|0x32000000(PHYS+SDRAM_SIZE，64M)
    |           |
    |           |
    |           |
    |           |
    |___________|
    |           |
    |  vmlinux  |
    |   image   |
    |___________|0x30008000(KERNEL_RAM_PADDR，解压后的kernel)
    |           |
    |           |
    |___________|0x30000000(PHYS_OFFSET，SDRAM的开始地址)
    |           |
    |           |
    |           |
    |           |
    |           |
    |___________|
    
    
     
    在开发板tqs3c2440中，SDRAM连接到内存控制器的Bank6中，所以它的开始内存地址是0x30000000，大小为64M，即0x2000000。 
    ARM Linux kernel将SDRAM的开始地址定义为PHYS_OFFSET。
    经bootloader加载的kernel,由自解压部分代码运行后，最终kernel被放置到KERNEL_RAM_PADDR（=PHYS_OFFSET + TEXT_OFFSET，即0x30008000）地址上的一段内存，经此放置后，kernel代码以后均不会被移动。
    
    在进入kernel代码前，即bootloader和自解压缩阶段，ARM未开启MMU功能。因此kernel启动代码一个重要功能是设置好相应的页表，并开启MMU功能。
    
    为了支持MMU功能，kernel镜像中的所有符号，包括代码段和数据段的符号，在链接时都生成了:在开启MMU时，所在物理内存地址->映射到的虚拟内存地址。
    
    以arm kernel第一个符号（函数）stext为例，在编译链接，它生成的虚拟地址是0xc0008000，而放置它的物理地址为0x30008000（还记得这是PHYS_OFFSET+TEXT_OFFSET？）。
    
    实际上这个变换可以利用简单的公式进行表示：va = pa – PHYS_OFFSET + PAGE_OFFSET。
    
    Arm linux最终的kernel空间的页表，就是按照这个关系来建立。
    
    之所以较早提及arm linux 的内存映射，原因是在进入kernel代码，里面所有符号地址值为清一色的0xCXXXXXXX地址，而此时ARM未开启MMU功能，故在执行stext函数第一条执行时，它的PC值就是stext所在的内存地址（即物理地址，0x30008000）。
    
    因此，下面有些代码，需要使用地址无关技术！   (地址无关码，难点。。。。)
    
    2. 一览stext函数
    这里的启动流程指的是解压后kernel开始执行的一部分代码，这部分代码和ARM体系结构是紧密联系在一起的，所以最好是将ARM ARCHITECTURE REFERENCE MANUL仔细读读，尤其里面关于控制寄存器啊，MMU方面的内容～
    stext函数定义在Arch/arm/kernel/head.S，它的功能是获取处理器类型和机器类型信息，并创建临时的页表，然后开启MMU功能，并跳进第一个C语言函数start_kernel。
    stext函数的在前置条件是：MMU, D-cache, 关闭; r0 = 0, r1 = machine nr, r2 = atags prointer.
          前面说过解压以后，代码会跳到解压完成以后的vmlinux开始执行，具体从什么地方开始执行我们可以看看生成的vmlinux.lds(arch/arm/kernel/)这个文件：

    1. OUTPUT_ARCH(arm)    
    2. ENTRY(stext)    
    3. jiffies = jiffies_64;    
    4. SECTIONS    
    5. {    
    6.  . = 0x80000000 + 0x00008000;    
    7.  .text.head : {     
    8.   _stext = .;    
    9.   _sinittext = .;    
    0.   *(.text.h    

    很明显我们的vmlinx最开头的section是.text.head，这里我们不能看ENTRY的内容，以为这时候我们没有操作系统，根本不知道如何来解析这里的入口地址，
    我们只能来分析他的section(不过一般来说这里的ENTRY和我们从seciton分析的结果是一样的)，这里的.text.head section我们很容易就能在arch/arm/kernel/head.S里面找到，
    而且它里面的第一个符号就是我们的stext：

    # .section ".text.head", "ax"    
    #     
    # ENTRY(stext)   
    #     
    #  /* 设置CPU运行模式为SVC，并关中断 */    
    #     
    #   msr  cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode    
    #     
    #                                      @ and irqs disabled    
    #     
    #   mrc p15, 0, r9, c0, c0        @ get processor id    
    #     
    #   bl    __lookup_processor_type         @ r5=procinfo r9=cupid    
    #     
    # /* r10指向cpu对应的proc_info记录 */    
    #     
    #    movs  r10, r5                         @ invalid processor (r5=0)?    
    #     
    #   beq __error_p                    @ yes, error 'p'    
    #     
    #   bl    __lookup_machine_type            @ r5=machinfo    
    #     
    # /* r8 指向开发板对应的arch_info记录 */    
    #     
    #    movs  r8, r5                           @ invalid machine (r5=0)?    
    #     
    #   beq __error_a                    @ yes, error 'a'    
    #     
    # /* __vet_atags函数涉及bootloader造知kernel物理内存的情况，我们暂时不分析它。 */    
    #     
    #   bl    __vet_atags    
    #     
    # /*  创建临时页表 */    
    #     
    #   bl    __create_page_tables    
        
    #   /*   
    #    
    #    * The following calls CPU specific code in a position independent   
    #    
    #    * manner.  See arch/arm/mm/proc-*.S for details.  r10 = base of   
    #    
    #    * xxx_proc_info structure selected by __lookup_machine_type   
    #    
    #    * above.  On return, the CPU will be ready for the MMU to be   
    #    
    #    * turned on, and r0 will hold the CPU control register value.   
    #    
    #    */    
    #     
    #  /* 这里的逻辑关系相当复杂，先是从proc_info结构中的中跳进__arm920_setup函数，   
    #    
    #   * 然后执__enable_mmu 函数。最后在__enable_mmu函数通过mov pc, r13来执行__switch_data，   
    #    
    #   * __switch_data函数在最后一条语句，鱼跃龙门，跳进第一个C语言函数start_kernel。   
    #    */    
    #     
    #   ldr   r13, __switch_data             @ address to jump to after    
    #     
    #                                      @ mmu has been enabled    
    #     
    #   adr  lr, __enable_mmu        @ return (PIC) address    
    #     
    #   add pc, r10, #PROCINFO_INITFUNC    
    #     
    # ENDPROC(stext)  

     这里的ENTRY这个宏实际我们可以在include/linux/linkage.h里面找到，可以看到他实际上就是声明一个GLOBAL Symbol，后面的ENDPROC和END唯一的区别是前面的声明了一个函数，可以在c里面被调用。

                 1. #ifndef ENTRY    
                 2. #define ENTRY(name) /    
                 3.   .globl name; /    
                 4.   ALIGN; /    
                 5.   name:    
                 6. #endif    
                 7. #ifndef WEAK    
                 8. #define WEAK(name)     /    
                 9.     .weak name;    /    
                10.     name:    
                11. #endif    
                12. #ifndef END    
                13. #define END(name) /    
                14.   .size name, .-name    
                15. #endif    
                16. /* If symbol 'name' is treated as a subroutine (gets called, and returns)  
                17.  * then please use ENDPROC to mark 'name' as STT_FUNC for the benefit of  
                18.  * static analysis tools such as stack depth analyzer.  
                19.  */    
                20. #ifndef ENDPROC    
                21. #define ENDPROC(name) /    
                22.   .type name, @function; /    
                23.   END(name)    
                24. #endif    

    找到了vmlinux的起始代码就进行分析了.

B. ARMv8上的：

ARMv8上的Linux内核的 head.S 主要工作内容：
        1、从el2特权级退回到el1
        2、确认处理器类型
        3、计算内核镜像的起始物理地址及物理地址与虚拟地址之间的偏移
        4、验证设备树的地址是否有效
        5、创建页表，用于启动内核
        6、设置CPU（cpu_setup），用于使能MMU
        7、使能MMU
        8、交换数据段
        9、跳转到start_kernel函数继续运行。

head-common.S

//////////////////////////////////////////////////////////////////////////////////////////////////////////////// //内核启动第二阶段（C部分） //////////////////////////////////////////////////////////////////////////////////////////////////////////////// I. start_kernel() --> setup_arch() --> setup_machine_fdt(__atags_pointer); //__atags_pointer就是来自R2寄存器,R2是TAG LIST地址，或设备树地址。实现在 kernel/arch/arm/kernel/devtree.c --> unflatten_device_tree() //执行完unflatten_device_tree()后，DTS节点信息,被解析出来，存到 of_allnodes 链表中! --> __unflatten_device_tree(initial_boot_params, &of_allnodes, early_init_dt_alloc_memory_arch); --> of_alias_scan(early_init_dt_alloc_memory_arch); // Get pointer to "/chosen" and "/aliasas" nodes for use everywhere(到处) --> .init_machine //启动流程到了板级文件 --> of_platform_populate() //跟据 of_allnodes 链表中的信息，加载 platform_device。实现在 drivers/of/platform.c，是 OF 的标准函数。 //如好多板文件，及驱动文件当中用此OF系API来加载 platform_device们。

II. 问：platform_device 已经注册到系统中了，那么其他设备，例如i2c、spi外设是怎样注册到系统中的？答：在注册i2c总线(非控制器驱动！ xxx_bus_type?)时 -->会调用到qup_i2c_probe()接口， -->该接口用于申请总线资源，和添加i2c适配器（i2c_adapter）。 -->1. i2c_add_adapter --> i2c_register_adapter --> i2c_scan_static_board_info --> i2c_new_device (缺点：必须在 i2c_register_adapter 之前要 i2c_register_board_info 掉，大多搞法是在板文件里注册i2c_board_info的) -->此时设备和驱动都已加载，于是drvier里的probe方法将被调用。后面流程就都不一样了。

                    -->2. 在成功添加i2c适配器后，会调用of_i2c_register_devices()接口。
                            -->此接口会解析i2c总线节点的子节点（挂载在该总线上的i2c设备节点），获取i2c外设的地址、中断号等硬件信息。
                                -->然后调用request_module()加载设备对应的驱动文件，调用i2c_new_device()，生成i2c设备！
                                      -->此时设备和驱动都已加载，于是drvier里面的probe方法将被调用。后面流程就都一样了。

 (跟spi一样了，spi_master被创建时，扫描 __board_list --> new spi_device)
 (在soundcore_open打开/dev/dsp节点函数中,会调用到: request_module("sound-slot-%i", unit>>4) 函数,这表示,让linux的用户空间调用/sbin/modprobe函数,加载名为 sound-slot-0.ko 模块)

加载流程并不是按找从树根到树叶的方式递归注册，而是只注册根节点下的第一级子节点，第二级及之后的子节点暂不注册！

Linux系统下的设备大多都是挂载在"虚拟平台总线"下的，因此在平台总线被注册后，会根据 of_allnodes 节点的树结构，去寻找该总线的子节点，所有的子节点将被作为设备注册到该总线上。

详细解释 setup_machine_fdt(__atags_pointer), unflatten_device_tree() 搞的动作：

  关键点：setup_machine_fdt(__atags_pointer)          
            到这个时候 DTB 还只是加载到内存中的 .dtb 文件而已，这个文件中，不仅包含数据结构，还包含了一些文件头等信息，
            kernel 需要从这些信息中，获取到数据结构相关的信息，然后再生成设备树。
            
            1. 这个函数的调用还有个参数 __atags_pointer，似乎是一个指针，干嘛的？（来自于汇编阶段R2寄存器. R2是TAG LIST地址，或设备树地址）
            2. 
            
            struct machine_desc * __init setup_machine_fdt(unsigned int dt_phys)    //TAG LIST或设备树 物理地址
            {
                ...
                devtree = phys_to_virt(dt_phys);
                ...
                initial_boot_params = devtree;  //TAG LIST或设备树 虚拟地址
                ...
            }
            struct boot_param_header 结构体，就是老内核的生成 zimage/uimage等时用到的那个header结构！！
            随后 kernel 把这个指针赋给了全局变量 initial_boot_params。也就是说以后 kernel 会是用这个指针指向的数据去初始化 device tree。


            struct boot_param_header {
                __be32 magic;               /* magic word OF_DT_HEADER */
                __be32 totalsize;           /* total size of DT block */
                __be32 off_dt_struct;       /* offset to structure */
                __be32 off_dt_strings;      /* offset to strings */
                __be32 off_mem_rsvmap;      /* offset to memory reserve map */
                __be32 version;             /* format version */
                __be32 last_comp_version;   /* last compatible version */
                /* version 2 fields below */
                __be32 boot_cpuid_phys; /* Physical CPU id we're booting on */
                /* version 3 fields below */
                __be32 dt_strings_size; /* size of the DT strings block */
                /* version 17 fields below */
                __be32 dt_struct_size; /* size of the DT structure block */
            };
            看这个结构体，很像之前所说的文件头，有魔数、大小、数据结构偏移量、版本等等，kernel 就应该通过这个结构获取数据，并最终生成设备树。




            int of_platform_populate(struct device_node *root, const struct of_device_id *matches, const struct of_dev_auxdata *lookup, struct device *parent)
            {
                struct device_node *child;
                int rc = 0;

                root = root ? of_node_get(root) : of_find_node_by_path("/");
                if (!root)
                    return -EINVAL;

                for_each_child_of_node(root, child) {
                    rc = of_platform_bus_create(child, matches, lookup, parent, true);
                    if (rc)
                        break;
                }

                of_node_put(root);
                return rc;
            }
            
            //此函数的注释写得很明白：“Populate platform_devices from device tree data”。
            //在 of_platform_populate 中如果 root 为 NULL，则将 root 赋值为根节点，这个根节点是用 of_find_node_by_path 取到的。
            //但是这个“device tree data”又是从那里来的？
            
            struct device_node *of_find_node_by_path(const char *path)
            {
                struct device_node *np = of_allnodes;       //很关键的全局变量：of_allnodes
                unsigned long flags;                        //struct device_node *of_allnodes;

                raw_spin_lock_irqsave(&devtree_lock, flags);
                for (; np; np = np->allnext) {
                    if (np->full_name && (of_node_cmp(np->full_name, path) == 0)
                        && of_node_get(np))
                        break;
                }
                raw_spin_unlock_irqrestore(&devtree_lock, flags);
                return np;
            }
                 
        很关键的全局变量：of_allnodes，定义是在 drivers/of/base.c 里面： struct device_node *of_allnodes;
        它应该就是那个所谓的“device tree data”了。它应该指向了 device tree 的根节点。

问：那这个全局变量 of_allnodes 又是咋来的？答：device tree 是由 DTC（Device Tree Compiler）编译成二进制文件 DTB（Ddevice Tree Blob）的，然后在系统上电之后由 bootloader 加载到内存中去，这个时候还没有 device tree，而在内存中只有一个所谓的 DTB，这只是一个以某个内存地址开始的一堆原始的 dt 数据，没有树结构。 kernel 的任务需要把这些数据转换成一个树结构，然后再把这棵树的root节点的地址赋值给 of_allnodes 就行了。

            没有这个 device tree 那所有的设备就没办法初始化，所以这个 dt 树的形成一定在 kernel 刚刚启动的时候就完成了。
            既然如此，来看看 kernel 初始化的代码（init/main.c）：

            asmlinkage void __init start_kernel(void)
            {
                ...
                setup_arch(&command_line);
                ...
            }
            这个 setup_arch 就是各个CPU架构自己的setup函数，哪个参与编译就调用哪个，在ARM中应当是 arch/arm/kernel/setup.c 中的 setup_arch。                
            void __init setup_arch(char **cmdline_p)
            {
                ...
                mdesc = setup_machine_fdt(__atags_pointer); /* kernel/arch/arm/kernel/devtree.c */
                ...
                unflatten_device_tree();
                ...
            }
            

            


    现在回到 setup_arch：

    /* kernel/drivers/of/fdt.c */
    void __init unflatten_device_tree(void)
    {
        __unflatten_device_tree(initial_boot_params, &of_allnodes, early_init_dt_alloc_memory_arch);
        ...
    }

    看见了吧，of_allnodes 就是在这里赋值的，device tree 也是在这里建立完成的。
    __unflatten_device_tree 函数我们就不去深究了，推测其功能应该就是： 解析数据、申请内存、填充结构等等。

    到此为止，device tree 的初始化就算完成了，在以后的启动过程中，kernel 就会依据这个 dt 来初始化各个设备。