xref: /DragonOS/kernel/src/arch/x86_64/mm/mod.rs (revision 40314b30ab2a7e1fd06a05a00f693e644e446035)
1d4f3de93Slogin pub mod barrier;
240fe15e0SLoGin 
340fe15e0SLoGin use alloc::vec::Vec;
440fe15e0SLoGin use hashbrown::HashSet;
540fe15e0SLoGin use x86::time::rdtsc;
640fe15e0SLoGin use x86_64::registers::model_specific::EferFlags;
740fe15e0SLoGin 
8a03c4f9dSLoGin use crate::driver::tty::serial::serial8250::send_to_default_serial8250_port;
940fe15e0SLoGin use crate::include::bindings::bindings::{
10abe3a6eaShanjiezhou     multiboot2_get_memory, multiboot2_iter, multiboot_mmap_entry_t,
1140fe15e0SLoGin };
1240fe15e0SLoGin use crate::libs::align::page_align_up;
13abe3a6eaShanjiezhou use crate::libs::lib_ui::screen_manager::scm_disable_put_to_window;
1440fe15e0SLoGin use crate::libs::printk::PrintkWriter;
1540fe15e0SLoGin use crate::libs::spinlock::SpinLock;
1640fe15e0SLoGin 
1734e6d6c8Syuyi2439 use crate::mm::allocator::page_frame::{FrameAllocator, PageFrameCount, PageFrameUsage};
1840fe15e0SLoGin use crate::mm::mmio_buddy::mmio_init;
1940fe15e0SLoGin use crate::{
2040fe15e0SLoGin     arch::MMArch,
2140fe15e0SLoGin     mm::allocator::{buddy::BuddyAllocator, bump::BumpAllocator},
2240fe15e0SLoGin };
2340fe15e0SLoGin 
2440fe15e0SLoGin use crate::mm::kernel_mapper::KernelMapper;
2540fe15e0SLoGin use crate::mm::page::{PageEntry, PageFlags};
2640fe15e0SLoGin use crate::mm::{MemoryManagementArch, PageTableKind, PhysAddr, PhysMemoryArea, VirtAddr};
2740fe15e0SLoGin use crate::syscall::SystemError;
2840fe15e0SLoGin use crate::{kdebug, kinfo};
29d4f3de93Slogin 
30d4f3de93Slogin use core::arch::asm;
3140fe15e0SLoGin use core::ffi::c_void;
3240fe15e0SLoGin use core::fmt::{Debug, Write};
3340fe15e0SLoGin use core::mem::{self};
34d4f3de93Slogin 
3540fe15e0SLoGin use core::sync::atomic::{compiler_fence, AtomicBool, Ordering};
36d4f3de93Slogin 
37*40314b30SXiaoye Zheng use super::kvm::vmx::vmcs::VmcsFields;
38*40314b30SXiaoye Zheng use super::kvm::vmx::vmx_asm_wrapper::vmx_vmread;
39*40314b30SXiaoye Zheng 
4040fe15e0SLoGin pub type PageMapper =
4140fe15e0SLoGin     crate::mm::page::PageMapper<crate::arch::x86_64::mm::X86_64MMArch, LockedFrameAllocator>;
4240fe15e0SLoGin 
4340fe15e0SLoGin /// @brief 用于存储物理内存区域的数组
4440fe15e0SLoGin static mut PHYS_MEMORY_AREAS: [PhysMemoryArea; 512] = [PhysMemoryArea {
4540fe15e0SLoGin     base: PhysAddr::new(0),
4640fe15e0SLoGin     size: 0,
4740fe15e0SLoGin }; 512];
4840fe15e0SLoGin 
4940fe15e0SLoGin /// 初始的CR3寄存器的值,用于内存管理初始化时,创建的第一个内核页表的位置
5040fe15e0SLoGin static mut INITIAL_CR3_VALUE: PhysAddr = PhysAddr::new(0);
5140fe15e0SLoGin 
5240fe15e0SLoGin /// 内核的第一个页表在pml4中的索引
5340fe15e0SLoGin /// 顶级页表的[256, 512)项是内核的页表
5440fe15e0SLoGin static KERNEL_PML4E_NO: usize = (X86_64MMArch::PHYS_OFFSET & ((1 << 48) - 1)) >> 39;
5540fe15e0SLoGin 
5640fe15e0SLoGin static INNER_ALLOCATOR: SpinLock<Option<BuddyAllocator<MMArch>>> = SpinLock::new(None);
5740fe15e0SLoGin 
5840fe15e0SLoGin #[derive(Clone, Copy)]
5940fe15e0SLoGin pub struct X86_64MMBootstrapInfo {
6040fe15e0SLoGin     kernel_code_start: usize,
6140fe15e0SLoGin     kernel_code_end: usize,
6240fe15e0SLoGin     kernel_data_end: usize,
6340fe15e0SLoGin     kernel_rodata_end: usize,
6440fe15e0SLoGin     start_brk: usize,
6540fe15e0SLoGin }
6640fe15e0SLoGin 
6740fe15e0SLoGin impl Debug for X86_64MMBootstrapInfo {
6840fe15e0SLoGin     fn fmt(&self, f: &mut core::fmt::Formatter) -> core::fmt::Result {
6940fe15e0SLoGin         write!(
7040fe15e0SLoGin             f,
7140fe15e0SLoGin             "kernel_code_start: {:x}, kernel_code_end: {:x}, kernel_data_end: {:x}, kernel_rodata_end: {:x}, start_brk: {:x}",
7240fe15e0SLoGin             self.kernel_code_start, self.kernel_code_end, self.kernel_data_end, self.kernel_rodata_end, self.start_brk)
7340fe15e0SLoGin     }
7440fe15e0SLoGin }
7540fe15e0SLoGin 
7640fe15e0SLoGin pub static mut BOOTSTRAP_MM_INFO: Option<X86_64MMBootstrapInfo> = None;
7740fe15e0SLoGin 
7840fe15e0SLoGin /// @brief X86_64的内存管理架构结构体
7940fe15e0SLoGin #[derive(Debug, Clone, Copy, Hash)]
8040fe15e0SLoGin pub struct X86_64MMArch;
8140fe15e0SLoGin 
8240fe15e0SLoGin /// XD标志位是否被保留
8340fe15e0SLoGin static XD_RESERVED: AtomicBool = AtomicBool::new(false);
8440fe15e0SLoGin 
8540fe15e0SLoGin impl MemoryManagementArch for X86_64MMArch {
8640fe15e0SLoGin     /// 4K页
8740fe15e0SLoGin     const PAGE_SHIFT: usize = 12;
8840fe15e0SLoGin 
8940fe15e0SLoGin     /// 每个页表项占8字节,总共有512个页表项
9040fe15e0SLoGin     const PAGE_ENTRY_SHIFT: usize = 9;
9140fe15e0SLoGin 
9240fe15e0SLoGin     /// 四级页表(PML4T、PDPT、PDT、PT)
9340fe15e0SLoGin     const PAGE_LEVELS: usize = 4;
9440fe15e0SLoGin 
9540fe15e0SLoGin     /// 页表项的有效位的index。在x86_64中,页表项的第[0, 47]位表示地址和flag,
9640fe15e0SLoGin     /// 第[48, 51]位表示保留。因此,有效位的index为52。
9740fe15e0SLoGin     /// 请注意,第63位是XD位,表示是否允许执行。
9840fe15e0SLoGin     const ENTRY_ADDRESS_SHIFT: usize = 52;
9940fe15e0SLoGin 
10040fe15e0SLoGin     const ENTRY_FLAG_DEFAULT_PAGE: usize = Self::ENTRY_FLAG_PRESENT;
10140fe15e0SLoGin 
10240fe15e0SLoGin     const ENTRY_FLAG_DEFAULT_TABLE: usize = Self::ENTRY_FLAG_PRESENT;
10340fe15e0SLoGin 
10440fe15e0SLoGin     const ENTRY_FLAG_PRESENT: usize = 1 << 0;
10540fe15e0SLoGin 
10640fe15e0SLoGin     const ENTRY_FLAG_READONLY: usize = 0;
10740fe15e0SLoGin 
10840fe15e0SLoGin     const ENTRY_FLAG_READWRITE: usize = 1 << 1;
10940fe15e0SLoGin 
11040fe15e0SLoGin     const ENTRY_FLAG_USER: usize = 1 << 2;
11140fe15e0SLoGin 
11240fe15e0SLoGin     const ENTRY_FLAG_WRITE_THROUGH: usize = 1 << 3;
11340fe15e0SLoGin 
11440fe15e0SLoGin     const ENTRY_FLAG_CACHE_DISABLE: usize = 1 << 4;
11540fe15e0SLoGin 
11640fe15e0SLoGin     const ENTRY_FLAG_NO_EXEC: usize = 1 << 63;
11740fe15e0SLoGin     /// x86_64不存在EXEC标志位,只有NO_EXEC(XD)标志位
11840fe15e0SLoGin     const ENTRY_FLAG_EXEC: usize = 0;
11940fe15e0SLoGin 
12040fe15e0SLoGin     /// 物理地址与虚拟地址的偏移量
12140fe15e0SLoGin     /// 0xffff_8000_0000_0000
12240fe15e0SLoGin     const PHYS_OFFSET: usize = Self::PAGE_NEGATIVE_MASK + (Self::PAGE_ADDRESS_SIZE >> 1);
12340fe15e0SLoGin 
12440fe15e0SLoGin     const USER_END_VADDR: VirtAddr = VirtAddr::new(0x0000_7eff_ffff_ffff);
12540fe15e0SLoGin     const USER_BRK_START: VirtAddr = VirtAddr::new(0x700000000000);
12640fe15e0SLoGin     const USER_STACK_START: VirtAddr = VirtAddr::new(0x6ffff0a00000);
12740fe15e0SLoGin 
12840fe15e0SLoGin     /// @brief 获取物理内存区域
12940fe15e0SLoGin     unsafe fn init() -> &'static [crate::mm::PhysMemoryArea] {
13040fe15e0SLoGin         extern "C" {
13140fe15e0SLoGin             fn _text();
13240fe15e0SLoGin             fn _etext();
13340fe15e0SLoGin             fn _edata();
13440fe15e0SLoGin             fn _erodata();
13540fe15e0SLoGin             fn _end();
13640fe15e0SLoGin         }
13740fe15e0SLoGin 
13840fe15e0SLoGin         Self::init_xd_rsvd();
13940fe15e0SLoGin 
14040fe15e0SLoGin         let bootstrap_info = X86_64MMBootstrapInfo {
14140fe15e0SLoGin             kernel_code_start: _text as usize,
14240fe15e0SLoGin             kernel_code_end: _etext as usize,
14340fe15e0SLoGin             kernel_data_end: _edata as usize,
14440fe15e0SLoGin             kernel_rodata_end: _erodata as usize,
14540fe15e0SLoGin             start_brk: _end as usize,
14640fe15e0SLoGin         };
14740fe15e0SLoGin         unsafe {
14840fe15e0SLoGin             BOOTSTRAP_MM_INFO = Some(bootstrap_info);
14940fe15e0SLoGin         }
15040fe15e0SLoGin 
15140fe15e0SLoGin         // 初始化物理内存区域(从multiboot2中获取)
15240fe15e0SLoGin         let areas_count =
15340fe15e0SLoGin             Self::init_memory_area_from_multiboot2().expect("init memory area failed");
154a03c4f9dSLoGin         send_to_default_serial8250_port("x86 64 init end\n\0".as_bytes());
15540fe15e0SLoGin 
15640fe15e0SLoGin         return &PHYS_MEMORY_AREAS[0..areas_count];
15740fe15e0SLoGin     }
15840fe15e0SLoGin 
15940fe15e0SLoGin     /// @brief 刷新TLB中,关于指定虚拟地址的条目
16040fe15e0SLoGin     unsafe fn invalidate_page(address: VirtAddr) {
16140fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
16240fe15e0SLoGin         asm!("invlpg [{0}]", in(reg) address.data(), options(nostack, preserves_flags));
16340fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
16440fe15e0SLoGin     }
16540fe15e0SLoGin 
16640fe15e0SLoGin     /// @brief 刷新TLB中,所有的条目
16740fe15e0SLoGin     unsafe fn invalidate_all() {
16840fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
16940fe15e0SLoGin         // 通过设置cr3寄存器,来刷新整个TLB
17040fe15e0SLoGin         Self::set_table(PageTableKind::User, Self::table(PageTableKind::User));
17140fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
17240fe15e0SLoGin     }
17340fe15e0SLoGin 
17440fe15e0SLoGin     /// @brief 获取顶级页表的物理地址
175*40314b30SXiaoye Zheng     unsafe fn table(table_kind: PageTableKind) -> PhysAddr {
176*40314b30SXiaoye Zheng         match table_kind {
177*40314b30SXiaoye Zheng             PageTableKind::Kernel | PageTableKind::User => {
17840fe15e0SLoGin                 let paddr: usize;
17940fe15e0SLoGin                 compiler_fence(Ordering::SeqCst);
18040fe15e0SLoGin                 asm!("mov {}, cr3", out(reg) paddr, options(nomem, nostack, preserves_flags));
18140fe15e0SLoGin                 compiler_fence(Ordering::SeqCst);
18240fe15e0SLoGin                 return PhysAddr::new(paddr);
18340fe15e0SLoGin             }
184*40314b30SXiaoye Zheng             PageTableKind::EPT => {
185*40314b30SXiaoye Zheng                 let eptp =
186*40314b30SXiaoye Zheng                     vmx_vmread(VmcsFields::CTRL_EPTP_PTR as u32).expect("Failed to read eptp");
187*40314b30SXiaoye Zheng                 return PhysAddr::new(eptp as usize);
188*40314b30SXiaoye Zheng             }
189*40314b30SXiaoye Zheng         }
190*40314b30SXiaoye Zheng     }
19140fe15e0SLoGin 
19240fe15e0SLoGin     /// @brief 设置顶级页表的物理地址到处理器中
19340fe15e0SLoGin     unsafe fn set_table(_table_kind: PageTableKind, table: PhysAddr) {
19440fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
19540fe15e0SLoGin         asm!("mov cr3, {}", in(reg) table.data(), options(nostack, preserves_flags));
19640fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
19740fe15e0SLoGin     }
19840fe15e0SLoGin 
19940fe15e0SLoGin     /// @brief 判断虚拟地址是否合法
20040fe15e0SLoGin     fn virt_is_valid(virt: VirtAddr) -> bool {
20140fe15e0SLoGin         return virt.is_canonical();
20240fe15e0SLoGin     }
20340fe15e0SLoGin 
20440fe15e0SLoGin     /// 获取内存管理初始化时,创建的第一个内核页表的地址
20540fe15e0SLoGin     fn initial_page_table() -> PhysAddr {
20640fe15e0SLoGin         unsafe {
20740fe15e0SLoGin             return INITIAL_CR3_VALUE;
20840fe15e0SLoGin         }
20940fe15e0SLoGin     }
21040fe15e0SLoGin 
21140fe15e0SLoGin     /// @brief 创建新的顶层页表
212d4f3de93Slogin     ///
21340fe15e0SLoGin     /// 该函数会创建页表并复制内核的映射到新的页表中
214d4f3de93Slogin     ///
21540fe15e0SLoGin     /// @return 新的页表
21640fe15e0SLoGin     fn setup_new_usermapper() -> Result<crate::mm::ucontext::UserMapper, SystemError> {
21740fe15e0SLoGin         let new_umapper: crate::mm::page::PageMapper<X86_64MMArch, LockedFrameAllocator> = unsafe {
21840fe15e0SLoGin             PageMapper::create(PageTableKind::User, LockedFrameAllocator)
21940fe15e0SLoGin                 .ok_or(SystemError::ENOMEM)?
22040fe15e0SLoGin         };
22140fe15e0SLoGin 
22240fe15e0SLoGin         let current_ktable: KernelMapper = KernelMapper::lock();
22340fe15e0SLoGin         let copy_mapping = |pml4_entry_no| unsafe {
22440fe15e0SLoGin             let entry: PageEntry<X86_64MMArch> = current_ktable
22540fe15e0SLoGin                 .table()
22640fe15e0SLoGin                 .entry(pml4_entry_no)
22740fe15e0SLoGin                 .unwrap_or_else(|| panic!("entry {} not found", pml4_entry_no));
22840fe15e0SLoGin             new_umapper.table().set_entry(pml4_entry_no, entry)
22940fe15e0SLoGin         };
23040fe15e0SLoGin 
23140fe15e0SLoGin         // 复制内核的映射
23240fe15e0SLoGin         for pml4_entry_no in KERNEL_PML4E_NO..512 {
23340fe15e0SLoGin             copy_mapping(pml4_entry_no);
23440fe15e0SLoGin         }
23540fe15e0SLoGin 
23640fe15e0SLoGin         return Ok(crate::mm::ucontext::UserMapper::new(new_umapper));
23740fe15e0SLoGin     }
23840fe15e0SLoGin }
23940fe15e0SLoGin 
24040fe15e0SLoGin impl X86_64MMArch {
24140fe15e0SLoGin     unsafe fn init_memory_area_from_multiboot2() -> Result<usize, SystemError> {
24240fe15e0SLoGin         // 这个数组用来存放内存区域的信息(从C获取)
24340fe15e0SLoGin         let mut mb2_mem_info: [multiboot_mmap_entry_t; 512] = mem::zeroed();
244a03c4f9dSLoGin         send_to_default_serial8250_port("init_memory_area_from_multiboot2 begin\n\0".as_bytes());
24540fe15e0SLoGin 
24640fe15e0SLoGin         let mut mb2_count: u32 = 0;
24740fe15e0SLoGin         multiboot2_iter(
24840fe15e0SLoGin             Some(multiboot2_get_memory),
24940fe15e0SLoGin             &mut mb2_mem_info as *mut [multiboot_mmap_entry_t; 512] as usize as *mut c_void,
25040fe15e0SLoGin             &mut mb2_count,
25140fe15e0SLoGin         );
252a03c4f9dSLoGin         send_to_default_serial8250_port("init_memory_area_from_multiboot2 2\n\0".as_bytes());
25340fe15e0SLoGin 
25440fe15e0SLoGin         let mb2_count = mb2_count as usize;
25540fe15e0SLoGin         let mut areas_count = 0usize;
25640fe15e0SLoGin         let mut total_mem_size = 0usize;
25740fe15e0SLoGin         for i in 0..mb2_count {
25840fe15e0SLoGin             // Only use the memory area if its type is 1 (RAM)
25940fe15e0SLoGin             if mb2_mem_info[i].type_ == 1 {
26040fe15e0SLoGin                 // Skip the memory area if its len is 0
26140fe15e0SLoGin                 if mb2_mem_info[i].len == 0 {
26240fe15e0SLoGin                     continue;
26340fe15e0SLoGin                 }
26440fe15e0SLoGin                 total_mem_size += mb2_mem_info[i].len as usize;
26540fe15e0SLoGin                 PHYS_MEMORY_AREAS[areas_count].base = PhysAddr::new(mb2_mem_info[i].addr as usize);
26640fe15e0SLoGin                 PHYS_MEMORY_AREAS[areas_count].size = mb2_mem_info[i].len as usize;
26740fe15e0SLoGin                 areas_count += 1;
26840fe15e0SLoGin             }
26940fe15e0SLoGin         }
270a03c4f9dSLoGin         send_to_default_serial8250_port("init_memory_area_from_multiboot2 end\n\0".as_bytes());
27140fe15e0SLoGin         kinfo!("Total memory size: {} MB, total areas from multiboot2: {mb2_count}, valid areas: {areas_count}", total_mem_size / 1024 / 1024);
27240fe15e0SLoGin 
27340fe15e0SLoGin         return Ok(areas_count);
27440fe15e0SLoGin     }
27540fe15e0SLoGin 
27640fe15e0SLoGin     fn init_xd_rsvd() {
27740fe15e0SLoGin         // 读取ia32-EFER寄存器的值
27840fe15e0SLoGin         let efer: EferFlags = x86_64::registers::model_specific::Efer::read();
27940fe15e0SLoGin         if !efer.contains(EferFlags::NO_EXECUTE_ENABLE) {
28040fe15e0SLoGin             // NO_EXECUTE_ENABLE是false,那么就设置xd_reserved为true
28140fe15e0SLoGin             kdebug!("NO_EXECUTE_ENABLE is false, set XD_RESERVED to true");
28240fe15e0SLoGin             XD_RESERVED.store(true, Ordering::Relaxed);
28340fe15e0SLoGin         }
28440fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
28540fe15e0SLoGin     }
28640fe15e0SLoGin 
28740fe15e0SLoGin     /// 判断XD标志位是否被保留
28840fe15e0SLoGin     pub fn is_xd_reserved() -> bool {
28940fe15e0SLoGin         return XD_RESERVED.load(Ordering::Relaxed);
29040fe15e0SLoGin     }
29140fe15e0SLoGin }
29240fe15e0SLoGin 
29340fe15e0SLoGin impl VirtAddr {
29440fe15e0SLoGin     /// @brief 判断虚拟地址是否合法
295d4f3de93Slogin     #[inline(always)]
29640fe15e0SLoGin     pub fn is_canonical(self) -> bool {
29740fe15e0SLoGin         let x = self.data() & X86_64MMArch::PHYS_OFFSET;
29840fe15e0SLoGin         // 如果x为0,说明虚拟地址的高位为0,是合法的用户地址
29940fe15e0SLoGin         // 如果x为PHYS_OFFSET,说明虚拟地址的高位全为1,是合法的内核地址
30040fe15e0SLoGin         return x == 0 || x == X86_64MMArch::PHYS_OFFSET;
30140fe15e0SLoGin     }
30240fe15e0SLoGin }
30340fe15e0SLoGin 
30440fe15e0SLoGin /// @brief 初始化内存管理模块
30540fe15e0SLoGin pub fn mm_init() {
306a03c4f9dSLoGin     send_to_default_serial8250_port("mm_init\n\0".as_bytes());
30740fe15e0SLoGin     PrintkWriter
30840fe15e0SLoGin         .write_fmt(format_args!("mm_init() called\n"))
30940fe15e0SLoGin         .unwrap();
31040fe15e0SLoGin     // printk_color!(GREEN, BLACK, "mm_init() called\n");
31140fe15e0SLoGin     static _CALL_ONCE: AtomicBool = AtomicBool::new(false);
31240fe15e0SLoGin     if _CALL_ONCE
31340fe15e0SLoGin         .compare_exchange(false, true, Ordering::SeqCst, Ordering::SeqCst)
31440fe15e0SLoGin         .is_err()
31540fe15e0SLoGin     {
316a03c4f9dSLoGin         send_to_default_serial8250_port("mm_init err\n\0".as_bytes());
31740fe15e0SLoGin         panic!("mm_init() can only be called once");
31840fe15e0SLoGin     }
31940fe15e0SLoGin 
32040fe15e0SLoGin     unsafe { X86_64MMArch::init() };
32140fe15e0SLoGin     kdebug!("bootstrap info: {:?}", unsafe { BOOTSTRAP_MM_INFO });
32240fe15e0SLoGin     kdebug!("phys[0]=virt[0x{:x}]", unsafe {
32340fe15e0SLoGin         MMArch::phys_2_virt(PhysAddr::new(0)).unwrap().data()
32440fe15e0SLoGin     });
32540fe15e0SLoGin 
32640fe15e0SLoGin     // 初始化内存管理器
32740fe15e0SLoGin     unsafe { allocator_init() };
32840fe15e0SLoGin     // enable mmio
32940fe15e0SLoGin     mmio_init();
33040fe15e0SLoGin }
33140fe15e0SLoGin 
33240fe15e0SLoGin unsafe fn allocator_init() {
33340fe15e0SLoGin     let virt_offset = BOOTSTRAP_MM_INFO.unwrap().start_brk;
33440fe15e0SLoGin     let phy_offset =
33540fe15e0SLoGin         unsafe { MMArch::virt_2_phys(VirtAddr::new(page_align_up(virt_offset))) }.unwrap();
33640fe15e0SLoGin 
33740fe15e0SLoGin     kdebug!("PhysArea[0..10] = {:?}", &PHYS_MEMORY_AREAS[0..10]);
33840fe15e0SLoGin     let mut bump_allocator =
33940fe15e0SLoGin         BumpAllocator::<X86_64MMArch>::new(&PHYS_MEMORY_AREAS, phy_offset.data());
34040fe15e0SLoGin     kdebug!(
34140fe15e0SLoGin         "BumpAllocator created, offset={:?}",
34240fe15e0SLoGin         bump_allocator.offset()
34340fe15e0SLoGin     );
34440fe15e0SLoGin 
34540fe15e0SLoGin     // 暂存初始在head.S中指定的页表的地址,后面再考虑是否需要把它加到buddy的可用空间里面!
34640fe15e0SLoGin     // 现在不加的原因是,我担心会有安全漏洞问题:这些初始的页表,位于内核的数据段。如果归还到buddy,
34740fe15e0SLoGin     // 可能会产生一定的安全风险(有的代码可能根据虚拟地址来进行安全校验)
34840fe15e0SLoGin     let _old_page_table = MMArch::table(PageTableKind::Kernel);
34940fe15e0SLoGin 
35040fe15e0SLoGin     let new_page_table: PhysAddr;
35140fe15e0SLoGin     // 使用bump分配器,把所有的内存页都映射到页表
35240fe15e0SLoGin     {
35340fe15e0SLoGin         // 用bump allocator创建新的页表
35440fe15e0SLoGin         let mut mapper: crate::mm::page::PageMapper<MMArch, &mut BumpAllocator<MMArch>> =
35540fe15e0SLoGin             crate::mm::page::PageMapper::<MMArch, _>::create(
35640fe15e0SLoGin                 PageTableKind::Kernel,
35740fe15e0SLoGin                 &mut bump_allocator,
35840fe15e0SLoGin             )
35940fe15e0SLoGin             .expect("Failed to create page mapper");
36040fe15e0SLoGin         new_page_table = mapper.table().phys();
36140fe15e0SLoGin         kdebug!("PageMapper created");
36240fe15e0SLoGin 
36340fe15e0SLoGin         // 取消最开始时候,在head.S中指定的映射(暂时不刷新TLB)
36440fe15e0SLoGin         {
36540fe15e0SLoGin             let table = mapper.table();
36640fe15e0SLoGin             let empty_entry = PageEntry::<MMArch>::new(0);
36740fe15e0SLoGin             for i in 0..MMArch::PAGE_ENTRY_NUM {
36840fe15e0SLoGin                 table
36940fe15e0SLoGin                     .set_entry(i, empty_entry)
37040fe15e0SLoGin                     .expect("Failed to empty page table entry");
37140fe15e0SLoGin             }
37240fe15e0SLoGin         }
37340fe15e0SLoGin         kdebug!("Successfully emptied page table");
37440fe15e0SLoGin 
37540fe15e0SLoGin         for area in PHYS_MEMORY_AREAS.iter() {
37640fe15e0SLoGin             // kdebug!("area: base={:?}, size={:#x}, end={:?}", area.base, area.size, area.base + area.size);
37740fe15e0SLoGin             for i in 0..((area.size + MMArch::PAGE_SIZE - 1) / MMArch::PAGE_SIZE) {
37840fe15e0SLoGin                 let paddr = area.base.add(i * MMArch::PAGE_SIZE);
37940fe15e0SLoGin                 let vaddr = unsafe { MMArch::phys_2_virt(paddr) }.unwrap();
38040fe15e0SLoGin                 let flags = kernel_page_flags::<MMArch>(vaddr);
38140fe15e0SLoGin 
38240fe15e0SLoGin                 let flusher = mapper
38340fe15e0SLoGin                     .map_phys(vaddr, paddr, flags)
38440fe15e0SLoGin                     .expect("Failed to map frame");
38540fe15e0SLoGin                 // 暂时不刷新TLB
38640fe15e0SLoGin                 flusher.ignore();
38740fe15e0SLoGin             }
38840fe15e0SLoGin         }
38940fe15e0SLoGin 
39040fe15e0SLoGin         // 添加低地址的映射(在smp完成初始化之前,需要使用低地址的映射.初始化之后需要取消这一段映射)
39140fe15e0SLoGin         LowAddressRemapping::remap_at_low_address(&mut mapper);
39240fe15e0SLoGin     }
393d4f3de93Slogin 
394d4f3de93Slogin     unsafe {
39540fe15e0SLoGin         INITIAL_CR3_VALUE = new_page_table;
396d4f3de93Slogin     }
39740fe15e0SLoGin     kdebug!(
39840fe15e0SLoGin         "After mapping all physical memory, DragonOS used: {} KB",
39940fe15e0SLoGin         bump_allocator.offset() / 1024
40040fe15e0SLoGin     );
40140fe15e0SLoGin 
40240fe15e0SLoGin     // 初始化buddy_allocator
40340fe15e0SLoGin     let buddy_allocator = unsafe { BuddyAllocator::<X86_64MMArch>::new(bump_allocator).unwrap() };
40440fe15e0SLoGin     // 设置全局的页帧分配器
40540fe15e0SLoGin     unsafe { set_inner_allocator(buddy_allocator) };
40640fe15e0SLoGin     kinfo!("Successfully initialized buddy allocator");
40740fe15e0SLoGin     // 关闭显示输出
408abe3a6eaShanjiezhou     scm_disable_put_to_window();
409abe3a6eaShanjiezhou 
41040fe15e0SLoGin     // make the new page table current
41140fe15e0SLoGin     {
41240fe15e0SLoGin         let mut binding = INNER_ALLOCATOR.lock();
41340fe15e0SLoGin         let mut allocator_guard = binding.as_mut().unwrap();
41440fe15e0SLoGin         kdebug!("To enable new page table.");
41540fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
41640fe15e0SLoGin         let mapper = crate::mm::page::PageMapper::<MMArch, _>::new(
41740fe15e0SLoGin             PageTableKind::Kernel,
41840fe15e0SLoGin             new_page_table,
41940fe15e0SLoGin             &mut allocator_guard,
42040fe15e0SLoGin         );
42140fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
42240fe15e0SLoGin         mapper.make_current();
42340fe15e0SLoGin         compiler_fence(Ordering::SeqCst);
42440fe15e0SLoGin         kdebug!("New page table enabled");
42540fe15e0SLoGin     }
42640fe15e0SLoGin     kdebug!("Successfully enabled new page table");
42740fe15e0SLoGin }
42840fe15e0SLoGin 
42940fe15e0SLoGin #[no_mangle]
43040fe15e0SLoGin pub extern "C" fn rs_test_buddy() {
43140fe15e0SLoGin     test_buddy();
43240fe15e0SLoGin }
43340fe15e0SLoGin pub fn test_buddy() {
43440fe15e0SLoGin     // 申请内存然后写入数据然后free掉
43540fe15e0SLoGin     // 总共申请200MB内存
43640fe15e0SLoGin     const TOTAL_SIZE: usize = 200 * 1024 * 1024;
43740fe15e0SLoGin 
43840fe15e0SLoGin     for i in 0..10 {
43940fe15e0SLoGin         kdebug!("Test buddy, round: {i}");
44040fe15e0SLoGin         // 存放申请的内存块
44140fe15e0SLoGin         let mut v: Vec<(PhysAddr, PageFrameCount)> = Vec::with_capacity(60 * 1024);
44240fe15e0SLoGin         // 存放已经申请的内存块的地址(用于检查重复)
44340fe15e0SLoGin         let mut addr_set: HashSet<PhysAddr> = HashSet::new();
44440fe15e0SLoGin 
44540fe15e0SLoGin         let mut allocated = 0usize;
44640fe15e0SLoGin 
44740fe15e0SLoGin         let mut free_count = 0usize;
44840fe15e0SLoGin 
44940fe15e0SLoGin         while allocated < TOTAL_SIZE {
45040fe15e0SLoGin             let mut random_size = 0u64;
45140fe15e0SLoGin             unsafe { x86::random::rdrand64(&mut random_size) };
45240fe15e0SLoGin             // 一次最多申请4M
45340fe15e0SLoGin             random_size = random_size % (1024 * 4096);
45440fe15e0SLoGin             if random_size == 0 {
45540fe15e0SLoGin                 continue;
45640fe15e0SLoGin             }
45740fe15e0SLoGin             let random_size =
45840fe15e0SLoGin                 core::cmp::min(page_align_up(random_size as usize), TOTAL_SIZE - allocated);
45940fe15e0SLoGin             let random_size = PageFrameCount::from_bytes(random_size.next_power_of_two()).unwrap();
46040fe15e0SLoGin             // 获取帧
46140fe15e0SLoGin             let (paddr, allocated_frame_count) =
46240fe15e0SLoGin                 unsafe { LockedFrameAllocator.allocate(random_size).unwrap() };
46340fe15e0SLoGin             assert!(allocated_frame_count.data().is_power_of_two());
46440fe15e0SLoGin             assert!(paddr.data() % MMArch::PAGE_SIZE == 0);
46540fe15e0SLoGin             unsafe {
46640fe15e0SLoGin                 assert!(MMArch::phys_2_virt(paddr)
46740fe15e0SLoGin                     .as_ref()
46840fe15e0SLoGin                     .unwrap()
46940fe15e0SLoGin                     .check_aligned(allocated_frame_count.data() * MMArch::PAGE_SIZE));
47040fe15e0SLoGin             }
47140fe15e0SLoGin             allocated += allocated_frame_count.data() * MMArch::PAGE_SIZE;
47240fe15e0SLoGin             v.push((paddr, allocated_frame_count));
47340fe15e0SLoGin             assert!(addr_set.insert(paddr), "duplicate address: {:?}", paddr);
47440fe15e0SLoGin 
47540fe15e0SLoGin             // 写入数据
47640fe15e0SLoGin             let vaddr = unsafe { MMArch::phys_2_virt(paddr).unwrap() };
47740fe15e0SLoGin             let slice = unsafe {
47840fe15e0SLoGin                 core::slice::from_raw_parts_mut(
47940fe15e0SLoGin                     vaddr.data() as *mut u8,
48040fe15e0SLoGin                     allocated_frame_count.data() * MMArch::PAGE_SIZE,
48140fe15e0SLoGin                 )
48240fe15e0SLoGin             };
48340fe15e0SLoGin             for i in 0..slice.len() {
48440fe15e0SLoGin                 slice[i] = ((i + unsafe { rdtsc() } as usize) % 256) as u8;
48540fe15e0SLoGin             }
48640fe15e0SLoGin 
48740fe15e0SLoGin             // 随机释放一个内存块
48840fe15e0SLoGin             if v.len() > 0 {
48940fe15e0SLoGin                 let mut random_index = 0u64;
49040fe15e0SLoGin                 unsafe { x86::random::rdrand64(&mut random_index) };
49140fe15e0SLoGin                 // 70%概率释放
49240fe15e0SLoGin                 if random_index % 10 > 7 {
49340fe15e0SLoGin                     continue;
49440fe15e0SLoGin                 }
49540fe15e0SLoGin                 random_index = random_index % v.len() as u64;
49640fe15e0SLoGin                 let random_index = random_index as usize;
49740fe15e0SLoGin                 let (paddr, allocated_frame_count) = v.remove(random_index);
49840fe15e0SLoGin                 assert!(addr_set.remove(&paddr));
49940fe15e0SLoGin                 unsafe { LockedFrameAllocator.free(paddr, allocated_frame_count) };
50040fe15e0SLoGin                 free_count += allocated_frame_count.data() * MMArch::PAGE_SIZE;
50140fe15e0SLoGin             }
50240fe15e0SLoGin         }
50340fe15e0SLoGin 
50440fe15e0SLoGin         kdebug!(
50540fe15e0SLoGin             "Allocated {} MB memory, release: {} MB, no release: {} bytes",
50640fe15e0SLoGin             allocated / 1024 / 1024,
50740fe15e0SLoGin             free_count / 1024 / 1024,
50840fe15e0SLoGin             (allocated - free_count)
50940fe15e0SLoGin         );
51040fe15e0SLoGin 
51140fe15e0SLoGin         kdebug!("Now, to release buddy memory");
51240fe15e0SLoGin         // 释放所有的内存
51340fe15e0SLoGin         for (paddr, allocated_frame_count) in v {
51440fe15e0SLoGin             unsafe { LockedFrameAllocator.free(paddr, allocated_frame_count) };
51540fe15e0SLoGin             assert!(addr_set.remove(&paddr));
51640fe15e0SLoGin             free_count += allocated_frame_count.data() * MMArch::PAGE_SIZE;
51740fe15e0SLoGin         }
51840fe15e0SLoGin 
51940fe15e0SLoGin         kdebug!("release done!, allocated: {allocated}, free_count: {free_count}");
52040fe15e0SLoGin     }
52140fe15e0SLoGin }
52240fe15e0SLoGin /// 全局的页帧分配器
52340fe15e0SLoGin #[derive(Debug, Clone, Copy, Hash)]
52440fe15e0SLoGin pub struct LockedFrameAllocator;
52540fe15e0SLoGin 
52640fe15e0SLoGin impl FrameAllocator for LockedFrameAllocator {
52734e6d6c8Syuyi2439     unsafe fn allocate(&mut self, count: PageFrameCount) -> Option<(PhysAddr, PageFrameCount)> {
52840fe15e0SLoGin         if let Some(ref mut allocator) = *INNER_ALLOCATOR.lock_irqsave() {
52940fe15e0SLoGin             return allocator.allocate(count);
53040fe15e0SLoGin         } else {
53140fe15e0SLoGin             return None;
53240fe15e0SLoGin         }
53340fe15e0SLoGin     }
53440fe15e0SLoGin 
53534e6d6c8Syuyi2439     unsafe fn free(&mut self, address: crate::mm::PhysAddr, count: PageFrameCount) {
53640fe15e0SLoGin         assert!(count.data().is_power_of_two());
53740fe15e0SLoGin         if let Some(ref mut allocator) = *INNER_ALLOCATOR.lock_irqsave() {
53840fe15e0SLoGin             return allocator.free(address, count);
53940fe15e0SLoGin         }
54040fe15e0SLoGin     }
54140fe15e0SLoGin 
54234e6d6c8Syuyi2439     unsafe fn usage(&self) -> PageFrameUsage {
54334e6d6c8Syuyi2439         if let Some(ref mut allocator) = *INNER_ALLOCATOR.lock_irqsave() {
54434e6d6c8Syuyi2439             return allocator.usage();
54534e6d6c8Syuyi2439         } else {
54634e6d6c8Syuyi2439             panic!("usage error");
54734e6d6c8Syuyi2439         }
54834e6d6c8Syuyi2439     }
54934e6d6c8Syuyi2439 }
55034e6d6c8Syuyi2439 
55134e6d6c8Syuyi2439 impl LockedFrameAllocator {
55234e6d6c8Syuyi2439     pub fn get_usage(&self) -> PageFrameUsage {
55334e6d6c8Syuyi2439         unsafe { self.usage() }
55440fe15e0SLoGin     }
55540fe15e0SLoGin }
55640fe15e0SLoGin 
55740fe15e0SLoGin /// 获取内核地址默认的页面标志
55840fe15e0SLoGin pub unsafe fn kernel_page_flags<A: MemoryManagementArch>(virt: VirtAddr) -> PageFlags<A> {
55940fe15e0SLoGin     let info: X86_64MMBootstrapInfo = BOOTSTRAP_MM_INFO.clone().unwrap();
56040fe15e0SLoGin 
56140fe15e0SLoGin     if virt.data() >= info.kernel_code_start && virt.data() < info.kernel_code_end {
56240fe15e0SLoGin         // Remap kernel code  execute
56340fe15e0SLoGin         return PageFlags::new().set_execute(true).set_write(true);
56440fe15e0SLoGin     } else if virt.data() >= info.kernel_data_end && virt.data() < info.kernel_rodata_end {
56540fe15e0SLoGin         // Remap kernel rodata read only
56640fe15e0SLoGin         return PageFlags::new().set_execute(true);
56740fe15e0SLoGin     } else {
56840fe15e0SLoGin         return PageFlags::new().set_write(true).set_execute(true);
56940fe15e0SLoGin     }
57040fe15e0SLoGin }
57140fe15e0SLoGin 
57240fe15e0SLoGin unsafe fn set_inner_allocator(allocator: BuddyAllocator<MMArch>) {
57340fe15e0SLoGin     static FLAG: AtomicBool = AtomicBool::new(false);
57440fe15e0SLoGin     if FLAG
57540fe15e0SLoGin         .compare_exchange(false, true, Ordering::SeqCst, Ordering::SeqCst)
57640fe15e0SLoGin         .is_err()
57740fe15e0SLoGin     {
57840fe15e0SLoGin         panic!("Cannot set inner allocator twice!");
57940fe15e0SLoGin     }
58040fe15e0SLoGin     *INNER_ALLOCATOR.lock() = Some(allocator);
58140fe15e0SLoGin }
58240fe15e0SLoGin 
58340fe15e0SLoGin /// 低地址重映射的管理器
58440fe15e0SLoGin ///
58540fe15e0SLoGin /// 低地址重映射的管理器,在smp初始化完成之前,需要使用低地址的映射,因此需要在smp初始化完成之后,取消这一段映射
58640fe15e0SLoGin pub struct LowAddressRemapping;
58740fe15e0SLoGin 
58840fe15e0SLoGin impl LowAddressRemapping {
58940fe15e0SLoGin     // 映射32M
59040fe15e0SLoGin     const REMAP_SIZE: usize = 32 * 1024 * 1024;
59140fe15e0SLoGin 
59240fe15e0SLoGin     pub unsafe fn remap_at_low_address(
59340fe15e0SLoGin         mapper: &mut crate::mm::page::PageMapper<MMArch, &mut BumpAllocator<MMArch>>,
59440fe15e0SLoGin     ) {
59540fe15e0SLoGin         for i in 0..(Self::REMAP_SIZE / MMArch::PAGE_SIZE) {
59640fe15e0SLoGin             let paddr = PhysAddr::new(i * MMArch::PAGE_SIZE);
59740fe15e0SLoGin             let vaddr = VirtAddr::new(i * MMArch::PAGE_SIZE);
59840fe15e0SLoGin             let flags = kernel_page_flags::<MMArch>(vaddr);
59940fe15e0SLoGin 
60040fe15e0SLoGin             let flusher = mapper
60140fe15e0SLoGin                 .map_phys(vaddr, paddr, flags)
60240fe15e0SLoGin                 .expect("Failed to map frame");
60340fe15e0SLoGin             // 暂时不刷新TLB
60440fe15e0SLoGin             flusher.ignore();
60540fe15e0SLoGin         }
60640fe15e0SLoGin     }
60740fe15e0SLoGin 
60840fe15e0SLoGin     /// 取消低地址的映射
60940fe15e0SLoGin     pub unsafe fn unmap_at_low_address(flush: bool) {
61040fe15e0SLoGin         let mut mapper = KernelMapper::lock();
61140fe15e0SLoGin         assert!(mapper.as_mut().is_some());
61240fe15e0SLoGin         for i in 0..(Self::REMAP_SIZE / MMArch::PAGE_SIZE) {
61340fe15e0SLoGin             let vaddr = VirtAddr::new(i * MMArch::PAGE_SIZE);
61426887c63SLoGin             let (_, _, flusher) = mapper
61540fe15e0SLoGin                 .as_mut()
61640fe15e0SLoGin                 .unwrap()
61726887c63SLoGin                 .unmap_phys(vaddr, true)
61840fe15e0SLoGin                 .expect("Failed to unmap frame");
61940fe15e0SLoGin             if flush == false {
62040fe15e0SLoGin                 flusher.ignore();
62140fe15e0SLoGin             }
62240fe15e0SLoGin         }
62340fe15e0SLoGin     }
62440fe15e0SLoGin }
62540fe15e0SLoGin #[no_mangle]
62640fe15e0SLoGin pub extern "C" fn rs_mm_init() {
62740fe15e0SLoGin     mm_init();
628d4f3de93Slogin }
629