精选linux每处理器内存分配

为了维护世界和平_

分类：学习笔记

发布时间 2024.02.15阅读数 571 评论数 0

一、每处理器

在多处理器系统中，每处理器变量为每个处理器生成一个变量副本，每个处理器访问自己的副本；

优点：避免处理器之间和处理器缓存之间的同步，提高程序的执行速度。

二、编程接口

1、静态


    DEFINE_PER_CPU(type,name);//定义
    DECLARE_PER_CPU(type,name);//声明
    宏定义展开
    _ attribute ((section(".data .. percpu"))) _ typeof_ (type) name 

    每处理器变量放在.data..percpu中

    DEFINE_PER_CPU_FIRST(type, name) ；//定义必须出现在每处理器变量集合中最先出现的每处理器变量
    DEFINE_PER_CPU_SHARED_ALLGNED(type,name);//定义和处理器缓存行对齐的每处理器变量，仅在SMP系统中需要
    DEFINE_PER_CPU_ALLGNED(type,name);//定义和处理器缓存行对齐的每处理器变量，都需要对齐
    DEFINE_PER_CPU_PAGE_ALIGNED(type,name);//定义和页长度对齐的每处理器变量；
    DEFINE_PER_CPU_READ_MOSTLY(type,name)定义以读为主的每处理器变量；

    允许任何模块引用 EXPORT_PER_CPU_SYMBOL(var)；把静态每处理器变量导出到符号表；
    只允许使用GPL许可的内核模块引用，使用EXPORT_PER_CPU_SYMBOL_GPL(var)

2、动态

void _percpu•_ alloc_percpu_gfp (size  size, size_t align, gfp t gfp); 
       宏 alloc_percpu_gfp(type,gfp)，是上一个的简化形式，参数size取sizeof(type);
_alloc_percpu 
       宏 alloc_percpu(type)是函数__alloc_percpu 的简化形式 

//常用
alloc__percpu(type) 
//释放
void free_percpu(void _percpu *_pdata);

3、访问每处理器变量


宏 this_cpu_ptr(ptr)用来得到当前处理器的变量副本的地址，展开如下；
    unsigned long _ ptr;
    _ptr = (unsigned long) (ptr);
    (typeof (ptr)) (_ptr + percpu_offset (raw_smp_processor_id ())); 
    当前处理器的变量副本的地址等于基准地址加上当前处理器的偏移；
宏 get_cpu_var(var)用来得到当前处理器的变量副本的值；

per_cpu_ptr(ptr, cpu) 用来得到指定处理器的变量副本的地址；
per_cpu(var,cpu)用来得到指定处理器的变量副本的值；

get_cpu_ptr(var) 禁止内核抢占并且返回当前处理器的变量副本的地址；
 put_cpu_ptr(var)开启内核抢占；与上一个成对使用，确保当前进程在内核模式下访问当前处理器的变量副本的时候不会被其他进程抢占

 get_cpu_var(var) 禁止内核抢占并且返回当前处理器的变量副本的值，
 pur_cpu_var(var) 开启内核抢占；与上一个成对使用，确保当前访问处理器变量副本的时候不会被其他进程抢占

三、每处理器的内存如何分配的

每处理器区域是按块分配的，每个块分为多个长度相同的单元（unit），每个处理器对应一个单元；

在NUMA系统上，把单元按内存节点分组，同一个内存节点的所有处理器对应的单元属于同一组；

块分配

1、vmalloc；从虚拟地址空间分配虚拟内存区域，然后映射到物理页；适用于多处理器系统

2、基于内核内存的块分配。直接从页分配器分配，使用直接映射的内核虚拟地址；适用于单处理器系统

this_cpu_ptr(ptr)访问每处理器变量，ptr是每处理器变量分配内存时返回的虚拟地址；
this_cpu_ptr (ptr)
= ptr + __per_cpu offset[cpu] ;• cpu是当前处理器的编号＊／
= ptr +(delta+ pcpu_unit_offsets[cpu])
= (ptr + delta) + pcpu unit offsets[cpu]
= (chunk->base addr + offset) + pcpu_unit_offse 七 s[cpu]
= (chunk->base_addr + pcpu_unit_offsets[cpu]) + offset 

pcpu_unit_offsets[cpu]是处理器对应的单元的偏移；
chunk->base_addr + pcpu_unit_offsets[cpu] 处理器对应单元的起始地址
offset 内部单元的偏移，就是变量副本的地址

分配图，放在每个小块的偏移和分配状态，使用最低位表示小块的分配状态；

假设系统有4个处理器，一个块分为4个单元，

分配图的初始状态，第一项存放第一个小块的偏移0，空闲，第二项存放单元的结束标记，偏移单元长度pcpu_unit_size，最低位被设置；块的初始状态，空

分配一个长度32字节的动态每处理器变量以后，

分配图使用三项:第一项存放第一个小块的偏移0，已分配；第二块存放第二个小块的偏移32，空闲；第三项存放单元的结束标记，偏移是单元长度pcpu_uint_size，最低被设置。

块的状态，每个单元中偏移0，长度32字节的小块被分配出去；

分配器根据空闲长度把块组织成链表，把每条链表称为块插槽，插槽数量是pcpu_nr_slots，

1、根据长度n计算插槽号的方法

1、如果空闲长度小于整数长度，或者最大的连续空闲字节数小于整数长度，那么插槽号是0；
2、如果块全部空闲，那么取最后一个插槽号，即pcpu_nr_slots - 1

3、其他情况：插槽号 = fln(n) - 3,并且不能小于1，fls(n)取n被设置的最高位。减3的目的是让空闲长度是1~15字节的块共享插槽1

2、确定块的参数
start_kernel -> setup__per_cpu_areas -> pcpu_embed_first_chunk -> pcpu_build_alloc i nfo

pcpu_build_alloc_info 计算分组信息和单元长度；

静态长度：内核中所有静态每处理器变量的长度总和；数据段结束地址 - 起始地址即（per_cpu_end - per_cpu_start）
保留长度：为内核模块的静态每处理器变量保留，使用宏PERCPU_MODULE_RESERVE定义，值是8KB
动态长度：为动态每处理器准备，使用宏PERCPU_DYNAMIC_RESERVE定义，在64位系统中值是28KB

size_sum = 静态长度 + 保留长度 + 动态长度

最小单元长度 min_unit_size = size_sum，并且不允许小于宏PCPU_MIN_UNIT_SIZE 值是32KB
分配长度 alloc_size = min_unit_size向上对齐到原子长度的整数倍，原子长度是页长度；
最大倍数 max = alloc_size / min_unit_size
单元长度 = alloc_size / 倍数 n，需要从最大倍数max到最小倍数1中找到一个最优的倍数n

学习链接：

kernel学习链接

参考

https://course.0voice.com/v1/course/intro?courseId=2&agentId=0

linux 处理器内存分配内核分析

转载原出处：

打赏 0

上一篇：linux缓存-利用缓存提高性能的编程技巧

下一篇：视频编解码 — 带宽预测

精选linux每处理器内存分配

为了维护世界和平_

一、每处理器

二、编程接口

三、每处理器的内存如何分配的

为你推荐

精选网络安全技术与应用实验——SSL验证分析 & 基于DTLS的安全服务器设计

四足机器人|机器狗|仿生机器人|多足机器人|Adams仿真|Simulink仿真|基于CPG的四足机器人Simulink与Adams虚拟样机|源码可直接执行|绝对干货！需要资料及指导的可以联系我！

解决Ubuntu 16.04没有WiFi链接的方法（自测成功）

C++基础与深度解析01——函数基本组成+函数传参的三种方法

XG-robot四驱四转智能小车——旭日X3派系统安装及python相关环境搭建

python-list-降维、元素相加

关于作者

为了维护世界和平_

42

0

500

2

STM32实现红外感应传感器功能

精选视频编解码 — RTP 与 RTCP

视频编解码 — 帧内预测

相关推荐

WMR四驱移动机器人树莓派系统-opencv安装笔记

扩展卡尔曼滤波EKF

浅谈武术擂台格斗机器人大赛

Cesium学习笔记5——加载topojson和Geojson

linux缓存-利用缓存提高性能的编程技巧

基于shell脚本和seq传参实现训练多套参数

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

精选linux每处理器内存分配

为了维护世界和平_

一、每处理器

二、编程接口

三、每处理器的内存如何分配的

为你推荐

精选网络安全技术与应用实验——SSL验证分析 & 基于DTLS的安全服务器设计

四足机器人|机器狗|仿生机器人|多足机器人|Adams仿真|Simulink仿真|基于CPG的四足机器人Simulink与Adams虚拟样机|源码可直接执行|绝对干货！需要资料及指导的可以联系我！

解决Ubuntu 16.04没有WiFi链接的方法（自测成功）

C++基础与深度解析01——函数基本组成+函数传参的三种方法

XG-robot四驱四转智能小车——旭日X3派系统安装及python相关环境搭建

python-list-降维、元素相加

评论（0）

关于作者

为了维护世界和平_

42

0

500

2

STM32实现红外感应传感器功能

精选视频编解码 — RTP 与 RTCP

视频编解码 — 帧内预测

相关推荐

WMR四驱移动机器人树莓派系统-opencv安装笔记

扩展卡尔曼滤波EKF

浅谈武术擂台格斗机器人大赛

Cesium学习笔记5——加载topojson和Geojson

linux缓存-利用缓存提高性能的编程技巧

基于shell脚本和seq传参实现训练多套参数

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板