一、磁盘知识
(图片来源博客源尖尖毛草博客)
传统的机配磁盘由盘片、机械臂、马达构成。 一块磁盘会有多个盘片。
- 磁道:盘片上一圈圈灰色同心圆。
- 扇区:磁道上一段圆弧,盘片上最小的物理存储单位,主要有512B和4KB两种格式。
(图片来源:博客园尖尖毛草博客)
- 柱面:扇区组成一个圆,上图中蓝色部分。 一个盘片上下两面都可读写,使用两个磁头读写。
计算存储容量=存储容量=磁头数×磁道(柱面)数×每道扇区数×每扇区字节数磁道扇区柱面三个参数计算存储容量 = 存储容量 = 磁头数 × 磁道(柱面)数 × 每道扇区数 × 每扇区字节数磁道 扇区 柱面 三个参数计算存储容量=存储容量=磁头数×磁道(柱面)数×每道扇区数×每扇区字节数磁道扇区柱面三个参数
老式磁盘中,每个磁道的扇区数是相等的,所以越往圆心存储密度越高。现代磁盘改为等密度结构,外围磁道的扇区数量大于内圈磁道,寻址方式也改为以扇区为单位的线性寻址。 为了与老式3D寻址兼容,现代磁盘控制器使用地址翻译器把3D寻址参数转为线性参数。
二、在深度系统中打开分区编辑器查看磁盘信息:
三、分区表
早期的分区以柱面为最小分区单位;现在的分区通常使用扇区为最小分区单位。每个扇区有一个自己的号码。磁盘分区表主要有MBR和GPT两种格式,GPT格式可以支持2T以上容量。
- 主分区:一块硬盘取多4个主分区。主分区激活就可以用来启动。
- 扩展分区:早期设计的硬盘只能分4个分区。后来建了sda4做为扩展分区,称为逻辑分区。
- 逻辑分区可以有很多个。
- Linux限制,一块硬盘主分区+扩展分区 最多只有4个。计算机的分区多于4个余下空间不能使用。
1. 下面重点看看MBR分区表
早期的Linux为了兼容Windows的磁盘,使用了支持Windows的MBR。MBR全称是Master Boot Record,通常放在磁盘的第一个扇区。这个扇区通常为512字节大小,当中包括两种东西:
- 主引导记录:446字节
- 分区表:64字节,最多只能有4组记录区,每组记录区记录该区起止柱面号码。
在深度系统使用下面命令读取MBR记录:
sudo dd if=/dev/sda of=~/bootsector bs=512 count=1
使用vim -b ~/bootsector打开查看 (在vim命令模式下输入:%!xxd 显示16进制模式)
末尾的55aa是标志位,图中选中的 8020开始即第一个分区信息,
- 第1字节80 表示是活动分区(00表示非活动分区)
- 第5字节83表示分区类型是Linux分区(8e为Linux LVM分区)
如果要改动文件,可以使用
sudo dd if=~/bootsector of=/dev/sda bs=512 count=1
写回磁盘。
使用C从扇区读取文件
#include <stdio.h>#include <stdlib.h>#include <sys/types.h>#include <sys/stat.h>#include <fcntl.h>#include <libgen.h>#include <unistd.h>static void usage(char *prog_name){ fprintf(stderr, "usage: %s device start count\n", prog_name); fprintf(stderr, "example: %s /dev/sda 0 512\n", prog_name);}int main(int argc, char *argv[]){ char buf[4096]; int fd = 0; int i = 0; int j = 0; int start = 0; int count = 0; char *device = NULL; if(argc != 4){ usage(basename(argv[0])); exit(1); } device = argv[1]; start = atol(argv[2]); count = atol(argv[3]); // 把磁盘像文件一样打开 fd = open(device, O_RDONLY); if(-1 == fd){ fprintf(stderr, "cannot open device"); exit(1); } // 找到起始位置 if(lseek(fd, start, SEEK_SET) != start){ fprintf(stderr, "cannot seek at %d", start); exit(1); } // 挨个字节读出来 while(count > 0){ int size = count > sizeof(buf) ? sizeof(buf) : count; read(fd, buf, size); /* 每行显示16个字节 每两个字节间以空格分开 */ for(i = 0; i < size/16; i++){ fprintf(stdout,"x:", i*16+start); for(j = 0; j < 16; j++){ fprintf(stdout, " x", (int)buf[i*16+j] & 0xFF); } fprintf(stdout,"\n"); fflush(stdout); } count -= size; start += size; }}
gcc编译运行:
扩展分区
分区记录里分一个扩展分区出来,然后在扩展分区前几个扇区用来再记录逻辑分区。Linux的SATA硬盘逻辑分区可以突破63个。
2. GPT分区(GUID Partition Table)
由于 MBR分区 每个分区表只有16字节,一个分区被限制最大只能使用2.2TB的磁盘。GPT将扇区以逻辑区块(Logincal Block Address,LBA)来处理,一个LBA默认512字节,第一个LBA就是LBA0.
- GPT使用了34个LBA来记录分区信息
- GPT把磁盘的最后34个LBA拿来作备份。
- LBA0:用来兼容MBR,存储了启动引导程序。
- LBA1:GPT表头记录
- LBA2-33:实际记录分区信息,每个LBA放4组分区记录,每组记录用到128字节空间。GPT分区表对单一分区容量限制达8ZB(1ZB=230TB)
GPT 没有了主分区、逻辑分区的区分 。
四、Linux的磁盘文件名
- 老的ide接口,使用 /dev/hd开头,现在已经很少使用;
- 现在物理磁盘一般模拟成 /dev/sd[a-p]格式,第一块磁盘为/dev/sda;
分区的文件名以第一块磁盘为例,为/dev/sda[1-128]。 - 虚拟机的磁盘通常是 /dev/vd[a-p] (比如用阿里的ECS)
- 磁盘阵列通常是 /dev/md[0-128]
- LVM是 /dev/VGNAME/LVNAME
五、Linux 常用的文件格式
Linux较早的文件系统使用的是ext2。centos6: 以ext4为主 。centos7: 以xfs为主,大文件系统,日志型 ,文件可以修复。执行命令: cat /etc/fstab
六、索引节点inode
每个存储设备或存储设备的分区被格式化为文件系统后有两部分:block+inode文件存储在硬盘上,最小存储单位是扇区,每个扇区可能是512Byte。但操作系统读取硬盘时,不会一个一个扇区读,而是一次性连续读多个扇区,多个扇区称为一个“块”。多个扇区组成的块,是文件存取的最小单位。“块”的大小,常见的有4B,即连续8个扇区。块用来存储数据,而inode用来存储这些数据元信息,主要包括:
- 文件大小
- 文件所属用户User ID
- 文件的Group ID
- 文件的读/写权限
- 文件的时间戳
- 链接数
- 文件数据Block的位置
inode为每个文件进行信息索引,所以就有了inode的数值。操作系统根据指令,可以通过inode值快速找到相对应的文件。
使用stat命令可以查看文件的inode信息:
$ stat linux2-4.mov16777220 3753644 -rw-r--r-- 1 apple staff 0 674287083 "Jul 9 23:49:23 2020" "Jul 9 23:07:22 2020" "Jul 9 23:07:23 2020" "Jul 9 23:07:08 2020" 4096 1344096 0 linux2-4.mov
硬盘在格式化的时候,操作系统会将硬盘分成两个区域:数据区、inode区。每个inode节点的大小一般为128B或256B;inode节点的数量在格式化时给定,一般是每1K或每2K设置一个inode。
如果一块1G的硬盘,每个inode节点大小为128B,每1K就设置一个inode,那inode占的空间会达到128M,占硬盘的12.8%。
df -i 命令可以查看每个硬盘分区的inode总数和已经使用的数量。