但是由于物理制程/制造方面的原因,导致nor和nand在一些具体操作方面的特性不同:
表1:Nand Flash和Nor Flash的区别
1. 理论上是可以的,而且也是有人验证过可以的,只不过由于 nand flash 的物理特性,不能完全保证所读取的数据 / 代码是正确的,实际上,很少这么用而已。因为,如果真是要用到 nand flash 做 XIP ,那么除了读出速度慢之外,还要保证有数据的校验,以保证读出来的,将要执行的代码 / 数据,是正确的。否则,系统很容易就跑飞了。
2. 芯片内执行 (XIP, eXecute In Place) :
http://hi.baidu.com/serial_story/blog/item/adb20a2a3f8ffe3c5243c1df.html
【 Nand Flash 的种类】
具体再分,又可以分为
1)Bare NAND chips :裸片,单独的 nand 芯片
2)SmartMediaCards : = 裸片 + 一层薄塑料,常用于数码相机和 MP3 播放器中。之所以称 smart ,是由于其软件 smart ,而不是硬件本身有啥 smart 之处。 ^_^
3)DiskOnChip :裸片 +glue logic , glue logic= 硬件 ECC 产生器 + 用于静态的 nand 芯片控制的寄存器 + 直接访问一小片地址窗口,那块地址中包含了引导代码的 stub 桩,其可以从 nand flash 中拷贝真正的引导代码。
【 spare area/oob 】
Nand 由于最初硬件设计时候考虑到,额外的错误校验等需要空间,专门对应每个页,额外设计了叫做 spare area 空区域,在其他地方,比如 jffs2 文件系统中,也叫做 oob ( out of band )数据。
其具体用途,总结起来有:
1. 标记是否是坏快
2. 存储 ECC 数据
3. 存储一些和文件系统相关的数据,如 jffs2 就会用到这些空间存储一些特定信息, yaffs2 文件系统,会在 oob 中,存放很多和自己文件系统相关的信息。
2. 软件方面
如果想要在 Linux 下编写 Nand Flash 驱动,那么就先要搞清楚 Linux 下,关于此部分的整个框架。弄明白,系统是如何管理你的 nand flash 的,以及,系统都帮你做了那些准备工作,而剩下的,驱动底层实现部分,你要去实现哪些功能,才能使得硬件正常工作起来。
【内存技术设备, MTD ( Memory Technology Device )】
MTD ,是 Linux 的存储设备中的一个子系统。其设计此系统的目的是,对于内存类的设备,提供一个抽象层,一个接口,使得对于硬件驱动设计者来说,可以尽量少的去关心存储格式,比如 FTL , FFS2 等,而只需要去提供最简单的底层硬件设备的读 / 写 / 擦除函数就可以了。而对于数据对于上层使用者来说是如何表示的,硬件驱动设计者可以不关心,而 MTD 存储设备子系统都帮你做好了。
对于 MTD 字系统的好处,简单解释就是,他帮助你实现了,很多对于以前或者其他系统来说,本来也是你驱动设计者要去实现的很多功能。换句话说,有了 MTD ,使得你设计 Nand Flash 的驱动,所要做的事情,要少很多很多,因为大部分工作,都由 MTD 帮你做好了。
当然,这个好处的一个“副作用”就是,使得我们不了解的人去理解整个 Linux 驱动架构,以及 MTD ,变得更加复杂。但是,总的说,觉得是利远远大于弊,否则,就不仅需要你理解,而且还是做更多的工作,实现更多的功能了。
此外,还有一个重要的原因,那就是,前面提到的 nand flash 和普通硬盘等设备的特殊性:
有限的通过出复用来实现输入输出命令和地址 / 数据等的 IO 接口,最小单位是页而不是常见的 bit ,写前需擦除等,导致了这类设备,不能像平常对待硬盘等操作一样去操作,只能采取一些特殊方法,这就诞生了 MTD 设备的统一抽象层。
MTD ,将 nand flash , nor flash 和其他类型的 flash 等设备,统一抽象成 MTD 设备来管理,根据这些设备的特点,上层实现了常见的操作函数封装,底层具体的内部实现,就需要驱动设计者自己来实现了。具体的内部硬件设备的读 / 写 / 擦除函数,那就是你必须实现的了。
表2.MTD设备和硬盘设备之间的区别
多说一句,关于 MTD 更多的内容,感兴趣的,去附录中的 MTD 的主页去看。
关于 mtd 设备驱动,感兴趣的可以去参考
MTD 原始设备与 FLASH 硬件驱动的对话
MTD 原始设备与 FLASH 硬件驱动的对话 - 续
那里,算是比较详细地介绍了整个流程,方便大家理解整个 mtd 框架和 nand flash 驱动。
【 Nand flash 驱动工作原理】
在介绍具体如何写 Nand Flash 驱动之前,我们先要了解,大概的,整个系统,和 Nand Flash 相关的部分的驱动工作流程,这样,对于后面的驱动实现,才能更加清楚机制,才更容易实现,否则就是,即使写完了代码,也还是没搞懂系统是如何工作的了。
让我们以最常见的, Linux 内核中已经有的三星的 Nand Flash 驱动,来解释 Nand Flash 驱动具体流程和原理。
此处是参考 2.6.29 版本的 Linux 源码中的 /drivers/mtd/nand/s3c2410.c ,以 2410 为例。
1. 在 nand flash 驱动加载后,第一步,就是去调用对应的 init 函数, s3c2410_nand_init, 去将在 nand flash 驱动注册到 Linux 驱动框架中。
2. 驱动本身,真正开始,是从 probe 函数, s3c2410_nand_probe->s3c24xx_nand_probe,
在 probe 过程中,去用 clk_enable 打开 nand flash 控制器的 clock 时钟,用 request_mem_region 去申请驱动所需要的一些内存等相关资源。然后,在 s3c2410_nand_inithw 中,去初始化硬件相关的部分,主要是关于时钟频率的计算,以及启用 nand flash 控制器,使得硬件初始化好了,后面才能正常工作。
3. 需要多解释一下的,是这部分代码:
for (setno = 0; setno < nr_sets; setno++, nmtd++) {
pr_debug("initialising set %d (%p, info %p)/n", setno, nmtd, info);
/* 调用 init chip 去挂载你的 nand 驱动的底层函数到 nand flash 的结构体中,以及设置对应的 ecc mode ,挂载 ecc 相关的函数 */
s3c2410_nand_init_chip(info, nmtd, sets);
/* scan_ident ,扫描 nand 设备,设置 nand flash 的默认函数,获得物理设备的具体型号以及对应各个特性参数,这部分算出来的一些值,对于 nand flash 来说,是最主要的参数,比如 nand falsh 的芯片的大小,块大小,页大小等。 */
nmtd->scan_res = nand_scan_ident(&nmtd->mtd,
(sets) ? sets->nr_chips : 1);
if (nmtd->scan_res == 0) {
s3c2410_nand_update_chip(info, nmtd);
/* scan tail ,从名字就可以看出来,是扫描的后一阶段,此时,经过前面的 scan_ident ,我们已经获得对应 nand flash 的硬件的各个参数,然后就可以在 scan tail 中,根据这些参数,去设置其他一些重要参数,尤其是 ecc 的 layout ,即 ecc 是如何在 oob 中摆放的,最后,再去进行一些初始化操作,主要是根据你的驱动,如果没有实现一些函数的话,那么就用系统默认的。 */
nand_scan_tail(&nmtd->mtd);
/* add partion ,根据你的 nand flash 的分区设置,去分区 */
s3c2410_nand_add_partition(info, nmtd, sets);
}
if (sets != NULL)
sets++;
}
4. 等所有的参数都计算好了,函数都挂载完毕,系统就可以正常工作了。
上层访问你的 nand falsh 中的数据的时候,通过 MTD 层,一层层调用,最后调用到你所实现的那些底层访问硬件数据 / 缓存的函数中。
【 Linux 下 nand flash 驱动编写步骤简介】
关于上面提到的,在 nand_scan_tail 的时候,系统会根据你的驱动,如果没有实现一些函数的话,那么就用系统默认的。如果实现了自己的函数,就用你的。
估计很多人就会问了,那么到底我要实现哪些函数呢,而又有哪些是可以不实现,用系统默认的就可以了呢。
此问题的,就是我们下面要介绍的,也就是,你要实现的,你的驱动最少要做哪些工作,才能使整个 nand flash 工作起来。
1. 对于驱动框架部分
其实,要了解,关于驱动框架部分,你所要做的事情的话,只要看看三星的整个 nand flash 驱动中的这个结构体,就差不多了:
static struct platform_driver s3c2410_nand_driver = {
.probe = s3c2410_nand_probe,
.remove = s3c2410_nand_remove,
.suspend = s3c24xx_nand_suspend,
.resume = s3c24xx_nand_resume,
.driver = {
.name = "s3c2410-nand",
.owner = THIS_MODULE,
},
};
对于上面这个结构体,没多少要解释的。从名字,就能看出来:
( 1 ) probe 就是系统“探测”,就是前面解释的整个过程,这个过程中的多数步骤,都是和你自己的 nand flash 相关的,尤其是那些硬件初始化部分,是你必须要自己实现的。
( 2 ) remove ,就是和 probe 对应的,“反初始化”相关的动作。主要是释放系统相关资源和关闭硬件的时钟等常见操作了。
(3)suspend 和 resume ,对于很多没用到电源管理的情况下,至少对于我们刚开始写基本的驱动的时候,可以不用关心,放个空函数即可。
2. 对于 nand flash 底层操作实现部分
而对于底层硬件操作的有些函数,总体上说,都可以在上面提到的 s3c2410_nand_init_chip 中找到:
static void s3c2410_nand_init_chip(struct s3c2410_nand_info *info,
struct s3c2410_nand_mtd *nmtd,
struct s3c2410_nand_set *set)
{
struct nand_chip *chip = &nmtd->chip;
void __iomem *regs = info->regs;
chip->write_buf = s3c2410_nand_write_buf ;
chip->read_buf = s3c2410_nand_read_buf ;
chip->select_chip = s3c2410_nand_select_chip ;
chip->chip_delay = 50;
chip->priv = nmtd;
chip->options = 0;
chip->controller = &info->controller;
switch (info->cpu_type) {
case TYPE_S3C2410:
/* nand flash 控制器中,一般都有对应的数据寄存器,用于给你往里面写数据,表示将要读取或写入多少个字节 (byte,u8)/ 字 (word,u32) ,所以,此处,你要给出地址,以便后面的操作所使用 */
chip->IO_ADDR_W = regs + S3C2410_NFDATA;
info->sel_reg = regs + S3C2410_NFCONF;
info->sel_bit = S3C2410_NFCONF_nFCE;
chip->cmd_ctrl = s3c2410_nand_hwcontrol ;
chip->dev_ready = s3c2410_nand_devready ;
break;
。。。。。。
}
chip->IO_ADDR_R = chip->IO_ADDR_W;
nmtd->info = info;
nmtd->mtd.priv = chip;
nmtd->mtd.owner = THIS_MODULE;
nmtd->set = set;
if (hardware_ecc) {
chip->ecc.calculate = s3c2410_nand_calculate_ecc ;
chip->ecc.correct = s3c2410_nand_correct_data ;
/* 此处,多数情况下,你所用的 Nand Flash 的控制器,都是支持硬件 ECC 的,所以,此处设置硬件 ECC(HW_ECC) ,也是充分利用硬件的特性,而如果此处不用硬件去做的 ECC 的话,那么下面也会去设置成 NAND_ECC_SOFT ,系统会用默认的软件去做 ECC 校验,相比之下,比硬件 ECC 的效率就低很多,而你的 nand flash 的读写,也会相应地要慢不少 */
chip->ecc.mode = NAND_ECC_HW;
switch (info->cpu_type) {
case TYPE_S3C2410:
chip->ecc.hwctl = s3c2410_nand_enable_hwecc ;
chip->ecc.calculate = s3c2410_nand_calculate_ecc;
break;
。。。。。
}
} else {
chip->ecc.mode = NAND_ECC_SOFT;
}
if (set->ecc_layout != NULL)
chip->ecc.layout = set->ecc_layout;
if (set->disable_ecc)
chip->ecc.mode = NAND_ECC_NONE;
}
而我们要实现的底层函数,也就是上面蓝色标出来的一些函数而已:
( 1 ) s3c2410_nand_write_buf 和 s3c2410_nand_read_buf :这是两个最基本的操作函数,其功能,就是往你的 nand flash 的控制器中的 FIFO 读写数据。一般情况下,是 MTD 上层的操作,比如要读取一页的数据,那么在发送完相关的读命令和等待时间之后,就会调用到你底层的 read_buf ,去 nand Flash 的 FIFO 中,一点点把我们要的数据,读取出来,放到我们制定的内存的缓存中去。写操作也是类似,将我们内存中的数据,写到 Nand Flash 的 FIFO 中去。具体的数据流向,参考上面的图 4 。
( 2 ) s3c2410_nand_select_chip : 实现 Nand Flash 的片选。
( 3 ) s3c2410_nand_hwcontrol :给底层发送命令或地址,或者设置具体操作的模式,都是通过此函数。
( 4 ) s3c2410_nand_devready : Nand Flash 的一些操作,比如读一页数据,写入(编程)一页数据,擦除一个块,都是需要一定时间的,在命发送完成后,就是硬件开始忙着工作的时候了,而硬件什么时候完成这些操作,什么时候不忙了,变就绪了,就是通过这个函数去检查状态的。一般具体实现都是去读硬件的一个状态寄存器,其中某一位是否是 1 ,对应着是出于“就绪 / 不忙”还是“忙”的状态。这个寄存器,也就是我们前面分析时序图中的 R/B# 。
( 5 ) s3c2410_nand_enable_hwecc : 在硬件支持的前提下,前面设置了硬件 ECC 的话,要实现这个函数,用于每次在读写操作前,通过设置对应的硬件寄存器的某些位,使得启用硬件 ECC ,这样在读写操作完成后,就可以去读取硬件校验产生出来的 ECC 数值了。
( 6 ) s3c2410_nand_calculate_ecc :如果是上面提到的硬件 ECC 的话,就不用我们用软件去实现校验算法了,而是直接去读取硬件产生的 ECC 数值就可以了。
( 7 ) s3c2410_nand_correct_data :当实际操作过程中,读取出来的数据所对应的硬件或软件计算出来的 ECC ,和从 oob 中读出来的 ECC 不一样的时候,就是说明数据有误了,就需要调用此函数去纠正错误。对于现在 SLC 常见的 ECC 算法来说,可以发现 2 位,纠正 1 位。如果错误大于 1 位,那么就无法纠正回来了。一般情况下,出错超过 1 位的,好像几率不大。至少我看到的不是很大。更复杂的情况和更加注重数据安全的情况下,一般是需要另外实现更高效和检错和纠错能力更强的 ECC 算法的。
当然,除了这些你必须实现的函数之外,在你更加熟悉整个框架之后,你可以根据你自己的 nand flash 的特点,去实现其他一些原先用系统默认但是效率不高的函数,而用自己的更高效率的函数替代他们,以提升你的 nand flash 的整体性能和效率。