NAND Flash 101:群聯 SmartRefresh™

保證 NAND 閃存的可靠性和數據完整性

作者 | 2021 年 12 月 6 日 | 全部, NAND閃存101, 技術

固態硬盤 (SSD) 在存儲市場中扮演的角色變得越來越重要。由於SSD相對於傳統硬盤(HDD)具有巨大的優勢,SSD將很快成為主流存儲解決方案。

SSD的採用與NAND閃存的工藝演進有關。與其他半導體產品一樣,NAND閃存芯片的單位成本將通過減少處理節點而顯著降低。閃存也主要由晶體管縮放和多級單元(MLC)技術驅動。單個閃存單元中可以存儲多於一位的數據。不幸的是,由於NAND閃存的物理特性,隨著晶體管尺寸的縮小和單個閃存單元中數據位的增加,可靠性會變得更差。已經開發出技術來彌補這些副作用。

 

 

讀取乾擾錯誤

NAND 閃存由數百萬個晶體管 (MOSFET) 組成。每個MOSFET可以被視為一個存儲單元。這些存儲單元通過閾值電壓 (Vth) 存儲數據,這是能夠“打開”存儲單元的最低電壓。

 

以2-bit MLC NAND為例,2-bit MLC NAND中的數據有四種狀態。將可能的 Vth 值的整個範圍劃分為這四個部分的三個參考電壓(例如,V1、V2 和 V3)。 Vth所在的區域表示存儲單元當前的狀態,用於識別存儲單元中已經存儲了哪些數據。所有存儲單元的閾值電壓都存在一個上限,稱為直通電壓(Vpass)。 Vpass 是保證存儲單元“開啟”所需的電壓。

NAND閃存塊可以被視為許多晶體管的陣列。 NAND 閃存上的簡單讀取操作是通過向字線 (WL) 施加參考電壓 (Vref),然後檢查該 WL 上所選單元的開關 ON/OFF 狀態來執行的。同一位線(BL)上的存儲器單元與其相鄰單元連接。由於要讀取的單元格只是其中之一,因此其他未選中的單元格必須保持其“ON”狀態,以確保可以感測到所選單元格的狀態。因此,必須對同一 BL 上的其他未選定單元應用直通 (Vpass)。

 

這樣,當執行讀數據操作時,同一塊中的其他未選擇單元的閾值電壓被移位到較高值。

 

由於Vpass,同一塊中未選擇的存儲單元的狀態可能會受到影響。當直通電壓施加到未選擇的晶體管時,由於稱為福勒-諾德海姆隧道效應的隧道效應,電荷可能被注入到浮動柵極中。這種效應將引起晶體管閾值電壓的偏移,從而導致不可接受的數據失真。

 

NAND閃存中的保留錯誤

有些用戶將文件寫入SSD,但很長時間不訪問它們。在這些舊文件中可以檢測到一些錯誤。這種錯誤是由於隨著時間的推移電荷洩漏造成的。這種現像類似於“讀干擾”的根本原因。晶體管中存在的電荷決定存儲單元的閾值電壓電平。隨著NAND閃存尺寸的縮小,閾值電壓窗口的尺寸也變得越來越小。這種縮小趨勢增加了由於保留噪聲而導致閾值電壓電平偏移的可能性。然而,很少訪問的數據的完整性仍然需要保證。

 

群聯的 SmartRefresh™ 技術

為了保護SSD中存儲的數據,Phison開發了一項專有技術,稱為 智能刷新™ 使用兩種主要方法:

      1. 動態錯誤位監控 (DEBM)
      2. 讀取重試

隨著工藝尺寸的縮小,NAND閃存的固有可靠性成為一個問題。糾錯碼(ECC)能力已成為NAND閃存行業最關鍵的話題之一。不幸的是,無論使用哪種ECC算法,其糾錯能力都必然存在理論上的限制。如果在ECC引擎被觸發之前能夠減少或避免錯誤,則ECC引擎無法恢復用戶數據的可能性就會降低。動態錯誤位監控 (DEBM) 是一種用於在發生任何數據損壞之前檢查數據健康狀態的機制。

 

群聯的嵌入式固件在後台運行,檢查每個塊的錯誤位。一旦在我們的固件設置的標準內出現塊故障(即錯誤位數超過預先確定的閾值),固件就會對該故障塊執行特定操作,以保證用戶數據的完整性。

 

讀取重試

從有問題的 NAND 塊中獲取正確數據的另一種方法是選擇不同的電壓電平來執行數據解釋。圖 1 說明了 2 位 MLC NAND 閃存的讀取操作以及用於解釋存儲數據的閾值電壓 (Vth)。如果當前目標塊被識別為有風險,群聯的固件會使用適當的電壓水平來分析數據。使用此方法檢索的數據的可靠性取決於 Vth 的選擇。群聯專有算法根據 NAND 塊的健康評估確定最佳 Vth 值。

 

空閒時間媒體掃描 (ITMS)

前面提到的方法可以分別被視為預防措施和糾正措施。 SmartRefresh™ 是一種結合了這兩種方法的技術,可保護用戶數據免受由於 NAND 閃存的物理特性而導致的意外錯誤。這個機制分為兩個階段。
第一階段是空閒時間媒體掃描 (ITMS)。當主機進入 IDLE 狀態時,ITMS 被觸發。一旦ITMS被激活,ITMS被分為許多ITMS週期,並且在每個ITMS週期內掃描多個扇區

 

ITMS 是一種用於在執行 DEBM 和 Read Retry 操作後檢測掃描的塊是否健康的機制。如果任何塊被識別為不健康塊,則對不健康塊內的有效數據進行適當處理以避免數據丟失。由於 ITMS 利用主機進入 IDLE 模式的持續時間來檢查存儲數據的健康狀態,因此只要主機向驅動器發送命令,ITMS 就會被中斷。在這種情況下,ITMS 將停止,並且下一個 ITMS 週期將從上一個 ITMS 週期中尚未檢查的地址啟動。

 

運行時媒體掃描 (RTMS)

第二階段是運行時媒體掃描 (RTMS)。與 ITMS 相比,執行 RTMS 的時序不限於 IDLE 模式。即使主機不斷向驅動器發送命令,RTMS 也能保證在特定時間段(例如每週一次)對整個驅動器進行完整掃描。換句話說,RTMS 旨在確保用於處理長期任務的驅動器的數據完整性。

 

群聯確保您數據的完整性

群聯的專有技術 SmartRefresh™ 提供可靠的機制來確保數據完整性,包括多層操作來保護存儲在 SSD 上的用戶數據。通過採用群聯的SmartRefresh™解決方案,您可以避免NAND閃存固有特性造成的錯誤。

 

加速創新的基礎™

zh_TW繁體中文