UTF-8 este un mod standard de codare a caracterelor pentru stocarea Unicode, dezvoltată pentru afișarea diferitelor limbi.
Deoarece Unicode și UTF-8 au fost dezvoltate după anii 1990, o versiune inițială a formatului ZIP (realizată în anii 1980) nu a acceptat UTF-8. Cu toate acestea, pe măsură ce formatul ZIP a devenit formatul standard de arhivă și a fost necesar să suporte Unicode, au fost lansate mai multe modalități de procesare a șirurilor UTF-8 în fișierele ZIP.
Bandizip acceptă două dintre acestea; o modalitate este de a converti numele de fișiere în UTF-8, iar cealaltă este de a stoca nume de fișiere UTF-8 suplimentare într-un câmp de antet suplimentar, în timp ce le stochează pe cele originale în MBCS.
Bandizip stochează numele de fișiere în fișiere ZIP, convertindu-le la UTF-8. Există o metodă standard de stocare a numelor de fișiere definită de APPNOTE, însă unele arhivatoare nu reușesc ocazional să recunoască fișierele ZIP sau le gestionează greșit, provocând deteriorarea numelor de fișiere. APPNOTE
Bandizip stochează nume de fișiere UTF-8 suplimentare într-un extra câmp de antet al formatului ZIP, în timp ce le stochează pe cele originale în MBCS. Această metodă este, de asemenea, definită de APPNOTE ca „Info-ZIP Unicode Path Extra Field”. Deoarece utilizează un câmp suplimentar pentru stocarea numelor de fișiere UTF-8, dimensiunile fișierelor vor fi cu zeci de octeți mai mari decât cele anterioare. Totuși, numele de fișiere originale sunt stocate în MBCS și, prin urmare, fișierele sunt mai sigure și mai compatibile.
Deoarece majoritatea programelor de arhivare (cum ar fi 7zip, Winrar și Winzip) suportă această caracteristică, aceasta previne deteriorarea numelor de fișiere în sistemele de operare cu o limbă de sistem diferită.
Imaginea de mai jos arată diferența dintre utilizarea funcției și neutilizarea acesteia la trimiterea unui fișier ZIP comprimat pe sistemul de operare coreean către sistemul de operare japonez.
Formatele TAR și TGZ sunt formate de arhivă utilizate în principal pe Unix (care utilizează nume de fișiere UTF-8). Această caracteristică vă permite să extrageți fișiere TAR/TGZ pe Unix fără probleme legate de numele de fișier.
NOTĂ: Este posibil ca unele aplicații pentru Windows să nu recunoască corect pagina de cod UTF-8 a formatelor TAR/TGZ.