logo

Práce se soubory zip v Pythonu

Tento článek vysvětluje, jak lze provádět různé operace se souborem zip pomocí jednoduchého programu python. Co je to soubor zip? ZIP je formát archivního souboru, který podporuje bezztrátovou kompresi dat. Bezeztrátovou kompresí máme na mysli, že kompresní algoritmus umožňuje dokonalou rekonstrukci původních dat z komprimovaných dat. Soubor ZIP je tedy jeden soubor obsahující jeden nebo více komprimovaných souborů, který nabízí ideální způsob, jak zmenšit velké soubory a udržet související soubory pohromadě. Proč potřebujeme soubory zip?
  • Aby se snížily nároky na skladování.
  • Pro zlepšení přenosové rychlosti oproti standardním připojením.
Pro práci na zip souborech pomocí pythonu použijeme vestavěný python modul tzv zipfile .

1. Rozbalení souboru zip

Python
# importing required modules from zipfile import ZipFile # specifying the zip file name file_name = 'my_python_files.zip' # opening the zip file in READ mode with ZipFile(file_name 'r') as zip: # printing all the contents of the zip file zip.printdir() # extracting all the files print('Extracting all the files now...') zip.extractall() print('Done!') 
The above program extracts a zip file named 'my_python_files.zip' in the same directory as of this python script. The output of above program may look like this: Práce se soubory zip v Pythonu' title=Pokusme se porozumět výše uvedenému kódu po částech:
  • from zipfile import ZipFile
    ZipFile is a class of zipfile module for reading and writing zip files. Here we import only class ZipFile from zipfile module.
  • with ZipFile(file_name 'r') as zip:
    Here a ZipFile object is made by calling ZipFile constructor which accepts zip file name and mode parameters. We create a ZipFile object in ČÍST režimu a pojmenujte jej jako zip .
  • zip.printdir()
    printdir() metoda vytiskne obsah archivu.
  • zip.extractall()
    extrahovat() metoda rozbalí veškerý obsah souboru zip do aktuálního pracovního adresáře. Můžete také zavolat výpis() method to extract any file by specifying its path in the zip file. For example:
    zip.extract('python_files/python_wiki.txt')
    This will extract only the specified file. If you want to read some specific file you can go like this:
    data = zip.read(name_of_file_to_read)

2. Zápis do souboru zip

Zvažte adresář (složku) s takovým formátem: Práce se soubory zip v Pythonu' title= Here we will need to crawl the whole directory and its sub-directories in order to get a list of all file paths before writing them to a zip file. The following program does this by crawling the directory to be zipped: Python
# importing required modules from zipfile import ZipFile import os def get_all_file_paths(directory): # initializing empty file paths list file_paths = [] # crawling through directory and subdirectories for root directories files in os.walk(directory): for filename in files: # join the two strings in order to form the full filepath. filepath = os.path.join(root filename) file_paths.append(filepath) # returning all file paths return file_paths def main(): # path to folder which needs to be zipped directory = './python_files' # calling function to get all file paths in the directory file_paths = get_all_file_paths(directory) # printing the list of all files to be zipped print('Following files will be zipped:') for file_name in file_paths: print(file_name) # writing files to a zipfile with ZipFile('my_python_files.zip''w') as zip: # writing each file one by one for file in file_paths: zip.write(file) print('All files zipped successfully!') if __name__ == '__main__': main() 
The output of above program looks like this: Práce se soubory zip v Pythonu' title=Pokusme se porozumět výše uvedenému kódu rozdělením na fragmenty:
  • def get_all_file_paths(directory): file_paths = [] for root directories files in os.walk(directory): for filename in files: filepath = os.path.join(root filename) file_paths.append(filepath) return file_paths
    First of all to get all file paths in our directory we have created this function which uses the os.walk()  metoda. V každé iteraci jsou všechny soubory přítomné v tomto adresáři připojeny k volanému seznamu cesty k souboru . Nakonec vrátíme všechny cesty k souborům.
  • file_paths = get_all_file_paths(directory)
    Here we pass the directory to be zipped to the get_all_file_paths() a získat seznam obsahující všechny cesty k souborům.
  • with ZipFile('my_python_files.zip''w') as zip:
    Here we create a ZipFile object in WRITE mode this time.
  • for file in file_paths: zip.write(file)
    Here we write all the files to the zip file one by one using napsat metoda.

3. Získání všech informací o souboru zip



Python
# importing required modules from zipfile import ZipFile import datetime # specifying the zip file name file_name = 'example.zip' # opening the zip file in READ mode with ZipFile(file_name 'r') as zip: for info in zip.infolist(): print(info.filename) print('tModified:t' + str(datetime.datetime(*info.date_time))) print('tSystem:tt' + str(info.create_system) + '(0 = Windows 3 = Unix)') print('tZIP version:t' + str(info.create_version)) print('tCompressed:t' + str(info.compress_size) + ' bytes') print('tUncompressed:t' + str(info.file_size) + ' bytes') 
The output of above program may look like this: ' title=
for info in zip.infolist():
Here infolist() metoda vytvoří instanci ZipInfo třídy, která obsahuje všechny informace o souboru zip. Máme přístup ke všem informacím, jako je datum poslední úpravy souborů, systém názvů souborů, na kterém byly soubory vytvořeny Velikost verze ZIP souborů v komprimované a nekomprimované podobě atd. Nikhil Kumar . Vytvořit kvíz