📚
GZip | Veri Bilimi
Sıkıştırılmış veri yapıları (zip, tar.gz) ve onları işleme

💎 Sıkıştırılmış Veri Formatı (gzip)

    Çok sık kullanılan sıkıştırma tipidir
    deflate algorithm yöntemini kullanır
      10, 10, 10, 2, 3, 3, 3, 3, 3, 50, 50, 1, 1, 50, 10, 10, 10, 10 (18 sayı) yerine
      (3, 10), (1, 2), (5, 3), (2, 50), (2, 1), (1, 50), (4, 10) (14 sayı) yazılır
      3 tane 10, 1 tane 2, 5 tane 3 ...
    Düşük verili dosyalarda verimli çalışmaz 😢
      Başlık bilgisi fazladan yer kaplar
      Sıkıştırma algoritması için çok fazla tekrarlı bitler gerekir
    Sade metin yerine kodlanmış metin barındırır
    Dosya işlemlerinde w değil wb kullanılır
w plaint text, wb binary text şeklinde yazar

💠 Gzip Metodları

Metod
Açıklama
gzip.open(<dosya>, <erişim modu>)
Dosyaya erişim

⭐ Gzip Örnekleri

1
#!/usr/bin/python
2
# -*- coding: utf-8 -*-
3
with gzip.open('./data/short_text.txt.gz', 'wb') as f:
4
f.write(short_text.encode('utf-8'))
5
Copied!
Last modified 1yr ago