[Python]334 重複する画像を削除する

[M1 Mac, Big Sur 11.6.7, Python 3.10.4]

スクリーンショットを何枚も撮影していると全く同じ画像が混ざることがあります。

OpenCVを使って同一ディレクトリ内にある画像同士を比較し内容が同じ場合は作成日時が古い方を削除するスクリプトを作成しました。

ファイルパスのリストを作成し、要素数2の組み合わせについて画像を比較、同じであれば作成日時の古い方を削除リストに追加。全ての判定が終わってからまとめて削除します。同じ画像が3枚以上あっても対応できるようにしました。

前にも書きましたが作成日時 st_birthtimeはMacOS限定です。Windowsの場合はst_ctimeになります。

import os,glob,itertools,cv2
import numpy as np

path_list = glob.glob("/Desktop/temp/*.png")

delete_list = []
for pair in itertools.combinations(path_list, 2):
    path_pair = list(pair)
    
    image1 = cv2.imread(path_pair[0])
    stat1 = os.stat(path_pair[0])
    btime1 = stat1.st_birthtime
    
    image2 = cv2.imread(path_pair[1])
    stat2 = os.stat(path_pair[1])
    btime2 = stat2.st_birthtime    

    result_compare = np.array_equal(image1, image2)
        
    if result_compare == True:
        if btime1 > btime2:
            delete_list.append(path_pair[1])
        else:
            delete_list.append(path_pair[0])
                
print(delete_list)

for file in delete_list:
    try:
        os.remove(file)
    except FileNotFoundError:
        pass

220712追記:
スクリプトの改良版を作成しました。