首页 > 文章列表 > 如何高效统计和排序商品列表中的元组数据?

如何高效统计和排序商品列表中的元组数据?

357 2025-04-03

如何高效统计和排序商品列表中的元组数据?

Python高效处理商品数据:统计与排序

本文演示如何利用Python高效处理商品列表数据,实现商品数量统计并按数量排序的功能。原始数据为包含商品名称、颜色、尺码和数量的元组列表,目标是统计相同商品属性的总数,并添加一个字段表示该商品名称的总数量,最终结果按总数量降序排列。

示例数据:

假设原始数据如下:

data = [
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '黑色', 'M', 1),
    ('裤子', '白色', 'S', 1),
]

目标结果:

我们需要将其转换为:

result = [
    ('连衣裙', '白色', 'S', 2, 3),
    ('连衣裙', '黑色', 'M', 1, 3),
    ('裤子', '白色', 'S', 1, 1),
]

其中,最后一个元素表示该商品名称的总数量。

Python代码实现:

我们将使用collections.Counter模块来高效地统计元组出现次数。以下代码展示了详细步骤:

from collections import Counter

data = [
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '白色', 'S', 1),
    ('连衣裙', '黑色', 'M', 1),
    ('裤子', '白色', 'S', 1),
]

# 统计每个(名称, 颜色, 尺码)组合的数量
item_counts = Counter(tuple(item[:-1]) for item in data)

# 统计每个商品名称的总数量
name_counts = Counter(item[0] for item in data)

# 构建结果列表,包含名称、颜色、尺码、数量和该名称的总数量
result = [(*item, count, name_counts[item[0]]) for item, count in item_counts.items()]

# 按总数量降序排序
result.sort(key=lambda x: (-x[4], x[0], x[1], x[2]))

print(result)

这段代码首先使用Counter统计每个(名称, 颜色, 尺码)组合的出现次数,然后统计每个商品名称的总数量。最后,它构建一个新的列表,包含名称、颜色、尺码、数量和该名称的总数量,并根据总数量降序排序。这种方法能够高效处理包含大量数据的列表。

来源:1741459953