数学中对集合的严格定义可能是抽象的且难以掌握。但实际上可以将集合简单地认为是定义明确的不同对象的集合,通常称为元素或成员。
Python 提供了一个内置的集合类型来将对象分组到一个集合中。集合类型(set type)是处理集合的数据类型。
集合类型的特点是它是一种与列表类型非常相似的数据类型,但它不能存储重复值,它没有下标和键等概念,并且是唯一元素,并且元素是可维护的。
利用这个特性,集合类型可以进行集合、交集、差等集合操作,适合管理类型。
整套学习自学教程中应用的数据都是《三國志》、《真·三國無雙》系列游戏中的内容。
定义一个集合
集合是无序的,并且元素是唯一的,集合本身可以修改,但集合中包含的元素必须是不可变类型。
构建集合的方式
# 构建的set数据会自动进行去重x = set()
list方式
x = set([‘曹操’, ‘孫権’, ‘劉備’, ‘曹操’, ‘司馬懿’])x{‘司馬懿’, ‘曹操’, ‘孫権’, ‘劉備’}
tuple方式
x = set((‘曹操’, ‘孫権’, ‘劉備’, ‘曹操’, ‘司馬懿’))x{‘司馬懿’, ‘曹操’, ‘孫権’, ‘劉備’}
字符串方式
s = ‘董卓’list(s)[‘董’, ‘卓’]set(s){‘董’, ‘卓’}
集合set自动排序且元素不可变
x = {42, ‘曹操’, (1, 2, 3), 3.14159}x{42, ‘曹操’, 3.14159, (1, 2, 3)}
list和dict不能被set
a = [1, 2, 3]{a}Traceback (most recent call last): File “F:/PythonWorkProject/test.py”, line 197, in {a}TypeError: unhashable type: ‘list’d = {‘a’: 1, ‘b’: 2}{d}Traceback (most recent call last): File “F:/PythonWorkProject/test.py”, line 197, in {d}TypeError: unhashable type: ‘dict’
集合的大小和成员资格
方法 len() 、in 、 not in 的应用。
x = {‘曹操’, ‘孫権’, ‘劉備’}len(x)3’孫権’ in xTrue’司馬懿’ in xFalse
集合的9种操作
计算集合并集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.union(x2[, x3 …])
x1.union(x2){‘劉備’, ‘董卓’, ‘司馬懿’, ‘孫権’, ‘曹操’}
x1 | x2 [| x3 …]
x1 | x2{‘劉備’, ‘董卓’, ‘司馬懿’, ‘孫権’, ‘曹操’}
多种合并操作
a = {1, 2, 3, 4}b = {2, 3, 4, 5}c = {3, 4, 5, 6}d = {4, 5, 6, 7}a.union(b, c, d){1, 2, 3, 4, 5, 6, 7}a | b | c | d{1, 2, 3, 4, 5, 6, 7}
计算集合交集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.intersection(x2[, x3 …])
x1.intersection(x2){‘劉備’}
x1 & x2 [& x3 …]
x1 & x2{‘劉備’}
多种交集操作
a = {1, 2, 3, 4}b = {2, 3, 4, 5}c = {3, 4, 5, 6}d = {4, 5, 6, 7}a.intersection(b, c, d){4}a & b & c & d{4}
计算集合之间差异
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.difference(x2[, x3 …])
x1.difference(x2){‘曹操’, ‘孫権’}x2.difference(x1){‘董卓’, ‘司馬懿’}
x1 – x2 [- x3 …]
x1 – x2{‘曹操’, ‘孫権’}x2 – x1{‘董卓’, ‘司馬懿’}
更多的是集合差异操作
a = {1, 2, 3, 30, 300}b = {10, 20, 30, 40}c = {100, 200, 300, 400}a.difference(b, c){1, 2, 3}a – b – c{1, 2, 3}
计算集合间对称差
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.symmetric_difference(x2)
x1.symmetric_difference(x2){‘曹操’, ‘司馬懿’, ‘董卓’, ‘孫権’}
x1 ^ x2 [^ x3 …]
x1 ^ x2{‘曹操’, ‘司馬懿’, ‘董卓’, ‘孫権’}
更多的集合对称差操作
a = {1, 2, 3, 4, 5}b = {10, 2, 3, 4, 50}c = {1, 50, 100}a ^ b ^ c{100, 5, 10}
判断两个集合是否包含相同的元素
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.isdisjoint(x2),包含返回 False,不包含返回 True(x1 & x2是空集)。
x1.isdisjoint(x2)Falsex2 – {‘劉備’}{‘董卓’, ‘司馬懿’}x1.isdisjoint(x2 – {‘劉備’})Truex1 = {1, 3, 5}x2 = {2, 4, 6}x1.isdisjoint(x2)Truex1 & x2set()
判断一个集合是否是另一个集合的子集
x1.issubset(x2),是则返回 True,否则返回 False,即x1 <= x2。一个集合被认为是它自身的一个子集。
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x1.issubset({‘曹操’, ‘孫権’, ‘劉備’, ‘司馬懿’, ‘董卓’})Truex2 = {‘劉備’, ‘司馬懿’, ‘董卓’}x1 <= x2Falsex = {1, 2, 3, 4, 5}x.issubset(x)Truex <= xTrue
判断一个集合是否是另一个集合的真子集
# x1 < x2x1 = {'曹操', '孫権'}x2 = {'曹操', '孫権', '劉備'}x1 < x2Truex1 = {'曹操', '孫権', '劉備'}x2 = {'曹操', '孫権', '劉備'}x1 < x2False# 子集与真子集的判断x = {1, 2, 3, 4, 5}x <= xTruex < xFalse
判断一个集合是否是另一个集合的超集
x1.issuperset(x2),是返回 True,否则返回 False。集合被认为是本身的一个子集,默认为自身超集。
# x1 >= x2x1 = {‘曹操’, ‘孫権’, ‘劉備’}x1.issuperset({‘曹操’, ‘孫権’})Truex2 = {‘劉備’, ‘司馬懿’, ‘董卓’}x1 >= x2Falsex = {1, 2, 3, 4, 5}x.issuperset(x)Truex >= xTrue
判断一个集合是否是另一个集合的正确超集
# x1 > x2x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘孫権’}x1 > x2Truex1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘孫権’, ‘劉備’}x1 > x2False# 集合不是其自身的正确超集x = {1, 2, 3, 4, 5}x > xFalse
集合的9种修改
集合本身可以修改,不会收到集合中包含元素的限制。
update计算并集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}
x1.update(x2[, x3 …])
x1.update([‘司馬懿’, ‘董卓’])x1{‘劉備’, ‘孫権’, ‘司馬懿’, ‘曹操’, ‘董卓’}
x1 |= x2 [| x3 …]
x1 |= x2x1{‘孫権’, ‘曹操’, ‘司馬懿’, ‘劉備’}
intersection_update 计算交集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}
x1.intersection_update(x2[, x3 …])
x1.intersection_update([‘劉備’, ‘司馬懿’])x1{‘劉備’}
x1 &= x2 [& x3 …]
x1 &= x2x1{‘曹操’, ‘劉備’}
difference_update 按差异修改集合
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}x1 -= x2x1{‘孫権’}x1.difference_update([‘曹操’, ‘孫権’, ‘司馬懿’])x1set()
symmetric_difference_update 按对称差修改集合
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}
x1.symmetric_difference_update(x2)
x1.symmetric_difference_update([‘司馬懿’, ‘董卓’])x1{‘孫権’, ‘董卓’}
x1 ^= x2
x1 ^= x2x1{‘孫権’, ‘司馬懿’}
add 元素添加到集合
x = {‘曹操’, ‘孫権’, ‘劉備’}x.add(‘司馬懿’)x{‘孫権’, ‘劉備’, ‘曹操’, ‘司馬懿’}
remove 集合中移除一个元素
x = {‘曹操’, ‘孫権’, ‘劉備’}x.remove(‘劉備’)x{‘孫権’, ‘曹操’}# 如果元素步存在则引发异常x.remove(‘司馬懿’)Traceback (most recent call last): File “”, line 1, in KeyError: ‘司馬懿’
discard 集合中移除一个元素
x = {‘曹操’, ‘孫権’, ‘劉備’}x.discard(‘劉備’)x{‘孫権’, ‘曹操’}x.discard(‘司馬懿’)x{‘孫権’, ‘曹操’}
pop 集合中随机移除一个元素
x = {‘曹操’, ‘孫権’, ‘劉備’}x.pop()’孫権’x{‘劉備’, ‘曹操’}x.pop()’劉備’x{‘曹操’}x.pop()’曹操’xset()x.pop()Traceback (most recent call last): File “”, line 1, in KeyError: ‘pop from an empty set’
clear 清空集合
x = {‘曹操’, ‘孫権’, ‘劉備’}x{‘曹操’, ‘孫権’, ‘劉備’}x.clear()xset()
被冻结集合
freezeset 为 Python的内置类型,不可变、不可操作。
x = frozenset([‘曹操’, ‘孫権’, ‘劉備’])xfrozenset({‘曹操’, ‘劉備’, ‘孫権’})len(x)3x & {‘劉備’, ‘司馬懿’, ‘董卓’}frozenset({‘劉備’})
尝试修改 freezeset 的方法会失败
x = frozenset([‘曹操’, ‘孫権’, ‘劉備’])x.add(‘司馬懿’)Traceback (most recent call last): File “”, line 1, in AttributeError: ‘frozenset’ object has no attribute ‘add’x.pop()Traceback (most recent call last): File “”, line 1, in AttributeError: ‘frozenset’ object has no attribute ‘pop’x.clear()Traceback (most recent call last): File “”, line 1, in AttributeError: ‘frozenset’ object has no attribute ‘clear’