skbio.stats.distance.DissimilarityMatrix¶
- class skbio.stats.distance.DissimilarityMatrix(data, ids=None, validate=True)[源代码]¶
存储对象之间的差异。
A DissimilarityMatrix 实例存储对象之间不同之处的正方形、中空、二维矩阵。例如,对象可以是样本或DNA序列。这些不同之处伴随着一系列ID。
提供了从磁盘加载相异矩阵和将相异矩阵保存到磁盘的方法,以及执行常见操作,例如基于对象ID提取相异度。
- 参数:
data (array_like or DissimilarityMatrix) -- 正方形、中空、二维
numpy.ndarray不同点(浮点数)的结构,或者可以转换为numpy.ndarray使用numpy.asarray或一维相异度向量(浮点数),如 scipy.spatial.distance.squareform 。可以改为是一个 DissimilarityMatrix (或子类)实例,在这种情况下将使用实例的数据。数据将转换为浮点型dtype如果有必要的话。一份复印件 not 如果已经是numpy.ndarray使用浮点数dtype。ids (sequence of str, optional) -- 用作对象ID的字符串序列。必须与中的行数/列数匹配 data 。如果
None(默认),ID将是单调递增的整数,转换为字符串,编号从零开始,例如,('0', '1', '2', '3', ...)。validate (bool, optional) -- 如果 validate 是
True(默认设置),并且数据不是DisimilarityMatrix对象,则将验证输入数据。
备注
相异点以冗余(正方形)格式存储 [1].
不检查数据的对称性,也不保证/假定数据是对称的。
引用
属性
T相异矩阵的转置。
data一系列不同之处。
default_write_formatdtype不同的数据类型。
ids对象ID的元组。
png在IPython笔记本中以PNG格式显示热图。
shape包含相异矩阵维度的双元素元组。
size相异矩阵中的元素总数。
svg在IPython笔记本中以SVG格式显示热图。
内嵌函数
__contains__(lookup_id)检查指定的ID是否在相异度矩阵中。
__eq__(其他)将此相异矩阵与另一个矩阵进行比较,以求相等。
__ge__(value, /)返回self>=值。
__getitem__\(索引)按对象ID或NumPy索引将不同的数据切片。
__getstate__\()泡菜的帮手。
__gt__(value, /)返回self>值。
__le__(value, /)返回self<=value。
__lt__(value, /)返回self<value。
__ne__(其他)确定两个相异矩阵是否不相等。
__str__\()返回相异矩阵的字符串表示形式。
方法
between(from_, to_[, allow_overlap])获取两组ID之间的距离
copy\()返回相异矩阵的深层副本。
filter(ids[, strict])根据ID过滤相异度矩阵。
from_iterable(iterable, metric[, key, keys])从给定度量的可迭代项创建DisimilarityMatrix。
index(lookup_id)返回指定ID的索引。
plot([cmap, title])创建相异矩阵的热图
read(file[, format])创建新的
DissimilarityMatrix实例。redundant_form\()返回冗余格式的相异度数组。
to_data_frame\()创建
pandas.DataFrame从这个开始DissimilarityMatrix。transpose\()返回相异矩阵的转置。
within\(ID)获取ID集合中的所有距离
write(file[, format])编写一个实例
DissimilarityMatrix保存到文件中。